OK
AJAX error!

Les forumsGrammalecteUtilisation de Hunspell

Utilisation de Hunspell

Bonjour

En matière de vérification orthographique (pas grammaticale) des noms propres, je songe à remplacer la fenêtre de dialogue par l'examen d'une liste alphabétique.

J'utilise un script (Linux) qui produit une liste alphabétique au format txt de tous les mots d'un fichier odt (livre p ex.) commençant par une majuscule. Tout doublon de nom propre dans cette liste indique une faute de frappe.

Cette liste comprend donc tous les noms propres auxquels il faut rajouter les noms communs (et quelques autres mots) qui sont en tête de phrase. Voici un petit extrait de la liste à titre d'exemple. Elle conserve les traits d'union (mais il est facile de les faire "oublier" en cas de besoin):

Montrons-lui
Morality
Mossieur
Mostaganem
Moulin
Moustache
Mouton-Couronné
Murat
Murillo
Murmurer
Mystère

J'envisage d'utiliser hunspell en fin de script. L'option omnivore "hunspell -a filename" traite cette liste en deux minutes et ne mentionne que les mots inconnus (ou fautifs). Il est alors extrêmement rapide de la parcourir et de relever les incohérences éventuelles.

Avez-vous des recommandations en vue d'un traitement ultérieur? Comment séparer automatiquement le bon grain (noms propres) de l'ivraie (reliquat), sous quelle forme faudrait-il présenter la liste pour qu'elle puisse être enregistrée dans le dictionnaire utilisateur?
le 24 janvier 2013 à 02:03
Bonjour,

Pour utiliser Hunspell dans un script, passez par Python, vous trouverez des réponses dans ce fil : www.dicollecte.org… Ça vous permettra d’utiliser l’analyse morphologique des mots, pour faire le tri.

sous quelle forme faudrait-il présenter la liste pour qu'elle puisse être enregistrée dans le dictionnaire utilisateur?


Les dictionnaires utilisateurs sont une simple liste de mots, un mot par ligne. Aucune genèse de formes fléchies n’est possible, il faut donc les entrer toutes. Voir le dossier wordbook dans le profil utilisateur de LibreOffice.
le 24 janvier 2013 à 10:25

Notification par e-mail    0