OK
AJAX error!

Les forumsLanguageToolRégression dans le lexique 4.5 pour LanguageTool

Régression dans le lexique 4.5 pour LanguageTool

J'ai téléchargé www.dicollecte.org… et j'ai utilisé la commande "DL2LT.py lexique-dicollecte-fr-v4.5.txt" pour transformer le fichier lexique-dicollecte-fr-v4.5.txt en fichier lexique-dicollecte-fr-v4.5.txt.LT.txt pour LanguageTool. Avant de l'intégrer à LanguageTool, je fais toujours un diff pour voir ce qui a changé depuis la version précédente (4.4.1). Et là je vois une régression systématique : un bon nombre de participes passés masculins singuliers des verbes du premier groupe on disparu (mais pas tous).

Par exemple, le mots suivants ont disparu entre lexique-dicollecte-fr-v4.4.1.txt.LT.txt et lexique-dicollecte-fr-v4.5.txt.LT.txt

abaissé abaisser V ppa m s
abandonné abandonner V ppa m s
abdiqué abdiquer V ppa m s
etc.

Mais les mots suivants sont présents :

allé aller V ppa m s
concerné concerner V ppa m s
crénelé créneler V ppa m s
etc.

Je n'ai pas encore eu le temps de rechercher le problème plus en détails.
le 17 mai 2012 à 09:08
Ah oui. D’habitude, je lance le script pour voir si tout va bien, mais, cette fois, je ne l’ai pas fait. Désolé. J’avais un peu modifié le fichier des affixes.
Corrigé.
le 17 mai 2012 à 09:33
Bonjour

est-ce à dire qu'il y aura une nouvelle version ?

pierre
le 17 mai 2012 à 09:58
Non, j’ai seulement mis à jour l’archive du lexique avec un script corrigé.
le 17 mai 2012 à 10:33
@Admin: Merci !

Bizarre, la taille du fichier lexique-dicollecte-fr-v4.5.zip est passée de 7105077 bytes à 6520135 bytes.
Mais j'ai vérifié, tous les fichiers dans le zip sont pourtant identiques, à part le script python qui a été mis à jour pour LanguageTool. Une compression plus efficace a donc été utilisée pour le nouveau fichier.

Je confirme que le problème est corrigé. J'intégrerai dicollecte-4.5 avec LT bientôt.
le 17 mai 2012 à 14:08
D’habitude, c’est mon script Python qui génère les extensions et les archives zip. Là, j’ai utilité 7-zip manuellement. Python ne doit pas utiliser un algo très puissant, j’imagine. :)
le 17 mai 2012 à 17:35

Notification par e-mail    0