OK
AJAX error!

Les forumsGrammalecteGrammalecte 0.3.x

Grammalecte 0.3.x

*** GRAMMALECTE 0.3 ***

Reportée depuis plusieurs mois, la nouvelle version majeure du correcteur grammatical voit enfin le jour.

// PRÉREQUIS

Cette version nécessite l’installation de la dernière extension multi-dictionnaires, la version 4.11, car l’étiquetage grammatical a changé. Sans cette extension, le correcteur grammatical sera dans certains cas incapable de comprendre ce que sont certains mots. Pareillement, évitez d’installer la nouvelle extension multi-dictionnaires avec les anciennes versions de Grammalecte.

Le dictionnaire est dorénavant inclus dans l’extension.


// JOURNAL DES MODIFICATIONS (résumé)

— Moteur multi-passes et réorganisation des règles de contrôle
— Moins faux positifs (comme d’habitude)
— Bugs divers corrigés
— Le lexicographe : informe de la nature grammaticale des mots dans le menu contextuel
— Le formateur de texte : formatage automatique du texte (apostrophes, espaces, etc.), accessible depuis le menu Outils


// MOTEUR MULTI-PASSES ET PRÉPROCESSEUR DE TEXTE

La nouveauté majeure, la plus discrète, concerne le moteur interne du correcteur. En version 0.1, Grammalecte, à l’instar de LanguageTool, n’effectuait qu’une seule passe sur le texte. Avec la version 0.2, le moteur en faisait deux (une paragraphe par paragraphe, une phrase par phrase) et utilisait un préprocesseur pour simplifier le texte entre les deux passes. Concrètement, ça revenait à ôter les signes graphiques encombrants, les adverbes, les locutions adverbiales et les expressions usuelles. Je ne reviens pas dessus, il suffit de relire ce que j’ai écrit sur la version 0.2 (www.dicollecte.org…).

Avec la version 0.3, le correcteur peut effectuer un nombre de passes théorique illimité, avec pour chacune d’elles un préprocesseur qui simplifie le texte et ôte ce qui n’est plus utile à la vérification. À présent, pour le français, cinq passes sont faites, et d’autres viendront peut-être à l’avenir selon les besoins.

Voici grosso modo comment ça se passe :

—> Passe 0, paragraphe par paragraphe
— Préprocesseur : suppression des URL
— Vérification des signes graphiques : apostrophes, ponctuation, espaces, guillemets, etc.

—> Passe 1, phrase par phrase
— Préprocesseur : suppression des signes graphiques encombrants (guillemets, certains tirets)
— Contrôle de cohérence entre certaines catégories de mots

—> Passe 2
— Préprocesseur : suppression des adverbes, locutions adverbiales, expressions usuelles, etc.
— Contrôle des groupes nominaux

—> Passe 3 & 4
— Préprocesseur : suppression de certains pronoms et adverbes entourant les verbes
— Contrôle des conjugaisons

Si le moteur multi-passes est au point, en revanche, la réorganisation des règles de contrôle n’en est qu’à son commencement. Le potentiel du nouveau moteur se déploiera au fur et à mesure des versions ultérieures. Comme d’habitude, je préfère opérer une montée progressive des ajouts et des modifications pour éviter une explosion des faux positifs.

Et comme toujours, la nouvelle version introduit de nouvelles règles de contrôle, corrige nombre de bugs mineurs et réduit le nombre de fausses alertes.

Enfin et surtout elle apporte avec elle de nouveaux outils annexes.


// LE LEXICOGRAPHE

Cet outil est très simple à utiliser, il est purement informatif. Sur un clic droit, le menu contextuel indique quelle est la nature grammaticale du mot sur lequel se trouve le curseur : nom, adjectif, adverbe, verbe, etc. Cette fonction est un peu expérimentale, mais fonctionne sans poser de problème particulier. Si vous constatez une erreur dans l’étiquetage, il faut proposer une modification du dictionnaire, car cet outil ne fait que transcrire de manière lisible les étiquettes inscrites dedans.

L’étiquetage du dictionnaire n’est pas toujours cohérent, observerez-vous peut-être. Par exemple, pour un nom masculin ou féminin, il peut y avoir une entrée étiquetée épicène, ou bien deux entrées, l’une disant que le nom est masculin, l’autre qu’il est féminin.

Requis : LibreOffice 4+, OpenOffice 3.4+. Ça ne fonctionne pas avec OpenOffice.org et LibreOffice 3.x à cause d’un bug de l’API corrigé dernièrement. Même avec ces versions, vous pouvez tout de même installer l’extension. Le correcteur grammatical fonctionnera, mais cette fonction sera inopérante.

Note : cet outil permettra à l’avenir d’afficher d’autres informations lexicales, sémantiques ou étymologiques. C’est déjà possible en fait, mais ça complique la tâche du correcteur grammatical, car ces informations sont disposées au beau milieu des étiquettes grammaticales (c’est dû à la structure du dictionnaire, et ce n’est pas modifiable). Pour bénéficier de ces informations, il faudrait ou bien tolérer une perte de performance du correcteur grammatical, ou bien recomposer tout le lexique dans un automate à états finis binaire indexable. La 2e solution a ma préférence, c’est le remède à beaucoup de problèmes, mais ce n’est pas pour tout de suite.


// LE FORMATEUR DE TEXTE

Cet outil, là encore assez simple, sert à automatiser le processus de correction des erreurs les plus communes, notamment typographiques. Si vous en avez marre de corriger une par une les apostrophes droites, les espaces surnuméraires, les guillemets et toutes sortes d’erreurs récurrentes, cet outil est fait pour vous. J’ai testé l’outil plusieurs fois, mais je vous recommande de l’essayer en premier lieu sur des textes assez courts, afin de vérifier qu’il ne corrompt rien.

Note : l’outil touche aux espaces, mais pas aux tabulations. Même si beaucoup font des mises en page dégueulasses avec des tabulations, il m’a paru dangereux de modifier automatiquement celles-ci.

Accès : menu Outils > Formateur de texte


Captures d’écran :
www.dicollecte.org…

Téléchargement :
www.dicollecte.org…



Historique des versions :
version 0.2 : www.dicollecte.org…
version 0.1 : www.dicollecte.org…
version 0.0 : www.dicollecte.org…
le 17 juin 2013 à 13:40
Grammalecte v0.3.1 :
— moins de faux positifs,
— correction de bugs concernant LibreOffice 3.x et OpenOffice.
le 18 juin 2013 à 17:13
Bonjour

Le formateur de texte est un remarquable outil, paramétrable, pratique et bien conçu. C'est à se demander comment on faisait avant. Merci...
le 19 juin 2013 à 19:06
Que de chemin parcouru, que de travail !

Bravo ! ça force le respect.

Personnellement, je trouve que votre contribution pour faire passer LibreOffice / OpenOffice du stade de la curiosité au stade du logiciel pro est très significative. c'est une énorme lacune qui est progressivement comblée.

Reste à intégrer la correction grammaticales à Impress et pourquoi pas à Calc (je sais, ce n'est pas de votre ressort)

Encore bravo !
le 19 juin 2013 à 21:07
Zou. Une petite mise à jour.

Version 0.3.2 :
— formateur de texte amélioré pour préserver le format existant,
— quelques faux positifs en moins.
le 23 juin 2013 à 21:26
Tout d'abord, je tiens à vous remercier pour cet excellent outil qu'est grammalecte. Je l'utilise depuis un bon moment au travail et je ne cesse de le recommander.
Ceci étant dit, je pense avoir trouvé un bug dans le formateur de texte : la suite suivante

t'a s'a d'a j'a l'a m'a n'a

est corrigée en

"t’a $1’a $1’a $1’a $1’a $1’a $1’a"


(J'utilise les dernières version de grammalecte et des dictionnaires, ainsi que LibreOffice 4.0.2.2)
le 25 juin 2013 à 12:05
Comme je l'explique dans ce fil (www.dicollecte.org…), le bug ne vient pas de Grammalecte mais de ICU, un module de LibreOffice, qui est bogué dans votre version. Utilisez LO 4.0.3+, ça fonctionnera correctement.
le 26 juin 2013 à 18:01
Nouvelle version : 0.3.3

Attention, à compter de cette version, Grammalecte inclut les dictionnaires orthographiques.

Il y aura donc dorénavant deux extensions avec le même identifiant :
— Grammalecte avec les dictionnaires,
— les dictionnaires sans Grammalecte.

L’installation de l’une écrasera l’autre.

L’identifiant unique retenu est celui de l’extension multi-dictionnaires incluse dans LibreOffice 4. L’installation de Grammalecte prendra donc sa place avec les dictionnaires à jour.

Toute autre version des extensions dictionnaires devra être désinstallée (LibreOffice 3.x et OpenOffice). Les anciennes versions de Grammalecte devront aussi être désinstallées, attendu que la nouvelle version ne s’installera pas à leur place.

J’espère que c’est clair. :)

Journal des modifications :
— moins de faux positifs,
— préprocesseur de texte amélioré,
— formateur de texte : espaces insécables fines, points médians sur certaines unités.

C’est plutôt une version de consolidation, aucun bouleversement majeur.
le 04 août 2013 à 22:10
Merci pour tout ce travail.

Je note que le kg.m² n'a pas été pris en compte pour le point médian par le formateur de texte

Ne pensez-vous pas que l'activation de l'option point médian pour les unités peut en dérouter plus d'un ?
le 04 août 2013 à 22:57
Le travail sur les unités n’est pas fini. Loin de là. C’est encore rudimentaire. Navré. En fait, je me demande toujours comment gérer les exposants. Mais j’ai préféré activer cette option, car, dans le cas contraire, le formateur va mettre un espace après les points.
le 04 août 2013 à 23:02
Il n'y a pas à être navré de quoi que ce soit, tout ce qui a été fait est déjà très appréciable. Et effectivement, le problème des unités est un vrai sac de nœuds

pour ma part, j'ai choisi de ne plus utiliser les exposants négatifs, j'ai ainsi pu convertir toutes les unités uniquement avec les symboles ² et ³

en fait, le ³ ne sert que pour quelques unités (volumes, masse volumique, débit volumique, densité d'énergie volumique)

je vais essayer de me mettre aux expressions régulières pour mettre à jour mes documents
le 05 août 2013 à 17:19
Nouvelle version : 0.3.4

Modifications :
— corrige un bug important du formateur de texte,
— quelques faux positifs supprimés.

C’est surtout une mise à jour d’urgence pour corriger le bug du formateur de texte.

Le système de mise à jour de LO devrait vous signaler cette nouvelle version. OO ne le fait apparemment pas.
le 13 août 2013 à 11:04
J’ai téléversé une nouvelle version de l’extension 0.3.4 hier après avoir corrigé le bug d’affichage du formateur de texte.

J’ai aussi désactivé le système de mise à jour qui posait trop de problèmes. Ça m’embête bien, j’aimerais pouvoir fournir des mises à jour plus facilement.
le 15 août 2013 à 07:21
J'ai eu effectivement beaucoup de problème avec le système de mise à jour. Mais j'ai l'impression que c'est lié à la confusion désormais entre le dictionnaire et le correcteur grammatical (chez moi une fois la 0.3.4 installée, il me réinstallait le dictionnaire 4.11 derrière probablement parce que 4.11 > 0.3.4 ). Si ils étaient vus comme deux extensions séparées (comme c'était le cas avant la 0.3.4), ça règlerait peut être le problème. Maintenant il est possible que y ait encore d'autres problèmes...
le 17 août 2013 à 16:33
Vraiment navré pour ces contretemps. Pour l’instant, on va continuer sans faire appel à cette fonction.
le 17 août 2013 à 18:31
Je viens enfin de comprendre pourquoi les mises à jour ont posé tant de problèmes pour certains d’entre vous.

Sur LibreOffice, si vous installez Grammalecte par-dessus l’extension dictionnaire incluse, LibreOffice va vous proposer une mise à jour de Grammalecte en réinstallant les dictionnaires par défaut sur l’extension installée.

En effet, les dictionnaires sont en version 4.11, tandis que Grammalecte est en version 0.3.4. Du coup, LO considère l’extension installée par défaut comme plus récente.

Solution temporaire : désinstaller l’extension dictionnaire incluse dans LO avant d’installer Grammalecte.

Solution ultérieure : harmoniser les numéros de version entre Grammalecte et l’extension dictionnaire.

Comme je n’ai pas envie de donner un numéro de version élevé à Grammalecte, je vais probablement réduire celui des dictionnaires. Je crains toutefois d’autres effets de bord. Tout ceci est bien embêtant.
le 23 août 2013 à 12:18
Nouvelle version : 0.3.5

Modifications :
— moins de faux positifs,
— correction de bugs concernant le lexicographe,
— nouvelle numérotation de l’extension afin d’éviter les mises à jour intempestives avec l’extension dictionnaire incluse dans LO.

Finalement, pas de changement global de numérotation. En revanche, l’extension Grammalecte (considérée comme un pack) sera dorénavant numérotée en fonction des dictionnaires inclus.
le 24 août 2013 à 15:08
Version 0.3.6 :
— beaucoup d’améliorations sur le préprocesseur de texte, le champ d’erreurs que le correcteur peut détecter s’est pas mal accru (par rapport à la version 0.3.5.0),
— réduction des faux positifs,
— intégration du dictionnaire 5.0 qui a été optimisé pour simplifier le fonctionnement du correcteur grammatical, ce qui se traduit par moins de consommation de mémoire et une vitesse accrue (je n’ai pas fait de tests, il faudra me croire sur parole…),
— réparation du lexicographe pour OpenOffice.
le 08 décembre 2013 à 19:38
Bon, je retire cette version du téléchargement.
Il n’y a pas de problèmes avec LibreOffice 4.1, mais ça plante avec les anciennes versions apparemment et aussi avec OpenOffice.
le 09 décembre 2013 à 18:45
Version 0.3.6.1 :
— corrige quelques bugs,
— version rétrocompatible pour OpenOffice et LibreOffice 3.x (conçue à l’arrache et la truelle).

Maintenir deux versions est une solution temporaire. Quand j’en aurai marre de ces histoires de rétrocompatibilité avec les anciennes versions de Python, tout ça passera à la trappe. Python 3 est sorti en 2008. Il est plus que temps de se débarrasser Python 2.x.

Dire que je devais me coucher tôt. :(
le 10 décembre 2013 à 03:16
Nouvelle version : 0.3.6.2 avec les dictionnaires corrigés inclus.
le 10 décembre 2013 à 11:23
Nouvelle version : 0.3.7

// Prérequis : Python 3.3
Aucune version rétrocompatible avec Python 2.x ne sera fournie et il n’y en aura d’ailleurs plus. Ce qui signifie que cette version nécessite au moins LibreOffice 4.0 et n’est plus compatible avec l’actuelle version d’OpenOffice.

// Nouveautés
— beaucoup moins de faux positifs,
— menu global pour accéder aux outils et options (les utilisateurs ignoraient souvent leur existence),
— quelques nouvelles options pour le formateur de texte,
— nouvel outil : le conjugueur (qui peut conjuguer tous les verbes du dictionnaire, environ 8000),
— mise à jour du dictionnaire 5.0 (il y avait encore des problèmes avec certaines graphies élidées),
— quelques bugs corrigés.

// À propos du conjugueur
Vous pouvez activer directement certaines options en tapant “ne pas” ou “se” avant le verbe ou “?” après celui-ci.

En sus du menu Grammalecte, vous pouvez accéder au conjugueur via le menu contextuel de Writer, en cliquant sur un verbe, sous une forme conjuguée ou non. Par exemple, sur le mot “suis”, il vous proposera de conjuguer “être” et “suivre”.

Cet outil est encore en version bêta, parce qu’il faudrait revoir l’étiquetage des 8000 verbes pour permettre la conjugaison de ceux-ci pronominalement et dans les temps composés (ce sont les participes passés qui posent problème, attendu que les accords sont soumis à des règles complexes). Il faudrait par exemple compléter l’étiquetage pour signaler si le verbe s’utilise avec l’auxiliaire être ou avoir. Du coup, pour la plupart des verbes, j’ai délibérément désactivé certaines options pour éviter d’éventuelles erreurs. Ne vous attendez pas à ce que ce soit corrigé prochainement, ça va demander beaucoup de temps, et ce n’est pas prioritaire à mes yeux.

Par ailleurs, certaines particularités ne sont pas gérées, par exemple le fait qu’il peut exister plusieurs graphies par conjugaison, comme je peux, je puis, ou les variantes graphiques introduites par la réforme de l’orthographe. Mon script prend la première graphie qu’il trouve et ignore le reste. Les variantes graphiques sont oubliées, la réforme est ignorée, sauf si vous demandez à l’infinitif une graphie réformée, comme connaitre (sans l’accent circonflexe).
le 18 janvier 2014 à 01:25
Nouvelle version : 0.3.8

// Modifications
— moins de faux positifs (comme toujours),
— beaucoup de bugs corrigés,
— nouvelles règles de contrôle,
— préprocesseur de texte consolidé,
— le menu global est désormais visible dans les documents maîtres et dans l’éditeur HTML, ainsi que dans Impress,
— quelques améliorations dans le formateur de texte.

Dans cette version, un gros travail de consolidation a été fait, une attention particulière a été portée sur les règles existantes, dont beaucoup ont été améliorées, et de nouvelles règles de contrôle ont été ajoutées. Vous devriez donc observer que le correcteur détecte plus d’erreurs qu’autrefois.

Pour rappel, vous pouvez recevoir un e-mail pour toutes les prochaines mises à jour en demandant à recevoir les notifications de ce fil (en bas à gauche) ou dans le fil des annonces : www.dicollecte.org…
le 01 mars 2014 à 11:51
Nouvelle version : 0.3.8.1
— Corrige un bug du formateur de texte.
le 02 mars 2014 à 13:38
Nouvelle version : 0.3.8.2
— Suppression de faux positifs.

Navré pour ces versions à répétition, mais il y avait encore un bug que je jugeais rédhibitoire.
le 03 mars 2014 à 22:32
Nouvelle version : 0.3.8.3
— Suppression de faux positifs.

Hmm…
le 05 mars 2014 à 13:55
Version 0.3.9 :
— moins de faux positifs,
— amélioration du préprocesseur de texte,
— correction du bug concernant la détection des lettres isolées,
— corrections de divers bugs,
— raccourci clavier pour accéder au menu,
— + version rétrocompatible avec AOO 4.

// Concernant la version pour AOO 4
AOO 4 contient la version 2.7 de Python qui est un peu mieux que Python 2.6, et c’est pourquoi je me suis attelé à écrire un mini-script de conversion. Ceci dit, Python 2.7 reste obsolète et contient des bugs qu’il est difficile d’ignorer (les mêmes que ceux de la version 2.6). Ce n’est pas dramatique, mais cela occasionne des effets curieux.
Par exemple, si vous écrivez « Était-elle fatiguer ? », AOO 4 ne verra rien.
Si vous écrivez « Mais était-elle fatiguer ? », AOO 4 verra l’erreur.
En fait, dès qu’une phrase (ou une expression régulière) commence par un signe avec diacritique, celui-ci semble ignoré, ce qui provoque parfois des erreurs dont certaines ont été contournées dans le code de Grammalecte, mais il est impossible de tout gérer de la sorte.

Par ailleurs, la conversion pour AOO 4 n’est peut-être pas parfaite. Ne vous étonnez donc pas si certaines erreurs détectées avec LibreOffice ne le sont pas avec OpenOffice. Je m’efforcerai de vérifier avec le temps.

Ceci dit, cette version reste quand même meilleure que toutes les précédentes. (On a vécu avec ça pendant longtemps avec Python 2.6 inclus dans LibO 3 et AOO 3, et on a fait avec.)

Je ne sais pas combien de temps la rétrocompatibilité sera maintenue. Cela sera ainsi tant que Grammalecte n’inclura pas une version binaire indexable de ses propres dictionnaires. Ce jour-là, c’en sera définitivement fini des versions rétrocompatibles avec Python 2.7.
le 18 avril 2014 à 16:35
Cette nuit, j’ai rêvé qu’il y avait un bug dans mon code à un endroit précis. Vérification faite, c’était bien le cas. Donc, nouvelle version. J’ai aussi vu que le Conjugueur plantait parfois avec AOO.

Version 0.3.9.1 :
— correction d’un bug du préprocesseur de texte,
— correction du plantage du conjugueur sur AOO.
le 19 avril 2014 à 14:52
Je ne dis rien, mais ça ne signifie pas que je ne fais rien. :)

Voici, une fois n’est pas coutume, une version bêta à tester :
[[ lien supprimé ]]

Cette version, outre les améliorations usuelles de détection, apporte un moteur de suggestion.

Dorénavant, au lieu d’avoir juste un message vous disant ce qui est erroné, Grammalecte fournit à présent la forme correcte dans bien des cas. C’est cette fonctionnalité qui a besoin d’être testée. La suggestion, c’est quand même une affaire délicate.
le 15 mai 2014 à 15:53

Notification par e-mail    1