OK
AJAX error!

Les forumsGrammalecteGrammalecte 0.2.x

Grammalecte 0.2.x

Grammalecte 0.2

Je suis heureux de vous présenter cette nouvelle mouture du correcteur grammatical qui apporte beaucoup de nouveautés, peu visibles à première vue pour l’utilisateur, mais qui devraient améliorer nettement le confort d’utilisation et l’aide à la chasse aux erreurs.

Les nouveautés se situent surtout sous le capot.


Soulignement restreint à la zone d’erreur

Auparavant, Grammalecte soulignait presque toujours toute la zone qu’il avait dû examiner pour repérer une erreur. Par exemple, si vous écriviez « Le petit chaperon rouges », il soulignait « Le petit chaperon rouges » au lieu seulement de mettre en exergue « rouges ». C’était une contrainte technique. Il n’était possible de faire autrement qu’au prix d’une lourde chute des performances et d’une complexité plutôt rédhibitoire.
À présent, restreindre la zone signalée au mot erroné est aisé et sans conséquences sur les performances.

Ce point qui paraît peut-être anodin a plusieurs conséquences :
— ça évite le chevauchement des erreurs que LibreOffice et OpenOffice ne savent pas bien gérer (ce point a toutefois été amélioré depuis LibO 3.6),
— ça simplifie grandement la suggestion des graphies correctes (j’ai plutôt manqué de temps pour réécrire toutes les règles pour donner une suggestion, ce point reste donc encore largement améliorable, mais c’est à présent possible) ;
— c’est probablement moins étrange pour l’utilisateur.
Et cette fonctionnalité est surtout un prérequis pour développer le préprocesseur de texte dont je vais vous parler.

Cette fonctionnalité a été « backportée » dans Lightproof, le correcteur duquel Grammalecte est issu.


Le préprocesseur de texte

Grammalecte, contrairement à LanguageTool et à Lightproof, analyse les textes que LibreOffice lui envoie en deux passes : paragraphe par paragraphe, puis phrase par phrase. Cet avantage permet d’introduire un nouvel outil, le préprocesseur de texte, dont le rôle est de modifier (en interne, pour le propre usage du correcteur uniquement) la phrase qu’il va analyser ; ces modifications consistent notamment en une simplification du texte, afin de le dépouiller de tout ce qui est gênant pour débusquer les erreurs.

Grammalecte 0.2 fonctionne ainsi :
— analyse du paragraphe (sans modification du texte)
>> remontée des erreurs à LibreOffice,
— transformation du texte par le préprocesseur de texte,
— analyse phrase par phrase du texte modifié
>> remontée des erreurs à LibreOffice.

L’épure du texte consiste notamment à ôter les adverbes, les locutions adverbiales, les expressions usuelles, les caractères indésirables qui ponctuent régulièrement les écrits.

Cette épure a plusieurs conséquences :
— elle simplifie drastiquement la désambiguïsation du texte (un souci permanent), et permet même souvent de se passer de faire de la désambiguïsation,
— elle réduit conséquemment le nombre de faux positifs,
— elle simplifie la recherche des erreurs et soulage le programmeur des maux de tête récurrents que la correction grammaticale automatique peut provoquer ;),
— elle permet la vérification, autrefois presque impossible, de certains accords distants.

Ce n’est pas la panacée, mais ça débroussaille déjà pas mal et ça permet vraiment d’y voir plus clair.

Concrètement, qu’est-ce que ça permet ? Voici par exemple des erreurs que Grammalecte parvient dorénavant à débusquer, ce que ni LanguageTool ni l’ancienne version ne sont capables de faire :

— Les hommes comme celui-là mange comme deux.
— Il venait, comme d’habitude, discuté avec son ami.
— Elle est de plus en plus belles.
— Ses « chiens » coure sur ma pelouse.
— Ils sont tout à fait désœuvré.
— Les infirmières à mi-temps ne travaille pas dans cette aile.
— Ils sont, semble-t-il, parti à la chasse.
— Je suis moi aussi complètement désespérés d’aller, le 1er janvier, travaillé à l’usine.
— Ils sont bel et bien mort.
— Des peines à peine croyable.
— Ces types-là venait mangé chez moi tous les dimanches.
— Des règles pas du tout claire.
— Ce roman de Jean-Paul Sartre es passionnant.
— Celui d’entre nous qui mens.

Dans les exemples ci-dessus, Grammalecte supprime en interne ce qui le gêne : « comme celui-là », « comme d’habitude », « de plus en plus », « à peine », etc.

Il y a environ 140 règles dans le préprocesseur, qui opèrent un nombre plus grand encore de modifications diverses.

À présent que le préprocesseur me simplifie la tâche, j’ai commencé à étendre la recherche d’erreurs là où Grammalecte ne prenait auparavant presque aucun risque de se tromper. Je n’en suis qu’au commencement sur ce point. J’ai préféré publier une nouvelle version que je juge supérieure à l’ancienne plutôt qu’attendre indéfiniment que ça me satisfasse pleinement.

Tout ceci n’est qu’un début, car je vois à présent que le potentiel du préprocesseur est bien supérieur à ce que j’avais imaginé en premier lieu. Expérimenter cet outil m’a donné plein d’idées audacieuses. Et je pense maintenant qu’il est possible de créer avec ce système un correcteur grammatical bien plus capable qu’il ne l’est déjà présentement.

Malheureusement, cela demandera encore beaucoup de temps et de tests. Il s’est passé quasiment 8 mois entre cette version et la précédente, et, au cours de cette période, je n’ai guère dû travailler plus de quelques semaines avec ténacité sur le correcteur. Je me prends alors à espérer avoir plus de temps à consacrer à cette tâche. Une seule année de travail à plein temps donnerait de bien meilleurs résultats. Du coup, j’ai ouvert un compte Paypal pour donations. Grammalecte reste bien sûr gratuit et vous êtes libres de contribuer ou non. Je pense notamment à vous, entreprises, institutions et organismes, qui installez des dizaines, des centaines, des milliers de postes, mais les particuliers ne devraient pas sous-estimer leur importance. Si vous appréciez ce logiciel, toute aide, en ces temps difficiles, est la bienvenue. :) Ça me fera gagner un temps précieux pour le développement de la suite.

Téléchargement :
www.dicollecte.org…



Historique des versions :
version 0.1 : www.dicollecte.org…
version 0.0 : www.dicollecte.org…
le 03 septembre 2012 à 10:17
D’ici la fin du mois, je sortirai une mise à jour (0.2.1), avec quelques petites améliorations diverses, avant une nouvelle refonte du système pour la version 0.3, visant une efficacité encore accrue. Grammalecte va s’orienter vers un système multi-préprocesseurs et multi-passes. Profondeur théorique infinie. J’ai eu le cerveau en ébullition ces dernières semaines. Si j’ai le temps, j’ajouterai plus de règles.
le 13 septembre 2012 à 10:04
Super !
le 14 septembre 2012 à 21:25
super travail, bravo et merci !
le 24 septembre 2012 à 14:57
Nouvelle version de Grammalecte : 0.2.1

Rien de révolutionnaire, cette fois-ci. Juste une amélioration de pas mal de petits détails, quelques règles supplémentaires, quelques corrections de bugs, quelques faux positifs en moins. En fait, j’ai surtout amélioré le préprocesseur de texte dont j’ai parlé précédemment : c’est là que se trouvent la plupart des améliorations.

Pour la suite, il faudra que je révise l’ensemble du moteur une nouvelle fois. Il n’y aura donc pas de nouvelle version avant pas mal de temps, sauf si celle-ci souffre de problèmes majeurs.

N’oubliez pas de me rapporter les faux positifs ici :
www.dicollecte.org…

Téléchargement :
www.dicollecte.org…
le 30 septembre 2012 à 21:21
Nouvelle version de Grammalecte : 0.2.2

Il s’agit d’enlever un faux positif (une régression) que je considère rédhibitoire :

Ils lui firent encore cette question:...


Merci à Tbj pour avoir signalé le problème.

Il y a deux autres corrections plus mineures.
le 02 octobre 2012 à 10:06
Nouvelle version de Grammalecte : v0.2.3

Beaucoup de faux positifs supprimés. Certains me semblent inacceptables, il y a clairement eu des régressions avec le nouveau moteur 0.2. J’espère que c’est la dernière version 0.2.x que je produis, mais je fournirai des correctifs rapidement si on trouve encore certains problèmes à mes yeux inacceptables.

Merci à dominiko, Tbj et pitpit pour avoir rapporté ces problèmes.

Faux positifs corrigés :

Il parle de son « inquiétude passionnée » et de son ‘inspiration tragique ’ (mais son “inspiration”).
Le nez de Cléopâtre, s’il eût été plus court, ...
Vous avez l’air resplendissantes.
Il s’inquiète pour leur santé.
De quand à quand travailles-tu ?
Écrivent-ils une lettre ? (contournement du bug de Python)
Mais, échappa-t-elle... Échappa-t-elle ?
Quelqu’un joue du piano.
Son manque d’expertise lui interdit toute promotion.
Je comptais le lire.
Tous sauf un acceptèrent son plan.
Ils sont légion
... si vous fussiez venu hier, vous auriez pu le voir.
Des cheveux châtain clair.
Je ne peux pas la manger.
Le canal de Suez. (Dictionnaire 4.7)
Laissez cette boîte là où elle est.
Une chambre avec air conditionné.
un rendu 3D. (Dictionnaire 4.7)


En fait, il y en a d’autres que j’ai trouvés moi-même, mais je ne tiens toujours pas de journal des modifications, hormis ce qu’on me signale. :)

J’ai créé un autre logo pour le correcteur et modifié un peu les couleurs du site (trop médicales peut-être).
le 07 octobre 2012 à 19:03
Nouvelle version de Grammalecte : v0.2.4

— Beaucoup de faux positifs en moins.
— Beaucoup d’améliorations dans le préprocesseur de texte.
— De nouvelles règles qui étendent la recherche des erreurs.
— Des bugs corrigés dans les messages rapportés.
— Un contournement d’un bug concernant Hunspell : sur les gros document, au commencement, Hunspell est tellement sollicité pour vérifier l’orthographe qu’il ne donne pas toujours les informations demandées par le correcteur grammatical ; du coup, j’ai rendu le Grammalecte très insistant pour avoir les données dont il a besoin. :)
— Une option spécifique pour l’apostrophe typographique qui semble gêner pas mal de monde.

On avance vers la version 0.3 à grands pas, mais il y a encore beaucoup à faire…

J’en ai profité pour publier une nouvelle version des dictionnaires.
le 17 novembre 2012 à 20:13
pour un handicapé du français comme moi ce programme est indispensable ! merci encore pour le SUPER boulot !
le 21 novembre 2012 à 20:52
Bonjour,

Libreoffice 3.6.4 va bientôt sortir, et j'hésite en déployer la version 3.6.5 et celle là dans mon lycée. la différence pourrait se faire sur une nouvelle version de grammalecte d'ici fin janvier.

avez-vous prévu une nouvelle version dans ce laps de temps. bien évidemment une réponse positive ou négative ne vous engage pas et ne serait qu'indicative

cordialement

pierre
le 24 novembre 2012 à 19:53
Oui, il y aura une nouvelle version avant fin janvier et même probablement avant fin décembre.
le 24 novembre 2012 à 21:58
J’ai pas mal de retard à cause de tous ces problèmes avec LibreOffice 4.0, mais voici enfin la nouvelle version de Grammalecte.

La version 0.2.5 ne révolutionne rien :
— beaucoup, beaucoup moins de faux positifs ;
— un préprocesseur de texte encore amélioré ;
— quelques bugs corrigés ;
— un peu de nettoyage de code.

Le journal des modifications semble bien maigre, mais je suis content de cette version car certains problèmes de longue date ont été corrigés.

Cette version est compatible avec Python 3. Mais je ne dirai pas qu’elle est vraiment compatible avec LibreOffice 4. J’ai mis longtemps à comprendre qu’un des problèmes concernant les espaces entre les phrases ne venait pas de mon code ou de Python 3, mais d’une modification non documentée de l’API de LibreOffice 4. Cette modification est peut-être un bug, j’attends toujours la réponse des dévs sur ce point. Si ce n’est pas un bug, je serai forcé de revoir en partie et peut-être en profondeur le code de Grammalecte, notamment le système à passages multiples que j’avais commencé à mettre en place.

Quoi qu’il en soit, dans les mois qui viennent, le développement risque de connaître un fort ralentissement, car je suis par ailleurs très occupé.

Téléchargement : www.dicollecte.org…
le 24 janvier 2013 à 20:41
Version 0.2.6 :
— compatibilité avec LibreOffice 4,
— quelques bugs corrigés,
— quelques améliorations diverses.

Téléchargement : www.dicollecte.org…
le 11 mars 2013 à 12:56

Version 0.2.6


Je vois un problème : le fichier « fr.dat » est absent dans l’archive « Grammalecte-v0.2.6.oxt ».
le 13 mars 2013 à 04:59
Un oubli de ma part. Désolé.
C’est corrigé.
le 13 mars 2013 à 09:34
Merci pour cette version compatible avec LibO 4 et encore BRAVO pour tout ce travail.
le 13 mars 2013 à 12:00
Version 0.2.7 :
— quelques bugs corrigés,
— moins de faux positifs,
— quelques améliorations diverses.

Téléchargement : www.dicollecte.org…
le 01 avril 2013 à 16:31
Je ne devais plus publier de version 0.2.x, mais comme j’ai déjà fait pas mal de modifications avant de m’attaquer aux délicates opérations prévues pour la 0.3 (et comme j’en ai marre qu’on ne signale toujours les mêmes faux positifs), j’ai changé d’avis.

Version 0.2.8 :
— toujours moins de faux positifs (encore),
— amélioration du préprocesseur de texte,
— quelques bugs corrigés,
— mise en place du système de notification de mise à jour prévu par LibreOffice/OpenOffice.
le 28 mai 2013 à 15:30
Voici quelques corrections dans le fichier fr.dat de Grammalecte-0.2.8 (ça peut attendre la version 0.3) :

$ diff fr.dat.orig fr.dat
734c734
< (au le) (\w+) au # Usage impropre. Après “au”, l’article “le” est inapprprié. (Ex : Je vais à la gare, je vais au stade.)
---
> (au le) (\w+) au # Usage impropre. Après “au”, l’article “le” est inapproprié. (Ex : Je vais à la gare, je vais au stade.)
736c736
< (au la) (\w+) à la # Usage impropre. Avec un nom féminen, utilisez la préposition “à”. (Ex : Je vais à la gare, je vais au stade.)
---
> (au la) (\w+) à la # Usage impropre. Avec un nom féminin, utilisez la préposition “à”. (Ex : Je vais à la gare, je vais au stade.)
1098c1098
< attendu(e|s|es) (que?) attendu \2 # Considéré comme préposition, invariable..
---
> attendu(e|s|es) (que?) attendu \2 # Considéré comme préposition, invariable.
1977c1977
< # forme interrogatives
---
> # formes interrogatives
le 28 mai 2013 à 22:12
Ah oui, merci. C’est bien pratique d’avoir LT comme serveur. :)
le 28 mai 2013 à 22:30
Comme toujours, merci pour ce travail de longue haleine...

Il n'y a pas de mise à jour des dictionnaires avec ?

Pierre
le 05 juin 2013 à 11:51

Il n'y a pas de mise à jour des dictionnaires avec ?


Non, ça viendra avec la version 0.3. Des tas de changements ont eu lieu en vue de préparer le terrain. J’ai préféré ne pas prendre de risques.
le 05 juin 2013 à 12:25

Notification par e-mail    0