OK
AJAX error!

Les forumsGrammalecteDétection des apostrophes problématiques

Détection des apostrophes problématiques

Bonjour

Grammalecte et les apostrophes

Je vous ai transmis par mail un fichier sur lequel apparaissaient en rouge certaines détections qu'il me semblait judicieux de mettre en œuvre sur Grammalecte (non pas sur le formateur de texte).

Je voudrais revenir sur le problème de la détection des erreurs concernant les lettres isolées et/ou les apostrophes.

Le formateur de texte sait changer les apostrophes droites en apostrophes typographiques. Cette option est aussi activée par défaut sur le Writer. Il s'agit d'autre chose.

Les erreurs impliquant les apostrophes sont récurrentes et il est rare qu'un long texte en soit exempt (pour ne pas parler du fameux binôme qu'elle-quelle qui justifie à lui seul un signalement). C'est à Grammalecte de les signaler.

Vous trouverez dans le lien ci-après un petit fichier d'une demi-page qui contient seize erreurs impliquant des apostrophes. Le fichier de test est nommé apostrophes.odt, le fichier examiné par la macro est apostrophe-macro.odt J'ai joint également trois petites copies d'écran pour illustrer ce type de problème.

dl.dropboxusercontent.com…

Résultats sur le fichier de test:
- Word 2013 détecte 4 erreurs (celles du deuxième paragraphe)
- La macro que je vous avez reçue détecte toutes les 16 erreurs.
- Grammalecte (version 3.7 sur Libre-Office) n'en détecte qu'une seule (s attache). La 3.6.2 aucune.

Il me semble que Grammalecte devrait significativement améliorer ses possibilités de détection dans ce domaine. Si vous le souhaitez, je puis vous fournir un fichier de test plus étoffé.
le 29 janvier 2014 à 15:07
Antidote détecte les 16 erreurs
le 29 janvier 2014 à 17:44
OK, merci d’avoir pris la peine de reformuler vos demandes sur le forum.
J’ai résolu la plupart des cas problématiques. Pour les autres, il faut que je réfléchisse un peu.
le 29 janvier 2014 à 19:21
Merci de cette réaction.

Ma remarque précédente sur les apostrophes concerne la vérification des formes élidées - à cet égard, la langue française est plus touchée par cette question que bien d'autres langues.

Pour autant que je sache, la vérification des formes élidées est négligée par hunspell (et donc par OpenOffice/LibreOffice). En présence d'une forme élidée, il ne voit que deux mots qu'il vérifie individuellement et s'en satisfait. hunspell traite ainsi de la même façon s'attache et s attache. L'apostrophe n'est pas son problème: celle-ci peut être manquante et remplacée par une espace, ou bien si elle est présente, placée avant ou après une espace, voire entre deux espaces, elle peut même être doublée, qu'importe. L'apostrophe peut mener à sa guise dans nos textes sa vie d'électron libre en toute impunité.

Le nombre d'apostrophes représentant souvent plus de cinq pour cent du nombre total des mots d'un texte, ce défaut de contrôle constitue une lacune sérieuse que Grammalecte devrait être en mesure de combler.
le 30 janvier 2014 à 05:33

hunspell traite ainsi de la même façon s'attache et s attache. L'apostrophe n'est pas son problème


Ce n’est pas tout à fait vrai, mais passons. Un correcteur orthographique fonctionne mot à mot. Le mot “s” est valide, “attache” aussi. Aucune raison pour lui de dire quoi que ce soit. Vous pourriez écrire : “la lettre s est…”. Un ordinateur ne peut comprendre ce que vous écrivez. Il y a des tas de cas où les lettres isolées ne se raccordent pas au mot suivant avec une apostrophe.

Ensuite, vous rendez Hunspell responsable d’une chose qu’il ne maîtrise pas. Hunspell ne fait que répondre aux questions posées par les logiciels et ce sont ces logiciels qui utilisent l’espace comme séparateur dans tous les cas.
le 02 février 2014 à 11:04
Bonjour,

Il m'arrive d'utiliser un vocabulaire imagé mais, rassurez-vous, je ne cherche pas à rendre hunspell "responsable" de quoi que ce soit : comme il "fonctionne au mot par mot", je constate simplement que cet outil si appréciable ne peut pas être utilisé pour vérifier les formes élidées.

Faut-il pour autant que les formes élidées échappent à toute vérification? Mon sentiment est que, si le vérificateur orthographique ne s'en occupe pas, cette affaire devrait être prise en charge par le vérificateur grammatical.

Comment procéder?

Il y a trois cas de figure principaux. Examinons-les par ordre décroissant en commençant par celui qui vous semble litigieux et qui est - statistiquement et malheureusement - le plus important.

1- si l'apostrophe est manquante entre deux mots (et que le premier mot est une lettre isolée).

Ce cas vous semble litigieux parce que vous craignez alors de signaler un faux positif. Vous donnez l'exemple de: "la lettre s est" pour montrer que les élisions ne sont pas toujours nécessaires. Incidemment, je vous signale que Grammalecte 3.7 signale désormais illogiquement "s attache" (contrairement à la version 3.6.2).

Il me semble qu'une étude statistique pourrait permettre de juger de ce qui est le plus utile: soit continuer à s'abstenir de faire quoi que ce soit, soit signaler les apostrophes présumées manquantes pour les lettres isolées. Ce cas de figure concerne en effet près de 83% des élisions.

Des données statistiques

Voici quelques statistiques faites à partir d'un roman classique (Les Français de Bertrand de Jouvenel) comptant 95 886 mots et plus de 6 400 apostrophes (6,6% du total des mots).

On y trouve un peu plus de 5 300 lettres isolées (d'où le pourcentage de 83% cité plus haut). L'apostrophe est généralement suivie d'une voyelle ou de la lettre h. Il s'agit par ordre décroissant des lettres l, d, s, n, c, j, m, t et ç et des majuscules correspondantes. Voici leur nombre d'occurrences (minuscules - majuscules).

1717 (1579 l - 138 L)
1229 (1191 d - 38 D)
830 (799 s - 31 S)
671 (656 n - 15 N)
600 (323 c - 277 C)
142 (77 j - 65 J)
101 (58m - 43M)
14 (12 t - 2 T)
12 (6ç - 6Ç)

En comparaison de ces 5300 (+) cas d'élisions, on ne trouve pas dans ce roman d'autre emploi pour les lettres isolées. Je n'ai pas constaté en pratique "des tas de cas". Je doute même que l'on puisse trouver un livre standard avec plus de cinq exceptions de ce genre (soit 0,1%) à moins bien sûr qu'il ne s'agisse d'un livre sur les bienfaits de la vitamine D ou sur les grèves de la ligne C. Et même dans ce cas, on peut souvent utiliser ce signalement pour mettre une espace insécable avant la lettre isolée.

La mise à disposition d'un outil valable dans 99,9% des cas me semble préférable à l'absence de tout outil. L'arbre ne doit pas cacher la forêt.

2- si l'apostrophe est manquante entre deux mots (avec un premier terme de deux caractères ou plus)

D'ordinaire, le premier terme nous informe alors de la nécessité d'une apostrophe. Ces cas doivent bien sûr être signalés. Par exemple comme dans "lorsqu elle", "aujourd hui", "qu il".

Toujours en examinant le roman cité ci-dessus:
- Le gros bataillon des cas d'élision de ce type est fourni par les 1005 (964 qu - 41 Qu) avec un peu plus de 15,4% des élisions.
- Cela concerne aussi les termes suivants classés par ordre décroissant: 54 j(J)usqu), 29 L(l)orsqu, 18 A(a)ujourd, 15 Q(q)uelqu, 6 puisqu, 1 entr soit 125 cas pour moins de 2% des élisions.

(Noter le cas de "qu elle"/"quelle" où une vérification grammaticale particulière est souhaitable.)

3- si l'apostrophe est présente:

Dans ce cas, je n'ai pas de statistiques à vous offrir car la correction du roman a été faite. Je puis toutefois vous dire que je rencontre fréquemment des erreurs dans ce domaine.

Il faudrait vérifier systématiquement si les apostrophes sont bien placées entre deux lettres (sans espace adjacente) et non doublées. Ce n'est peut-être pas toujours suffisant mais cela paraît sans risque.

Conclusion

J'utilise également hunspell en ligne de commande, sans logiciel intermédiaire et c'est de l'étude de ses listes que je tire mes constatations. Mes listes sont à votre disposition.

J'espère vous avoir convaincu de la nécessité de sauver les bébés phoques de vérifier - toutes - les apostrophes.
le 03 février 2014 à 05:20
1. C’est le seul cas vraiment problématique.

Grammalecte 3.7 signale désormais illogiquement "s attache"


Ce n’est pas illogique. Ça ne fonctionne qu’avec un pronom sujet placé juste avant (“je”, “tu”, “il”, etc.) ou s’il y a l’adverbe de négation “ne”. Voilà pourquoi vous constatez que ça fonctionne dans certains cas et pas d’autres. Si vous écrivez « l’homme s attache », rien n’est signalé.
Ceci dit, votre argumentaire est plutôt convaincant, même si votre problématique concerne avant tout les documents numérisés qui sont plein d’erreurs de ce genre. Vos chiffres sont impressionnants uniquement à cause de ça. Pour les documents tapés, on ne rencontre pas si souvent ces problèmes, hormis l’apostrophe droite.
Je suis partagé, mais étendre la recherche d’erreurs de ce genre quitte à avoir quelques faux positifs reste envisageable. D’autres avis ?

2. Oui. OK, c’est fait. C’était déjà en partie le cas.

3. Oui, c’est normalement déjà vérifié. Si ça n’est pas le cas, c’est un bug. Je ne constate rien d’anormal de mon côté.

Il faudrait vérifier systématiquement si les apostrophes sont bien placées entre deux lettres (sans espace adjacente) et non doublées. Ce n'est peut-être pas toujours suffisant mais cela paraît sans risque.


Non, on ne peut pas procéder ainsi. L’apostrophe courbe, c’est aussi un guillemet simple. C’est surtout utilisé en anglais, mais pas seulement. C’est assez fréquemment utilisé, probablement dans les documents traduits de l’anglais.
le 04 février 2014 à 22:57
La nuit porte conseil et j’ai finalement décidé d’étendre la recherche d’erreurs sur ce point.

Concernant les lettres isolées minuscules, il faudra néanmoins que le mot précédent ne soit ni “lettre”, ni “caractère”, ni “glyphe”, et il faudra que la liaison par apostrophe engendre un mot connu du dictionnaire. Si pour une raison quelconque vous avez dans votre texte quelque chose comme “j administration” (suite à une erreur de numérisation), le correcteur ne proposera pas l’apostrophe.

Pour les lettres isolées majuscules, elles devront être en début de phrase. Et l’union doit engendrer une forme connue du dictionnaire.
le 05 février 2014 à 09:58
Bonjour,

- le cas 1 (lettres isolées) sera désormais signalé selon certaines règles.

Je suis heureux que vous ayez décidé d'étendre la recherche sur ce point. Les règles que vous vous imposez à cet égard, hormis le cas des "lettres, caractères et glyphes", me semblent superflues. L'important à mon avis est de signaler la lettre isolée pour examen. Voici pourquoi:

- Pourquoi exiger que l'apostrophe soit suivie par "un mot connu du dictionnaire"?. C'est se lier les mains de façon inconsidérée: je viens de lire un livre qui s'appelle "le pendu d'Argol". Si j'oublie l'apostrophe après le d, cela ne serait pas signalé parce que le mot Argol n'est pas dans le dictionnaire. Quel intérêt? L'important est de signaler le d isolé. C'est vrai aussi pour le L majuscule dans la phrase: "'L Irtych est un fleuve de Sibérie"

- Puisque vous prenez cet exemple, il reste judicieux aussi de signaler le j isolé qui est dans "j administration", même s'il ne n'implique pas une élision, tout simplement parce que c'est manifestement une coquille (pour "l'administration"?). Il faut signaler le j isolé.

- le cas 2 est pris en compte.

J'ai fourni une petite liste des mots de deux caractères et plus demandant l'élision. Cette liste n'a aucune prétention à l'exhaustivité et ne cite que ce que j'ai trouvé dans le roman. J'ai d'ailleurs oublié un autre couple "à problème" : quel que/quelque

- le cas 3

Vous avez marqué une réticence.

- Si vous signalez les lettres isolées, vous signalez de facto les cas où l'apostrophe a une espace à sa gauche. Inutile donc de s'en préoccuper.
- Les cas où l'apostrophe a une espace à sa droite sont toujours fautifs (au moins en français) et doivent être signalés.
- Enfin reste le cas où l'apostrophe courbe est doublée; cela peut venir, dites-vous, d'une conversion des guillemets droits anglais que l'on trouve souvent dans nos traductions. Eh bien, c'est aussi une excellente raison pour les signaler, de la même façon que l'on signale dans le correcteur orthographique les mots d'origine étrangère.

Signaler n'est pas corriger, c'est attirer l'attention, et c'est vraiment très utile. À mon avis, plus les règles de signalement sont simples, et mieux l'on s'y retrouve.

Admin :
Ceci dit, votre argumentaire est plutôt convaincant, même si votre problématique concerne avant tout les documents numérisés qui sont plein d’erreurs de ce genre.


Les besoins de correction liés à la numérisation sont aussi légitimes que d'autres en dépit du caractère parfois exécrable de ceux qui s'en occupent. Ces besoins sont souvent massifs parce qu'ils portent sur des livres entiers. L'hôpital ne discrimine aucun patient, y compris ceux qui souffrent de pathologies sévères.
le 05 février 2014 à 14:51

roger64 :
- Pourquoi exiger que l'apostrophe soit suivie par "un mot connu du dictionnaire"?. C'est se lier les mains de façon inconsidérée: je viens de lire un livre qui s'appelle "le pendu d'Argol". Si j'oublie l'apostrophe après le d, cela ne serait pas signalé parce que le mot Argol n'est pas dans le dictionnaire. Quel intérêt? L'important est de signaler le d isolé. C'est vrai aussi pour le L majuscule dans la phrase: "'L Irtych est un fleuve de Sibérie"


La remarque est pertinente, j’avais oublié les noms propres.

- Puisque vous prenez cet exemple, il reste judicieux aussi de signaler le j isolé qui est dans "j administration", même s'il ne n'implique pas une élision, tout simplement parce que c'est manifestement une coquille (pour "l'administration"?). Il faut signaler le j isolé.


Soit. C’est quand même un faux positif, mais c’est un faux positif tolérable. Je ferai peut-être autrement plus tard, car si je constate que ça pose problème, je n’aurai aucun scrupule à revenir en arrière.

J'ai d'ailleurs oublié un autre couple "à problème" : quel que/quelque


Autre sujet, autre fil. ;)

- Les cas où l'apostrophe a une espace à sa droite sont toujours fautifs (au moins en français) et doivent être signalés.


Les guillemets simples sont déjà corrigés, me semble-t-il. Mais uniquement si vous utilisez des apostrophes droites. Je considère que celui qui écrit des apostrophes courbes sait ce qu’il fait.

- Enfin reste le cas où l'apostrophe courbe est doublée; cela peut venir, dites-vous, d'une conversion des guillemets droits anglais que l'on trouve souvent dans nos traductions. Eh bien, c'est aussi une excellente raison pour les signaler […]


Oui, en effet, je n’avais pas pensé à ce cas. C’est fait.

Signaler n'est pas corriger, c'est attirer l'attention, et c'est vraiment très utile.


Oui, mais comme vous le savez, la politique de Grammalecte c’est, autant que possible, de ne pas ennuyer l’utilisateur avec de fausses alertes.

les besoins de correction liés à la numérisation sont aussi légitimes que d'autres en dépit du caractère parfois exécrable de ceux qui s'en occupent. Ces besoins sont souvent massifs parce qu'ils portent sur des livres entiers.


Je me suis déjà essayé à la numérisation il y a pas mal de temps et je vois bien les problèmes auxquels on a à faire face. Mais vous n’avez pas priorité sur les autres utilisateurs, si j’ose dire. Ils aussi sont à prendre en compte. J’ai fixé une politique sur les faux positifs, j’essaie de m’y tenir, j’ai même été trop laxiste pendant une période, faute d’avoir le temps de corriger les problèmes. Pour rappel, nous parlons ici du correcteur grammatical, qui a une politique contestable concernant les faux positifs mais à laquelle je tiens. Par ailleurs, vos problèmes sur les lettres isolées sont déjà résolus par le formateur de texte, qui, lui, ne se soucie pas des faux positifs : il traite tout massivement et fait tout le boulot en un clic, c’est même sur votre demande que j’ai amélioré ce point.
En fait, ce qu’il faudrait, c’est un 3e outil qui fasse une liste des anomalies potentielles. Ça ne perturberait pas les utilisateurs avec les fausses alertes et ça signalerait tout ce qui est douteux à part. Encore un truc sur la liste “à faire”…
le 05 février 2014 à 16:52
En effet, il ne faut pas oublier que certains vont écrire : Soit m la masse d'un objet de longueur l et de volume V. dans un texte scientifique, les lettre isolées peuvent être légion

Je trouve très agréable dans un texte scientifique de ne pas avoir un tas de signalements. Cela porte les étudiants à ne plus y faire attention.
le 05 février 2014 à 18:06

pitpit :
Soit m la masse d'un objet de longueur l et de volume V. dans un texte scientifique, les lettre isolée peuvent être légion


Bon exemple. Du coup, impossible de laisser la règle en l’état. Et même en imposant la reconnaissance par le dictionnaire des graphies jointes par apostrophe, ça posera problème. Car on peut par exemple écrire : le volume l est plus important que prévu.
Du coup, cette détection des potentielles apostrophes manquantes sera dans une option désactivée par défaut.
le 05 février 2014 à 20:08

Admin :
Du coup, cette détection des potentielles apostrophes manquantes sera dans une option désactivée par défaut.



Nous voici dans le meilleur des deux mondes (scientifique et "littéraire"). De la discussion jaillit la lumière. Merci de vos réactions constructives.

Admin :
En fait, ce qu’il faudrait, c’est un 3e outil qui fasse une liste des anomalies potentielles. Ça ne perturberait pas les utilisateurs avec les fausses alertes et ça signalerait tout ce qui est douteux à part. Encore un truc sur la liste “à faire”…



C'est vrai qu'il y aurait un outil à développer pour renifler et signaler les faux amis, les erreurs courantes que l'on rencontre à longueur de page et pas seulement dans les textes numérisés. Patience et longueur de temps...

À ce sujet, je ne sais pas si vous connaissez ce site qui n'est pas trop mal fait. Je ne peux l'utiliser que de façon ponctuelle car c'est un site en ligne et je ne peux pas y déverser un livre complet. Il dispose de quatre couleurs différentes pour l'orthographe, la grammaire, une catégorie "à examiner", et une autre "typographie et ponctuation". Incidemment, il détecte 15 des seize apostrophes fautives du fichier de test (voir plus haut).
Leur licence d'utilisation n'est pas précisée (ou alors je l'ai ratée). S'il s'agit d'un outil opensource, peut-être y aurait t-il un intérêt à les contacter? Mais à la réflexion, j'en doute, il me semble plutôt qu'ils doivent se faire les dents avant de sortir plus tard une version commerciale mais, à vrai dire, je n'en sais rien.

www.scribens.fr…

Je sais que pour le moment les API de LibreOffice vous imposent le choix d'une couleur qui n'est d'ailleurs pas la plus visible. Qui sait, cela aussi pourrait changer au fil du temps.

le 06 février 2014 à 01:29

Notification par e-mail    1