OK
AJAX error!

Les forumsDictionnaireStructure du dictionnaire : apostrophe, séparatrice des mots

Structure du dictionnaire : apostrophe, séparatrice des mots

Depuis le début, l’apostrophe est, dans notre dictionnaire, un caractère faisant partie intégrante des mots. C’est pourquoi il fallait générer toutes les formes fléchies avec les formes élidées pour que celles-ci soient reconnues.
L’avantage de ce choix, c’est que ça nous permettait de signaler nombre de graphies erronées, comme « j’avait », « m’écarté », « l’instituts », etc. Grâce à cette conception, le dictionnaire offrait au correcteur orthographique la possibilité de détecter des erreurs de grammaire.
L’inconvénient, c’est que, pour ce faire, il a fallu écrire une structure du dictionnaire très complexe qui est coûteuse pour le mécanisme de suggestion.

À présent, l’apostrophe va être considérée comme un séparateur de mots. Les associations de mots connus séparés par une apostrophe seront donc dorénavant toutes considérées comme valides par le correcteur orthographique. C’est le correcteur grammatical qui se chargera de vérifier les combinaisons grammaticalement incorrectes.

Néanmoins, pour un temps, je vais continuer à fournir parallèlement les dictionnaires avec l’ancienne structure.

Note : L’apostrophe reste toutefois aussi un caractère acceptable pour la composition des mots. Elle sera considérée de la même manière que le trait d’union.
le 03 juin 2015 à 11:10
Nouvelle étiquette (dans le champ lexical) : “pel”, qui signifie “pas d’élision”.

Cette étiquette permettra (quand les étiquettes lexicales seront incluses dans les données du correcteur) de signaler des formes élidées erronées comme “l’haut”. Mais ce sera le correcteur grammatical qui signalera l’erreur, et les suggestions seront meilleures que celle du correcteur orthographique.
le 11 juin 2015 à 19:15
C'est dommage, car cela fait perdre la correction de quelques fautes dans Impress, Draw et Calc. Mais si c'est pour la bonne cause...
le 11 juin 2015 à 20:44
Les dictionnaires avec l’ancienne structure seront toujours fournis. Il va y avoir un temps d’adaptation pour régler tous les détails. Nous entrons en zone expérimentale. Au pire, il sera toujours possible de revenir à l’ancien format pour LO/OO, si ça coince vraiment.
le 11 juin 2015 à 20:59
Il faudrait surtout que LO se mette à utiliser la correction de grammaire dans Impress et éventuellement Calc
le 13 juin 2015 à 11:19
J'avoue trouver dommage de ne plus prendre en compte l'apostrophe dans le dictionnaire :

* de nombreux programmes utilisent Hunspell mais pas de correcteur grammatical. Moins d'erreurs vont donc être détectées. Je suppose aussi que pas mal d'utilisateurs de LibreOffice utilisent Hunspell sans Grammalecte ou LanguageTool.
* pour trouver les erreurs dans LanguageTool, il va falloir modifier les étiquettes et revoir pas mal de règles je suppose. Il n'est pas en effet possible de savoir si « l'hôpital » et « l'haricot » sont correctes sans ajouter une étiquette.

le 20 juin 2015 à 06:50
Oui, j’en suis conscient. J’ai revu mon générateur de dictionnaires la semaine dernière et les versions avec gestion des formes élidées seront toujours fournies.
le 20 juin 2015 à 08:36
Est-ce que U+02BC (MODIFIER LETTER APOSTROPHE) pourrait être considéré également comme caractère séparateur en plus de U+0027 (APOSTROPHE) et U+2019 (RIGHT SINGLE QUOTATION MARK)? Son emploi devrait être considéré comme correct dʼaprès cet article (en): tedclancy.wordpress.com… (ici ça parle de lʼanglais mais je ne vois pas pourquoi ça ne serait pas le cas pour le français).
le 02 février 2016 à 18:10
En fait, ce fil n’a plus de raison d’être.
Cette modification du dictionnaire est annulée. www.dicollecte.org…
le 02 février 2016 à 18:15
Ce changement nʼest pas permis par lʼactuelle structure du dictionnaire?
le 02 février 2016 à 18:19
Si bien sûr, mais, attendu que les apostrophes ne sont pas considérées comme des séparateurs de mots dans le dictionnaire actuel, faire que le caractère ʼ (U+02BC) soit considéré comme tel n’aurait pas beaucoup de consistance.

Je viens de faire un test.
Si j’écris “l’apostrophe” avec U+2019, pas d’erreur dans le dico.
Si j’écris “lʼapostrophe” avec U+02BC, le correcteur fait la gueule. D’ailleurs, Firefox n’aime vraiment pas ce caractère, car il le souligne même quand il est isolé.

Donc, je présume que vous voudriez voir le caractère U+02BC pris en compte par le correcteur plutôt que de le considérer comme un séparateur de mots. :)
le 02 février 2016 à 18:27
Hum oui, je présume que je me suis trompée dans la terminologie. Effectivement, je souhaiterais que cette apostrophe soit comptée comme les deux autres caractères présentement compris comme tels dans le dictionnaire, si cʼest possible? Jʼen serais très reconnaissante. :)
le 02 février 2016 à 18:32
C’est fait. Ça intégrera la prochaine version du dictionnaire.

Si vous ne voulez pas patienter jusque-là, vous pouvez modifier vous-même le fichier des affixes (*.aff) du dictionnaire et ajouter la commande

ICONV ʼ ’


avec les autres commandes de ce genre. Ce qui donne :

ICONV 41
ICONV ’ ’
ICONV ʼ ’


ICONV effectue un remplacement des caractères par d’autres sur les tokens que reçoit le correcteur orthographique.

Par exemple, quand le correcteur reçoit le token «l’apostrophe» (U+2019), il le transforme en «l’apostrophe» (U+0027) avant d’examiner si ce token est valide.
La nouvelle commande ICONV spécifie que nous remplacerons désormais aussi le caractère U+02BC par le caractère U+0027 en interne avant examen.

À noter que la commande OCONV fait une conversion en sortie, et que vous pouvez forcer le correcteur, lorsqu’il fait une suggestion, à transformer certains caractères par d’autres.

Par exemple, si vous écrivez «l’amitiés» (avec une apostrophe droite), le correcteur fera une suggestion avec une apostrophe courbe.
le 02 février 2016 à 19:04
Argh, j’avais oublié que ce forum convertit automatiquement les apostrophes droites en apostrophes typographiques depuis quelque temps. :/
le 02 février 2016 à 19:09
Génial, merci beaucoup. :)
le 02 février 2016 à 19:12
Est-il possible de faire en sorte que le correcteur propose des suggestions utilisant U+02BC à la place de U+2019? (juste pour mon usage personnel)
le 02 février 2016 à 19:19
Eh bien, oui, c’est justement ce que je vous expliquais avec la commande OCONV. Si vous remplacez l’apostrophe typographique de la commande OCONV par U+02BC, le correcteur fera des suggestions avec ce caractère.

Si vous voulez que le correcteur souligne toutes les apostrophes différentes de U+02BC, il faut les supprimer de la liste des caractères de WORDCHARS et ajouter U+02BC.
le 02 février 2016 à 19:32
Cʼest bon, jʼai réussi à faire ce que je voulais. merci beaucoup :)
le 02 février 2016 à 21:57

Notification par e-mail    1