OK
AJAX error!

Les forumsDictionnaireDictionnaires Ancien et Annexe

Dictionnaires Ancien et Annexe

La plupart de ceux qui participent aujourd’hui l’ignorent probablement : la répartition des graphies entre les différents (sous-)dictionnaires a longtemps été une problématique majeure avant que nous parvenions à un résultat à peu près satisfaisant (du moins, j’ose le croire tel) concernant la réforme, et il y eut pas mal de querelles et d’hésitations.

Aujourd’hui, la problématique demeure surtout de savoir quels mots nous acceptons ou pas. Je constate que vous proposez de plus en plus de mots rares, vieux et des graphies plus ou moins désuètes dont je ne sais parfois que faire, tiraillé entre le désir de référencer l’utile, de trier le superflu, de satisfaire les exigences de tout le monde et de ne pas trop alourdir le dico. Je ne sais pas ce vous pensez de ma sélection, je ne suis pas certain d’être totalement logique sur cette question, mais comme on ne me fait pas de remarques, je ne sais pas.


## Dictionnaire Ancien

Bref, un idée me trotte dans l’esprit depuis quelque temps : créer un nouveau sous-dictionnaire (appelé Vieux) pour y ranger tout ce qui n’a plus vraiment d’usage aujourd’hui, trop rare, trop vieux pour que la plupart des utilisateurs s’en soucient vraiment. Comme je constate la recrudescence du vocabulaire ancien dans les propositions, j’imagine que ça pourra satisfaire certaines personnes (notamment Rinaldum). Et comme ça ne demande pas plus de boulot de bazarder les vieilleries dans un sous-dictionnaire que de les refuser, pourquoi pas ?

Au final, ce sous-dictionnaire Vieux servira à générer un dictionnaire Ancien, qui sera une extension du dictionnaire Classique (qui est lui-même une extension du dico Moderne).

La question, c’est : devrions-nous inclure les graphies de ce sous-dico “Vieux” dans le dico “Toutes variantes”. À mon avis, non, car le dico “Toutes variantes” a pour vocation de satisfaire ceux qui veulent pouvoir utiliser les graphies réformées ou anciennes selon leur gré. Mais je vous pose la question : qu’en pensez-vous ?


## Dictionnaire Annexe

L’autre sujet de ce fil, c’est le sous-dictionnaire Annexe, qui, jusqu’à présent, a servi de placard pour ce qui nous dérangeait mais qu’on n’a pas voulu refuser pour des raisons un peu aléatoires.
Il contient :
— des graphies anciennes, qu’on va mettre dans le sous-dico Vieux ;
— des mots désuets, qu’on va aussi mettre dans le sous-dico Vieux ;
— des mots valides (et modernes), mais dont la proximité est si proche avec des mots plus usuels qu’on a craint de valider des fautes d’orthographe : intension, côcher, status, accro, etc. En bref, des faux-amis qu’on a jugés trop redoutables.

C’est ce dernier point que je voudrais aborder. Des faux-amis, on en a laissé pas mal dans le sous-dictionnaire Commun. Alors pourquoi certains sont dans Annexe demeure un peu délicat à justifier.

Que faire ?
— Mettre tous les faux-amis dans Annexe ?
— Ne pas mettre les faux-amis dans Annexe ? (Le sous-dico Annexe devient alors inutile, on le supprime.)
— On laisse dans Annexe seulement les faux-amis les plus rares, afin de ne pas trop perturber l’usage courant ?

Votre avis ?
le 18 février 2013 à 11:18
À mon avis, si un mot est référencé par un dictionnaire suffisamment respecté, et a fortiori par plusieurs dictionnaires, on peut l'accepter automatiquement dans Dicollecte.

La question d’alourdir le dictionnaire ne se pose pas vraiment : la quantité de mémoire évolue probablement plus vite que la taille du dictionnaire Dicollecte à présent. Le taille du dictionnaire a-t-elle changé beaucoup ces dernières années ?

Cela dit, il est intéressant étiqueter les mots rares, vieux, etc. Surtout les « faux-amix ».

La correction orthographique dans l’éditeur de texte Vim permet de signaler l’usage des mots rares, qui peuvent être employés par erreur. Voir :

vimdoc.sourceforge.net…

Dans la doc de Hunspell, je vois aussi la directive WARN pour indiquer des mots corrects mais dont l'usage est rare et qui sont en fait souvent employés plutôt par erreur :

=== www.manpagez.com… ===
WARN flag
This flag is for rare words, wich are also often spelling mis-
takes, see option -r of command line Hunspell and FORBIDWARN.
===

Je ne sais pas qui utilise cette directive WARN. Je ne pense pas que LibreOffice/OpenOffice utilise cela (pas sûr), mais on peut imaginer d’autres applications qui peuvent utiliser cette information.

devrions-nous inclure les graphies de ce sous-dico “Vieux” dans le dico “Toutes variantes”. À mon avis, non, car le dico “Toutes variantes” a pour vocation de satisfaire ceux qui veulent pouvoir utiliser les graphies réformées ou anciennes selon leur gré. Mais je vous pose la question : qu’en pensez-vous ?



À mon avis il faut inclure les mots vieux dans le dictionnaire « toutes variantes ». J’utilise le dictionnaire « toutes variantes », car je ne veux pas de fausses erreurs toujours discutables. Un mot vieux n'est pas incorrecte. Je préfère donc l’inclure. Mais signaler ces mots avec la directive WARN (ou quelque chose d’équivalent) peut être utile. Peut-être que j’utiliserai cela dans LanguageTool un jour, pour signaler ces mots comme erreur possible mais pas certaine.
le 19 février 2013 à 21:25
Le nombre d’entrées dans le dictionnaire n’impacte que très peu la mémoire, je pense, mais le problème du nombre d’entrées concerne surtout la suggestion des graphies correctes qui se dégrade avec l’accroissement des possibilités et surtout, à mes yeux, la lourdeur de l’algo de suggestion (probablement un truc exponentiel) qui rame de plus en plus souvent, même sur ma machine (6 cœurs — 16 Go). Le dico français possède trop de règles qui alourdissent beaucoup le processus. Au point que la première version 3 (qui n’a jamais été publiée) pouvait prendre 30 s, voire plus, pour suggérer les graphies correctes. J’en ai parlé à l’auteur de Hunspell, qui m’a expliqué comment écrire les règles pour réduire le travail de l’algo. C’est raisonnablement utilisable, mais c’est toujours trop lourd à mon goût.

J’avais testé WARN et FORBIDWARN il y a quelques années : Firefox et OOo considéraient les mots étiquetés avec comme incorrects.

À mon avis il faut inclure les mots vieux dans le dictionnaire « toutes variantes ». J’utilise le dictionnaire « toutes variantes », car je ne veux pas de fausses erreurs toujours discutables. Un mot vieux n'est pas incorrecte. Je préfère donc l’inclure. Mais signaler ces mots avec la directive WARN (ou quelque chose d’équivalent) peut être utile. Peut-être que j’utiliserai cela dans LanguageTool un jour, pour signaler ces mots comme erreur possible mais pas certaine.


Soyons clairs, on parle ici de mots vraiment rares et vraiment vieux, pas des mots qu’on utilise comme ça. Des mots qu’on refuse à l’heure actuelle. Je ne voudrais pas être mal compris. :)

Quant aux faux-amis ? Dans Annexe ou pas ? Quelle est ton opinion ?
Pour ma part, je pense y mettre seulement ceux qui sont rares.

Les faux-amis sont déjà étiquetés avec fxa, mais je n’intègre pas les étiquettes lexicales dans les dictionnaires finaux. Penses-tu que ça pourrait être utile ?
le 20 février 2013 à 11:29
Bonjour,

je me laisse aller à quelques suggestions :

Effectivement, si le dictionnaire gagne en qualité, il perd en qualité des suggestions face aux erreurs.

Par exemple, moi je rédige surtout des textes techniques, et je n'ai pas besoin de propositions de mots du monde la chimie ou des science de la vie.

est-il possible d'avoir une option qui indiquerait que mon texte est technique, et que le correcteur ne me proposera de mots des sciences de la vie.

On peut imaginer autour du dictionnaire principal, plusieurs sous catégories : technique, sciences de la vie, chimie, etc..

et une option, soit générale, soit liée au document (mieux) qui permettrai de limiter les propositions en cas d'erreur

Pierre
le 06 avril 2013 à 14:35
Non, Hunspell ne dispose d’aucun mécanisme de sélection des suggestions.
L’étiquetage sémantique (encore très expérimental) ne peut pour l’instant servir à ça.

Pour ma part, je réfléchis à un moyen d’améliorer la suggestion du correcteur orthographique sur une approche phonétique. Mais je n’ai juste pas le temps de m’en occuper. Grammalecte reste ma priorité.

Quant à la question de ce fil, disons que je manque pour l’instant de motivation pour m’attaquer à ce nouveau chantier.
Là, j’essaie de faire passer l’extension multi-dictionnaires dans LibreOffice.
le 09 avril 2013 à 12:36

Notification par e-mail    0