OK
AJAX error!

Les forumsDictionnairePolitique du dictionnaire concernant les abréviations

Politique du dictionnaire concernant les abréviations

Doit-on accepter dans Dicollecte, qui est un dictionnaire plutôt orienté vers l'écrit, toutes les apocopes et abréviations du langage parlé ?
Je ne dis pas qu'il faut toutes les refuser mais peut-être se limiter à ceux qui sont très très courants.

---
Admin : sujet repris de la proposition « hippo » : www.dicollecte.org…
le 14 février 2012 à 11:06

patrick_g :
Doit-on accepter dans Dicollecte, qui est un dictionnaire plutôt orienté vers l'écrit, toutes les apocopes et abréviations du langage parlé ?
Je ne dis pas qu'il faut toutes les refuser mais peut-être se limiter à ceux qui sont très très courants.


Nous ne sommes effectivement pas obligés de tout accepter dans le dictionnaire, notamment lorsque ça concerne le langage parlé, mais, comme souvent, il est nécessaire de déterminer quelle est la bonne limite.

Auparavant, les abréviations étaient interdites dans notre dictionnaire. Mais, comme je laisse la liberté aux participants de proposer et de modifier la politique du dictionnaire après discussion, nous en sommes venus à accepter les abréviations référencées dans le Larousse ou le Robert : www.dicollecte.org…

Pour autant que je me souvienne, cette règle n’a jamais été bien stricte, ni bien claire.
Pour ma part, je ne vois pas d’objection à intégrer les abréviations courantes (le flou sur la définition de courant ne me dérange pas). En revanche, je suis plus ennuyé par les mots comme héro (www.dicollecte.org…) ou accro (www.dicollecte.org…), qui sont très proches de mots usuels (respectivement héros et accroc).

Que faire donc ?
Les ôter n’est pas nécessairement satisfaisant. C’est pénible de voir des mots corrects souligner en rouge. Le correcteur grammatical peut détecter une erreur si on écrit le héro ou un héro, mais ne verra rien pour accro s’il y a une erreur. Par ailleurs, il n’y a toujours pas de correcteur grammatical pour Mozilla.

La solution peut consister à écrire un règle stricte dans la politique du dictionnaire, mais ce n’est pas pour ça que ça satisfait tout le monde. Par exemple, pour les sigles : www.dicollecte.org…

Nous sommes toujours coincés entre ceux qui veulent épurer et ceux qui veulent tout référencer. :)

Votre avis ?
le 14 février 2012 à 11:33
mea culpa. Je crois être à l'origine d'une bonne part des dernières abréviations familières.
Actuellement, je ne les mets plus qu'en proposition, mais certains ont été entrés directement dans le dico.
Je n'ai aucun problème à ce que l'on en élimine quelques uns.
Voici une liste des abr. fam. entrés dernièrement dans le dico :
psycho, ophtalmo, loco, héro (!), hélio, géo, gastro, dirlo, cyclo, croco, conso, compo.

Quand au sujet sur la ligne de conduite, moi, mon but, c'est de diminuer le nombre de mots non reconnus lorsque
l'on récupère un texte électronique (Wikipedia, livre, etc.)
Le Français est une langue vivante, et les LibreOffice/OpenOffice ne servent pas qu'à écrire des textes officiels;
si vous voulez empêcher un futur Frédéric Dard d'écrire ses œuvres avec xxxoffice, tant pis,
abandonnons nos automobiles pour de bons vieux vélocipèdes et autre voitures hypomobiles.
Adieu nanotubes, papy-boomeur et astromobile...

;-)
le 14 février 2012 à 13:00
Il ne faut pas exagéré, il ne s'agit pas d'interdire tous les mots nouveaux.
Quand on importe un texte et qu'un mot n'est pas reconnu, OoO et LibO permettent de "tout ignorer" ou, au choix, de l'ajouter au dictionnaire personnel. C'est donc un faux problème.
Si on veut éviter tout soulignement, on va rapidement se retrouver avec une bonne partie des dictionnaires des autres langues compris dans dicollecte :)

Par ailleurs, OoO et LibO sont aussi utilisés dans le milieu professionnel (si, si !). Dans ces conditions, il est assez malvenu d'envoyer aux clients un texte qui contient :
- trop d'abréviations parlées (bas niveau de langue, pas professionnel),
- des fautes qui n'ont pas été détectées parce qu'elles correspondent à une abréviation.

Le problème des abréviations, c'est que tous le monde n'a pas le même cadre de référence et qu'elles peuvent donc avoir un sens différent en fonction du lecteur. Hippo, par exemple et d'après Google, sert pour hippopotame et pour hippocampe. Dans ce cas ce n'est pas très grave mais dans d'autres ça peut mener à une incompréhension voire à un contre-sens. Il vaut donc mieux que le rédacteur soit averti de l'éventuel problème.
Personnellement, je préfère un faux positif qui laisse le choix d'accepter ou pas la graphie, qu'un faux négatif qui fait que l'erreur passe inaperçue. Mais je suis peut-être un extra-terrestre :)

Il y a certainement une solution qui convient à tous. On peut imaginer de les mettre dans un dictionnaire séparé (puisque nos traitements de texte supporte d'en utiliser plusieurs simultanément). Ou encore de les marquer avec un flag spécial qui ferait qu'ils soient soulignés dans une autre couleur (et que le correcteur orthographique propose le(s) mot(s) entier(s)) ou que Grammalecte les signale comme "mot douteux" (le correcteur de MS-Word faisait ça dans le temps, je ne sais pas si c'est toujours le cas).
S'il est possible de générer plusieurs dictionnaires/lexiques, peut-être serait-ce bien de le faire aussi pour les "jargons" (science, économie, informatique, etc.). Ça permettrait d'accepter plus facilement des mots peu courants,certains néologismes ou certains anglicismes par exemple.

P.S. : J'imagine que le futur Frédéric Dard ne voulait pas parler d'hypomobile (excavatrice ?) mais d'hippomobile (voiture à cheval) :)
le 15 février 2012 à 06:44
@ patrick_g
voilà ce qui arrive lorsque l'on recopie bêtement d'une image trouvée sur Internet !
C'est hypohyper-frustrant...

(4 éditions pour avoir le texte correct...)
le 15 février 2012 à 12:20
Pour ma part, je suis sensible à la liberté littéraire.

patrick_g :
Par ailleurs, OoO et LibO sont aussi utilisés dans le milieu professionnel (si, si !). Dans ces conditions, il est assez malvenu d'envoyer aux clients un texte qui contient :


L’entreprise, soyons clair, n’a pas plus de droit que le nouveau Céline à venir. :)

- trop d'abréviations parlées (bas niveau de langue, pas professionnel),


Personne n’impose de les employer. Il y a plein de mots grossiers dans les dictionnaires de référence…

- des fautes qui n'ont pas été détectées parce qu'elles correspondent à une abréviation.


C’est le point délicat.

Il vaut donc mieux que le rédacteur soit averti de l'éventuel problème. Personnellement, je préfère un faux positif qui laisse le choix d'accepter ou pas la graphie, qu'un faux négatif qui fait que l'erreur passe inaperçue. Mais je suis peut-être un extra-terrestre :)


C’est un choix compréhensible, mais ce n’est pas la politique de la maison. :)

En fait, le problème que tu décris concerne tous les mots, et ce n’est pas du tout spécifique aux abréviations.
Par exemple, intension (www.dicollecte.org…), pour cette raison, a été placé dans le dictionnaire Annexe. Nous avons le tag fxa pour désigner les faux-amis.

On peut imaginer de les mettre dans un dictionnaire séparé (puisque nos traitements de texte supporte d'en utiliser plusieurs simultanément).


Voilà qui est douteux. Pour avoir testé sur OOo, la gestion de plusieurs dicos pour une locale donne des résultats plutôt fantaisistes et aléatoires. Pour Mozilla, c’est un dictionnaire à la fois. Dans tous les cas, les interfaces ne sont pas pensées pour ça. Si même les distributions Linux ne proposent qu’un dico français à la fois, ce n’est pas pour rien.

Ou encore de les marquer avec un flag spécial qui ferait qu'ils soient soulignés dans une autre couleur (et que le correcteur orthographique propose le(s) mot(s) entier(s)) ou que Grammalecte les signale comme "mot douteux" (le correcteur de MS-Word faisait ça dans le temps, je ne sais pas si c'est toujours le cas).


On pourrait extraire tous les mots étiquetés fxa et les souligner avec Grammalecte grâce à une option idoine.

S'il est possible de générer plusieurs dictionnaires/lexiques, peut-être serait-ce bien de le faire aussi pour les "jargons" (science, économie, informatique, etc.). Ça permettrait d'accepter plus facilement des mots peu courants,certains néologismes ou certains anglicismes par exemple.


Il ne faut pas mélanger tous les problèmes. Le découpage en tranches du dictionnaire ne résoudra pas la problématique des faux-amis. Par ailleurs, nous n’avons étiqueté sémantiquement que 4 % du dictionnaire (en plus de six mois). Ce n’est pas demain la veille que ce sera faisable. Et, le jour où ça le sera, je gage que ceux qui voudront découper le dico par segments vont vite abandonner. C’est une fausse bonne idée, àmha, qui ne résistera pas à la pratique (peut-être envisageable quand les interfaces des logiciels pourront gérer ça correctement).
le 15 février 2012 à 15:23
Tbj : Ça arrive à tout le monde ;)

Admin :
Personne n’impose de les employer. Il y a plein de mots grossiers dans les dictionnaires de référence…


Je pensais à mes jeunes collègues qui le font sans même s'en rendre compte :(

C’est un choix compréhensible, mais ce n’est pas la politique de la maison. :)


Ça m'emplis de tristesse :)

En fait, le problème que tu décris concerne tous les mots, et ce n’est pas du tout spécifique aux abréviations.


J'en suis bien conscient, bien que "tous les mots" soit peut-être un peu exagéré.

Voilà qui est douteux. Pour avoir testé sur OOo, la gestion de plusieurs dicos pour une locale donne des résultats plutôt fantaisistes et aléatoires. Pour Mozilla, c’est un dictionnaire à la fois. Dans tous les cas, les interfaces ne sont pas pensées pour ça. Si même les distributions Linux ne proposent qu’un dico français à la fois, ce n’est pas pour rien.


J'avoue ne pas savoir comment fonctionne les dictionnaires dans Libo/OoO/Mozilla, mais je voyais plutôt les lexiques multiples gérés par Hunspell de façon transparente pour l'appli au-dessus (à l'interface qui permet la sélection des dictionnaires près).

On pourrait extraire tous les mots étiquetés fxa et les souligner avec Grammalecte grâce à une option idoine.


Cool !

Il ne faut pas mélanger tous les problèmes. Le découpage en tranches du dictionnaire ne résoudra pas la problématique des faux-amis. Par ailleurs, nous n’avons étiqueté sémantiquement que 4 % du dictionnaire (en plus de six mois). Ce n’est pas demain la veille que ce sera faisable. Et, le jour où ça le sera, je gage que ceux qui voudront découper le dico par segments vont vite abandonner. C’est une fausse bonne idée, àmha, qui ne résistera pas à la pratique (peut-être envisageable quand les interfaces des logiciels pourront gérer ça correctement).


C'était juste une idée. Je ne pensais pas à découper Dicollecte en plusieurs parties mais plutôt à ajouter de petits addenda thématiques.
le 15 février 2012 à 19:55

patrick_g :
J'en suis bien conscient, bien que "tous les mots" soit peut-être un peu exagéré.


J’aurais dû dire : toutes les catégories de mots. :)

J'avoue ne pas savoir comment fonctionne les dictionnaires dans Libo/OoO/Mozilla, mais je voyais plutôt les lexiques multiples gérés par Hunspell de façon transparente pour l'appli au-dessus (à l'interface qui permet la sélection des dictionnaires près).


L’interface de Mozilla ne permet de sélectionner qu’un seul dico à la fois.
OOo/LibO permettent d’affecter plusieurs dictionnaires à une langue, mais ça ne marche pas toujours pour une raison que j’ignore. À mon avis, rien n’est vraiment pas prévu pour ça, mais ça fonctionne mystérieusement parfois.

On pourrait extraire tous les mots étiquetés fxa et les souligner avec Grammalecte grâce à une option idoine.


Cool !


En ce moment, je travaille sur un préprocesseur de texte pour Grammalecte. Ensuite, il faut absolument que je finisse le boulot sur les synsets. On m’a encore demander de libérer le code de Dicollecte et il faut que ce soit fait avant ça.
Je verrai ce qu’on peut faire des faux-amis après ça. Ça ne devrait pas être bien compliqué.
le 20 février 2012 à 10:55

Notification par e-mail    0