OK
AJAX error!

Les forumsDictionnaireIntroduction de mots anglais

Introduction de mots anglais

J’envisage d’introduire des noms anglais usuels qui sont fréquemment repris en français pour diverses raisons. Les proscrire du dictionnaire n’empêche pas les gens de les utiliser à tout-va et génère nombre de faux positifs inutiles.

Exemples :
dream team
king size
low cost
bad boy

Sous réserve que les mots introduits ne puissent être confondus avec une orthographe française.

Des remarques, des suggestions ?
le 28 mai 2013 à 12:13
personne ne répond ? Pour que tu te sentes moins seul je réponds alors ;-)

Moi je ne suis pas trop chaud, mais bon...
Dans les exemples que tu donnes, ce sont des "expressions" incluant des blancs ;
comment comptes entrer cela : dream, king, low, bad, good, boy ?
Cela va ressembler à un dico anglais... Il faut un "tag" différent/supplémentaire (l'étymologie 'anglais' ne me semble pas suffisant)
Je suis curieux de voir quelle méthode tu envisages...

Je me suis toujours demandé s'il y avait moyen d'intercepter des expressions pour les faire valoir comme bonne alors que chaque partie
ne l'est peut être pas : exemple : un "te deum" est pour moi valide, mais deum tout seul...
Cela couvre notamment certains mots "composés" et villes : il y a dans le dico "Angeles", mais la plupart du temps, je suppose,
on voudrait valider "Los Angeles"; actuellement

Il est parti pour Las Angeles

est tout à fait valable...
C'est aussi le cas de certains mots qui ne sont valablement utilisés que dans des expressions et proverbes (je n'en n'ai pas en tête, sorry)
En résumé, si on parvient à ne valider que certains groupes de mots (te deum, Los Angeles, da capo, etc.) et non pas les mots individuels, cela
pourrait être une base aussi pour une dream team de bad boys à low cost ;-)
le 29 mai 2013 à 08:18

Tbj :
comment comptes entrer cela : dream, king, low, bad, good, boy ?


Comme des mots indépendants. Car ils peuvent servir en diverses occasions.

Cela va ressembler à un dico anglais... Il faut un "tag" différent/supplémentaire (l'étymologie 'anglais' ne me semble pas suffisant)
Je suis curieux de voir quelle méthode tu envisages...


Je n’envisageais rien de particulier. Il y a déjà pas mal de mots anglais dans le dico. Il est toujours possible de les regrouper dans un sous-dictionnaire particulier, si besoin. Ça ne pose pas de problème particulier.

Je me suis toujours demandé s'il y avait moyen d'intercepter des expressions pour les faire valoir comme bonne alors que chaque partie ne l'est peut être pas : exemple : un "te deum" est pour moi valide, mais deum tout seul...


Oui, c’est possible. Il suffit de créer une règle adéquate dans le correcteur grammatical. Vous pouvez toujours en proposer.

Il faut toutefois se souvenir d’une chose : chaque règle alourdit le système, il est donc utile de se concentrer sur les fautes courantes ou, si possible, sur celles difficiles à trouver.

On peut par exemple créer un règle qui dit : tout mot précédent “deum” différent de “te” doit être signalé. Mais la question est : est-ce bien utile ?

Cela couvre notamment certains mots "composés" et villes : il y a dans le dico "Angeles", mais la plupart du temps, je suppose,
on voudrait valider "Los Angeles"; actuellement

Il est parti pour Las Angeles

est tout à fait valable...


Il est facile de créer une règle pour ça.

C'est aussi le cas de certains mots qui ne sont valablement utilisés que dans des expressions et proverbes (je n'en n'ai pas en tête, sorry)


Oui, il est important de se concentrer sur les confusions courantes comme : il est tant que je vienne. Je viens de créer la règle pour ça. Les confusions de ce genre sont légion. Si vous avez des idées, proposez.

En résumé, si on parvient à ne valider que certains groupes de mots (te deum, Los Angeles, da capo, etc.) et non pas les mots individuels, cela pourrait être une base aussi pour une dream team de bad boys à low cost ;-)


Valider des groupes de mots, ce serait bien, mais le correcteur orthographique en est incapable. Seul le correcteur grammatical peut le faire, mais il a déjà beaucoup à faire. Alors, je ne suis pas opposé à de telles propositions, mais il faut oublier l’accessoire et se concentrer sur l’essentiel.

Pour en revenir au sujet initial, les mots anglais, je ne pense pas qu’il soit bien à propos de contrôler le groupement de ces mots particuliers. Si quelqu’un veut écrire team au lieu d’équipe, boy au lieu de garçon/homme/mec, king au lieu de roi, etc. peu importe qu’il l’ait fait dans un groupe nominal complètement anglais.

Quelqu’un peut écrire :
— Aujourd’hui, le boss est content, avec notre teams, on a fait du bon boulot. Good job, les boys !
Yes ! Et Michel, c’est le king, il a propulsé les ventes au top. Pas comme ce looser de Bob…

Aussi critiquable que soit cette façon de parler, ça fait quand même 5 mots soulignés (sur 9 anglicismes). Qu’est-ce que ça apporte ? L’utilisateur se moque du correcteur quand il estime que ce ne sont pas des erreurs d’orthographe, et, d’ailleurs, ce n’en sont pas. Ce ne sont pas non plus des erreurs de grammaire, c’est juste la novlangue managériale. Disons que c’est seulement une faute de goût.

Bref, ça souligne en rouge inutilement, et ça empêche les correcteurs de faire leur boulot. Vous remarquerez que teams est erronément au pluriel et que looser est mal orthographié.

Mais, bon, je pose la question sur l’introduction des mots anglais dans le dictionnaire, car c’est un sujet sensible, contrairement aux mots japonais, russes, indiens ou amérindiens qui peuvent y entrer sans que personne s’en offusque le moins du monde. :)
le 30 mai 2013 à 19:32
Si l'introduction de mots anglais devait avoir une utilité dans le dictionnaire, ce serait pour proposer les équivalents français à la correction. Ainsi, par exemple, considérant « email » comme erroné, le dictionnaire proposerait « courriel » (et non uniquement émail), ou pour « marketing » proposerait « mercatique », etc. Je crains, hélas ! que la technique utilisée ne le permette.
le 12 juin 2013 à 01:23
Il faudrait refaire le correcteur orthographique pour supporter cette fonctionnalité et choisir le type de graphies qu’on veut utiliser.

Ce que vous suggérez n’est pas impossible à faire avec Hunspell, mais ce n’est pas tout à fait prévu pour ça. Tapez antitartre et faites un clic droit.
le 12 juin 2013 à 07:53
L'exemple de détartrant qui remplace antitartre est conforme à ce que je propose. Votre système d'introduction de mots ne permet pas d'introduire de mots fautifs et leurs équivalents corrects. Comment puis-je proposer, pour reprendre mon exemple, de remplacer email (e-mail) par courriel, etc. ?
Une grande variété de mots anglais a envahi le jargon des métiers et il serait heureux que le dictionnaire puisse suggérer la version française de ces mots pour en favoriser l'adoption. Cela pourrait constituer une nouvelle catégorie, au même titre que les mots classiques, réformés et modernes.
le 12 juin 2013 à 21:25
L’exemple avec détartrant, ce n’est qu’un test fait il y a fort longtemps et qui est resté tel quel parce que je n’ai jamais été très convaincu d’utiliser ce mécanisme pour forcer l’usage de certains termes.

Ce mécanisme est plutôt pensé pour se substituer au mécanisme de suggestion usuel lorsqu’il est défaillant, c’est-à-dire pour corriger les erreurs d’orthographe.
Par exemple, si vous écrivez disez, il suggère dites, faites pour fesez, puits pour puit, etc. Ces règles sont écrites en dur, parce que le mécanisme de suggestion de base n’est pas très efficace.

Votre système d'introduction de mots ne permet pas d'introduire de mots fautifs et leurs équivalents corrects. Comment puis-je proposer, pour reprendre mon exemple, de remplacer email (e-mail) par courriel, etc. ?


Effectivement, rien sur ce site ne permet de faire ça (à part faire une liste sur le forum). Il faut écrire des règles spécifiques avec la commande Hunspell REP.

Ce n’est pas compliqué, il suffit d’ajouter la règle :
REP antitartre détartrant

Comment puis-je proposer, pour reprendre mon exemple, de remplacer email (e-mail) par courriel, etc. ?


REP email courriel

(Je viens d’ajouter la règle.)

Une grande variété de mots anglais a envahi le jargon des métiers et il serait heureux que le dictionnaire puisse suggérer la version française de ces mots pour en favoriser l'adoption.


Pour ce faire, il faudrait supprimer les mots anglais du dictionnaire. Franchement, je ne vois pas supprimer les mots anglais du dico, par exemple marketing juste pour suggérer mercatique. Ça reste envisageable, mais à rebours de ce qu’on a fait jusqu’à présent.
Par ailleurs, ce serait embêtant pour LanguageTool qui reprend les termes de cette base de données. Sans compter que ce n’est pas une erreur orthographique et que ce serait brider le potentiel du correcteur grammatical, incapable de reconnaître ces mots.

Bref, ce travail-là peut être fait, mais ce n’est pas tellement le boulot d’un correcteur orthographique. Il y a d’autres moyens de faire.

Pour les puristes, il y a déjà une extension pour remplacer tous les anglicismes :
extensions.libreoffice.org…

Ça pourrait être fait aussi par le correcteur grammatical. Mais le mieux, à mon avis, ça reste les balises actives. Les balises actives (ou smart tags) sont une troisième forme de marqueurs de texte (ça souligne en pointillé rose dans LibreOffice). J’avais commencé à tester ça il y a plusieurs années, mais je n’ai jamais finalisé le prototype, faute de temps.


Cela pourrait constituer une nouvelle catégorie, au même titre que les mots classiques, réformés et modernes.


Comment voyez-vous la chose ?
4 dictionnaires sans les mots anglais et 4 dictionnaires avec les mots anglais ?

Pour ma part, je n’ai déjà pas de le temps de m’occuper du dictionnaire Vieux dont j’ai parlé il y a quelques mois (www.dicollecte.org…).
le 13 juin 2013 à 14:11
Bonjour,

La question est épineuse, c'est le moins que l'on puisse dire...

À titre personnel, je suis contre l'introduction d'anglicismes dans le dictionnaire (sauf ceux qui n'en sont plus... tels low cost qui vient d'entrer au Robert et qui peut donc être une proposition parfaitement acceptable pour dicollecte). Je ne vais pas ici développer d'argumentation par rapport à ma prise de position (ce serait trop long ;-).
Par contre, la position de compromis proposée par la mise à disposition d'une version sans 'anglicismes' ou avec 'anglicismes' du dictionnaire me semble particulièrement pertinente : il revient à l'utilisateur final de faire son choix. Cela étant, n'étant pas programmeur, j'ignore si cela est difficile à faire (à automatiser). Si j'ai bien compris, ce qui risque de poser problème, au-delà des nouvelles entrées, c'est les anciennes entrées (i.e. les anglicismes déjà présents) puisque cela requiert un traitement humain. À l'impossible, nul n'est tenu : s'il est décidé de 'marquer' des mots comme anglicismes, que cela ne concerne que les nouvelles propositions (même si des modifications individuelles, à l'occasion, par les contributeurs, contrôleurs ou éditeurs sont toujours possibles évidemment).

Du côté de la proposition de mots, cela suppose qu'il existe un marqueur quelque part (indiquant 'anglicisme' - cela peut se faire dans la liste 'belgicisme', etc. par ex.) ou un sous-dictionnaire (ce qui est peut-être plus facile ? en particulier lorsqu'un anglicisme n'en devient plus un, par simple changement du sous-dictionnaire vers le dictionnaire commun) ; et une définition précise et concertée des critères de ce que sont les anglicismes pour les contrôleurs et éditeurs de dicollecte -- par ex. 'terme absent des dictionnaires de référence et/ou pour lequel il existe une proposition de substitution des commissions de terminologie (FranceTerme), dont la fréquence d'usage (attestée par Google, uniquement pages en français ?) est d'au moins 100.000 emplois, etc.).

Du côté utilisateur, je suis d'accord avec vous sur le fait qu'il s'agit d'un vérificateur orthographique et que lui ajouter un rôle de vérification de l'admissibilité ou non de tel ou tel autre mot selon qu'il s'agit d'un anglicisme ou non, avec suggestion de l'équivalent français, n'est pas forcément une bonne idée. D'autant qu'il existe l'extension que vous signalez (même si elle n'est pas à jour, si elle est bien imparfaite, etc.) et qu'en outre, l'idée des smart tags me semble une très bonne solution (que vous, moi ou un tiers développe l'extension nécessaire ou pas). Si l'on a une double version des dictionnaires, la question ne se pose plus.

Remarques auxiliaires :
- le problème de l'impossibilité pour Hunspell de travailler sur des termes complexes (multimots) est un sacré problème... Le régler via grammalecte n'est effectivement pas la panacée. Cela va poser des problèmes encore plus sérieux avec l'introduction d'anglicismes.
- Que faire des anglicismes plurigraphiques, genre email or e-mail ;-), British En vs US English and/or Aussie English, etc. ?
- L'introduction d'anglicismes dans un vérificateur orthographique fige l'orthographe anglaise et en empêche la francisation (voir les hésitations multiples autour du mot 'multimedia' (et sa forme plurielle en particulier) dans les années 90...

Cordialement,

Paul

le 31 août 2013 à 12:20
Bonjour,

Par contre, la position de compromis proposée par la mise à disposition d'une version sans 'anglicismes' ou avec 'anglicismes' du dictionnaire me semble particulièrement pertinente : il revient à l'utilisateur final de faire son choix.


Ce truc, c’est vraiment l’idée que tout le monde a, mais personne n’a jamais été capable de me dire comment le concevoir. Qu’est-ce qui serait bien ? 8 dictionnaires, 4 sans anglicismes, 4 avec ? (En tout cas, je n’ai pas envie de me lancer dans ce genre d’ennuis.)

Je comprend que ça défrise certains puristes de voir des mots anglais comme football, camping, gangster, grizzly, iceberg, klaxon, jazz, pull, pixel, sandwich, trader et web dans un dictionnaire français, mais je pense que la plupart s’en accommodent très bien. Je pense d’ailleurs que ceux qui voudraient un dico sans anglicismes vont vite changer d’avis. ;) Très vite. Surtout que le dico ne force personne à les utiliser. Les puristes peuvent donc de facto déjà exclure d’écrire tout ce qu’ils jugent indigne de la langue française.

Par ailleurs, je n’ai jamais compris pourquoi il fallait traiter les anglicismes différemment des germanismes, des italianismes, des hispanismes, des arabismes, etc.

Si j'ai bien compris, ce qui risque de poser problème, au-delà des nouvelles entrées, c'est les anciennes entrées (i.e. les anglicismes déjà présents) puisque cela requiert un traitement humain.


On a déjà pas mal étiqueté de mots anciens, grâce à la bonne volonté des contributeurs : www.dicollecte.org…

Du côté de la proposition de mots, cela suppose qu'il existe un marqueur quelque part (indiquant 'anglicisme' - cela peut se faire dans la liste 'belgicisme', etc. par ex.)


Ça se fait déjà avec les étiquettes étymologiques.

ou un sous-dictionnaire (ce qui est peut-être plus facile ?


En fait, je me suis trompé en affirmant qu’on pourrait facilement mettre tout ça dans un sous-dictionnaire. Comme certains termes anglais sont touchés par la réforme, ce n’est pas possible. Un mot ne peut être attribué qu’à un seul sous dictionnaire.

une définition précise et concertée des critères de ce que sont les anglicismes


Pour nous c’est un mot emprunté à la langue anglaise. C’est la définition commune.

Du côté utilisateur, je suis d'accord avec vous sur le fait qu'il s'agit d'un vérificateur orthographique et que lui ajouter un rôle de vérification de l'admissibilité ou non de tel ou tel autre mot selon qu'il s'agit d'un anglicisme ou non, avec suggestion de l'équivalent français, n'est pas forcément une bonne idée. D'autant qu'il existe l'extension que vous signalez (même si elle n'est pas à jour, si elle est bien imparfaite, etc.) et qu'en outre, l'idée des smart tags me semble une très bonne solution (que vous, moi ou un tiers développe l'extension nécessaire ou pas).


Une bonne idée, peut-être, mais pas prioritaire. J’ai vraiment mieux à faire que de forcer les gens à éviter d’utiliser les anglicismes, ce que toute personne soucieuse de ce point saura faire elle-même si elle le désire… À mes yeux, bien que je sois d’une certaine manière un puriste, les emprunts lexicaux à d’autres langues ne sont pas un problème. Le français souffre de bien d’autres maux que celui-ci. On n’a vraiment pas besoin de l’anglais pour faire n’importe quoi. Par ailleurs, un correcteur orthographique peut-il rivaliser avec le mimétisme (voire le moutonnisme), j’en doute. Un peu donquichottesque, tout ça.

Que faire des anglicismes plurigraphiques, genre email or e-mail ;-), British En vs US English and/or Aussie English, etc. ?


Dans le fond, on fait nous-mêmes beaucoup de suivisme de l’usage. Que l’usage importe le terme anglais, américain ou australien, on s’en moque royalement, on prend ce qui est utilisé et on évite les variantes graphiques si on le peut.

L'introduction d'anglicismes dans un vérificateur orthographique fige l'orthographe anglaise et en empêche la francisation (voir les hésitations multiples autour du mot 'multimedia' (et sa forme plurielle en particulier) dans les années 90...


C’est une bonne remarque. Mais on a la réforme pour les graphies nouvelles (qui personnellement me hérissent le poil ; gentleman-farmeur, c’est moche).
Le pluriel des noms en apposition ne concerne pas que les mots anglais, mais tous les mots, et, oui, c’est un problème.
le 03 septembre 2013 à 12:19

Ce truc, c’est vraiment l’idée que tout le monde a, mais personne n’a jamais été capable de me dire comment le concevoir. Qu’est-ce qui serait bien ? 8 dictionnaires, 4 sans anglicismes, 4 avec ? (En tout cas, je n’ai pas envie de me lancer dans ce genre d’ennuis.)


N'étant pas programmeur, je n'ai évidemment aucune idée quant à la faisabilité de cette proposition de dédoublement des dictionnaires... Je pensais naïvement que la présence d'un marqueur permettrait de distinguer facilement les données moyennant quelque moulinette. Donc si pas faisable parce que trop compliqué, mangeur de temps, etc. autant laisser de côté.

Je comprend que ça défrise certains puristes de voir des mots anglais comme football, camping, gangster, grizzly, iceberg, klaxon, jazz, pull, pixel, sandwich, trader et web dans un dictionnaire français, mais je pense que la plupart s’en accommodent très bien. Je pense d’ailleurs que ceux qui voudraient un dico sans anglicismes vont vite changer d’avis. ;) Très vite. Surtout que le dico ne force personne à les utiliser. Les puristes peuvent donc de facto déjà exclure d’écrire tout ce qu’ils jugent indigne de la langue française.
Par ailleurs, je n’ai jamais compris pourquoi il fallait traiter les anglicismes différemment des germanismes, des italianismes, des espagnolismes, des arabismes, etc.



Je ne suis pas un puriste, loin de là. Par contre, et c'est pour cela que j'insistais sur ce point, il faut bien fixer une limite à moins que l'on ne souhaite faire un vérificateur orthographique pour l'anglais (et l'espagnol, l'arabe, etc. si l'on traite tout sur pied d'égalité) ; je n'ai peut-être pas bien compris ce qu'il y a derrière la notion d'emprunt et ce qui suit rejoint peut-être ce que vous vouliez dire ; ce que je proposais (de manière sans doute pas assez claire) était de disposer d'un critère simple et pratique, de nature à éviter maux de tête et débats sans fin : accepter automatiquement tout terme déjà présent dans les dictionnaires de référence utilisés par Dicollecte (donc, je crois, tous les termes que vous citez en exemple et dont on se fiche qu'il s'agisse ou non d'anglicismes puisqu'adoubés par les dictionnaires, ils sont désormais des emprunts bienvenus), mais en écartant ceux de ces termes qui font l'objet d'un équivalent officiel des commissions de néologie.
Ce raisonnement serait applicable à tout emprunt de quelque langue qu'il soit (d'où pas d'inégalité).
Last but not least (hihihi), rappelons quand même que, comme dernière pièce dun édifice visant à gérer les anglicismes (toujours dans l'optique d'éviter maux de tête et débats sans fin), il est toujours possible d'activer la vérification d'un contenu simultanément en français et en anglais. dicollecte respecterait alors l'orthodoxie commune en matière d'anglicismes en se fondant sur une règle simple et sans pour autant empêcher quiconque le souhaite to use as many anglicisms as they like in their writings.
le 04 septembre 2013 à 18:50
Une précision par rapport à la finale de mon message précédent : vérifier 'simultanément' en anglais et en français au sens où si une graphie est définie comme erronée en français, on peut toujours vérifier si elle est correcte en anglais. La manipulation est certes laborieuse aujourd'hui et une vérification multilangue véritablement simultanée n'est encore que balbutiante dans les suites bureautiques alors que des éditeurs de texte comme Notepad++ avec l'extension DSpell la supportent...
le 04 septembre 2013 à 23:13

paulau :
N'étant pas programmeur, je n'ai évidemment aucune idée quant à la faisabilité de cette proposition de dédoublement des dictionnaires... Je pensais naïvement que la présence d'un marqueur permettrait de distinguer facilement les données moyennant quelque moulinette. Donc si pas faisable parce que trop compliqué, mangeur de temps, etc. autant laisser de côté.


Il n’existe aucun sélecteur permettant de filtrer le dictionnaire, aucune interface dans les logiciels pour opérer cette sélection. Il n’existe que deux possibilités : un mot se trouve dans le dictionnaire ou il ne s’y trouve pas. Les étiquettes apposées n’ont aucun contrôle sur le correcteur. Elles sont purement informatives.
Du coup, le seul choix, c’est de sélectionner les mots en amont ou de multiplier les dictionnaires. Et quatre, c’est déjà beaucoup.

Je ne suis pas un puriste, loin de là.


Je fais de l’ironie bien sûr, mais “puriste” n’est pas très péjoratif dans ma bouche, puisque je me qualifie moi-même ainsi. Seulement je (me) modère. ;) On ne peut pas faire un dico sur ses seules préférences.

accepter automatiquement tout terme déjà présent dans les dictionnaires de référence utilisés par Dicollecte (donc, je crois, tous les termes que vous citez en exemple et dont on se fiche qu'il s'agisse ou non d'anglicismes puisqu'adoubés par les dictionnaires, ils sont désormais des emprunts bienvenus), mais en écartant ceux de ces termes qui font l'objet d'un équivalent officiel des commissions de néologie.


Les commissions de néologie arrivent trop souvent après la bataille… heureusement ou malheureusement, ça dépend des cas, à mon humble avis. Pour l’instant, on peut étiqueter les mots avec le tag mci (mot contre-indiqué), mais on s’en sert peu puisque ça ne change rien. Et ça ne viendra qu’avec les smart tags qui pourront faire des signalements discrets, un jour que j’aurai le temps de m’occuper de ça. (Mon prototype ne fonctionne plus depuis la version 4 de LO, quelqu’un a cassé l’API, et auparavant ça entrait apparemment en conflit avec le correcteur grammatical, ça prendra du temps de démêler tout ça.)
Sinon, d’accord sur votre raisonnement.

Une précision par rapport à la finale de mon message précédent : vérifier 'simultanément' en anglais et en français au sens où si une graphie est définie comme erronée en français, on peut toujours vérifier si elle est correcte en anglais. La manipulation est certes laborieuse aujourd'hui et une vérification multilangue véritablement simultanée n'est encore que balbutiante dans les suites bureautiques alors que des éditeurs de texte comme Notepad++ avec l'extension DSpell la supportent...


Un jour, j’implémenterai probablement mon propre correcteur orthographique dans LO (la moitié du boulot est déjà fait, la reconnaissance, ne manque plus qu’un mécanisme de suggestion meilleur que celui de Hunspell), et cette option peut être implémentée, je l’ai vue dans une extension. On peut créer son propre correcteur et aller voir dans les correcteurs voisins si ça nous chante. ;)

Mais tout ça… tout ça demande beaucoup de temps. En fait, il faudrait bosser à temps plein sur ces questions pour avancer vraiment. Et j’y passe déjà bien trop de temps, trop pour mon propre bien.
Pour le moment, ma priorité reste Grammalecte, toujours largement sous-exploité. La prochaine version devrait étendre pas mal la superficie de détection des erreurs, sans modifier le moteur, juste en exploitant mieux le préprocesseur de texte.
le 05 septembre 2013 à 08:16
Je reviens à la question initiale qui porte sur la pertinence d'introduire des mots anglais dans le dictionnaire. Je pense que de la même manière qu'il revient à ceux qui veulent éviter les anglicismes de ne pas les utiliser, il incombe aux anglomanes de tout poil d'accepter que le correcteur orthographique rejette des mots ou de les intégrer à leur propre dictionnaire.

Le correcteur pourrait néanmoins suggérer à l'utilisateur de changer la langue du mot ou d'un groupe de mots fautifs et lui donner la possibilité de le faire de manière immédiate (via un menu contextuel voire un raccourci clavier une fois que la langue de substitution aura été choisie).

D'une manière générale, pour bénéficier d'une correction orthographique efficace, l'utilisateur doit être conscient de l'utilisation qu'il fait de plusieurs langues. Si la langue d'un mot devait ne plus être clairement identifiable par la personne qui l'utilise, il s'agirait alors d'un mot qui a été complètement intégré à la langue et il devrait faire partie du dictionnaire.

Il y a aussi des mots (souvent mots-valises) qui sont à consonance étrangère et pourtant fautifs dans les deux langues, comme par exemple surbooking qui est à la fois fautif en français (surréservation) et en anglais (overbooking). Le correcteur français ne saurait proposer (voire substituer) que surréservation alors que le correcteur anglais pourrait ne rien proposer (ce qui n'est cependant pas le cas de celui de mon navigateur). Nonobstant, si l'utilisateur devait indiquer au correcteur qu'il s'agit d'un mot anglais, il comprendrait que le mot est également fautif dans cette langue.

En relisant les exemples initiaux, qui tiennent plutôt des expressions idiomatiques que du dictionnaire, j'imagine mal qu'ils puissent être interprétées par le rédacteur autrement que comme tels.
le 05 septembre 2013 à 13:38
Plevr,

Par rapport à votre proposition de suggérer une suggestion de modification de langue : ce mécanisme est déjà plus ou moins implémenté aujourd'hui dans OpenOffice/LibreOffice. Lorsqu'un mot est souligné comme éventuellement erroné et que l'on ouvre la boîte de dialogue du vérificateur, le premier champ de la boîte de dialogue permet de modifier la langue de vérification pour le mot concerné. Si le mot est reconnu dans la nouvelle langue spécifiée, le changement de langue opéré pour le mot concerné est conservé dans le document (on peut le constater dans la barre d'état). Entre parenthèses, cette pratique est d'autant plus adéquate que le marquage linguistique de mots d'une autre langue par rapport à la langue principale d'un document est une bonne pratique en termes d'accessibilité (synthèse vocale pour malvoyants). Si le mot est erroné dans la nouvelle langue choisie, des suggestions sont évidemment proposées pour cette langue et on peut corriger.

J'indiquais dans un message précédent que la manip n'est malheureusement pas des plus simples (trop de manip pour l'utilisateur lambda ou trop long pour l'utilisateur pressé) et regrettais qu'il ne soit pas possible de charger deux dictionnaires (de base vs dictionnaires utilisateur). Par contre, en investiguant les options de ligne de commande du vérificateur Hunspell (option -d), j'ai constaté qu'on pouvait charger plusieurs dictionnaires de base : il est donc possible de vérifier un texte en franglais. Le problème, c'est que ce n'est apparemment pas possible aujourd'hui dans l'implémentation des appels passés par Open/LibreOffice à Hunspell...

Cela ne règle évidemment pas la question de fond : 'tel mot est-il un anglicisme ou non et doit-il être ou non intégré dans dicollecte ?' (pour laquelle je proposais un critère pratique, dont l'arbitraire serait fondé sur autre chose que les méninges des contributeurs à dicollecte).
le 05 septembre 2013 à 17:45
Paulau,

Effectivement, l'option de changement de langue est rébarbative, surtout pour une utilisation soutenue. Nous, les puristes, pourrions nous en réjouir dans la mesure où cela gêne la pratique du franglais mais devons le déplorer dans la mesure où l'utilisateur incriminera plutôt le correcteur.

Il me semble que dès lors qu'une langue secondaire a été utilisée dans le document, le correcteur (moyennant réglage) pourrait automatiquement basculer de la langue principale à la langue secondaire en cas de mot fautif mais devrait tout de même souligner le mot différemment pour avertir le rédacteur si le mot fautif dans la langue principale mais pas dans la secondaire. On pourrait imaginer que ce dernier pourrait accepter le basculement vers la langue secondaire d'un simple raccourci clavier (la touche arrêt défilement y trouverait une nouvelle raison d'être : elle validerait le dernier mot souligné qui la précède, que ce soit pour en changer la langue dans la situation que je viens de décrire, ou pour ajouter un mot au dictionnaire personnel).
le 05 septembre 2013 à 21:39
Pevr,

Je subodore une difficulté, liée aux capacités matérielles de l'informatique : la lenteur (dans la doc. d'Hunspell, il y a déjà un avertissement, si j'ai bon souvenir, sur la dégradation potentielle des performances du système en cas d'utilisation de dictionnaires multiples) ; d'autant qu'un mot peut être présent dans de nombreuses langues et que si l'algorithme doit aller fouiller dans plusieurs dictionnaires de base pour savoir quelle langue autre que la langue principale est susceptible de convenir, on n'est pas sorti de l'auberge ; et la commodité pour l'utilisateur risque de se retourner contre le vérificateur par perte de patience.

Par contre, pour ce qui concerne les dictionnaires personnels, sauf erreur de ma part, il manque une fonctionnalité élémentaire au système des dictionnaires personnels : la possibilité de spécifier celui dans lequel on souhaite enregistrer un mot (il me semble que c'est possible dans la suite MS Office depuis Word 2007) et cela s'est vraiment ennuyeux (je travaille en général avec 4 ou 5 dictionnaires personnels en sus du dictionnaire de base). Mais peut-être me trompé-je ?


le 05 septembre 2013 à 22:50
Paulau,

dégradation potentielle des performances du système en cas d'utilisation de dictionnaires multiples



Il ne s'agirait pas de détecter la langue du mot en inspectant tous les dictionnaires mais bien d'utiliser, quand le mot est fautif dans le dictionnaire du texte principal, le dictionnaire de la langue secondaire déjà utilisée pour un mot dans le document. Ainsi, la fonctionnalité serait effective dès lors qu'un mot au moins dans le document a été balisé comme appartenant à une autre langue que le correcteur considèrera comme la langue secondaire.

Par ailleurs, j'appuie ton observation sur les dictionnaires personnels et ajoute que ceux-ci devraient (s'ils ne le sont pas déjà, mon utilisation de ceux-ci étant minimale) pouvoir être liés à une langue (ou pas s'agissant des noms propres).
le 05 septembre 2013 à 23:03
Ah oui, je comprends mieux ta suggestion maintenant et, effectivement cela serait pas mal.
Pour les dictionnaires personnels, il est possible de les affecter à une langue ou à aucune langue en particulier (et c'est effectivement ce que je fais pour les noms propres - lors de la création d'un dictionnaire utilisateur, on spécifie 'Toutes' dans le champ 'Langue').
Au passage, je viens de découvrir quelque chose que j'ignorais (LibreOffice 4.01, peut-être pas implémenté dans les versions antérieures) : au cas où tu ne connaîtrais pas : lors de la création d'un dictionnaire utilisateur, on peut aussi spécifier qu'il s'agit d'une liste noire (mots déconseillés) en cochant la case Exception. On peut ensuite y spécifier le mot recommandé. J'ai testé avec 'software' (admis par dicollecte) et ai spécifié 'logiciel' ; lors de la vérification, software a bien été souligné comme mot potentiellement erroné et la suggestion était bien 'logiciel' (et rien d'autre).
le 06 septembre 2013 à 00:30
Si dicollecte admets software alors le vers est déjà dans le fruit. Je vois qu'il est dans plusieurs sources (TLFi, Wiktionnaire et Larousse). Mais que fait la police ?
le 06 septembre 2013 à 09:03

pevr :
il incombe aux anglomanes de tout poil d'accepter que le correcteur orthographique rejette des mots ou de les intégrer à leur propre dictionnaire.


Non, rejeter les mots anglais courants pose trois problèmes :
1. Quand les utilisateurs voient trop de choses correctes soulignées en rouge (un anglicisme n’est pas une erreur d’orthographe), ça perturbe la recherche des véritables erreurs. Autrement dit, certaines erreurs d’orthographe de français ne sont pas vues parce que le correcteur fait trop de bruit (trop de rouge dans le texte).
2. Plus grave encore, tout mot non reconnu nuit à la correction grammaticale. Le correcteur grammatical a besoin d’identifier les mots. Un mot inconnu est susceptible de laisser passer des erreurs de grammaire, voire d’induire le correcteur en erreur avec les règles qui tolèrent un certain flou.
3. Les francophones sont aussi susceptibles de faire des erreurs d’orthographe ou de frappe sur les mots anglais qu’ils emploient souvent. Il est donc utile de les aider à les repérer et à se corriger. S’ils utilisent des mots anglais, il est préférable qu’ils les écrivent correctement.

Le correcteur pourrait néanmoins suggérer à l'utilisateur de changer la langue du mot ou d'un groupe de mots fautifs


On fait des dictionnaires avec ce qui existe. Faire un dictionnaire en fonction de ce qui n’existe pas n’a pas beaucoup de sens. Si cette possibilité existait, on s’en servirait, mais ça n’est pas le cas. Par ailleurs, le correcteur orthographique est un module esclave, il ne commande rien du tout. Il ne fait qu’une seule chose : répondre aux questions que lui posent les autres logiciels. Il n’y a guère que deux questions : dis-moi si ce mot existe dans cette langue (OUI/NON) ; donne-moi la liste des mots proche de ce mot. (Hunspell répond à une troisième question : quelles sont les étiquettes apposées sur un mot.) Le correcteur n’a aucun pouvoir sur les applications qui l’utilisent. Le correcteur porte un mauvais nom : ce n’est qu’un répondeur, il ne fait qu’informer les logiciels, qui décident ce qu’il faut faire en fonction des réponses données. Autrement dit, si vous voulez que les applications offrent plus de choix en matière de correction orthographique, aussi curieux que ça puisse paraître, ce n’est pas au correcteur orthographique qu’il faut le demander, mais aux applications qui utilisent le correcteur (LibreOffice, Firefox, etc.).

D'une manière générale, pour bénéficier d'une correction orthographique efficace, l'utilisateur doit être conscient de l'utilisation qu'il fait de plusieurs langues.


Utiliser des emprunts lexicaux, ce n’est aucunement utiliser une autre langue. Un dictionnaire doit pouvoir répondre au sujet des emprunts lexicaux. Toutes les langues empruntent, déforment, mésusent.
Par ailleurs, non, l’utilisateur n’a pas forcément vos priorités, ni besoin qu’on lui signale ce qu’il ne veut pas nécessairement savoir, surtout s’il le sait déjà. Ponctuer le texte de signaux inutiles, ce n’est pas aider l’utilisateur. Suggérer peut être utile, mais seulement si c’est requis. Signaler par exemple que hardware est un anglicisme, est-ce bien utile ? L’utilisateur le sait déjà, et s’il ne veut pas écrire matériel, ça le regarde.

Il y a aussi des mots (souvent mots-valises) qui sont à consonance étrangère et pourtant fautifs dans les deux langues, comme par exemple surbooking qui est à la fois fautif en français (surréservation) et en anglais (overbooking). Le correcteur français ne saurait proposer (voire substituer) que surréservation alors que le correcteur anglais pourrait ne rien proposer (ce qui n'est cependant pas le cas de celui de mon navigateur). Nonobstant, si l'utilisateur devait indiquer au correcteur qu'il s'agit d'un mot anglais, il comprendrait que le mot est également fautif dans cette langue.


Les langues évoluent, empruntent et déforment. Fautif ou pas fautif, ceci n’est pas une question d’orthographe. Encore une fois, je ne suis pas opposé à utiliser des outils qui permettraient de donner plus d’informations, mais ils n’existent pas. Surbooking n’est pas plus une faute d’orthographe que parking.

paulau :
Par contre, en investiguant les options de ligne de commande du vérificateur Hunspell (option -d), j'ai constaté qu'on pouvait charger plusieurs dictionnaires de base : il est donc possible de vérifier un texte en franglais. Le problème, c'est que ce n'est apparemment pas possible aujourd'hui dans l'implémentation des appels passés par Open/LibreOffice à Hunspell...


C’est possible, mais ce n’est pas utilisé, parce que c’est susceptible de générer bien d’autres problèmes.
En agissant de la sorte, celui qui écrirait un texte français avec le dico anglais en sus ne verrait pas qu’il fait une erreur en écrivant language, license, etc. Il y a beaucoup de mots français qui ont une graphie très proche en anglais.

pevr :
Il me semble que dès lors qu'une langue secondaire a été utilisée dans le document, le correcteur (moyennant réglage) pourrait automatiquement basculer de la langue principale à la langue secondaire en cas de mot fautif mais devrait tout de même souligner le mot différemment pour avertir le rédacteur si le mot fautif dans la langue principale mais pas dans la secondaire.


Ceci n’existe pour l’instant pas. Une seule manière de souligner les fautes d’orthographe : en rouge. Tout le monde a fait du suivisme et tous les logiciels se contentent de ça pour l’instant. On fait avec.

paulau :
Par contre, pour ce qui concerne les dictionnaires personnels, sauf erreur de ma part, il manque une fonctionnalité élémentaire au système des dictionnaires personnels : la possibilité de spécifier celui dans lequel on souhaite enregistrer un mot (il me semble que c'est possible dans la suite MS Office depuis Word 2007) et cela s'est vraiment ennuyeux (je travaille en général avec 4 ou 5 dictionnaires personnels en sus du dictionnaire de base). Mais peut-être me trompé-je ?


C’était possible avant. Je pense que c’est un bug, vous devriez le signaler.

pevr :
Si dicollecte admets software alors le vers est déjà dans le fruit. Je vois qu'il est dans plusieurs sources (TLFi, Wiktionnaire et Larousse). Mais que fait la police ?


Un mot admis dans les dictionnaires de référence et utilisé plus de 15 millions de fois sur les pages francophones, oui, ce mot a parfaitement sa place chez nous.
le 07 septembre 2013 à 14:32
Je comprends votre point de vue. Dans ce cas j'imagine que grammalecte pourrait prendre le relais en matière de bon usage si, par exemple, un emprunt devait avoir un équivalent moins populaire voire pourrait mettre ces mots en italique.

Je comprends également votre hantise des faux-positifs mais j'ai la naïveté de croire qu'un correcteur a aussi vocation à accompagner le rédacteur dans une meilleure utilisation de la langue.

À quoi bon utiliser un correcteur orthographique quand on utilise des mots anglais à tout-va ? Bientôt il faudra intégrer le langage SMS, car après tout, il fait aussi partie de l'usage. Sé mots 6 ndevrè ils pa êtr ajoutés ds ldictionR ?
le 08 septembre 2013 à 01:40
Le SMS ne se soucie ni d’orthographe ni de grammaire, ça ne nous concerne donc pas.

Je comprends également votre hantise des faux-positifs mais j'ai la naïveté de croire qu'un correcteur a aussi vocation à accompagner le rédacteur dans une meilleure utilisation de la langue.


Laisser le correcteur orthographique faire son boulot et militer pour l’amélioration des outils existants, c’est le meilleur moyen d’obtenir des résultats utiles pour tout le monde. Lister les anglicismes, les néologismes et tous les mots qu’on pourrait signaler d’une manière ou d’une autre, ce n’est qu’une question d’étiquetage, mais il manque des outils pour les utiliser, nous manquons de possibilités, les logiciels ne nous en offrent pas beaucoup. Ce point est encore très négligé en aval. (Il faut dire que vu l’état des dictionnaires libres, personne ne se lance dans l’affaire parce qu’il n’y a rien à proposer. Le dictionnaire français que nous concevons ici est très largement en avance sur la grande majorité de ses homologues en matière d’étiquetage.)

Je comprends votre point de vue. Dans ce cas j'imagine que grammalecte pourrait prendre le relais en matière de bon usage si, par exemple, un emprunt devait avoir un équivalent moins populaire voire pourrait mettre ces mots en italique.


Le correcteur grammatical est lui aussi un module esclave. Il n’a que les pouvoirs qu’on lui accorde, c’est-à-dire presque aucun. En gros, lui aussi ne fait que répondre aux questions. Il n’y a guère qu’une seule question que le traitement de texte lui pose : dis-moi où sont les erreurs et ce que tu suggères le cas échéant. Et c’est tout. Il ne lui est pas accordé de mettre en italique ou de souligner d’une autre couleur, il ne choisit pas l’ordre dans lequel le texte lui est passé ni comment il est passé. En fait, il ne choisit rien, il ne fait que répondre aux questions. C’est tout. J’aimerais pouvoir souligner de la couleur que je veux, ce serait super pour la lisibilité des erreurs, mais ce n’est pas possible.

Par ailleurs, même si je pourrais effectivement souligner tous les anglicismes en bleu, nous avons pour l’instant un problème de performance qui ne nous permet pas d’écrire un nombre de règles infini. Je réfléchis à un moyen de résoudre ce problème, mais ça demande une refonte du correcteur (beaucoup de temps et de travail donc, mais c’est sur ma liste “à faire”). Priorité est donc donnée à la grammaire. Quand ce sera résolu, il suffira de mettre une option pour les anglicismes et le reste, et plus rien ne s’y opposera.

L’autre possibilité, ce serait d’utiliser les “SmartTags” (une troisième manière de souligner le texte). Mon prototype fonctionnait sur LO 3.x, mais provoquait un conflit avec le correcteur grammatical que je n’ai jamais réussi à résoudre. Du coup, ça reste dans les cartons en attendant d’avoir le temps et de trouver une idée pour que les deux fonctionnent ensemble. Avec LO 4, ça ne fonctionne plus, l’API a dû changer ou il y a un bug dans LO, je ne sais pas. Pas eu le temps de m’y intéresser.

Dernière possibilité, écrire un module similaire au formateur de texte pour faire du remplacement automatique ou à la demande. Le formateur de texte, lui, prend le contrôle du traitement de texte, ses possibilités sont bien plus grandes. On pourrait faire vraiment des tas de choses avec, mais encore une fois je n’ai pas le temps de tout faire.


Pour en revenir au dictionnaire et aux mots qu’on intègre, sachez que la politique du dictionnaire a été tracée entre 2007 et 2010 par les plus gros contributeurs et moi-même et qu’elle n’a guère changé depuis lors. Nous avons eu beaucoup de mal à nous mettre d’accord. Il y a eu pas mal de débats à propos de beaucoup de choses, beaucoup de ces discussions ne sont pas sur ce forum, qui n’existait pas encore alors, mais sur celui d’OOo (la section n’existe plus), ou dans les propositions de mots, c’était parfois par mails aussi. Nous tenons une position plutôt intermédiaire entre pas mal d’extrêmes. Entre les puristes de la langue française, ceux qui nous accusent de laxisme et qui pensent qu’on accepte trop de mots (de mots français), ceux qui nous trouvent trop rigides et qui voudraient qu’on liste absolument tout, les réformistes qui nous trouvent trop archaïques, les classicistes qui nous ont accusés d’être trop réformistes et d’œuvrer en douce pour la réforme, etc., il est difficile de trouver un milieu à peu près correct. Quoi qu’on fasse, on est sujet de l’ire des uns ou des autres. Du coup, je suis assez blasé par ces querelles et je vous parais sans doute inflexible. Dans le fond, je m’en tiens aux décisions d’autrefois, on ne peut de toute façon pas satisfaire tout le monde ni changer de politique tous les matins, ça demande trop d’efforts. Quand je souhaite une nouvelle orientation, je pose la question, on discute, et voilà. Du coup, vu la teneur de cette discussion, je ne vais pas ajouter d’anglicismes outre mesure, mais je ne vais pas pour autant revenir en arrière et défaire ce qui a été fait. La politique du dico va rester la même.
le 08 septembre 2013 à 10:59
Je note qu'Andidote (canadien) introduit de nombreux anglicismes, probablement pour les mêmes raisons. Il souligne l’anglicisme et propose un mot français. par exemple upgrade est accepté par antidote. Il connait aussi quelques noms de marque comme OpenOffice et LibreOffice.
le 22 septembre 2013 à 10:54

Notification par e-mail    1