OK
AJAX error!

Les forumsLanguageToolLemmes des déterminants

Lemmes des déterminants

Bonjour,

Je me présente, Rigaut Théotime, employé de LanguageTool. Je m'excuse par avance si cette question a déjà été posée ailleurs dans ces forums, mes recherches n'ont porté aucun fruit.

J'ai pu constater dernièrement que les déterminants (notés det) ont chacun leur propre lemme :


139424 1 de de mg det epi inv de T
214633 1 des des mg det epi pl des TS
140801 1 du du mg det mas sg du T
154666 1 la la mg det fem sg la L
178568 1 un un mg det mas sg 1 AN
155146 1 le le mg det mas sg le L
214632 1 les les mg det epi pl les LS
178578 1 une une mg det fem sg un AN
129834 1 au au mg prep det mas sg o A
214679 1 aux aux mg prep det mas pl oks A



Je me demandais donc s'il existait une raison pour laquelle, par exemple, "de" est considéré son propre mot plutôt que le pluriel de "des". D'abord par curiosité personnelle, et ensuite puisque cela nous empêche de générer automatiquement des suggestions par ce biais (tenter de transformer "de" singulier en son équivalent pluriel ne retourne rien, puisque "des" est son propre mot et ne partage pas de lemme avec "de").

Merci d'avance de votre réponse,
Bien cordialement.
le 30 avril 2020 à 18:04
Bonjour,

Le problème est à la fois technique mais aussi linguistique.
Le lexique est basé sur les règles de Hunspell qui comportent des limitations et, si on ne veut pas avoir à ajouter des tas de drapeaux supplémentaires, on est contraint.

Cela dit, même sans ça, le français ne brille pas particulièrement par sa cohérence. Où avez-vous lu que “des” était le pluriel de “de” ?
Le CNRTL dit que c’est plutôt le pluriel de “un” et de “une”.

Dénombrable. Un homme -> des hommes. Une femme -> des femmes.
Indénombrable. Du sable -> des sables. De la purée -> des purées.
De grands hommes ou des grands hommes ? Pluriel et pluriel.

En fait, “des”, c’est la contraction de “de” avec “les”. À la fois déterminant et préposition.

Il y a une proximité lexicale entre “de” et “des”, mais pas une relation de nombre.

Pour “au”, “aux”…
— au est masculin,
— aux est masculin et féminin,
— à la pour le féminin.
— à l’homme (masculin), à l’insouciance (féminin)…
Au et aux sont des contractions de “à” avec “le” et “les”.

Pour beaucoup de déterminants, c’est piégeux et compliqué. Peut-être qu’il serait possible de fusionner certains d’entre eux, mais vu que ce n’est pas toujours possible, je ne suis pas sûr que ce soit une si bonne idée.
Sans compter qu’il faudrait créer des règles spéciales dans Hunspell pour gérer toutes ces complications.
le 30 avril 2020 à 19:12
« Cela dit, même sans ça, le français ne brille pas particulièrement par sa cohérence. »

Tant que vous ne vous évertuez pas à lui ôter cette qualité…
le 30 avril 2020 à 20:25
Vous avez tout à fait raison quant à « de » et « des ». C'était entièrement une erreur de ma part.

En ce qui concerne notre problème, notre équipe envisage de s'inspirer voire d'implémenter le système de lexique de FreeLing pour les déterminants, puisque nous l'utilisons pour la plupart des autres langues latines ; soit quelque chose de cet ordre (dans notre format interne) :

Mot | Lemme suivi de sa description : D : Déterminant ; P : Préposition | m : Masculin ; f : Féminin ; e : Épicène| s : Singulier ; p : Pluriel

le le D m s
l' le D e s
la le D f s
les le D e p

un un D m s
une un D f s
des un D e p

au au P + D m s
aux au P + D e p

du du P + D m s
des du P + D e p


...et ainsi de suite.

J'ignore si c'est une solution envisageable pour Grammalecte, ni à vrai dire s'il est besoin d'une solution du tout ; mais voilà néanmoins où nous en sommes.
le 04 mai 2020 à 18:10
Je suggère de regarder l’étiquetage à Freeling ici :
github.com…

Les lemmes et les étiquettes semblent raisonnables.
le 05 mai 2020 à 12:47
Je vais revoir l’organisation des déterminants pour Hunspell.
J’ignore encore le détail, mais ça ne devrait faire aucune différence pour vous, si vous utilisez le lexique pour créer le vôtre.

Maintenant que j’y pense, autrefois LT utilisait son propre lexique pour les mots grammaticaux. N’est-ce plus le cas ?
le 05 mai 2020 à 13:25

Notification par e-mail    0