OK
AJAX error!

Les forumsÉtiquetage du dictionnaireCatégories sémantiques

Catégories sémantiques

Il nous est proposé de plus en plus de mots scientifiques concernant la chimie, la biochimie, la médecine, etc., domaines dans lesquels le dictionnaire est encore assez lacunaire.

Pour nous y retrouver parmi tous ces mots, il serait bon de créer de nouvelles étiquettes lexicales. Ça fait assez longtemps que j’y songe, mais j’ai plusieurs fois ajourné cette décision, faute d’avoir le temps d’y réfléchir sereinement. Il y avait toujours plus urgent à faire. En effet, la multiplication des domaines scientifiques ne rend pas forcément aisé de savoir dans quelle catégorie se rangent certains mots.

Par exemple, pour un terme comme acétaminophène (autre nom du paracétamol), faut-il le ranger dans une catégorie biochimie, pharmacologie, ou dans un plus vaste ensemble comme biologie, chimie ou médecine ?

Le choix des catégories n’est donc pas anodin. Il est nécessaire que celles-ci soient suffisamment claires et sans ambiguïtés, afin que nous ne perdions pas de temps à décider où ranger les mots qu’on nous propose, sans compter que ceux qui s’occupent du dictionnaire (y compris moi-même) ne sont pas forcément des spécialistes en ces matières.

Dans mon Robert 2010, je vois une liste impressionnante d’étiquettes, et je ne pense pas qu’il soit utile d’inclure autant de catégories dans notre dictionnaire.

Votre avis ?
le 12 mai 2011 à 21:48
Wow, tu as fait un poste juste pour ça merci ;). Étant donné que j'ai une ancienne version du Larousse et que je me sers plus de celui ci (oui en plus...), j'ai un avis mitigé. Je pense que nous devrions choisir un étiquetage très précis et qui ne change peu ou qui grâce à l'étiquetage précis nous permette facilement de faire basculer les mots dans un autre catégorie. Car même si ce ne sont "que" des groupes on peut facilement disons avoir un groupe avec 8000 mots si l’étiquetage est trop vague. Surtout que trouver des erreurs sera plus facile, car ainsi on s'attaquera à corriger des groupes de mot plutôt que de s'y prendre mot à mot. Ça m'intéresserai de savoir de quoi a l'air l'étiquetage du Robert 2010 tu pourrais nous le montrer?
le 12 mai 2011 à 22:12
Oui, ton point de vue se défend. Ça éviterait d’avoir à revenir sur la question par la suite, mais je crains que ce ne soit une charge de travail trop importante. Nous ne sommes jamais plus que quelques-uns à travailler sur les dictionnaires.

Scans un peu pourris faits trop vite :
img34.imageshack.us…
img96.imageshack.us…
img543.imageshack.us…
img215.imageshack.us…
img339.imageshack.us…
img854.imageshack.us…
img715.imageshack.us…
le 12 mai 2011 à 22:41
J'ai aujourd'hui essayé de ranger des animaux... Bref ça c'est pas passé comme je le pensais le plus problème étant que le français donne un même nom pour une quantité d'animaux. A mon avis on devrait chercher un correcteur qui a déjà tout catégoriser, je vais voir celui du portugais (Brésil + Portugal), allemand, anglais et luxembourgeois. Si les autres n'ont pas catégoriser les mots je pense qu'on devrait laisser les pattes de ça car si on devrait le catégoriser faudrait disons 1 catégorie et 2 sous-catégories pour vraiment le catégoriser correctement.
le 13 mai 2011 à 21:48
Il est désormais possible de classer les entrées dans des catégories sémantiques. Plutôt que de les mettre dans le champ dit «lexical», j’ai préféré créer un champ «sémantique» dédié à ces étiquettes.

Allez sur n’importe quelle proposition et appuyez sur F5 pour recharger le script des listes d’étiquettes.

C’est encore en phase de tests. Pas à cause des bugs, mais parce qu’il faut encore décider des étiquettes à créer.
le 08 août 2011 à 17:27
Quelques remarques :
- Faudra faire apparaître le champs sémantique dans les listings "résultats de recherche", "propositions", etc...
- Surtout si tu comptes (faire) compléter ce champs dans les mots déjà dans le dico : fameux travail !
- Quand est-il des mots ayant une entrée dans le dico, mais 2 (ou +) significations ? Style foudre; dupliquer l'entrée ou faire comme pour le champs lexical et ajouter les étiquettes à la suite (ex. rare fam vieux -> méd astron)
le 09 août 2011 à 06:38

- Faudra faire apparaître le champs sémantique dans les listings "résultats de recherche", "propositions", etc...


Fait.

- Surtout si tu comptes (faire) compléter ce champs dans les mots déjà dans le dico : fameux travail !


Ça se fera au fur et à mesure, comme avec le champ «lexique». Au début, ce champ était pour moi anecdotique, mais les membres ont tout de suite beaucoup investi dedans.

- Quand est-il des mots ayant une entrée dans le dico, mais 2 (ou +) significations ? Style foudre; dupliquer l'entrée ou faire comme pour le champs lexical et ajouter les étiquettes à la suite (ex. rare fam vieux -> méd astron)


Contrairement champ «lexique» où l’on étiquette selon le dénominateur commun, on peut ici envisager d’ajouter les étiquettes, même si ça ne concerne qu’un seul sens de l’entrée.

En fait, tout est encore à discuter. Il manque encore pas mal d’étiquettes.

Inutile de s’abstenir d’ajouter des entrées juste pour ce champ.
le 09 août 2011 à 09:36
j'ai essayé la recherche étendue avec un champ sémantique défini et cela fonctionne;
existe-t-il une méthode pour rechercher des mots commençant par "..."
et ayant un des champs proposé "vide"

Exemple : "arthr" + champ sémantique laissé vide, retourne une liste contenant arthrodèse
qui est de type "chir"

but : retrouver les mots entrés sans champ sémantique rempli; maintenant, c'est encore facile ;-)
le 09 août 2011 à 17:59

Tbj :
existe-t-il une méthode pour rechercher des mots commençant par "..."
et ayant un des champs proposé "vide"


Non, ce n’est pas possible pour l’instant. Il faudrait que je revoie l’interface pour forcer la recherche sur les champs vides.

Ajout : je viens de faire un petit hack vite fait. Si tu tapes «//» dans l’un des champs, le système demande que celui-ci soit vide.
le 12 août 2011 à 10:46
impeccable, ce trick, il faudra s'en souvenir...
le 12 août 2011 à 22:05
Est-ce qu’on décompose les mathématiques dans leurs divers aspects ? (algèbre, géométrie, etc.)
Cette question se pose pour pas mal de domaines. Les dictionnaires le font souvent.
le 18 août 2011 à 20:51
pourquoi pas, un peu comme pour la médecine subdivisé en chirurgie, anatomie, etc.
... Mais il est bon de laisser aussi le générique "mathématiques"
le 19 août 2011 à 05:51
La liste sémantique évolue... perpétuellement.
Serait-il possible de faire une sorte d' "autocomplétion" (argh!), sur le champs sémantique
car certains pauvres contributeurs (!) passent pas mal de temps
à re-parcourir la liste déroulante ;-)
... ou une autre méthode...
(cela pourrait aussi s'appliquer au champs lexical, mais comme il reste plus "stable", ...)
le 21 août 2011 à 09:01

Tbj :
Serait-il possible de faire une sorte d' "autocomplétion" (argh!), sur le champs sémantique
car certains pauvres contributeurs (!) passent pas mal de temps
à re-parcourir la liste déroulante ;-)
... ou une autre méthode...


Ça devrait être possible puisque la librairie Autosuggest (le seul code de ce site que je n'ai pas écrit moi-même) fonctionnait ainsi avant que je la modifie. En revanche, si ma mémoire ne me fait pas défaut, je crois que c'était un réglage global. Je vais voir ce que je peux faire. Comme je ne suis pas un grand expert en Javascript, ça va me demander un peu de temps.
le 21 août 2011 à 14:01

Tbj :
Serait-il possible de faire une sorte d' "autocomplétion" (argh!), sur le champs sémantique


Voilà, c’est fait. F5 pour recharger le script.
le 28 août 2011 à 11:56
J’ai ajouté l’étiquette @ qui servira à désigner les mots trop communs ou trop polysémiques. Ça nous permettra de les distinguer de ceux que nous n’avons pas encore étiquetés.
le 05 novembre 2011 à 15:54
Je m’aperçois que je n’ai pas précisé que le tag @ peut être employé avec des tags plus spécifiques.
Par exemple, backup est notamment un terme informatique, mais comme il a aussi un sens plus générique utilisé dans d’autres domaines, on peut l’étiqueter avec @ info.
le 14 avril 2012 à 11:30

Notification par e-mail    0