OK
AJAX error!

Les forumsÀ propos du siteUtiliser Dicollecte pour un jeu

Utiliser Dicollecte pour un jeu

Bonjour,

J'ai développé un petit jeu : www.lemotleplusfrequent.fr…

Je voudrais savoir svp si je dois indiquer que j'utilise les données issues de Dicollecte ? Il me semble que non, mais je voudrais être sûr...
le 13 décembre 2012 à 17:06
Bonjour,

Non, ce n’est pas obligatoire. Il faut lire la MPL 2 pour le détail : www.mozilla.org…

Les obligations concernent surtout la distribution du logiciel et du code, mais si vous ne diffusez ni l’un ni l’autre, pas de problème.

Citer la source, beaucoup le font par reconnaissance, j’imagine, ou simplement à titre informatif ; je ne suis pas dans la tête de ceux qui utilisent ce que je propose et je ne leur demande pas de comptes (tant que je n’ai pas le sentiment qu’ils violent la licence). ;)
le 14 décembre 2012 à 09:32
En tout cas, sympa ce petit jeu :)
le 14 décembre 2012 à 12:00
Très bien merci ! Je pense que je ne vais pas le mettre pour le moment.
le 14 décembre 2012 à 19:04
Au fait Admin, j'ai vu que la fréquence des mots sont disponibles dans Lexique, comment a-t-elle été calculée ?
Sinon, je n'ai pas compris son utilisation, mais je verrai plus tard.
le 15 décembre 2012 à 14:32
C’est expliqué ici : www.dicollecte.org…

L’utilité du lexique ? Il ne sert pas à grand-chose tel quel. C’est la mise à plat du dictionnaire en quelque sorte. Il peut servir à tous ceux qui veulent utiliser les données sans avoir à comprendre le fonctionnement de Hunspell et ou à décliner tous les lemmes en formes fléchies.

Il sert quand même notamment à générer le lexique pour LanguageTool.
Je le propose à télécharger parce qu’on me demandait souvent la liste de tous les mots du dictionnaire.
le 15 décembre 2012 à 15:04
Vous avez analysé 45 milliards de mots !!! Très impressionnant, chapeau ! Effectivement, votre PC a dû chauffer :)
Ce fichier est intéressant et il a l'air exploitable directement. En fait, c'est le code que je n'ai pas compris, mais je l'ai seulement survolé.
le 15 décembre 2012 à 17:41
J’ai seulement dénombré les occurrences des mots. C’est Google qui a fait la plupart du boulot, il suffit de synthétiser les données : www.dicollecte.org…
Pour ma part, j’ai juste fait le compte de tout Wikipédia et Wikisource et d’un corpus de textes bien plus restreint. ;)
le 16 décembre 2012 à 10:19
On sent quand même le travail effectué, ce n'est pas rien. Il y avait un gros travail de tri avec pas mal de Go de données brutes. Par contre, je me demande comment vous avez distingué la nature des mots !

Google est bigrement impressionnant ! Bizarre cette pointe d'amour en 1697, dans leur exemple ???

Au fait, j'ai enfin installé Grammalecte dans OpenOffice, ce ne sera pas du luxe ;)
J'espère que vous parviendrez à le proposer pour Firefox et autres.
le 17 décembre 2012 à 00:20
Je me suis simplement borné à compter les mots, c’est tout. C’est vrai que ça fait pas mal de données.
Quant aux indices sur les livres anciens, je pense qu’ils ne sont pas très fiables, car le nombre de livres est probablement bien plus réduit. Du coup, on constate beaucoup de variations.
le 26 décembre 2012 à 16:19

Notification par e-mail    0