OK
AJAX error!

Les forumsGrammalecteSupport des langages à balisage léger

Support des langages à balisage léger

Bonjour,

Merci beaucoup pour l'outil, il est génial. J'écris beaucoup dans des formats à balisage comme le markdown et je me demandais s'il était prévu d'avoir de ceux-ci un support dans Grammalecte ?

Par exemple, pour mettre du texte en italique, je vais faire quelque chose comme ça: _Il peux_. Grammalecte ne le supporte pas et rapporte simplement les mots comme étant inconnus du dictionnaire et ne rapporte pas l'erreur.
le 23 septembre 2020 à 14:03
Bonjour,

Il y a plusieurs manières de résoudre le problème, aucune n’étant pleinement satisfaisante. Le caractère “_” est considéré comme faisant partie des caractères “lettres” dans l’Unicode. Autrement dit, le correcteur orthographique fait correctement son travail quand il signale que “_il” ou “peux_” ne font pas partie du dictionnaire.

Je comprends que ce n’est pas une réponse satisfaisante pour vous, mais ça peut être utile d’avoir de tel signalement sur la correction de texte mal numérisé ou mal recopié.

Solutions :
— De votre côté, utiliser le caractère “*” qui en Markdown a la même fonction que “_”.
— De notre côté, modifier le tokenizer pour refuser le caractère “_” comme faisant partie intégrante des mots (trop compliqué, trop lourd, apporte plus d’emmerdements qu’autre chose), indiquer au correcteur orthographique que tout mot contenant le caractère “_” est correct (simple, mais effets de bord probablement non souhaitables), purger proprement le début et la fin de chaque mot (ça ralentit le correcteur orthographique pour tout le monde et tous les mots de tous les textes…, pas sûr de vouloir faire ça)…

Bref, la demande est légitime pour certains usages, mais au détriment du reste. Sachant que vous pouvez faire autrement en employant “*” au lieu de “_”, est-ce bien nécessaire ?


Désolé pour le délai de réponse. J’étais en déplacement.
le 25 septembre 2020 à 15:41

De votre côté, utiliser le caractère “*” qui en Markdown a la même fonction que “_”.



Pour le markdown oui. J'ai donné cet exemple car le format est connu avec un exemple basique de texte formaté. Il y a aussi le caractère ` (apostrophe inversée) qui est très utilisé (je ne sais pas comment il est considéré). Cependant, j'utilise aussi beaucoup l'asciidoc pour lequel _ et * n'ont pas le même sens.

Je comprends que ce n’est pas une réponse satisfaisante pour vous, mais ça peut être utile d’avoir de tel signalement sur la correction de texte mal numérisé ou mal recopié.



Je n'avais pas pensé à ce cas d'usage en effet.

Une autre solution serait que j'essaie de supprimer des caractères problématiques de mon côté avant d'envoyer le texte à Grammalecte puis de faire correspondre la réponse de l'outil avec le texte d'origine. Ce qui risque de ne pas être trivial.

Autre piste : j'ai vu qu'on pouvais configurer Grammalecte. Est-ce qu'il ne serais pas possible de configurer des caractères à ignorer ? Comme ça ceux qui en ont besoin peuvent configurer l'outil (moyennant un coût de "nettoyage") et les autres n'ont pas à payer le coût de la modification.

Désolé pour le délai de réponse. J’étais en déplacement.



Pas de souci (et ça reste très court comme délai).
le 25 septembre 2020 à 16:04
Non, il n’est pas possible d’ignorer des caractères au gré des besoins, le tokeniseur ne permet pas ce genre de choses. Mais encore faut-il se mettre d’accord sur ce que signifie “ignorer”.

Mais passons, je viens de faire quelques tests en interne, et finalement, après un débat avec moi-même, il ne me paraît pas absurde de se débarrasser sans ménagement de ces caractères superflus. Attendu que LibreOffice le fait par défaut (il tokenise lui-même), il me semble bien de m’aligner sur ce comportement.

Pas sûr de la meilleure méthode pour gérer ça, mais peu importe, la première solution testée est suffisamment viable pour l’instant.
le 30 septembre 2020 à 18:05
D'accord. Merci, j'espère voir arriver ça bientôt. Et bon courage pour le dev !
le 02 octobre 2020 à 09:18
Hier, j’ai modifié le tokeniseur pour gérer ça proprement, c’est mieux que les autres bidouilles possibles.
Cette modification engendre plein d’effets de bord subtils et complexes à gérer, qui nécessitent de faire plus de tests.
Mais a priori, c’est fonctionnel.
Je publierai une nouvelle version d’ici une semaine ou deux.
le 02 octobre 2020 à 11:48
C'est rapide, merci beaucoup.
le 02 octobre 2020 à 12:03

Notification par e-mail    1