OK
AJAX error!

Les forumsGrammalecte[Writer] Discordances entre F7 et les erreurs soulignées

[Writer] Discordances entre F7 et les erreurs soulignées

J’ai installé la version 0.5.6.1 dans LibreOffice. J’ai aussi téléchargé la source en 7z et j’ai trouvé dans les fichiers un "rules.grx", contenant des règles pour l’OCR.

J’avoue que je ne sais pas trop lire ce code (expressions régulières ?), mais en me basant sur les commentaires (clans / dans), je me suis fait un petit fichier de test avec de fausses erreurs d’OCR…

… Puis je l’ai passé à la moulinette de LO + Grammalecte…

Dans une première passe, Grammalecte m’a détecté les erreurs d’OCR pour les mots inexistants I955 et 1O000, etc.
Mais il ne m’a rien proposé d’autres pour corriger les erreurs d’OCR ; même dans une deuxième passe, il ne détecte rien.
(Je parle de l’appel via F7 ou via l’icône "Orthographe et Grammaire")
Par contre après fermeture du module Grammalecte, la plupart — je n’ai pas vérifié plus loin — des erreurs d’OCR sont bien soulignées en bleu et un clic droit me propose bien la correction adéquate.

J’ai aussi essayé le "formateur de texte" au cas où quelque chose aurait été implémenté, mais non…

Ai-je loupé quelque chose ?

le 30 mai 2016 à 08:01
Je ne suis pas sûr de comprendre ce que tu fais, en fait.
Modifier simplement le fichier rules.grx ne suffit pas. Il faut recompiler l’extension et l’installer pour voir les modifications.

Mais si je comprends bien tu as juste testé les règles existantes. Ça ne marchait pas au début, puis ça fonctionnait finalement. Mais je ne comprends pas ce que tu as fait entre les deux. Que veux dire “fermeture du module Grammalecte” ?

Tout ce que je peux te dire, c’est que LO ne réexamine pas le texte qu’il considère déjà analysé. Si tu ouvres un fichier avec des erreurs d’OCR, mais que l’option OCR n’est pas cochée, il ne verra pas les erreurs même après avoir coché l’option OCR. Parce qu’il considère le texte comme déjà analysé. Il faut donc modifier un paragraphe pour qu’il l’examine à nouveau ou fermer et rouvrir le fichier pour qu’il réanalyse tout.

Le formateur de texte ne corrige et ne corrigera aucune erreur d’OCR. C’est trop piégeux pour lui.
le 01 juin 2016 à 09:38
C’est pas toujours facile à expliquer ce qui (semble) sauter aux yeux pour soi…

Donc j’ai réessayé de tester les diverses phrases que j’ai inventée pour voir ce que tu détectes/corriges dans la partie "erreurs de numérisations". Ces phrases sont simplement basées sur des commentaires trouvés dans rules.grx (partie OCR).

Ici je repars d’un nouveau fichier vide, dans lequel je colle les phrases de test.
Comme l’option OCR est cochée, des mots sont "automatiquement" soulignés en rouges et en bleus :
en rouge j’ai I955, 1O000 et i1. (Je voudrais obtenir 1955, 10000, il)
Je lance le correcteur orthographique (grammaire incluse) par F7, et je fais "ignorer" pour ces 3 mots.
Après je reçois la fenêtre de LO disant que la correction est terminée !
Si relance une 2e fois la correction (F7), on me trouve un problème d’espace insécable (que je veux ignorer pour l’instant) et … c’est terminé.

Pourtant le texte contient 52 mots soulignés en bleu !
J’aurais voulu que via F7, Grammalecte me propose de corriger tous ces mots bleus.
Actuellement je suis obligé de cliquer droit sur chacun et de valider une des corrections.

Je ne sais pas si c’est beaucoup plus clair maintenant ? Ou alors, je poste (où ?) mon fichier de test…



le 01 juin 2016 à 12:36
OK, je vois. Il y a discordance entre ce qui est souligné en bleu et ce que F7 propose. Malheureusement, ici, le bug vient de LO (sauf erreur de ma part).
Envoie-moi le fichier par e-mail, je vais quand même vérifier.
le 01 juin 2016 à 12:43
Effectivement, avec ton document, F7 déconne complètement, que l’option ocr soit activée ou non. En revanche, j’ai copié-collé le texte dans un document neuf sans marque de formatage, et j’ai réessayé. Là, tout fonctionne normalement.
le 01 juin 2016 à 13:39
Je vais le transférer vers un autre ordinateur chez moi ; merci pour le conseil.
le 01 juin 2016 à 14:45

Notification par e-mail    0