OK
AJAX error!

Les forumsGrammalecteLes exposants et le formateur de texte

Les exposants et le formateur de texte

Bonjour

Je viens de convertir au format EPUB un fichier odt d'histoire militaire. Il comprenait un très grand nombre d'exposants (705 au total), concernant surtout des numéros d'unités (8e tabor, 6e compagnie, 1re section, 1er bataillon) mais aussi quelques dates (1er février). Quelques exposants peuvent aussi suivre des chiffres romains (VIIe ArmeeKorps, XIXe siècle).

Une fois obtenu l'EPUB, il m'a été facile de faire un contrôle des exposants avec l'éditeur de Calibre. Je me suis aperçu grâce à une expression rationnelle simple qu'il manquait 41 exposants pour arriver au nombre final de 705. Je n'ai pas eu à l'étendre aux chiffres romains car le sujet ne s'y prêtait pas.

Voici cette regex sous forme de fichier json.

{
"searches": [
{
"case_sensitive": false,
"dot_all": false,
"find": "(\\d)(er|re|e)",
"mode": "regex",
"name": "mettre les exposants manquants (après chiffres)",
"replace": "\\1<sup>\\2</sup>"
}
],
"version": 1

Question: ce type de recherche/remplacement pourrait-il être activé dans le formateur de texte? (le cas échéant sous forme de choix à cocher).

ll pourrait également être utile de proposer dans le formateur de texte le remplacement des espaces suivant les exposants par des espaces insécables, ou des fines insécables.
le 30 août 2016 à 17:35
Bonjour,

En théorie, le formateur de texte devrait déjà transformer les ordinaux conformément à ce que vous attendez, selon l’expression régulière que vous mentionnez. (Même si celle-ci ne suffit pas à changer les ordinaux romains.)

Mais,
1. La regex du formateur de texte est plus “sécurisée”, donc il y a probablement des cas particuliers qui lui échappent.
2. Le moteur de regex de Writer est bugué, donc il y a peut-être des cas particuliers qui lui échappent aussi. Par ailleurs, ces bugs nous contraignent parfois.

Il faudrait que vous listiez les 41 cas où ça a failli pour que je puisse vérifier/ajuster.
le 30 août 2016 à 17:56
Bonjour

J'ai fait un petit contrôle. Compte tenu des nombreuses répétitions, il y a huit cas d'exposants non détectés
du 1er Tabor
1er B.E.P.
la 1re,
les 1re et
la 1re compagnie
sa 1re
la 1re compagnie
1re section
la 2e section
la 2e compagnie
IIIe/3e R.E.I.
IIe/3e R.E.I.
3e G.C.C.P.
8e R.T.M.
le 11e Tabor
59e Goum
le 30 août 2016 à 18:51
Je viens de faire le test avec LO 5.2, et tout a fonctionné correctement.
Il y a donc vraisemblablement un élément annexe qui altère le fonctionnement attendu.

Pouvez-vous m’envoyer le fichier ?
le 30 août 2016 à 19:09
OK c'est fait.
le 30 août 2016 à 22:02
Le formateur de texte m’indique avoir fait 774 remplacements sur les ordinaux. Dans la liste de ceux qui ont été oubliés chez vous, il n’y en a chez moi qu’un seul :

1erB.E.P.


Le remplacement n’a pas été fait parce “1er” est accolé à “B.E.P.”, et le formateur de texte, par prudence, n’y touche pas. (L’expression régulière exige que “1er” constitue un token entier.)
le 31 août 2016 à 06:15
Merci de votre test et bravo pour votre résultat. Comme j'avais déjà passé Grammalecte sur ce fichier (ordinaux sélectionnés), il ne m'indique bien sûr rien de nouveau et je ne sais pas comptabiliser les exposants (réels et potentiels) sur LibreOffice.

Faute de mieux, votre test m'incite à améliorer ma propre recherche sur l'EPUB pour tenter de trouver les exposants excédentaires.

Ajout: après vérification, j'obtiens 765 exposants mais seulement 705 suivis par un espace.
le 31 août 2016 à 07:47

Notification par e-mail    0