OK
AJAX error!

Les forumsGrammalecteCorrection des contenus scientifiques

Correction des contenus scientifiques

je propose de créer ce fil afin d'étudier, de discuter, des différentes possibilités de correction des textes ayant un contenu scientifique.

Par exemple, en lisant ceci : tex.loria.fr… chapitre deux, il est expliqué, que le point centré est le symbole de la multiplication. On doit donc écrire N·m et non pas N.m. Le correcteur d'orthographe accepte la mauvaise forme.

l'utilisation du point centré permettrait peut être, par une règle générale, d'accepter m·Cp·ΔT, en effet, si on utilise le point centré, c'est pour multiplier deux termes qui n'ont pas à être corrigés. Cela peut par contre être en conflit avec une correction des unités... qui seront donc systématiquement validées...

je propose également les espaces insécables avant et après le signe =, mais aussi des signes ;≥; ≤
le 06 juillet 2013 à 16:11
Il est surprenant que le point médian ne soit pas considéré par défaut comme un séparateur.
Vous devriez le demander à LibreOffice. Vous pouvez aussi l’ajouter dans la liste des séparateurs dans les Options > Writer > Général.

Je vais envisager de l’ajouter dans Hunspell.

l'utilisation du point centré permettrait peut être, par une règle générale, d'accepter m·Cp·ΔT, en effet, si on utilise le point centré, c'est pour multiplier deux termes qui n'ont pas à être corrigés. Cela peut par contre être en conflit avec une correction des unités... qui seront donc systématiquement validées...


Je n’ai pas compris votre propos sur le conflit avec la correction des unités.
On peut faire deux choses :
— dire que le point médian est un séparateur, chaque unité sera alors examinée séparément,
— créer des règles de composition pour ces cas précis (pour ma part, je n’y connais pas grand chose, ce sera donc aux gens motivés de gérer ça : voir www.dicollecte.org…)

On doit donc écrire N·m et non pas N.m.


Alors, il faut intégrer les unités de mesure du SI dans le dictionnaire, comme pour les autres : www.dicollecte.org…
le 06 juillet 2013 à 20:37
Je viens de remarquer que deux lettres séparées par un point étaient toujours(?) acceptées. N.m ne fait donc pas exception. Je croyais qu'une entrée spécifique considérait N.m comme valide. du coup n.m est aussi considéré comme valide...

L'idée d'avoir une bonne correction de la plupart des unités me plait bien, je veux bien apporter une modeste contribution si c'est possible.

On peut commencer par les unités et leurs multiples. Cela semble être déjà le cas, bizarrement quelques unités résistent comme kΩ mΩ µΩ, alors que MΩ GΩ sont acceptés. Y a t il un règle de composition pour ces unités ou bien sont-elles ajoutées au cas par cas ?
le 06 juillet 2013 à 21:22
Quelques essais sur les unités présentées ici : ressources.univ-lemans.fr…

m'ont montré que l'ensemble des unités étaient reconnues (excepté quelques multiples du Ohm)

de même tout groupe de lettre (?) se terminant par des chiffres est accepté

Le boulot est déjà fait !

reste à pouvoir associer tout ça avec un point centré ou un /
le 06 juillet 2013 à 22:50
Oui, Laurent avait géré la question des unités internationales. Il avait fait du bon boulot.

En ce qui concerne le symbole de l’ohm, attention, il existe deux codes dans l’Unicode pour la lettre oméga majuscule : www.dicollecte.org… Du coup, si vous tapez le mauvais caractère (même si c’est bien un oméga), le correcteur considère ça comme une erreur.

Quant au point médian, je pense que je vais le déclarer comme séparateur.
le 07 juillet 2013 à 07:53
effectivement, c'est bien de là que vient le problème. Bigre, après avoir changé tous mes Ohms de la police symbole en Ohm symbole grec de la police du texte, voilà que je dois à nouveau les changer pour le symbole du Ohm...

Ne peut-on accepter les deux car je ne vois pas de différence entre ces deux symbole.


Le fait de considérer que le point médian est un séparateur va avoir comme conséquence la validation de toutes les unités séparées par ce point médian (à condition qu'elles soient valides séparément ?) daN·mm² sera donc considéré comme valide ?
le 07 juillet 2013 à 10:51

Ne peut-on accepter les deux car je ne vois pas de différence entre ces deux symbole.


On peut. Mais, de mémoire, Laurent était assez opposé à l’idée. Unicode propose deux caractères, oméga majuscule et ohm. C’est le même symbole, mais est-ce la même graphie dans toutes les polices de caractères ? Pour ma part, je n’ai pas d’avis et je m’en moque un peu, pour tout dire. Je suis sûr qu’on me reprochera d’être trop laxiste dans un cas et trop rigoriste dans l’autre. :)

Je peux aussi forcer Hunspell à transformer le code en interne ou suggérer la bonne graphie.

Faites la proposition, il y aura peut-être des gens pour vous soutenir ou vous combattre.

Le fait de considérer que le point médian est un séparateur va avoir comme conséquence la validation de toutes les unités séparées par ce point médian (à condition qu'elles soient valides séparément) ?


Oui. Il me semble logique d’avoir le même comportement qu’avec le point.

daN·mm² sera donc considéré comme valide ?


Ça dépend si on accepte automatiquement les nombres avec un chiffre. mm² n’existe pas dans Hunspell, il n’y a que les mm.
le 07 juillet 2013 à 11:42
daN.mm² est accepté par le dictionnaire, je suppose que toute unité peut être mise au carré, au cube, ou à la puissance 42

Je peux aussi forcer Hunspell à transformer le code en interne ou suggérer la bonne graphie.



je pense que c'est un bon compromis

Quant au point médian, je pense que je vais le déclarer comme séparateur.



Je me permets une proposition ici, si quelqu'un va jusqu'à utiliser le point médian pour ses unités, c'est qu'il cherche une certaine rigueur, ne peut-on en profiter pour être alors plus rigoureux dans la correction de ces unités ?
L'utilisation du point médian comme séparateur à pour effet de valider toute combinaison d'unités, les bonnes, comme celles qui n'ont pas de sens.
Il y a en gros un vingtaine de grandeurs (couple, viscosité, accélération, vitesse, etc.) qui sont des associations d'unités, on peut en ajouter quelques unes qui ne sont pas considérées comme faisant partie du système classique, mais largement utilisées (le kW·h par exemple) cela ne devrait pas dépasser une trentaines d'entrées.

Concrètement il faudrait ajouter N·m pour le couple, dans les unités ainsi que la possibilité d'y adjoindre les préfixes multiplicateurs (k, da, m, etc.) mais pas de chiffre derrière. idem pour m·s-1 pour la vitesse et m·s-2 pour l'accélération, etc.
le 07 juillet 2013 à 12:32

daN.mm² est accepté par le dictionnaire, je suppose que toute unité peut être mise au carré, au cube, ou à la puissance 42


Le dictionnaire n’accepte rien du tout. ;) Dans ces cas-là, les logiciels évitent juste de lui poser la question. Mais si on lui demande son avis, il considère que c’est faux. Dans Firefox, tout mot suivi d’un chiffre (ex : trucbidule3459²) n’est pas envoyé au dictionnaire, mais accepté automatiquement. Dans LibreOffice, il y a une option pour activer/désactiver ce comportement.

je pense que c'est un bon compromis


Je viens d’ajouter un correctif pour gérer ça. Je vois d’ailleurs que mon éditeur de texte n’écrit pas ohm et oméga majuscule tout à fait de la même façon.

Je me permets une proposition ici, si quelqu'un va jusqu'à utiliser le point médian pour ses unités, c'est qu'il cherche une certaine rigueur, ne peut-on en profiter pour être alors plus rigoureux dans la correction de ces unités ?


Sans doute, mais le point médian peut aussi servir à séparer des mots, pas seulement des unités de mesure.
fr.wikipedia.org…
Le comportement sera le même que si vous écrivez km/h. Le signe / est considéré comme un séparateur et le sera toujours, attendu qu’on peut difficilement faire autrement.

Maintenant, on peut quand même ajouter les unités dans le dictionnaire, pour identification et recensement. Ce n’est pas complètement inutile. Le mieux, c’est peut-être de faire comme le point et le tiret : considérer le point médian comme un séparateur et comme un caractère possible dans un mot.

Il faut éviter de demander au correcteur orthographique de gérer ce qui sort de ses compétences.

Concrètement il faudrait ajouter N·m pour le couple, dans les unités ainsi que la possibilité d'y adjoindre les préfixes multiplicateurs (k, da, m, etc.)


Les drapeaux sont là pour ça.

mais pas de chiffre derrière.


Le comportement des logiciels sur ce point ne dépend pas Hunspell, mais du choix des concepteurs.

idem pour m·s-1 pour la vitesse et m·s-2 pour l'accélération, etc.


On n’écrit plus m/s et m/s² ? (Ça fait bien longtemps que je n’ai pas touché à la physique…)
Par ailleurs, le tiret est aussi considéré comme un séparateur.
le 08 juillet 2013 à 08:12

On n’écrit plus m/s et m/s² ? (Ça fait bien longtemps que je n’ai pas touché à la physique…)
Par ailleurs, le tiret est aussi considéré comme un séparateur.



les deux écritures sont possibles.

Donc, j'ai fait une liste des unité à ajouter, à partir du document sur les unités dont j'ai donné le lien.

Masse volumique : kg·m-3

Débit volumique m3·s-1

Débit massique g.s-1

Vitesse : m·s-1

Accélération : m·s-2

Moment de force : N·m

Tension superficielle : N·m-1

Travail Énergie : W·h

Moment d’inertie : kg·m2

Quantité de mouvement : N·s

Viscosité dynamique : Pa·s

Viscosité cinématique : m2·s

Quantité d’électricité : A·h

Résistivité Ω·m

Intensité de champ magnétique : A·m-1

Capacité thermique : J·K-1

Chaleur massique : J·kg-1·K-1

Conductivité thermique : W·m-1·K-1

Convection thermique : W·m-2·K-1

Intensité acoustique W·m-2

Luminance cd·m-2

Dose d’exposition C·kg-1

je n'ai pas proposé les versions avec le / car elles seront automatiquement validées si j'ai bien compris. cela fait 22 entrées à l'usage, on en proposera quelques autres (inductance linéique (H·m-1) ou conductivité (S·m)) mais ça ne devrait pas être sujet à trop d'inflation (quoique, je pense déjà aux densités d'énergie massique et volumique (J·kg-1 et J·m-3))
le 08 juillet 2013 à 09:06

Moment de force : N·m


Je viens de voir que ceci avait déjà été proposé : www.dicollecte.org…
le 08 juillet 2013 à 10:23
Personnellement, je trouve que l'utilisation correcte du point centrée est une bonne chose. Il s'agit ici d'une vision pédagogique. Dans N·m, ce sont des newtons multipliés par des mètres.

Je n'ai pas réellement d'avis sur la politique du dictionnaire, personnellement je pense qu'une meilleure correction des contenus scientifiques des textes est un plus, mais c'est essentiellement par ce que j'en produis et que ça m'énerve de voir la plupart de mes écrits soulignés et qu'en parallèle je cherche comment le correcteur d’orthographe et de grammaire pourraient aider mes élèves à plus de rigueur dans leurs écrits.

Au final, je me soumets au choix de ceux qui travaillent activement sur le dictionnaire et le correcteur de grammaire.

Enfin j'ajoute qu'avec les nombreux ajouts de mots de vocabulaire, la correction de LibreOffice/Dicollecte/Grammalecte me semble bien meilleure que celle de la concurrence payante
le 08 juillet 2013 à 18:54

ça m'énerve de voir la plupart de mes écrits soulignés


L’ajout du point médian comme séparateur devrait résoudre ce problème.

Toutes mes formules sont précédées et suivies d'un soulignement bleu, signe d'une grammaire à revoir. Le soulignement est lié à la présence d'un espace avant et après les formules (objets math) mais ces espaces sont nécessaires à la lisibilité du texte.


Pouvez-vous m’envoyer des exemples à l’adresse : dicollecte [chez] free [point] fr ?
Merci.
le 11 juillet 2013 à 08:01
je viens de voir deux petite boulettes dans les unités :


Moment d’inertie : kg·m2



on devrait plutôt écrire g·m2 car k est un des préfixes possibles

de même pour :
masse volumique kg·m-3 -> g·m-3
Moment d’inertie : kg·m2 -> g·m2

je suis embêté pour la chaleur massique J·kg-1·K-1

pour l'eau, c'est 4 180 J·kg-1·K-1 mais aussi 4,18 kJ·kg-1·K-1 ou encore 4,18 J·g-1·K-1 (jamais vu cette troisième forme)

même problème pour la dose d’exposition C·kg-1 (jamais utilisé)

le problème vient du fait que l'unité de base pour la masse est le kg et non le g, je suis partisan de laisser ces deux dernière unité comme proposées. ce qui revient à mettre g a la place de kg uniquement lorsque le kg est en tête d'unité, ça le laisse la possibilité de mettre n'importe quel multiplicateur.
le 11 juillet 2013 à 10:28

En pièce jointe, un fichier qui devrait poser problème
je dis 'devrait', car je suis repassé à la version 3.6.7 (j'avais la version 4.0.4) et le problème n'est plus présent


Pour ma part, je ne constate aucun problème non plus avec la 4.0.4. Lancez le formateur de texte et dites-moi quelle version de Python vous avez (c’est écrit en gris très clair en haut à droite).

Bonne nouvelle. Aucune des unités de mesure que vous listez ne sera soulignée en rouge avec la version 4.12. Je viens de tester.
le 11 juillet 2013 à 13:45
Ah oui, je vois. Mais je ne peux rien faire pour ça. Le correcteur ne reçoit pas les formules dans les boîtes. C’est invisible pour lui. Quand vous écrivez :

On note également l’admittance complexe [Y = 1/Z]


le correcteur ne reçoit que :

On note également l’admittance complexe


L’objet formule n’est pas passé et le correcteur n’a aucun moyen de savoir que la formule est là. L’espace est donc considéré comme en fin de ligne.
le 11 juillet 2013 à 17:11
Problème avec le litre :

ici : fr.wikipedia.org…

on dit que le l généralement utilisé peut être confondu avec le 1. ce qui est vrai pour certaines polices, on doit en fait utiliser le ℓ cursif que l'on trouve en U + 2113 ou encore le L

Le L et le l sont bien reconnus, mais pas le ℓ

Bonne nouvelle. Aucune des unités de mesure que vous listez ne sera soulignée en rouge avec la version 4.12. Je viens de tester.



très bonne nouvelle effectivement (même si je suis peut-être le seul à m'en réjouir)
le 11 juillet 2013 à 21:33
pour les fonctions on a oublié la cotangente cotan

il y a aussi les fonctions réciproques

arcsin ; arccos ; arctan ; arccotan

on peut aussi mettre, les fonctions hyperboliques

sinh ; cosh; tanh ; cotanh

et leurs fonctions réciproques

arcosh ; arsinh ; artanh ; arcotanh

et/ou bien sur, leurs formes avec la parenthèse ouvrante accolée

sinh( ; cosh( ; etc...
le 13 juillet 2013 à 09:06
OK, je regarderai ça quand j’aurai un moment.

Vous pouvez toujours faire des propositions pour ajouter ces termes, notez bien. ;)
le 13 juillet 2013 à 12:05
La modification de certaines unités est quasi impossible, à cause des bugs du module ICU. Il reste la possibilité d’utiliser les caractères en exposant pour circonvenir les limitations : fr.wikipedia.org…
Mais si on fait ça, il faudrait modifier toutes les unités existantes utilisant des chiffres en exposant. Sinon, ce sera incohérent. Je ne pense pas faire ça pour l’instant. La question des unités est un sac de nœuds.
le 28 juillet 2013 à 09:59

Admin :
La modification de certaines unités est quasi impossible, à cause des bugs du module ICU. Il reste la possibilité d’utiliser les caractères en exposant pour circonvenir les limitations : fr.wikipedia.org…
Mais si on fait ça, il faudrait modifier toutes les unités existantes utilisant des chiffres en exposant. Sinon, ce sera incohérent. Je ne pense pas faire ça pour l’instant. La question des unités est un sac de nœuds.



je regarderai ça après les vacances, j'ai une connexion internet très limitée

je pensais aussi aux espaces insécables de chaque coté du signe = (par le formateur de texte)

qu'en pensez-vous ?

idem pour les signes > ; < et ceux que vous avez ajouté en autocorrection (=)
le 28 juillet 2013 à 11:09

Admin :
La modification de certaines unités est quasi impossible, à cause des bugs du module ICU. Il reste la possibilité d’utiliser les caractères en exposant pour circonvenir les limitations : fr.wikipedia.org…
Mais si on fait ça, il faudrait modifier toutes les unités existantes utilisant des chiffres en exposant. Sinon, ce sera incohérent. Je ne pense pas faire ça pour l’instant. La question des unités est un sac de nœuds.



je ne sais pas si vous faîtes allusion au caractères en exposant (1 ; 2 ; 3) (U+00B9 ; U+00B2 ; U+00B3)

je pense qu'il est préférable d'utiliser ces caractères plutôt que la mise en exposant. Cela rend le texte plus robuste à des modifications. En tous cas, c'est ce que j'essaye de faire dans mes textes.

Par contre, je n'ai pas trouvé de - (moins) en exposant dans la police Times New Roman. Mais c'est présent dans la police Linux Libertine G (U+207B). Cette lacune est bien embêtante.

On peut imaginer deux choses :

- dans le formateur de texte, remplacer les exposants 1 2 3 par leur équivalent quand une unité est détectée
- dans les autocorrections remplacer cm2 par cm² par exemple, m3 par m³, etc...
le 04 août 2013 à 18:52

je pense qu'il est préférable d'utiliser ces caractères plutôt que la mise en exposant. Cela rend le texte plus robuste à des modifications.


Oui, on va faire ça.
fr.wikipedia.org…

Mémo UTF-8 :
— exposant : ⁰ ¹ ² ³ ⁴ ⁵ ⁶ ⁷ ⁸ ⁹ ⁺ ⁻ ⁼ ⁽⁾ ᵃᵇᶜᵈᵉᶠᵍʰʲᵏˡᵐᵒᵖʳˢᵗᵘᵛʷˣʸᶻ ⁱⁿ ᴬᴭᴮᴰᴱᴳᴴᴵᴶᴷᴸᴹᴺᴼᴾᴿᵀᵁⱽᵂ
— indice : ₀ ₁ ₂ ₃ ₄ ₅ ₆ ₇ ₈ ₉ ₊ ₋ ₌ ₍ ₎ ₐₑᵢⱼₒᵣᵤᵥₓₔₕₖₗₘₙₚₛₜ

Exemples (sans formatage avec des balises) : XXᵉ, 3ᵉ, 1ᵉʳ, nº, Mᵐᵉ, Mᵐᵉˢ, Mˡˡᵉ, Mˡˡᵉˢ, Mᵍʳ, Mᵉ, Mᵉˢ.


Mais je ferai rien pour les signes > < = etc. Ceux-ci sont susceptibles d’être utilisés en programmation. Je préfère laisser tous les cas trop délicats aux utilisateurs. Le formateur de texte reste un outil rudimentaire qui ne fait que du chercher/remplacer aveuglément, sans la moindre idée du contexte. Ce n’est qu’un automate sans intelligence.
le 08 août 2013 à 22:00
OK

Pour ma part, j'ai commencé à écrire mon propre formateur de texte, qui compète le votre. du coup, j'entrevois les difficultés que vous devez affronter.

Je remplace donc les espaces des chaque coté du signe égal (s'il y en a) par des espaces insécables. Je n'ai jamais vu de signe égal qui doive se retrouver seul en début de ligne ou en fin de ligne. Mais je vous fais totalement confiance pour les choix que vous faîtes pour le dictionnaire.

J'ai aussi fait quelques ajouts, qui ne sont ni des autocorrections, ni des je ne sais quoi.

Par exemple I_0 sera remplacé par I₀ etc... c'est un vrai plaisir
le 08 août 2013 à 22:40
bonjour,

Les amélioratiosn apportées par les autocorrections et le formateur de texte sont un gros plus pour l'écriture de texte avec un contenu scientifique.
Cependant, concernant les unités et l'utilisation du point centré, il me semble que l'on pourrait utiliser les autocorrections.

Par exemple, pour écrire N·m, je dois taper N//.[espace][ N·m ?

voire en plus N.m. --> N·m. (si l'unité est en fin d'une phrase et que l'espace déclenchant l’autocorrection n’arrive qu'après le point final)

cela concernerait une bonne dizaines d'unités

Pierre
le 09 juin 2014 à 11:20
les plus utilisées :
W.h
N.m
N.s
g.m² ou g.m2
Pa.s
A.h
Ω.m

plus compliqué

N.s/m² ou N.s/m2
J/(kg.K)
W/(M.K)
le 11 juin 2014 à 20:18
Bonjour,

Depuis que les autocorrections des unités ajoutent les symboles ² et ³, je pense que l'on peut envisager de compléter la listes des espaces insécables ajoutés par le formateur de texte ou détectés par Grammalecte avec ces autocorrections...

en particulier m² ; m³ ; mm² ; mm³ qui sont souvent employées.

Pierre
le 08 novembre 2014 à 11:42
sur writer de libreoffice, version 4.3.4

lorsque je tape m3/ cela se transforme en m³/ dès que je tape le "/".

C'est très bien, mais je ne vois pas par quel mécanisme c'est obtenu. Normalement, il faut appuyer sur espace pour que l'autocorrection s'exécute ?

le 18 novembre 2014 à 20:55
Je ne sais pas si c’est normal. J’imagine que ces caractères sont considérés comme des séparateurs. Du coup, il va falloir revoir certaines autocorrections.
le 19 novembre 2014 à 12:17

D’autres unités en vue ?



En piochant dans la liste des autocorrections (ce qui valide finalement le fait ce soit une unité)

*g·m² ; *m²·s ; m³/s ; */cm² ; */km² ; */dm² ; */m² ; */m³ ; */mm² ; /µm²

il manque les /mm³ ; et /cm³

On pourrait ajouter les *m³/h ; *ℓ/h et *ℓ/s qui sont aussi très utilisées (dans les autocorrections et les espaces insécables)

Mais l'ensemble est déjà devenu très pratique.

Ajout 4/12/2014
Je pense aussi au tr/min et au µF qui sont souvent utilisées
le 26 novembre 2014 à 12:25
Bonjour,

Je crois qu'il est possible d’améliorer encore un peu la correction des contenus scientifiques. en particulier, l'ajout des espaces insécables (ou fines insécables) comme séparateur des milliers.
ainsi le nombre (obligatoirement cardinal) situé avant une unité devrait être corrigé et/ou signalé par le formateur de texte/grammalecte.

1500 kW --> 1 500 kW
1500 Ω --> 1 500 Ω

Qu'en pensez vous ?

Pierre
le 04 décembre 2014 à 11:09
Bonjour,

Je crois que vous avez déjà répondu, mais dans le doute...

Lorsque l’on écrit Nm ou tr/mn Hunspell ne propose pas les bonnes graphies. N·m et min. Il n'y a pas un moyen de l’aider dans ses propositions ?

Pierre
le 29 mars 2015 à 16:16
Je l’ai déjà dit, on ne peut pas vraiment maîtriser ce que suggère Hunspell, il n’en fait qu’à sa tête. J’ai écrit une commande spécifique, mais pour les mots courts, ça ne fonctionne pas. Je ne sais pas pourquoi.

Je m’aperçois que ce fil évoque tellement de points que j’en ai perdu le fil. Quand ça devient bordélique, je ne retiens rien.

J’ai réglé les espaces insécables dans les cas comme 1,5·10³ kW.

Pour 1500 kW --> 1 500 kW, je suis partagé.

Je vais faire du nettoyage dans ce fil et effacer ce qui a été réglé.
le 29 mars 2015 à 21:16
Dommage, j'espérais que l'on pouvait aider un peu Hunspell, par exemple en lui disant explicitement qu'il faut proposer N·m pour Nm. j'imagine que c'est là le problème des mots courts. tant pis

Pierre
le 30 mars 2015 à 19:56
J’ai essayé avec mn, mais ça ne fonctionne pas.

Il n’est pas exclu que je remplace le correcteur orthographique par le mien un jour, mais mon prototype est encore très expérimental et je n’ai pas vraiment le temps de m’en occuper, mais si ça se fait un jour, il sera enfin possible de régler comme on veut le moteur de suggestion.
le 31 mars 2015 à 10:27

Notification par e-mail    2