Grammalecte  View Ticket

2020-04-23
18:41 Ticket [6aaaba2839] Problème de detection des majuscules en début de phrase status still Open with 3 other changes artifact: 9a9863e776 user: goffi
16:58 Ticket [6aaaba2839]: 3 changes artifact: 404aa5745a user: olr
12:33 Ticket [6aaaba2839]: 3 changes artifact: 1c92a4afd1 user: goffi
2020-04-18
18:04 Ticket [6aaaba2839]: 5 changes artifact: d8c9f07812 user: olr
2020-04-16
16:28 Ticket [6aaaba2839]: 6 changes artifact: a299096807 user: olr
15:55 New ticket [6aaaba2839]. artifact: 09be30a54d user: goffi

UUID: 6aaaba28392b32addab255237faca39795e66e35
Title/Titre: Problème de detection des majuscules en début de phrase
Status: Open Type: Feature_Request
Severity/Gravité: Important Priority/Priorité: Medium
Module: FR_Rules Resolution: Open
Modified/Modifié: 2020-04-23 18:41:29
Version(s): 1.8.0
Comments / Commentaires :
goffi // 2020-04-16 15:55:04 :

Bonjour,

Grammalecte est utilisé comme correcteur pour le français dans Superdesk, un logiciel libre de journalisme (je suis développeur sur ce logiciel). On nous a remonté un problème de détection des majuscules, avec le texte suivant:

l'avion affrété en raison du nouveau coronavirus pour rapatrier de Chine 28 Français et 36 ressortissant autres pays de l'Union européenne est arrivé à l'a port de Roissy, a-t-on appris vendredi de source aéroportuaires. troisième avion affrétée par Paris depuis le début de la crise, l'appareil était parti jeudi de Wuhan, épicentre de l'épidémie du virus. Les rapatriés français doivent être placés en quarantaine dans un village vacances du Calvados (Normandie) où ils doivent y être confinés 14 jours.https://www.monde-diplomatique.fr/audio/2020-04-Au_Royaume_Uni_la_tentation_de_l_ineluctable.mp3?cle=rBimzcWg%2BQsHnInFV8i%2B les autres passagers européens doivent être "pris en charge, dès leur arrivée, par les autorités de leur pays", selon le Quai d'Orsay.

l'appareil, un Airbus A38https://www.monde-diplomatique.fr/audio/2020-04-Au_Royaume_Uni_la_tentation_de_l_ineluctable.mp3?cle=rBimzcWg%2BQsHnInFV8i%2https://www.monde-diplomatique.fr/audio/2020-04-Au_Royaume_Uni_la_tentation_de_l_ineluctable.mp3?cle=rBimzcWg%2BQsHnInFV8i%2B0, avait été affrété par Paris avec l'objectif principal d'acheminer du fret d'équipement médical à l'intention du personnel soignant chinois dans la province du Hubei, la plus touchée par l'épidémie, selon une source diplomatique.

mais son vol retour vers la France était l'occasion de rapatrier une soixantaine de ressortissants français et européens qui le désiraient, a-t-elle ajouté.

Il manque plusieurs majuscules en début de phrases, mais uniquement celle de "troisième" (dans "troisième avion affrétée par Paris depuis le début de la crise"), les autres majuscules manquantes ne sont pas détectées (comme le "l" de "l'avion affrété en raison du nouveau coronavirus" en début de phrase).

Merci, et merci pour le travail effectué sur ce superbe outil.


olr // 2020-04-16 16:28:02 :
Bonjour,

La première majuscule absente est bien détectée, mais elle est masquée par une autre erreur : l’apostrophe typographique. Si vous corrigez cette erreur, celle de la majuscule absente est vue elle aussi.

Quant aux autres, effectivement, mais c’est voulu dans la mesure où Grammalecte considère qu’il faut au moins deux phrases (avec un point les séparant) pour faire la proposition d’ajouter une majuscule.

Pour les raisons suivantes :
— Typographiquement, il est possible de voir des titres sans majuscule, comme effet de style.
— Lors des énumérations, une phrase peut terminer par un point sans commencer par une majuscules. Or, ces énumérations sont parfois faites avec des puces (qui ne sont pas du texte, donc non identifiables par Grammalecte).

Autrement dit, c’est un nid à faux positif, et on ne peut avoir de certitude sur les intentions des utilisateurs.
Il faudrait une autre option typographique, mais à la veille de publier une nouvelle version, je vais pour l’instant m’abstenir.

goffi // 2020-04-23 12:33:26 :

Bonjour,

merci pour la réponse.

La première majuscule absente est bien détectée, mais elle est masquée par une autre erreur : l’apostrophe typographique. Si vous corrigez cette erreur, celle de la majuscule absente est vue elle aussi.
Ah, les erreurs d'apostrophes typographiques sont désactivées sur l'instance en question à la demande de l'utilisateur. Il serait pratique d'avoir les autres erreurs sur la même séquences, ainsi celle ignorées ne masqueraient pas les autres.
Quant aux autres, effectivement, mais c’est voulu dans la mesure où Grammalecte considère qu’il faut au moins deux phrases (avec un point les séparant) pour faire la proposition d’ajouter une majuscule.

Je vois, ce n'est pas une mauvaise chose pour éviter les faux positifs.

Il faudrait une autre option typographique, mais à la veille de publier une nouvelle version, je vais pour l’instant m’abstenir.

Bien entendu, je comprends.

Merci beaucoup pour cette réponse et encore une fois pour le travail effectué sur Grammalecte.


olr // 2020-04-23 16:58:59 :
En théorie, avoir désactivé la détection des apostrophes typographiques n’empêche nullement le signalement de la majuscule manquante. Au contraire même, puisqu’il n’y a pas parasitage entre deux erreurs différentes.

goffi // 2020-04-23 18:41:29 :

La configuration utilisée est la suivante (le ignore_rules est une implémentation spécifique à Superdesk, elle supprime simplement les règles indiquées avant de retourner les résultats):

GRAMMALECTE_CONFIG = {
    # disable typographic apostrophes
    "apos": False,
    # disable typographic quotation marks
    "ignore_rules": {
        "typo_guillemets_typographiques_doubles_ouvrants",
        "typo_guillemets_typographiques_doubles_fermants",
    },
}

Mes excuses si je mets du temps à répondre, je ne serai disponible qu'en fin de semaine prochaine.