Grammalecte  Ticket Change Details

Overview

Artifact ID: c2aabff7c9f4f869944f1c434dfbba3427ea98cb2d1e42099155cb844b3fe8c4
Ticket: 2070b106f2bacf78d29c4a4d489b2713699f169c
Diverses erreurs dans Dicollecte
User & Date: anonymous on 2023-11-09 00:32:15
Changes

  1. foundin changed to: "7.0"
  2. icomment:
    Bonjour,
    
    (J’ai envoyé ce signalement le 5 juillet comme un e-mail,
    à une adresse @grammalecte.net trouvée dans un README.
    N’ayant pas reçu de confirmation de réception, je re-tente ici.)
    
    Merci pour votre travail sur Dicollecte / Grammalecte !
    J’écris juste pour signaler quelques erreurs apparentes
    que j’ai remarquées en travaillant sur Dicollecte 7.0
    (les choses ont peut-être changé dans une version plus récente...).
    
    (Au passage, si jamais vous utilisez le programme `unmunch` de hunspell,
    il se trouve que ce programme est obsolète et fait n’importe quoi sur la base Dicollecte,
    j’ai recodé une version qui supporte correctement Dicollecte, mon programme se trouve là :
        https://gitlab.crans.org/mevel/dictionnaires/-/tree/master/unmunch
    )
    
    
    ----------------------------------------------------------------
    
    Le dictionnaire Hunspell ajoute des élisions (l', d', qu', ç', j', m', s', n'…)
    même devant des consonnes (changement dû à 7.0)
    et même devant des mots où ça ne veut rien dire (déjà dans 6.3)
    
        Le 1er problème est dû à des règles d’affixes de cette forme:
            PFX L' 0 l' . dp:le|la+
            PFX L' 0 L' . dp:le|la+
            PFX D' 0 d' . dp:de+
            PFX D' 0 D' . dp:de+
            PFX Q' 0 qu' . dp:que+
            PFX Q' 0 Qu' . dp:que+
            PFX j' 0 j' . dp:je+
            ...
        où la condition "." est triviale. Il faudrait changer la condition pour
        qu’elle vérifie que la 1re lettre du mot préfixé est une voyelle ou H:
            PFX L' 0 l' [AÀÂEÈÉÊIÎOÔUYŒÆHaàâeèéêiîoôuyœæh] dp:le|la+
        (voir le drapeau préfixe Um qui fait quelque chose de similaire)
    
    autres suggestions d’améliorations pour le fichier *.aff:
    
        MAP ÿŸ    (à ajouter au MAP pour i)
        MAP œŒ(oe)(Oe)(OE)
        MAP æÆ(ae)(Ae)(AE)
    
    Le fichier *.dic ne contient que des apostrophes droites,
    SAUF une unique apostrophe typographique dans le lemme de ce mot:
    
        chefs-d'œuvre/D'Q' po:nom is:mas is:pl st:chef-d’œuvre
    
    le tableur ne contient que des apostrophes typographiques,
    SAUF une unique apostrophe droite dans le lemme de ce mot:
    
        boutons-d’or    bouton-d'or
    
    mots absents dans le tableur mais présents dans le dictionnaire Hunspell:
    
        vas-y
        va-t'en
        allez-vous-en
        allez-y
        allons-nous-en
        allons-y
        entrebattez-vous
        entrebattons-nous
        entre-détruisez-vous
        entredétruisez-vous
        entre-détruisons-nous
        entredétruisons-nous
        entre-nuisez-vous
        entrenuisez-vous
        entre-nuisons-nous
        entrenuisons-nous
        attoflops
        centiflops
        décaflops
        déciflops
        exaflops
        femtoflops
        gigaflops
        hectoflops
        kiloflops
        mégaflops
        microflops
        milliflops
        nanoflops
        petaflops
        pétaflops
        picoflops
        téraflops
        yoctoflops
        yottaflops
        zeptoflops
        zettaflops
    
    mots présents dans le tableur mais absents dans le dictionnaire Hunspell:
    
        - tous les mots contenant un point:
            b.a.-ba
            c.-à-d
            J.-C
        - tous les mots avec espaces:
            + mots latins ou anglais:
                deus ex machina
                jet set
                machine learning
                machine learnings
                nec plus ultra
                northern blot
                persona non grata
                southern blot
                standing ovation
                standing ovations
                star system
                star systems
                statu quo
            + noms propres ok:
                Air France
                Apache Software Foundation
                Buenos Aires
                Central Park
                Club Méditerranée
                Cosa Nostra
                Creative Commons
                Deutsche Bank
                Free Software Foundation
                General Electric
                General Motors
                Hong Kong
                La Nouvelle-Orléans
                La Rochelle
                Las Vegas
                Le Bris
                Les Vigneaux
                Los Angeles
                New Delhi
                New York
                Phnom Penh
                Rhode Island
                Royal Navy
                San Francisco
                Sierra Leone
                Silicon Valley
                Texas Instruments
                The Document Foundation
                Wall Street
            + noms propres douteux (qui seraient plutôt à supprimer du tableur):
                Casseurs Flowters
                Énergie Partagée
                Golden Show
                Hero Corp
                Lovely Rita
                Mix Bizarre
                Olea Medical
                Scred TV
                Standard de Liège
        - autres mots:
            Gaspésie–Îles-de-la-Madeleine
            Saguenay–Lac-Saint-Jean
            R&D
    
    mots douteux (dans le tableur et dans le dictionnaire Hunspell):
    
        Apexagri (une entreprise)
        Dordoigne (un patronyme, une entreprise)
        Demerlé (un patronyme)
        Dᴏꜱꜱᴍᴀɴɴ (patronyme, écrit en petites capitales Unicode)
        Bîne (???)
        peuton (ça devrait être Peuton, une commune française)
        software
    
  3. login: "anonymous"
  4. mimetype: "text/plain"
  5. private_contact changed to: "1a37c4cdff08452f3896fa4b368161a9b4d6010c"
  6. severity changed to: "Important"
  7. status changed to: "Open"
  8. title changed to: "Diverses erreurs dans Lexique"
  9. type changed to: "Code_Defect"