Grammalecte  Check-in [bc646479ae]

Overview
Comment:[fr] quelques ajustements
Downloads: Tarball | ZIP archive | SQL archive
Timelines: family | ancestors | descendants | both | fr | rg
Files: files | file ages | folders
SHA3-256: bc646479ae236ee89feb7e00f6d6bcc3e1515af04c1a6e4b85410732c7f22aee
User & Date: olr on 2018-08-25 08:16:21
Other Links: branch diff | manifest | tags
Context
2018-08-25
12:21
[fr] faux positif: être content check-in: fc959d7ba3 user: olr tags: fr, rg
08:16
[fr] quelques ajustements check-in: bc646479ae user: olr tags: fr, rg
08:15
[core] gc engine: useless trailing spaces in token rewriting check-in: 7afd82e022 user: olr tags: core, rg
Changes

Modified gc_lang/fr/rules.grx from [02d22bc255] to [2f595cfb08].

2258
2259
2260
2261
2262
2263
2264
2265

2266
2267
2268
2269
2270
2271
2272
2273
2274
2275
2276
2277
2278
2279
2280

2281
2282
2283
2284
2285
2286
2287
2258
2259
2260
2261
2262
2263
2264

2265
2266
2267
2268
2269
2270
2271
2272
2273
2274
2275
2276
2277
2278
2279

2280
2281
2282
2283
2284
2285
2286
2287







-
+














-
+







    rut
        <<- ->> fut                                                                                 # Erreur de numérisation ?

TEST: __ocr__ ce petit {{rut}} traité comme un chien

# il / n / ils / U / Us / i1 / if / 11
__ocr_il__
    [<start>|,]  n  ~[bcdfghjklmnpqrstvwxz]
    [<start>|,]  [n|h|d]  ~[bcdfghjklmnpqrstvwxz]
        <<- morph(\3, ":(?:O[on]|3s)") -2>> il                                                      # Erreur de numérisation ?

    U
        <<- ->> Il|il                                                                               # Erreur de numérisation ?

    Us
        <<- ->> Ils|ils                                                                             # Erreur de numérisation ?

    [i1|if|11|1f]
        <<- ->> Il|il                                                                               # Erreur de numérisation ?

    [i1s|ifs|11s|1fs]
        <<- ->> Ils|ils                                                                             # Erreur de numérisation ?

TEST: __ocr__ {{n }}contient trop de soufre.
TEST: __ocr__ {{n}} contient trop de soufre.
TEST: __ocr__ {{Us}} arrive demain.
TEST: __ocr__ {{i1s}} en savent beaucoup trop pour leur propre bien.


# fa / la
__ocr_la__
    fa
2308
2309
2310
2311
2312
2313
2314
2315
2316


2317
2318
2319
2320
2321
2322
2323
2308
2309
2310
2311
2312
2313
2314


2315
2316
2317
2318
2319
2320
2321
2322
2323







-
-
+
+








    ~^[Ii1]’[aâeéèêëiîïoôuyh]
        <<- ->> ="l’"+\1[2:] + "|L’"+\1[2:] + "|j’"+\1[2:] + "|J’"+\1[2:]                           # Erreur de numérisation ?

    [I|i|1]  ~^[aâeéèêëiîïoôuy]
        <<- ->> l’\2|L’\2|j’\2|J’\2                                                                 # Erreur de numérisation ?

TEST: __ocr__ {{Y’}}arrive demain.
TEST: __ocr__ {{I’}}arrive demain.
TEST: __ocr__ {{Y’arrive}} demain.
TEST: __ocr__ {{I’arrive}} demain.


# l’ / V / P
__ocr_l__
    ~^V.
        <<- \1.istitle() and before(r"\w") and morph(\1, ":", ":M") >>>
        <<- spell(\1[1:]) ->> ="v"+\1[1:] + "|l’"+\1[1:]                                            # Erreur de numérisation ?
2364
2365
2366
2367
2368
2369
2370

2371
2372
2373
2374
2375
2376
2377
2378
2379
2380
2381
2382

2383
2384
2385
2386
2387
2388
2389
2364
2365
2366
2367
2368
2369
2370
2371
2372
2373
2374
2375
2376
2377
2378
2379
2380
2381
2382

2383
2384
2385
2386
2387
2388
2389
2390







+











-
+







        <<- not morph(<1, ":(?:V0|N.*:m:[si])") ->> tu|le|la                                        # Erreur de numérisation ?

TEST: __ocr__ il s’agit de {{lés}} observer.
TEST: __ocr__ avec {{1e}} chien du policier
TEST: __ocr__ il le jura sur {{1a}} tête de sa mère
TEST: __ocr__ {{1c}} chat du voinsin est idiot
TEST: __ocr__ {{lai}} gros sont mal vus.
TEST: __ocr__ {{1es}} jours clairs
TEST: __ocr__ {{lu}} as si bien réussi


# M. / Mr / M
__ocr_mr__
    M ,  ~^[A-ZÉÈ]
        <<- -1:2>> "Mr |M. "                                                                        # Erreur de numérisation ?

    M  ~^[A-ZÉÈ]
        <<- -1>> "Mr |M. "                                                                          # Erreur de numérisation ?

TEST: __ocr__ {{M, }}Patrick nous a oubliés.
TEST: __ocr__ {{M,}} Patrick nous a oubliés.


# Mais / Hais / Mats / niais
__ocr_mais__
    Hais
        <<- ->> Mais                                                                                # Erreur de numérisation ?

2540
2541
2542
2543
2544
2545
2546
2547

2548
2549
2550
2551
2552
2553
2554
2541
2542
2543
2544
2545
2546
2547

2548
2549
2550
2551
2552
2553
2554
2555







-
+







TEST: __ocr__ elles ne savent pas {{quo}} faire
TEST: __ocr__ {{Quo}} penser de tout ceci ?
TEST: __ocr__ pour elle, c’est une condition sine qua non.


# qu’importe
__ocr_qu_importe__
    qu’ importé
    [qu’|qu] [importé|importa]
        <<- -2>> importe                                                                            # Erreur de numérisation ?

TEST: __ocr__ Qu’{{importé}} le flacon, pourvu qu’on ait l’ivresse.


# qui / gui
__ocr_qui__
2660
2661
2662
2663
2664
2665
2666
2667

2668
2669
2670
2671
2672
2673
2674
2661
2662
2663
2664
2665
2666
2667

2668
2669
2670
2671
2672
2673
2674
2675







-
+








TEST: __ocr__ il avait {{ure}} femme élégante et silencieuse
TEST: __ocr__ c’est pour {{vine}} amie


# vous / voua / voue
__ocr_vous__
    [vous|voua]
    [voue|voua]
        <<- ->> vous                                                                                # Erreur de numérisation ?

TEST: __ocr__ avec {{voue}}, je n’ai pas confiance.



@@@@
9170
9171
9172
9173
9174
9175
9176
9177

9178
9179
9180
9181
9182
9183
9184
9171
9172
9173
9174
9175
9176
9177

9178
9179
9180
9181
9182
9183
9184
9185







-
+







    >numéro  *NUM
    [n°|no]  *NUM
        <<- ~2>> *


__mot_composé_avec_là__
    ~-[lL][àÀ]$
        <<- morph(\1, ":[NAQ]", ":G", 0, -3) ~>> =\1[:-3]
        <<- morph(\1, ":[NA]", ":G", 0, -3) ~>> =\1[:-3]

TEST: cette femme-là {{étaient}} partout.


__simplification_des_nombres__
    [vingt|trente|quarante|cinquante|soixante|soixante-dix|septante|quatre-vingt|octante|huitante|quatre-vingt-dix|nonante|mille] et [un|une|onze]
        <<- ~>> \1-et-\3||