Overview
Comment: | [fr] quelques ajustements |
---|---|
Downloads: | Tarball | ZIP archive | SQL archive |
Timelines: | family | ancestors | descendants | both | fr | rg |
Files: | files | file ages | folders |
SHA3-256: |
bc646479ae236ee89feb7e00f6d6bcc3 |
User & Date: | olr on 2018-08-25 08:16:21 |
Other Links: | branch diff | manifest | tags |
Context
2018-08-25
| ||
12:21 | [fr] faux positif: être content check-in: fc959d7ba3 user: olr tags: fr, rg | |
08:16 | [fr] quelques ajustements check-in: bc646479ae user: olr tags: fr, rg | |
08:15 | [core] gc engine: useless trailing spaces in token rewriting check-in: 7afd82e022 user: olr tags: core, rg | |
Changes
Modified gc_lang/fr/rules.grx from [02d22bc255] to [2f595cfb08].
︙ | ︙ | |||
2258 2259 2260 2261 2262 2263 2264 | rut <<- ->> fut # Erreur de numérisation ? TEST: __ocr__ ce petit {{rut}} traité comme un chien # il / n / ils / U / Us / i1 / if / 11 __ocr_il__ | | | | 2258 2259 2260 2261 2262 2263 2264 2265 2266 2267 2268 2269 2270 2271 2272 2273 2274 2275 2276 2277 2278 2279 2280 2281 2282 2283 2284 2285 2286 2287 | rut <<- ->> fut # Erreur de numérisation ? TEST: __ocr__ ce petit {{rut}} traité comme un chien # il / n / ils / U / Us / i1 / if / 11 __ocr_il__ [<start>|,] [n|h|d] ~[bcdfghjklmnpqrstvwxz] <<- morph(\3, ":(?:O[on]|3s)") -2>> il # Erreur de numérisation ? U <<- ->> Il|il # Erreur de numérisation ? Us <<- ->> Ils|ils # Erreur de numérisation ? [i1|if|11|1f] <<- ->> Il|il # Erreur de numérisation ? [i1s|ifs|11s|1fs] <<- ->> Ils|ils # Erreur de numérisation ? TEST: __ocr__ {{n}} contient trop de soufre. TEST: __ocr__ {{Us}} arrive demain. TEST: __ocr__ {{i1s}} en savent beaucoup trop pour leur propre bien. # fa / la __ocr_la__ fa |
︙ | ︙ | |||
2308 2309 2310 2311 2312 2313 2314 | ~^[Ii1]’[aâeéèêëiîïoôuyh] <<- ->> ="l’"+\1[2:] + "|L’"+\1[2:] + "|j’"+\1[2:] + "|J’"+\1[2:] # Erreur de numérisation ? [I|i|1] ~^[aâeéèêëiîïoôuy] <<- ->> l’\2|L’\2|j’\2|J’\2 # Erreur de numérisation ? | | | | 2308 2309 2310 2311 2312 2313 2314 2315 2316 2317 2318 2319 2320 2321 2322 2323 | ~^[Ii1]’[aâeéèêëiîïoôuyh] <<- ->> ="l’"+\1[2:] + "|L’"+\1[2:] + "|j’"+\1[2:] + "|J’"+\1[2:] # Erreur de numérisation ? [I|i|1] ~^[aâeéèêëiîïoôuy] <<- ->> l’\2|L’\2|j’\2|J’\2 # Erreur de numérisation ? TEST: __ocr__ {{Y’arrive}} demain. TEST: __ocr__ {{I’arrive}} demain. # l’ / V / P __ocr_l__ ~^V. <<- \1.istitle() and before(r"\w") and morph(\1, ":", ":M") >>> <<- spell(\1[1:]) ->> ="v"+\1[1:] + "|l’"+\1[1:] # Erreur de numérisation ? |
︙ | ︙ | |||
2364 2365 2366 2367 2368 2369 2370 2371 2372 2373 2374 2375 2376 2377 2378 2379 2380 2381 | <<- not morph(<1, ":(?:V0|N.*:m:[si])") ->> tu|le|la # Erreur de numérisation ? TEST: __ocr__ il s’agit de {{lés}} observer. TEST: __ocr__ avec {{1e}} chien du policier TEST: __ocr__ il le jura sur {{1a}} tête de sa mère TEST: __ocr__ {{1c}} chat du voinsin est idiot TEST: __ocr__ {{lai}} gros sont mal vus. TEST: __ocr__ {{lu}} as si bien réussi # M. / Mr / M __ocr_mr__ M , ~^[A-ZÉÈ] <<- -1:2>> "Mr |M. " # Erreur de numérisation ? M ~^[A-ZÉÈ] <<- -1>> "Mr |M. " # Erreur de numérisation ? | > | | 2364 2365 2366 2367 2368 2369 2370 2371 2372 2373 2374 2375 2376 2377 2378 2379 2380 2381 2382 2383 2384 2385 2386 2387 2388 2389 2390 | <<- not morph(<1, ":(?:V0|N.*:m:[si])") ->> tu|le|la # Erreur de numérisation ? TEST: __ocr__ il s’agit de {{lés}} observer. TEST: __ocr__ avec {{1e}} chien du policier TEST: __ocr__ il le jura sur {{1a}} tête de sa mère TEST: __ocr__ {{1c}} chat du voinsin est idiot TEST: __ocr__ {{lai}} gros sont mal vus. TEST: __ocr__ {{1es}} jours clairs TEST: __ocr__ {{lu}} as si bien réussi # M. / Mr / M __ocr_mr__ M , ~^[A-ZÉÈ] <<- -1:2>> "Mr |M. " # Erreur de numérisation ? M ~^[A-ZÉÈ] <<- -1>> "Mr |M. " # Erreur de numérisation ? TEST: __ocr__ {{M,}} Patrick nous a oubliés. # Mais / Hais / Mats / niais __ocr_mais__ Hais <<- ->> Mais # Erreur de numérisation ? |
︙ | ︙ | |||
2540 2541 2542 2543 2544 2545 2546 | TEST: __ocr__ elles ne savent pas {{quo}} faire TEST: __ocr__ {{Quo}} penser de tout ceci ? TEST: __ocr__ pour elle, c’est une condition sine qua non. # qu’importe __ocr_qu_importe__ | | | 2541 2542 2543 2544 2545 2546 2547 2548 2549 2550 2551 2552 2553 2554 2555 | TEST: __ocr__ elles ne savent pas {{quo}} faire TEST: __ocr__ {{Quo}} penser de tout ceci ? TEST: __ocr__ pour elle, c’est une condition sine qua non. # qu’importe __ocr_qu_importe__ [qu’|qu] [importé|importa] <<- -2>> importe # Erreur de numérisation ? TEST: __ocr__ Qu’{{importé}} le flacon, pourvu qu’on ait l’ivresse. # qui / gui __ocr_qui__ |
︙ | ︙ | |||
2660 2661 2662 2663 2664 2665 2666 | TEST: __ocr__ il avait {{ure}} femme élégante et silencieuse TEST: __ocr__ c’est pour {{vine}} amie # vous / voua / voue __ocr_vous__ | | | 2661 2662 2663 2664 2665 2666 2667 2668 2669 2670 2671 2672 2673 2674 2675 | TEST: __ocr__ il avait {{ure}} femme élégante et silencieuse TEST: __ocr__ c’est pour {{vine}} amie # vous / voua / voue __ocr_vous__ [voue|voua] <<- ->> vous # Erreur de numérisation ? TEST: __ocr__ avec {{voue}}, je n’ai pas confiance. @@@@ |
︙ | ︙ | |||
9170 9171 9172 9173 9174 9175 9176 | >numéro *NUM [n°|no] *NUM <<- ~2>> * __mot_composé_avec_là__ ~-[lL][àÀ]$ | | | 9171 9172 9173 9174 9175 9176 9177 9178 9179 9180 9181 9182 9183 9184 9185 | >numéro *NUM [n°|no] *NUM <<- ~2>> * __mot_composé_avec_là__ ~-[lL][àÀ]$ <<- morph(\1, ":[NA]", ":G", 0, -3) ~>> =\1[:-3] TEST: cette femme-là {{étaient}} partout. __simplification_des_nombres__ [vingt|trente|quarante|cinquante|soixante|soixante-dix|septante|quatre-vingt|octante|huitante|quatre-vingt-dix|nonante|mille] et [un|une|onze] <<- ~>> \1-et-\3|| |
︙ | ︙ |