1386
1387
1388
1389
1390
1391
1392
1393
1394
1395
1396
1397
1398
1399
1400
1401
1402
1403
1404
1405
|
1386
1387
1388
1389
1390
1391
1392
1393
1394
1395
1396
1397
1398
1399
1400
1401
1402
1403
1404
|
-
-
-
+
+
+
-
|
(1’)[aâeéèêëiîïoôuyh][\w-]* @@0
<<- -1>> l’|L’|j’|J’ # Erreur de numérisation ?
TEST: __ocr__ {{1’}}année s’annonce agitée.
__[i]/ocr(ocr_il_regex)__
[i1][1f]s?
<<- \0.endswith("s") ->> Ils|ils # Erreur de numérisation ?
<<- __else__ ->> Il|il # Erreur de numérisation ?
1fs?
<<- \0.endswith("s") ->> Ils|ils|ifs # Erreur de numérisation ?
<<- __else__ ->> Il|il|if # Erreur de numérisation ?
TEST: __ocr__ {{1fs}} s’en sortent comme ils peuvent.
TEST: __ocr__ {{i1s}} en savent beaucoup trop pour leur propre bien.
!!!
!!!
!!! Processeur: Dernier nettoyage avant coupure du paragraphe en phrases !!
!!!
|
2481
2482
2483
2484
2485
2486
2487
2488
2489
2490
2491
2492
2493
2494
2495
2496
2497
2498
2499
2500
2501
2502
|
2480
2481
2482
2483
2484
2485
2486
2487
2488
2489
2490
2491
2492
2493
2494
2495
2496
2497
2498
2499
2500
2501
2502
2503
2504
2505
2506
2507
2508
2509
|
-
+
-
+
+
+
+
+
+
+
+
+
|
# il / n / ils / U / Us / i1 / if / 11
__ocr_il__
[<start>|,] [n|h|d] ~^[bcdfghjklmnpqrstvwxz]
<<- morph(\3, ":(?:O[on]|3s)") -2>> il # Erreur de numérisation ?
U
[U|if|i1]
<<- ->> Il|il # Erreur de numérisation ?
Us
[Us|ifs|i1s]
<<- ->> Ils|ils # Erreur de numérisation ?
11
<<- not morph(>1, ":N", "*")
->> Il|il # Erreur de numérisation ?
TEST: __ocr__ {{n}} contient trop de soufre.
TEST: __ocr__ {{Us}} arrive demain.
TEST: __ocr__ {{i1s}} en savent beaucoup trop pour leur propre bien.
TEST: __ocr__ elle a 11 ans.
TEST: __ocr__ 11 jours de souffrance
TEST: __ocr__ nous sommes le 11 septembre
# fa / la
__ocr_la__
fa
<<- ->> la # Erreur de numérisation ?
|
5352
5353
5354
5355
5356
5357
5358
5359
5360
5361
5362
5363
5364
5365
|
5359
5360
5361
5362
5363
5364
5365
5366
5367
5368
5369
5370
5371
5372
5373
5374
5375
5376
5377
5378
5379
5380
5381
5382
5383
5384
5385
5386
5387
5388
5389
5390
5391
5392
5393
5394
5395
5396
5397
5398
5399
5400
5401
5402
5403
5404
5405
5406
5407
5408
5409
5410
5411
5412
5413
5414
5415
|
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
|
<<- /conf/ not (morph(\2, ":V0") and morph(\3, ":[QY]"))
-2>> =suggSimil(\2, ":[AWGT]", True) # Incohérence probable avec “si” : “\2” ne devrait pas être une forme verbale conjuguée.
TEST: Ces gens sont si {{prit}} par leur travail qu’ils en oublient de vivre.
TEST: Ça ira mieux demain, surtout si émerge une demande forte de la part des consommateurs.
TEST: Toutes les bifurcations qui auraient été possibles si avaient été pris en compte des critères autre que la captation de valeur ajoutée, l’augmentation des taux de profit, et l’accumulation du capital.
__conf_si_x_être__
si *WORD [/-je|/-tu|/-il|/-elle|/-on|/-nous|/-vous|/-ils|/-elles]
<<- /conf/ morphVC(\3, ">(?:être|devenir|redevenir|rester|sembler|demeurer|para[îi]tre)/") and morph(\2, ":(?:Y|[123][sp])", ":[AQ]")
-2>> =suggVerbPpas(\2) # Incohérence probable. Ce devrait probablement être un participe passé ou un adjectif.
TEST: si {{frapper}} fussent-ils, rien ne put les mouvoir.
TEST: si détruit soit-il, on pourra le remettre sur ses pieds.
__conj_si_x_être__
si *WORD [/-je|/-tu]
<<- /conf/ morphVC(\3, ">(?:être|devenir|redevenir|rester|sembler|demeurer|para[îi]tre)/") and morph(\2, ":A.*:p", ":[si]")
-2>> =suggSing(\2) # Accord avec “\3” : l’adjectif doit être au singulier.
si *WORD /-il
<<- /conf/ morphVC(\3, ">(?:être|devenir|redevenir|rester|sembler|demeurer|para[îi]tre)/") and morph(\2, ":A.*:[fp]", ":[me]:[si]")
-2>> =suggMasSing(\2) # Accord avec “\3” : l’adjectif doit être au masculin singulier.
si *WORD /-elle
<<- /conf/ morphVC(\3, ">(?:être|devenir|redevenir|rester|sembler|demeurer|para[îi]tre)/") and morph(\2, ":A.*:[mp]", ":[fe]:[si]")
-2>> =suggFemSing(\2) # Accord avec “\3” : l’adjectif doit être au féminin singulier.
si *WORD /-nous
<<- /conf/ morphVC(\3, ">(?:être|devenir|redevenir|rester|sembler|demeurer|para[îi]tre)/") and morph(\2, ":A.*:s", ":[pi]")
-2>> =suggPlur(\2) # Accord avec “\3” : l’adjectif doit être au pluriel.
si *WORD /-ils
<<- /conf/ morphVC(\3, ">(?:être|devenir|redevenir|rester|sembler|demeurer|para[îi]tre)/") and morph(\2, ":A.*:[sf]", ":[me]:[pi]")
-2>> =suggMasPlur(\2) # Accord avec “\3” : l’adjectif doit être au masculin pluriel.
si *WORD /-elles
<<- /conf/ morphVC(\3, ">(?:être|devenir|redevenir|rester|sembler|demeurer|para[îi]tre)/") and morph(\2, ":A.*:[sm]", ":[fe]:[pi]")
-2>> =suggFemPlur(\2) # Accord avec “\3” : l’adjectif doit être au féminin pluriel.
TEST: si {{clairvoyants}} deviendrais-je
TEST: si {{fragiles}} sois-tu
TEST: si {{idiote}} semble-t-il
TEST: si {{riches}} soit-elle
TEST: si {{grand}} paraissons-nous
TEST: si {{frappé}} fussent-ils, rien ne put les mouvoir.
TEST: si {{étonnés}} demeurent-elles
__conf_trop_vconj__
trop @:[123][sp]¬:(?:[GNAQWM]|3p)
<<- /conf/ not tag_before(\1, "ce_que") -2>> _ # Incohérence probable avec “trop” : “\2” n’est ni un adjectif, ni un participe passé, ni un adverbe.
TEST: J’ai trop {{mangeais}}.
TEST: Ce que nous réussissons presque sera considéré comme un échec.
|
11063
11064
11065
11066
11067
11068
11069
11070
11071
11072
11073
11074
11075
11076
11077
|
11113
11114
11115
11116
11117
11118
11119
11120
11121
11122
11123
11124
11125
11126
11127
|
-
+
|
jaune [paille|sable]
noir [de|d’] [encre|jais]
noir et blanc
rose [bonbon|chair|corail]
rouge [brique|carmin|cerise|écarlate|rubis|sang|tomate|vermillon]
vert [émeraude|olive|pistache|pomme]
<<- morph(<1, ":[NA]", ":D") ~>> *
<<- __else__ and morph(<1, ":D|>(?:être|devenir|redevenir|rester|sembler|demeurer)") ~>> ␣
<<- __else__ and morph(<1, ":D|>(?:être|devenir|redevenir|rester|sembler|demeurer|para[îi]tre)") ~>> ␣
<<- __also__ =>> define(\1, [":A:e:i"])
__simplification_noms_propres__
don Juan
<<- ~1>> *
|