1473
1474
1475
1476
1477
1478
1479
1480
1481
1482
1483
1484
1485
1486
1487
1488
1489
1490
1491
1492
1493
1494
1495
|
1473
1474
1475
1476
1477
1478
1479
1480
1481
1482
1483
1484
1485
1486
1487
1488
1489
1490
1491
1492
1493
1494
1495
1496
|
-
-
+
+
+
|
<<- ->> \1\2|\1-\2 # Trait d’union conditionnel. Erreur de numérisation ?
TEST: __ocr__ c’est {{anti‑américain}}
## Caractères rares
__<s>/ocr(ocr_caractères_rares)__
\w*[{}<>&*#£]+\w*
<<- \0 != "<" and \0 != ">" ->> _ # Erreur de numérisation ? Cette chaîne contient un caractère de fréquence rare.
\w*[{}<>&*#£^|]+\w*
<<- \0 != "<" and \0 != ">" ->> _ # Erreur de numérisation ? Cette chaîne contient un caractère de fréquence rare.
__<s>/ocr(ocr_doublons_caractères_rares)__
[\]\[({}][\]\[({}]+
<<- ->> _ # Erreur de numérisation ? Succession douteuse de caractères.
TEST: __ocr__ trouve {{l£}} temps
TEST: __ocr__ elle s’{{avance*}} sur le seuil
TEST: __ocr__ {{e||e}} vient
TEST: __ocr__ par beaucoup d’argent ? {{{Il}} débouche le Jack Daniels
TEST: __ocr__ {{[[}}voyons celà].
TEST: __ocr__ {{((}}voyons ceci).
## Mélange chiffres/lettres
__[i]/ocr(ocr_le_la_les_regex)__
|
2503
2504
2505
2506
2507
2508
2509
2510
2511
2512
2513
2514
2515
2516
2517
|
2504
2505
2506
2507
2508
2509
2510
2511
2512
2513
2514
2515
2516
2517
2518
|
-
+
|
TEST: __ocr__ {{J }}arrive demain
# Note: l’option “mapos” cherche les apostrophes manquantes après les lettres l, d, n, m, t, s, j, c, ç
__ocr_lettres_isolées2!2__
[á|â|ä|b|c|ç|d|e|é|è|ê|ë|f|g|h|i|í|ì|î|ï|j|k|l|m|n|o|ó|ò|ô|ö|p|q|r|s|t|u|ú|ù|û|ü|v|w|x|z]
<<- not before("\\d[ ]+$") and not (\1.isupper() and value(>1, "|.|<end>|"))
<<- /ocr/ not before("\\d[ ]+$") and not (\1.isupper() and value(>1, "|.|<end>|"))
->> _ # Lettre isolée : erreur de numérisation ?
TEST: __ocr__ des verres luisent sur {{i}} le bureau blanc.
TEST: __ocr__ la voix, {{e}} est celle de…
TEST: __ocr__ ressemble {{h}} une fenêtre de serre.
TEST: __ocr__ Ça a duré 3 h.
TEST: __ocr__ c’est alors que je suis fort.
|
16016
16017
16018
16019
16020
16021
16022
16023
16024
16025
16026
16027
16028
16029
16030
16031
16032
16033
16034
16035
16036
16037
16038
16039
16040
16041
16042
16043
16044
16045
16046
16047
16048
16049
16050
16051
16052
16053
16054
16055
16056
16057
16058
16059
16060
|
16017
16018
16019
16020
16021
16022
16023
16024
16025
16026
16027
16028
16029
16030
16031
16032
16033
16034
16035
16036
16037
16038
16039
16040
16041
16042
16043
16044
16045
16046
16047
16048
16049
16050
16051
16052
16053
16054
16055
16056
16057
16058
16059
16060
16061
16062
|
-
+
-
+
-
+
+
-
+
|
TEST: {{Quelques}} deux cents hommes. ->> Quelque
TEST: les quelque 2,5 millions d’habitants
TEST: les quelque 12 000 stations-service
## Celui, celle, ceux, celles
__gn_celui__
celui @:¬:(?:G|W|m:[si])
celui @:¬:(?:G|W|P|m:[si])
<<- /gn/ morph(\-1, ":A.*:f") --1>> =suggMasSing(\-1, True) # Accord avec “\1” : cet adjectif devrait être au masculin singulier.
<<- /gn/ __else__ and morph(\-1, ":A.*:p") -2>> =suggMasSing(\-1) # Accord avec “\1” : cet adjectif devrait être au masculin singulier.
TEST: celui {{envoyés}} là-bas tombera dans un piège
TEST: celui {{perdue}} aura une pénalité
TEST: celui pris par surprise sera abattu
__gn_celle__
celle @:¬:(?:G|W|f:[si])
celle @:¬:(?:G|W|P|f:[si])
<<- /gn/ morph(\-1, ":A.*:m") --1>> =suggFemSing(\-1, True) # Accord avec “\1” : cet adjectif devrait être au féminin singulier.
<<- /gn/ __else__ and morph(\-1, ":A.*:p") -2>> =suggFemSing(\-1) # Accord avec “\1” : cet adjectif devrait être au féminin singulier.
TEST: celle {{envoyés}} là-bas tombera dans un piège
TEST: celle {{perdues}} aura une pénalité
TEST: celle prise par surprise sera abattue
__gn_ceux__
ceux @:¬:(?:G|W|m:[pi])
ceux @:¬:(?:G|W|P|m:[pi])
<<- /gn/ morph(\-1, ":A.*:f") --1>> =suggMasPlur(\-1, True) # Accord avec “\1” : cet adjectif devrait être au masculin pluriel.
<<- /gn/ __else__ and morph(\-1, ":A.*:s") -2>> =suggMasPlur(\-1) # Accord avec “\1” : cet adjectif devrait être au masculin pluriel.
TEST: ceux {{envoyé}} là-bas tombera dans un piège
TEST: ceux {{perdues}} auront une pénalité
TEST: ceux perdus dans la neige
TEST: l’approche conseillée, c’est-à-dire celle consistant à réaliser un diagnostic
__gn_celles__
celles @:¬:(?:G|W|f:[pi])
celles @:¬:(?:G|W|P|f:[pi])
<<- /gn/ morph(\-1, ":A.*:m") --1>> =suggFemPlur(\-1, True) # Accord avec “\1” : cet adjectif devrait être au féminin pluriel.
<<- /gn/ __else__ and morph(\-1, ":A.*:s") -2>> =suggFemPlur(\-1) # Accord avec “\1” : cet adjectif devrait être au féminin pluriel.
TEST: celles {{envoyés}} là-bas tombera dans un piège
TEST: celles {{perdue}} aura une pénalité
TEST: celles venues chanter doivent se rendre là-bas.
|