1392
1393
1394
1395
1396
1397
1398
1399
1400
1401
1402
1403
1404
1405
|
->> _ # Erreur de numérisation ? Mot composé inconnu du dictionnaire.
TEST: __ocr__ c’est du {{base-bal}}]
TEST: __ocr__ cet homme-là est corrompu.
TEST: __ocr__ cette femme-là est revenue nous dire ce qu’elle pensait de nous.
TEST: __ocr__ Est-ce le bon moment pour nous ennuyer avec ça ?
## Lettres isolées
# Note: l’option “mapos” cherche les apostrophes manquantes après les lettres l, d, n, m, t, s, j, c, ç
__[s]/ocr(ocr_lettres_isolées)!2__
\w(?!’)
<<- not re.search("[0-9aàAÀyYdlnmtsjcçDLNMTSJCÇ_]", \0) and not before("\\d[ ]+$") and not (\0.isupper() and after0(r"^\."))
->> _ # Lettre isolée : erreur de numérisation ?
|
>
>
>
>
>
>
>
>
|
1392
1393
1394
1395
1396
1397
1398
1399
1400
1401
1402
1403
1404
1405
1406
1407
1408
1409
1410
1411
1412
1413
|
->> _ # Erreur de numérisation ? Mot composé inconnu du dictionnaire.
TEST: __ocr__ c’est du {{base-bal}}]
TEST: __ocr__ cet homme-là est corrompu.
TEST: __ocr__ cette femme-là est revenue nous dire ce qu’elle pensait de nous.
TEST: __ocr__ Est-ce le bon moment pour nous ennuyer avec ça ?
## Trait d’union conditionnel
__[i]/ocr(tu_trait_union_conditionnel)__
({w1})‑({w1}) @@0,$
<<- ->> \1\2|\1-\2 # Trait d’union conditionnel. Erreur de numérisation ?
TEST: __ocr__ c’est {{anti-américain}}
## Lettres isolées
# Note: l’option “mapos” cherche les apostrophes manquantes après les lettres l, d, n, m, t, s, j, c, ç
__[s]/ocr(ocr_lettres_isolées)!2__
\w(?!’)
<<- not re.search("[0-9aàAÀyYdlnmtsjcçDLNMTSJCÇ_]", \0) and not before("\\d[ ]+$") and not (\0.isupper() and after0(r"^\."))
->> _ # Lettre isolée : erreur de numérisation ?
|
1540
1541
1542
1543
1544
1545
1546
1547
1548
1549
1550
1551
1552
1553
1554
1555
1556
1557
|
->> \1 # Doublon.
TEST: Il y a un {{doublon doublon}}.
### Traits d’union douteux
__[i]/tu(tu_trait_union_douteux)__
({w1})(?:--|—|–)({w1}) @@0,$
<<- spell(\1+"-"+\2) and analyse(\1+"-"+\2, ":") ->> \1-\2 # Trait d’union : un tiret simple suffit.
TEST: Nous préparons une {{contre–attaque}}.
!!!! Nombres: typographie !!
#(\d\d\d\d)-(\d\d\d\d) <<- ->> \1–\2 # Ne pas séparer deux dates par un trait d’union, mais par un tiret demi-cadratin.
__[s]/num(num_lettre_O_zéro1)__ [\dO]+[O][\dO]+ <<- not option("ocr") ->> =\0.replace("O", "0") # S’il s’agit d’un nombre, utilisez le chiffre « 0 » plutôt que la lettre « O ».
|
|
>
>
|
1548
1549
1550
1551
1552
1553
1554
1555
1556
1557
1558
1559
1560
1561
1562
1563
1564
1565
1566
1567
|
->> \1 # Doublon.
TEST: Il y a un {{doublon doublon}}.
### Traits d’union douteux
__[i]/tu(tu_trait_union_douteux)__
({w1})(?:--|—|–|−|⁃)({w1}) @@0,$
<<- spell(\1+"-"+\2) and analyse(\1+"-"+\2, ":") ->> \1-\2 # Trait d’union : un tiret simple suffit.
TEST: Nous préparons une {{contre–attaque}}.
TEST: Nous préparons une {{contre−attaque}}.
!!!! Nombres: typographie !!
#(\d\d\d\d)-(\d\d\d\d) <<- ->> \1–\2 # Ne pas séparer deux dates par un trait d’union, mais par un tiret demi-cadratin.
__[s]/num(num_lettre_O_zéro1)__ [\dO]+[O][\dO]+ <<- not option("ocr") ->> =\0.replace("O", "0") # S’il s’agit d’un nombre, utilisez le chiffre « 0 » plutôt que la lettre « O ».
|