1590
1591
1592
1593
1594
1595
1596
1597
1598
1599
1600
1601
1602
1603
1604
1605
1606
1607
1608
|
!!!
!!!
!!! Processeur: épuration des signes inutiles et quelques simplifications !!
!!!
!!!
# fin de phrase
__<s>(p_fin_de_phrase)__ [.?!:;…][ .?!… »”")]*$ <<- ~>> *
# Guillemets et exposants
__<s>(p_guillemets_exposants)__ [«»“”"„`¹²³⁴⁵⁶⁷⁸⁹⁰]+ <<- ~>> *
# Chapitres et références
__<s>(p_chapitre_référence)__ [\[({][\dIVXLCDM]+, \d+[\])}] <js>[\[\(\{][\dIVXLCDM]+, \d+[\]\)\}]</js> <<- ~>> *
# le, la ou les chose(s)
__[i>(p_le_ou_les)__ l[ea] ou les {w_2}([(]s[)]) @@$ <<- ~1>> s
__[i](p_le_ou_la)__ l(e ou la|a ou le) {w_2} @@1 <<- ~1>> ’
|
>
>
>
|
|
|
1590
1591
1592
1593
1594
1595
1596
1597
1598
1599
1600
1601
1602
1603
1604
1605
1606
1607
1608
1609
1610
1611
|
!!!
!!!
!!! Processeur: épuration des signes inutiles et quelques simplifications !!
!!!
!!!
# début de phrase
__<s>(p_début_de_phrase)__ ^[ .?!:;–—•·… »«‘’“”\"'¿¡-]+ <<- ~>> *
# fin de phrase
__<s>(p_fin_de_phrase)__ [ .?!:;–—•·… »«‘’“”\"'¿¡-]+$ <<- ~>> *
# Guillemets et exposants
__<s>(p_guillemets_exposants)__ [«»“”\"„`¹²³⁴⁵⁶⁷⁸⁹⁰]+ <<- ~>> *
# Chapitres et références
__<s>(p_chapitre_référence)__ [\[({][\dIVXLCDM]+, \d+[\])}] <js>[\[\(\{][\dIVXLCDM]+, \d+[\]\)\}]</js> <<- ~>> *
# le, la ou les chose(s)
__[i>(p_le_ou_les)__ l[ea] ou les {w_2}([(]s[)]) @@$ <<- ~1>> s
__[i](p_le_ou_la)__ l(e ou la|a ou le) {w_2} @@1 <<- ~1>> ’
|