385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
|
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
|
-
-
+
+
+
-
-
-
+
+
+
-
+
|
("(?<!,) etc[.]", ", etc.", True, True)
],
"misc3": [
("[ -]t[’'](?=il\\b|elle|on\\b)", "-t-", True, True),
(" t-(?=il|elle|on)", "-t-", True, True),
("[ -]t[’'-](?=ils|elles)", "-", True, True),
("(?<=[td])-t-(?=il|elle|on)", "-", True, True),
(" c(elles?|elui|eux) (ci|là)\\b", " c$1-$2", True, True),
("C(elles?|elui|eux) (ci|là)\\b", "C$1-$2", True, True),
(" ce(lles?|lui|ux) (ci|là)\\b", " ce$1-$2", True, True),
("Ce(lles?|lui|ux) (ci|là)\\b", "Ce$1-$2", True, True),
(" dix (sept|huit|neuf)", " dix-$1", True, True),
("Dix (sept|huit|neuf)", "Dix-$1", True, True),
("quatre vingt", "quatre-vingt", False, True),
("Quatre vingt", "Quatre-vingt", False, True),
("(soixante|quatre-vingt) (deux|trois|quatre|cinq|six|sept|huit|neuf|dix|onze|douze|treize|quatorze|quinze|seize|dix-sept|dix-huit|dix-neuf)", "$1-$2", True, False),
("(vingt|trente|quarante|cinquante) (deux|trois|quatre|cinq|six|sept|huit|neuf)", "$1-$2", True, False),
(" ci (joint|desso?us|contre|devant|avant|après|incluse|g[îi]t|gisent)", " ci-$1", True, True),
("(?<!-)\\b(ci) (joint|desso?us|contre|devant|avant|après|incluse|g[îi]t|gisent)", "$1-$2", True, False),
("\\bvis à vis", "vis-à-vis", False, True),
("\\bVis à vis", "Vis-à-vis", False, True),
("Ci (joint|desso?us|contre|devant|avant|après|incluse|g[îi]t|gisent)", "Ci-$1", True, True),
(" vis à vis\\b", "vis-à-vis", False, True),
("Vis à vis\\b", "Vis-à-vis", False, True),
("week end", "week-end", False, True),
("Week end", "Week-end", False, True),
("(plus|moins) value", "$1-value", True, False)
("(plus|moins) value", "$1-value", True, False),
],
"misc5a": [
("(qu|lorsqu|puisqu|quoiqu|presqu|jusqu|aujourd|entr|quelqu) ", "$1’", True, True),
],
"misc5b": [
("\\bj (?=[aàeéêiîoôuyhAÀEÉÊIÎOÔUYH])", "j’", True, True),
("\\bn (?=[aàeéêiîoôuyhAÀEÉÊIÎOÔUYH])", "n’", True, True),
|