Grammalecte  Check-in [2b52a5e3d7]

Overview
Comment:[fr] conversion: regex rules -> graph rules
Downloads: Tarball | ZIP archive | SQL archive
Timelines: family | ancestors | descendants | both | fr | rg
Files: files | file ages | folders
SHA3-256: 2b52a5e3d76f7f1ec799e11654d865899c4ccba1facbb1464fa18083353c35d4
User & Date: olr on 2018-07-24 22:13:18
Other Links: branch diff | manifest | tags
Context
2018-07-24
22:14
[core][bug] gc engine: use ad hoc token index check-in: 28025b7ef5 user: olr tags: core, rg
22:13
[fr] conversion: regex rules -> graph rules check-in: 2b52a5e3d7 user: olr tags: fr, rg
21:23
[fr] conversion: regex rules -> graph rules check-in: e4f2abc13a user: olr tags: fr, rg
Changes

Modified gc_lang/fr/rules.grx from [364771fc0c] to [d42fea4f5c].

5108
5109
5110
5111
5112
5113
5114
5115

5116
5117
5118
5119
5120
5121
5122
5108
5109
5110
5111
5112
5113
5114

5115
5116
5117
5118
5119
5120
5121
5122







-
+







TEST: Ce sale {{tir-au-flan}} le paiera cher.
TEST: le flan est une pâtisserie.
TEST: versez du caramel sur le flan.


# en son for intérieur / fort
__conf_for_intérieur__
    [en|dans] [mon|ton|son|leur|notre|votre] [fort|forts|fore|fores] [>intérieure]
    [en|dans] [mon|ton|son|leur|notre|votre] [fort|forts|fore|fores|fors] [>intérieure]
        <<- /conf/ -3:4>> for intérieur                                     # Confusion : “for” vient du latin “forum” et le “for intérieur” évoque la conscience individuelle.

TEST: En mon {{fort intérieur}}, je le crois.
TEST: Dans son {{fort intérieur}}, je le crois.


# golf / golfe
8513
8514
8515
8516
8517
8518
8519

































8520
8521
8522
8523
8524
8525
8526
8527
8528
8529
8530
8531
8532
8533
8534
8535
8536
8537
8538
8539
8540
8541
8542
8543
8544
8545
8546
8513
8514
8515
8516
8517
8518
8519
8520
8521
8522
8523
8524
8525
8526
8527
8528
8529
8530
8531
8532
8533
8534
8535
8536
8537
8538
8539
8540
8541
8542
8543
8544
8545
8546
8547
8548
8549
8550
8551
8552
8553
8554
8555
8556
8557
8558
8559













8560
8561
8562
8563
8564
8565
8566







+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+







-
-
-
-
-
-
-
-
-
-
-
-
-







    complètement
        <<- not morph(<1, ":D.*:m") ~>> *

    ~.ment$  ?[parlant|pas]¿
        <<- morph(\1, ":W", ":(?:3p|N)") ~>> *


# tous / tout / toute / toutes
__purge_tout_tout_tous_toutes__
    tout            [le|ce|cet|mon|ton|son]
    toute           [la|cette|ma|ta|sa]
    [tous|toutes]   [les|des|mes|tes|ses|ces|nos|vos|leurs]
        <<- ~1>> *


@@@@
@@@@
@@@@
@@@@
@@@@GRAPH: purge_avant_gn                                                                                  _
@@@@
@@@@
@@@@
@@@@

__purge_ponctuations__
    ,   ,
    (   )
    [   ]
    <   >
    [-|–|—]  [-|–|—]
        <<- ~>> *

    <start>  ,
        <<- ~2>> *

    ,  <end>
        <<- ~1>> *



@@@@
@@@@END_GRAPH                                                                                      _
@@@@



# tous / tout / toute / toutes
__[i](p_tout_déterminant_masculin)__        (tout) (?:le|cet?|[mts]on) @@0              <<- ~1>> *
__[i](p_toute_déterminant_féminin)__        (toute) (?:la|cette|[mts]a) @@0             <<- ~1>> *
__[i](p_tous_toutes_déterminant_pluriel)__  (tou(?:te|)s) (?:[ldscsmt]es|[nv]os) @@0    <<- ~1>> *


# après
__<s>(p_virgule_virgule)__              , +,                                        <<- ~>> *
__<s>(p_première_virgule)__             ^ *,                                        <<- ~>> *
__<s>(p_dernière_virgule)__             , *$                                        <<- ~>> *
__<s>(p_tiret_tiret)__                  [—–-] +[—–-]                                <<- ~>> *
__<s>(p_parenthèses_vides)__            [(] +[)]                                    <<- ~>> *
__<s>(p_balise_vide)__                  [<] +[>]                                    <<- ~>> *


## Seconde passe (il faut réorganiser tout le cycle de simplification)

__[i](p_à_nos_yeux)__
    (à (?:[mts]es|[nv]os|leurs) yeux) +({w_1}) @@0,$ <<- not morph(\2, ":A.*:[me]:[pi]", False) ~1>> *
__[i](p_à_la_dernière)__