Grammalecte  Check-in [bf49a78851]

Overview
Comment:[fr] màj: métagraphe, màj: dictionnaire
Downloads: Tarball | ZIP archive | SQL archive
Timelines: family | ancestors | descendants | both | trunk | fr
Files: files | file ages | folders
SHA3-256: bf49a78851ccddbf8cd8fbba726cacc7c4754d6f720437ec5b22c39391ebe6ab
User & Date: olr on 2019-04-09 13:39:51
Original Comment: [fr] màj: métagraphe
Other Links: manifest | tags
Context
2019-04-11
21:00
[fr][core] découpage des phrases check-in: 119552d3ae user: olr tags: trunk, fr, core
2019-04-09
13:39
[fr] màj: métagraphe, màj: dictionnaire check-in: bf49a78851 user: olr tags: trunk, fr
13:39
[fr] faux positif check-in: 7ee30b8b77 user: olr tags: trunk, fr
Changes

Modified gc_lang/fr/dictionnaire/metagraphe.py from [47f74994c2] to [faeb79ed1d].

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25


26

27
28
29
30
31
32
33
#! python3
#
# Metagraphe
#
# By Olivier R. - 2013

import re
import unicodedata

# Dictionnaire des caractères pour la phonétique         
PHMAP = str.maketrans({ 'à': 'a',  'â': 'a',  'ä': 'a',  'å': 'a',  'ā': 'a',
                        'ç': 'S',
                        'é': 'é',  'è': 'é',  'ê': 'é',  'ë': 'é',  'ē': 'é',
                        'î': 'i',  'ï': 'i',  'ī': 'i', 
                        'ñ': 'ni',
                        'ô': 'o',  'ö': 'o',  'ō': 'o',
                        'ù': 'u',  'û': 'u',  'ü': 'u',  'ū': 'u',
                        'ÿ': 'i',
                        'æ': 'é' })

def getPhonex (s, sMorph):
    "returns a simplified phonetic string"
    s = s.lower().translate(PHMAP)
    if re.match("[A-Z0-9]+$", s) or len(s) == 1:
        return s


    else:

        s = re.sub("sc(?=[eéiy])", "S", s)
        s = re.sub("x[cs](?=[eéiy])", "kS", s)
        s = re.sub("c(?=[eéiy])", "S", s)
        s = re.sub("c(?=[auoœ])", "k", s)
        s = re.sub("ge(?=[ao])", "j", s)
        s = re.sub("g(?=[ieéy])", "j", s)
        s = re.sub("gue", "ge", s)







|

|



|








<
|

>
>

>







1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

23
24
25
26
27
28
29
30
31
32
33
34
35
#! python3
#
# Metagraphe
#
# By Olivier R. - 2013

import re


# Dictionnaire des caractères pour la phonétique
PHMAP = str.maketrans({ 'à': 'a',  'â': 'a',  'ä': 'a',  'å': 'a',  'ā': 'a',
                        'ç': 'S',
                        'é': 'é',  'è': 'é',  'ê': 'é',  'ë': 'é',  'ē': 'é',
                        'î': 'i',  'ï': 'i',  'ī': 'i',
                        'ñ': 'ni',
                        'ô': 'o',  'ö': 'o',  'ō': 'o',
                        'ù': 'u',  'û': 'u',  'ü': 'u',  'ū': 'u',
                        'ÿ': 'i',
                        'æ': 'é' })

def getPhonex (s, sMorph):
    "returns a simplified phonetic string"

    if re.match("[A-Z0-9]{2,}$", s):
        return s
    elif len(s) == 1:
        return s.lower().translate(PHMAP)
    else:
        s = s.lower().translate(PHMAP)
        s = re.sub("sc(?=[eéiy])", "S", s)
        s = re.sub("x[cs](?=[eéiy])", "kS", s)
        s = re.sub("c(?=[eéiy])", "S", s)
        s = re.sub("c(?=[auoœ])", "k", s)
        s = re.sub("ge(?=[ao])", "j", s)
        s = re.sub("g(?=[ieéy])", "j", s)
        s = re.sub("gue", "ge", s)
103
104
105
106
107
108
109
110
111
112
113
def getGraphix (s):
    "returns a simplified spelling"
    return ''


def getMetagraphe (s, sMorph):
    return (getPhonex(s, sMorph), getGraphix(s))

if __name__ == '__main__':
    import doctest
    doctest.testmod()







<
<
<
<
105
106
107
108
109
110
111




def getGraphix (s):
    "returns a simplified spelling"
    return ''


def getMetagraphe (s, sMorph):
    return (getPhonex(s, sMorph), getGraphix(s))




Modified gc_lang/fr/dictionnaire/orthographe/FRANCAIS.dic from [1346a3c0c4] to [9a6bd64955].

1
2
3
4
5
6
7
8
83581
Ω/U.||--	po:nom	is:mas	is:inv	lx:symb	se:élec	di:*	fq:0	id:201049
_	po:div	di:*	fq:0	id:231410
&	po:mg	po:cjco	se:@	di:*	fq:5	id:220668
ℓ/U.||--	po:nom	is:mas	is:inv	lx:symb	di:*	fq:4	id:223155
1ʳᵉ/--	po:adj	is:fem	is:sg	lx:ord	se:@	di:*	fq:0	id:225847
1ᵉʳ/--	po:adj	is:mas	is:sg	lx:ord	se:@	di:*	fq:2	id:225845
1ʳᵉˢ/--	po:adj	is:fem	is:pl	lx:ord	se:@	di:*	fq:0	id:225848
|







1
2
3
4
5
6
7
8
83583
Ω/U.||--	po:nom	is:mas	is:inv	lx:symb	se:élec	di:*	fq:0	id:201049
_	po:div	di:*	fq:0	id:231410
&	po:mg	po:cjco	se:@	di:*	fq:5	id:220668
ℓ/U.||--	po:nom	is:mas	is:inv	lx:symb	di:*	fq:4	id:223155
1ʳᵉ/--	po:adj	is:fem	is:sg	lx:ord	se:@	di:*	fq:0	id:225847
1ᵉʳ/--	po:adj	is:mas	is:sg	lx:ord	se:@	di:*	fq:2	id:225845
1ʳᵉˢ/--	po:adj	is:fem	is:pl	lx:ord	se:@	di:*	fq:0	id:225848
26246
26247
26248
26249
26250
26251
26252
26253
26254
26255
26256
26257
26258
26259
26260
économat/S*()	po:nom	is:mas	di:*	fq:5	id:180909
économe/S*()	po:nom	po:adj	is:epi	di:*	fq:6	id:180910
économètre/S*()	po:nom	is:epi	di:*	fq:5	id:203036
économétricienne/F*()	po:nom	di:*	fq:3	id:180919
économétrie/S*()	po:nom	is:fem	di:*	fq:5	id:180920
économétrique/S*()	po:adj	is:epi	di:*	fq:6	id:180921
économicisme/S*()	po:nom	is:mas	se:philo	se:écono	di:*	fq:4	id:229238
économiciste/S*()	po:nom	po:adj	is:adj	se:philo	se:écono	di:*	fq:4	id:229239
économicité/S*()	po:nom	is:fem	se:écono	di:*	fq:4	id:223943
économicopolitique/S*()	po:adj	is:epi	se:écono	se:polit	di:R	fq:4	id:230206
économico-politique/S*()	po:adj	is:epi	se:écono	se:polit	di:M	fq:2	id:230205
économico-sociale/W*()	po:adj	se:polit	se:écono	di:*	fq:2	id:224400
économie/S*()	po:nom	is:fem	se:écono	di:*	fq:8	id:180911
économique/S*()	po:nom	po:adj	is:epi	se:écono	di:*	fq:8	id:180912
économiquement/D'Q'	po:adv	di:*	fq:6	id:180913







|







26246
26247
26248
26249
26250
26251
26252
26253
26254
26255
26256
26257
26258
26259
26260
économat/S*()	po:nom	is:mas	di:*	fq:5	id:180909
économe/S*()	po:nom	po:adj	is:epi	di:*	fq:6	id:180910
économètre/S*()	po:nom	is:epi	di:*	fq:5	id:203036
économétricienne/F*()	po:nom	di:*	fq:3	id:180919
économétrie/S*()	po:nom	is:fem	di:*	fq:5	id:180920
économétrique/S*()	po:adj	is:epi	di:*	fq:6	id:180921
économicisme/S*()	po:nom	is:mas	se:philo	se:écono	di:*	fq:4	id:229238
économiciste/S*()	po:nom	po:adj	is:epi	se:philo	se:écono	di:*	fq:4	id:229239
économicité/S*()	po:nom	is:fem	se:écono	di:*	fq:4	id:223943
économicopolitique/S*()	po:adj	is:epi	se:écono	se:polit	di:R	fq:4	id:230206
économico-politique/S*()	po:adj	is:epi	se:écono	se:polit	di:M	fq:2	id:230205
économico-sociale/W*()	po:adj	se:polit	se:écono	di:*	fq:2	id:224400
économie/S*()	po:nom	is:fem	se:écono	di:*	fq:8	id:180911
économique/S*()	po:nom	po:adj	is:epi	se:écono	di:*	fq:8	id:180912
économiquement/D'Q'	po:adv	di:*	fq:6	id:180913
69259
69260
69261
69262
69263
69264
69265
69266
69267
69268
69269
69270
69271
69272
69273
69274
69275
69276
69277
69278
69279
69280
69281
69282

69283
69284
69285
69286
69287
69288
69289
rythmicienne/F.()	po:nom	di:*	fq:4	id:170258
rythmicité/S.()	po:nom	is:fem	di:*	fq:5	id:170259
rythmique/S.()	po:adj	is:epi	di:*	fq:6	id:170260
rythmiquement	po:adv	di:*	fq:5	id:170261
Ryxeo	po:patr	is:epi	is:inv	di:X	fq:1	id:227309
s	po:nom	is:mas	is:inv	di:*	fq:8	id:171110
s/U.||--	po:nom	is:fem	is:inv	lx:symb	di:*	fq:8	id:201100
s’	po:mg	po:properobj	po:preverb	po:3pe	is:epi	is:sg	is:pl	st:se	se:@	di:*	fq:0	id:232450
S/U.||--	po:nom	is:mas	is:inv	lx:symb	di:*	fq:8	id:201099
sa	po:mg	po:detpos	is:fem	is:sg	se:@	di:*	fq:9	id:171116
SA	po:nom	is:fem	is:inv	lx:sig	di:*	fq:6	id:201275
Saab	po:npr	is:epi	is:inv	se:soc	se:auto	di:*	fq:5	id:229134
Saad	po:prn	is:mas	is:inv	di:*	fq:5	id:230658
saanen/S.()	po:nom	is:fem	se:élev	di:*	fq:2	id:228992
s’abader	po:v1____p_e_	po:infi	lx:rare	lx:rég	di:*	fq:0	id:171111
Sabatier	po:patr	is:epi	is:inv	di:X	fq:6	id:227174
sabayon/S.()	po:nom	is:mas	di:*	fq:3	id:171117
sabbat/S.()	po:nom	is:mas	di:*	fq:6	id:171118
sabbathienne/F.()	po:adj	lx:rare	di:*	fq:1	id:171119
sabbatique/S.()	po:adj	is:epi	di:*	fq:5	id:171120
sabéenne/F.()	po:nom	po:adj	di:*	fq:5	id:171159
sabéisme/S.()	po:nom	is:mas	di:*	fq:4	id:171160
sabelle/S.()	po:nom	is:fem	di:*	fq:4	id:171121
sabellianisme/S.()	po:nom	is:mas	di:*	fq:4	id:171122

sabine/F.()	po:nom	po:adj	di:*	fq:5	id:171123
Sabine	po:prn	is:fem	is:inv	di:*	fq:6	id:125321
sabir/S.()	po:nom	is:mas	di:*	fq:5	id:171124
sablage/S.()	po:nom	is:mas	di:*	fq:5	id:171125
sable	po:adj	is:epi	is:inv	lx:col	di:*	fq:7	id:212757
sable/S.()	po:nom	is:mas	di:*	fq:7	id:171126
sabler/a0p+()	po:v1_it___zz	di:*	fq:5	id:171127







|
















>







69259
69260
69261
69262
69263
69264
69265
69266
69267
69268
69269
69270
69271
69272
69273
69274
69275
69276
69277
69278
69279
69280
69281
69282
69283
69284
69285
69286
69287
69288
69289
69290
rythmicienne/F.()	po:nom	di:*	fq:4	id:170258
rythmicité/S.()	po:nom	is:fem	di:*	fq:5	id:170259
rythmique/S.()	po:adj	is:epi	di:*	fq:6	id:170260
rythmiquement	po:adv	di:*	fq:5	id:170261
Ryxeo	po:patr	is:epi	is:inv	di:X	fq:1	id:227309
s	po:nom	is:mas	is:inv	di:*	fq:8	id:171110
s/U.||--	po:nom	is:fem	is:inv	lx:symb	di:*	fq:8	id:201100
s’	po:mg	po:properobj	po:preverb	po:3pe	is:epi	is:inv	st:se	se:@	di:*	fq:0	id:232450
S/U.||--	po:nom	is:mas	is:inv	lx:symb	di:*	fq:8	id:201099
sa	po:mg	po:detpos	is:fem	is:sg	se:@	di:*	fq:9	id:171116
SA	po:nom	is:fem	is:inv	lx:sig	di:*	fq:6	id:201275
Saab	po:npr	is:epi	is:inv	se:soc	se:auto	di:*	fq:5	id:229134
Saad	po:prn	is:mas	is:inv	di:*	fq:5	id:230658
saanen/S.()	po:nom	is:fem	se:élev	di:*	fq:2	id:228992
s’abader	po:v1____p_e_	po:infi	lx:rare	lx:rég	di:*	fq:0	id:171111
Sabatier	po:patr	is:epi	is:inv	di:X	fq:6	id:227174
sabayon/S.()	po:nom	is:mas	di:*	fq:3	id:171117
sabbat/S.()	po:nom	is:mas	di:*	fq:6	id:171118
sabbathienne/F.()	po:adj	lx:rare	di:*	fq:1	id:171119
sabbatique/S.()	po:adj	is:epi	di:*	fq:5	id:171120
sabéenne/F.()	po:nom	po:adj	di:*	fq:5	id:171159
sabéisme/S.()	po:nom	is:mas	di:*	fq:4	id:171160
sabelle/S.()	po:nom	is:fem	di:*	fq:4	id:171121
sabellianisme/S.()	po:nom	is:mas	di:*	fq:4	id:171122
Sabina	po:prn	is:fem	is:inv	di:*	id:232923
sabine/F.()	po:nom	po:adj	di:*	fq:5	id:171123
Sabine	po:prn	is:fem	is:inv	di:*	fq:6	id:125321
sabir/S.()	po:nom	is:mas	di:*	fq:5	id:171124
sablage/S.()	po:nom	is:mas	di:*	fq:5	id:171125
sable	po:adj	is:epi	is:inv	lx:col	di:*	fq:7	id:212757
sable/S.()	po:nom	is:mas	di:*	fq:7	id:171126
sabler/a0p+()	po:v1_it___zz	di:*	fq:5	id:171127
70830
70831
70832
70833
70834
70835
70836
70837
70838
70839
70840
70841
70842
70843
70844
scyphozoaire/S.()	po:nom	is:mas	se:zool	et:grec	di:*	fq:1	id:218960
scytale/S.()	po:nom	is:fem	et:grec	di:*	fq:4	id:215346
scythe/S.()	po:nom	po:adj	is:epi	di:*	fq:5	id:172121
scythique/S.()	po:adj	is:epi	di:*	fq:5	id:172122
sdcard/S.()	po:nom	is:fem	lx:sig	se:info	di:X	fq:2	id:227695
SDF	po:nom	is:epi	is:inv	lx:sig	di:*	fq:5	id:205926
SDTAN	po:nom	is:mas	is:inv	lx:sig	di:X	fq:1	id:227431
se	po:mg	po:properobj	po:preverb	po:3pe	is:epi	is:sg	is:pl	se:@	di:*	fq:9	id:172133
seaborgium/S.()	po:nom	is:mas	di:*	fq:2	id:182487
Seagate	po:npr	is:epi	is:inv	se:soc	se:info	di:*	fq:3	id:226844
sea-line/S.()	po:nom	is:mas	se:indus	se:techni	et:angl	di:*	fq:1	id:223436
SeaMonkey	po:npr	is:mas	is:inv	se:prod	se:info	et:angl	di:*	fq:3	id:201677
Seamus	po:prn	is:mas	is:inv	di:*	fq:4	id:225097
Sean	po:prn	is:mas	is:inv	di:*	fq:5	id:221221
séance/S.()	po:nom	is:fem	di:*	fq:8	id:175230







|







70831
70832
70833
70834
70835
70836
70837
70838
70839
70840
70841
70842
70843
70844
70845
scyphozoaire/S.()	po:nom	is:mas	se:zool	et:grec	di:*	fq:1	id:218960
scytale/S.()	po:nom	is:fem	et:grec	di:*	fq:4	id:215346
scythe/S.()	po:nom	po:adj	is:epi	di:*	fq:5	id:172121
scythique/S.()	po:adj	is:epi	di:*	fq:5	id:172122
sdcard/S.()	po:nom	is:fem	lx:sig	se:info	di:X	fq:2	id:227695
SDF	po:nom	is:epi	is:inv	lx:sig	di:*	fq:5	id:205926
SDTAN	po:nom	is:mas	is:inv	lx:sig	di:X	fq:1	id:227431
se	po:mg	po:properobj	po:preverb	po:3pe	is:epi	is:inv	se:@	di:*	fq:9	id:172133
seaborgium/S.()	po:nom	is:mas	di:*	fq:2	id:182487
Seagate	po:npr	is:epi	is:inv	se:soc	se:info	di:*	fq:3	id:226844
sea-line/S.()	po:nom	is:mas	se:indus	se:techni	et:angl	di:*	fq:1	id:223436
SeaMonkey	po:npr	is:mas	is:inv	se:prod	se:info	et:angl	di:*	fq:3	id:201677
Seamus	po:prn	is:mas	is:inv	di:*	fq:4	id:225097
Sean	po:prn	is:mas	is:inv	di:*	fq:5	id:221221
séance/S.()	po:nom	is:fem	di:*	fq:8	id:175230
81893
81894
81895
81896
81897
81898
81899

81900
81901
81902
81903
81904
81905
81906
vintage/S.()	po:nom	is:mas	et:angl	di:*	fq:4	id:203491
vintage/S.()	po:adj	is:epi	et:angl	di:R	fq:4	id:203492
vinyle/S.()	po:nom	is:mas	di:*	fq:5	id:179584
vinylidénique/S.()	po:adj	is:epi	se:chim	di:*	fq:0	id:226500
vinylique/S.()	po:adj	is:epi	di:*	fq:5	id:179585
vinylite/S.()	po:nom	is:fem	di:*	fq:3	id:179586
vioc/S.()	po:nom	is:epi	di:*	fq:3	id:179587

viol/S.()	po:nom	is:mas	se:crime	di:*	fq:6	id:179588
violable/S.()	po:adj	is:epi	di:*	fq:4	id:220639
violacer/a0p+()	po:v1__t_q_zz	di:*	fq:6	id:179589
Violaine	po:prn	is:fem	is:inv	di:*	fq:5	id:217294
violat/S.()	po:nom	is:mas	se:pharma	et:lat	di:*	fq:4	id:179591
violation/S.()	po:nom	is:fem	di:*	fq:7	id:179592
violâtre/S.()	po:adj	is:epi	di:*	fq:5	id:179614







>







81894
81895
81896
81897
81898
81899
81900
81901
81902
81903
81904
81905
81906
81907
81908
vintage/S.()	po:nom	is:mas	et:angl	di:*	fq:4	id:203491
vintage/S.()	po:adj	is:epi	et:angl	di:R	fq:4	id:203492
vinyle/S.()	po:nom	is:mas	di:*	fq:5	id:179584
vinylidénique/S.()	po:adj	is:epi	se:chim	di:*	fq:0	id:226500
vinylique/S.()	po:adj	is:epi	di:*	fq:5	id:179585
vinylite/S.()	po:nom	is:fem	di:*	fq:3	id:179586
vioc/S.()	po:nom	is:epi	di:*	fq:3	id:179587
viognier/S.()	po:nom	is:mas	se:alcool	di:*	id:232922
viol/S.()	po:nom	is:mas	se:crime	di:*	fq:6	id:179588
violable/S.()	po:adj	is:epi	di:*	fq:4	id:220639
violacer/a0p+()	po:v1__t_q_zz	di:*	fq:6	id:179589
Violaine	po:prn	is:fem	is:inv	di:*	fq:5	id:217294
violat/S.()	po:nom	is:mas	se:pharma	et:lat	di:*	fq:4	id:179591
violation/S.()	po:nom	is:fem	di:*	fq:7	id:179592
violâtre/S.()	po:adj	is:epi	di:*	fq:5	id:179614