1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
|
#!python3
# -*- coding: UTF-8 -*-
dSimilarChars = {
"a": "aàâáä",
"à": "aàâáä",
"â": "aàâáä",
"á": "aàâáä",
"ä": "aàâáä",
"c": "cç",
"ç": "cç",
"e": "eéêèë",
"é": "eéêèë",
"ê": "eéêèë",
"è": "eéêèë",
"ë": "eéêèë",
"i": "iîïíì",
"î": "iîïíì",
"ï": "iîïíì",
"í": "iîïíì",
"ì": "iîïíì",
"o": "oôóòö",
"ô": "oôóòö",
"ó": "oôóòö",
"ò": "oôóòö",
"ö": "oôóòö",
"u": "uûùüú",
"û": "uûùüú",
"ù": "uûùüú",
"ü": "uûùüú",
"ú": "uûùüú",
}
## No stemming
def noStemming (sFlex, sStem):
return sStem
def rebuildWord (sFlex, cmd1, cmd2):
|
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
|
1
2
3
4
5
6
7
8
|
#!python3
## No stemming
def noStemming (sFlex, sStem):
return sStem
def rebuildWord (sFlex, cmd1, cmd2):
|