Grammalecte: Changes On Branch 71c195e4f6ee607d

Changes In Branch Lexicographe Through [71c195e4f6] Excluding Merge-Ins

This is equivalent to a diff from 4ffad6e596 to 71c195e4f6

2017-11-06
11:58		[fr] locution: à vil prix check-in: a7b1ce6537 user: olr tags: fr, Lexicographe
2017-11-05
18:23		[fr] locutions: màj check-in: 71c195e4f6 user: olr tags: fr, Lexicographe
18:21		[fr] locutions: màj check-in: 2afa78ffb5 user: olr tags: fr, Lexicographe
2017-10-29
11:19		Détection des locutions dans le lexicographe check-in: 47ddd1a06d user: IllusionPerdu tags: Lexicographe
2017-10-28
19:58		[build][fr] build_data: code cleaning check-in: ba1b8fe0e2 user: olr tags: trunk, fr, build
13:47		[build][fr] rename locutions files check-in: 4ffad6e596 user: olr tags: trunk, fr, build
13:17		[build][fr] data: locutions check-in: e356116b6e user: olr tags: trunk, fr, build

Modified gc_core/js/text.js from [9bf91b3594] to [abcdad5f85].

Modified gc_core/js/tokenizer.js from [9bb6ea03fb] to [9d996e312d].

Modified gc_lang/fr/build_data.py from [1ffed9614b] to [1c5ad0c32d].

Deleted gc_lang/fr/data/locutions.txt version [190d018874].

Added gc_lang/fr/data/locutions_adjectivales.txt version [7996fc7d51].

Added gc_lang/fr/data/locutions_adverbiales.txt version [7bd0ef2732].

Added gc_lang/fr/data/locutions_conjonctives.txt version [5596a0d0a0].

Added gc_lang/fr/data/locutions_interjectives.txt version [a75dfa4d36].

Added gc_lang/fr/data/locutions_nominales.txt version [d33a0ce029].

more than 10,000 changes

Added gc_lang/fr/data/locutions_pronominales.txt version [774a9591f7].

Added gc_lang/fr/data/locutions_prépositives.txt version [e91665df2c].

Added gc_lang/fr/data/locutions_verbales.txt version [2dfa915420].

Modified gc_lang/fr/modules-js/lexicographe.js from [08da929c5c] to [e07c787a42].

Modified gc_lang/fr/modules-js/locutions_data.json from [12115cc355] to [835a70fdd1].

cannot compute difference between binary files

Modified gc_lang/fr/modules/locutions_data.py from [4e9754ba4b] to [1b8f1d5aa6].

cannot compute difference between binary files

Modified gc_lang/fr/webext/content_scripts/panel_lxg.css from [58f7a11f55] to [3124710f3d].

Modified gc_lang/fr/webext/content_scripts/panel_lxg.js from [d3537b8dce] to [efe863473e].

Modified gc_lang/fr/webext/gce_worker.js from [ad4b1695da] to [ac6f473dd4].

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26	1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26	- + - +	// JavaScript /jslint esversion: 6/ /global require,exports/ "use strict"; if (typeof(require) !== 'undefined') { var helpers = require("resource://grammalecte/helpers.js"); } var text = { ~~getParagraph: function* (sText) {~~ getParagraph: function* (sText, sSepParagraph = "\n") { // generator: returns paragraphs of text let iStart = 0; let iEnd = 0; sText = sText.replace("\r\n", "\n").replace("\r", "\n"); ~~while ((iEnd = sText.indexOf(~~"\n"~~, iStart)) !== -1) {~~ while ((iEnd = sText.indexOf(sSepParagraph, iStart)) !== -1) { yield sText.slice(iStart, iEnd); iStart = iEnd + 1; } yield sText.slice(iStart); }, wrap: function* (sText, nWidth=80) {
︙
41 42 43 44 45 46 47 48 49 50 51 52 53 54 55	41 42 43 44 45 46 47 48 49 50 51 52 53 54 55	- +	} yield sText; }, getReadableError: function (oErr) { // Returns an error oErr as a readable error try { ~~let sResult = "\n* " + oErr['nStart'] + ":" + oErr['nEnd']~~ let sResult = "\n* " + oErr['nStart'] + ":" + oErr['nEnd'] + " # " + oErr['sLineId'] + " # " + oErr['sRuleId'] + ":\n"; sResult += " " + oErr["sMessage"]; if (oErr["aSuggestions"].length > 0) { sResult += "\n > Suggestions : " + oErr["aSuggestions"].join(" \| "); } if (oErr["URL"] !== "") { sResult += "\n > URL: " + oErr["URL"];
︙

︙
12 13 14 15 16 17 18 ~~19 20~~ 21 22 23 24 25 26 27 28 29 30 31 32 33 ~~34 35~~ 36 37 38 39 40 41 42	12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42	- - + + - - + +	const aTkzPatterns = { // All regexps must start with ^. "default": [ [/^[  \t]+/, 'SPACE'], [/^\/(?:bin\|boot\|dev\|etc\|home\|lib\|mnt\|opt\|root\|sbin\|tmp\|usr\|var\|Bureau\|Documents\|Images\|Musique\|Public\|Téléchargements\|Vidéos)(?:\/[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ_.()-]+)/, 'FOLDER'], [/^[a-zA-Z]:\\(?:Program Files(?: \(x86\)\|)\|[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ.()]+)(?:\\[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ_.()-]+)/, 'FOLDER'], [/^\/(?:~\|bin\|boot\|dev\|etc\|home\|lib\|mnt\|opt\|root\|sbin\|tmp\|usr\|var\|Bureau\|Documents\|Images\|Musique\|Public\|Téléchargements\|Vidéos)(?:\/[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ_.()-]+)/, 'FOLDERLINUX'], [/^[a-zA-Z]:\\(?:Program Files(?: \(x86\)\|)\|[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ.()]+)(?:\\[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ_.()-]+)/, 'FOLDERWIN'], [/^[,.;:!?…«»“”‘’"(){}\[\]/·–—]+/, 'SEPARATOR'], [/^(?:https?:\/\/\|www[.]\|[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ_-]+[@.][a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ_-]{2,}[@.])[a-zA-Z0-9][a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ_.\/?&!%=+"'@$#-]+/, 'LINK'], [/^[#@][a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ_-]+/, 'TAG'], [/^<[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ]+.?>\|<\/[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ]+ >/, 'HTML'], [/^\[\/?[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ]+\]/, 'PSEUDOHTML'], [/^&\w+;(?:\w+;\|)/, 'HTMLENTITY'], [/^\d\d?h\d\d\b/, 'HOUR'], [/^-?\d+(?:[.,]\d+\|)/, 'NUM'], [/^[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ]+(?:[’'`-][a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ]+)/, 'WORD'] ], "fr": [ [/^[  \t]+/, 'SPACE'], [/^\/(?:bin\|boot\|dev\|etc\|home\|lib\|mnt\|opt\|root\|sbin\|tmp\|usr\|var\|Bureau\|Documents\|Images\|Musique\|Public\|Téléchargements\|Vidéos)(?:\/[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ_.()-]+)/, 'FOLDER'], [/^[a-zA-Z]:\\(?:Program Files(?: \(x86\)\|)\|[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ.()]+)(?:\\[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ_.()-]+)/, 'FOLDER'], [/^\/(?:~\|bin\|boot\|dev\|etc\|home\|lib\|mnt\|opt\|root\|sbin\|tmp\|usr\|var\|Bureau\|Documents\|Images\|Musique\|Public\|Téléchargements\|Vidéos)(?:\/[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ_.()-]+)/, 'FOLDERLINUX'], [/^[a-zA-Z]:\\(?:Program Files(?: \(x86\)\|)\|[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ.()]+)(?:\\[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ_.()-]+)/, 'FOLDERWIN'], [/^[,.;:!?…«»“”‘’"(){}\[\]/·–—]+/, 'SEPARATOR'], [/^(?:https?:\/\/\|www[.]\|[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ_-]+[@.][a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ_-]{2,}[@.])[a-zA-Z0-9][a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ_.\/?&!%=+"'@$#-]+/, 'LINK'], [/^[#@][a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ_-]+/, 'TAG'], [/^<[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ]+.?>\|<\/[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ]+ *>/, 'HTML'], [/^\[\/?[a-zA-Zà-öÀ-Ö0-9ø-ÿØ-ßĀ-ʯﬁ-ﬆ]+\]/, 'PSEUDOHTML'], [/^&\w+;(?:\w+;\|)/, 'HTMLENTITY'], [/^(?:l\|d\|n\|m\|t\|s\|j\|c\|ç\|lorsqu\|puisqu\|jusqu\|quoiqu\|qu)['’`]/i, 'ELPFX'],
︙
64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81	64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81	- + - +	while (sText) { let nCut = 1; for (let [zRegex, sType] of this.aRules) { try { if ((m = zRegex.exec(sText)) !== null) { if (sType == 'SEPARATOR') { for (let c of m[0]) { ~~yield { "sType": sType, "sValue": c, "nStart": i, "nEnd": i + m[0].length }~~ yield { "sType": sType, "sValue": c, "nStart": i, "nEnd": i + m[0].length } } } else { ~~yield { "sType": sType, "sValue": m[0], "nStart": i, "nEnd": i + m[0].length }~~ yield { "sType": sType, "sValue": m[0], "nStart": i, "nEnd": i + m[0].length } } nCut = m[0].length; break; } } catch (e) { helpers.logerror(e);
︙

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35	1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50	+ + + + + + + + + + + + + + +	#!python3 # FRENCH DATA BUILDER # # by Olivier R. # License: MPL 2 import json import os import itertools import grammalecte.ibdawg as ibdawg from grammalecte.echo import echo from grammalecte.str_transform import defineSuffixCode import grammalecte.fr.conj as conj import grammalecte.tokenizer as tkz class cd: """Context manager for changing the current working directory""" def __init__ (self, newPath): self.newPath = os.path.expanduser(newPath) def __enter__ (self): self.savedPath = os.getcwd() os.chdir(self.newPath) def __exit__ (self, etype, value, traceback): os.chdir(self.savedPath) def readFile (spf): if os.path.isfile(spf): with open(spf, "r", encoding="utf-8") as hSrc: for sLine in hSrc: sLine = sLine.strip() if sLine == "__END__": break if sLine and not sLine.startswith("#"): yield sLine else: raise OSError("# Error. File not found or not loadable: " + spf) def makeDictionaries (sp, sVersion): with cd(sp+"/dictionnaire"): os.system("genfrdic.py -s -gl -v "+sVersion) def makeConj (sp, bJS=False):
︙
45 46 47 48 49 50 51 ~~52 53 54~~ 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123	60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136	- - - + + - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +	"spre": ":Sp", "simp": ":Sq", "cond": ":K", "impe": ":E", "1sg": ":1s", "2sg": ":2s", "3sg": ":3s", "1pl": ":1p", "2pl": ":2p", "3pl": ":3p", "1isg": ":1ś", "mas sg": ":Q1", "mas pl": ":Q2", "mas inv": ":Q1", "fem sg": ":Q3", "fem pl": ":Q4", "epi inv": ":Q1" } # read lexicon ~~~~with open(sp+"/data/dictConj.txt", 'r', encoding='utf-8') as hSrc:~~ nStop = 0 for n, line in enumerate(~~hSrc.~~readl~~ines(~~)):~~ nStop = 0 for n, sLine in enumerate(readFile(sp+"/data/dictConj.txt")): ~~line = line.strip()~~ nTab = line.count("\t") if nTab == 1: # new entry sLemma, sVtyp = line.split("\t") dConj = { ":PQ": { ":P": "", ":Q1": "", ":Q2": "", ":Q3": "", ":Q4": ""}, ":Ip": { ":1s": "", ":2s": "", ":3s": "", ":1p": "", ":2p": "", ":3p": "", ":1ś": "" }, ":Iq": { ":1s": "", ":2s": "", ":3s": "", ":1p": "", ":2p": "", ":3p": "" }, ":Is": { ":1s": "", ":2s": "", ":3s": "", ":1p": "", ":2p": "", ":3p": "" }, ":If": { ":1s": "", ":2s": "", ":3s": "", ":1p": "", ":2p": "", ":3p": "" }, ":K": { ":1s": "", ":2s": "", ":3s": "", ":1p": "", ":2p": "", ":3p": "" }, ":Sp": { ":1s": "", ":2s": "", ":3s": "", ":1p": "", ":2p": "", ":3p": "", ":1ś": "" }, ":Sq": { ":1s": "", ":2s": "", ":3s": "", ":1p": "", ":2p": "", ":3p": "", ":1ś": "" }, ":E": { ":2s": "", ":1p": "", ":2p": "" } } if sVtyp not in lVtyp: dVtyp[sVtyp] = nVtyp lVtyp.append(sVtyp) nVtyp += 1 elif nTab == 2: # flexion _, sTag, sFlex = line.split("\t") if sTag.count(" ") == 0: if sTag == "ppre": dConj[":PQ"][":P"] = defineSuffixCode(sLemma, sFlex) else: try: mode, g = sTag.split(maxsplit=1) mode = dTrad[mode] g = dTrad[g] if dConj[mode][g] == "": dConj[mode][g] = defineSuffixCode(sLemma, sFlex) else: # comment gérer les autres graphies ? pass except: print(sLemma.encode("utf-8").decode("ascii"), " - ", sTag, " - non géré: ", mode, " / ", g) elif line == "$": # we store the dictionary of rules for this lemma if dConj[":Ip"][":1ś"] == "2è": dConj[":Ip"][":1ś"] = "2é" elif sLemma == "pouvoir": dConj[":Ip"][":1ś"] = "6uis" lConjTags = [] for key in [":PQ", ":Ip", ":Iq", ":Is", ":If", ":K", ":Sp", ":Sq", ":E"]: bFound = False for i, d in enumerate(dPatternList[key]): if dConj[key] == d: bFound = True lConjTags.append(i) break if not bFound: lConjTags.append(len(dPatternList[key])) dPatternList[key].append(dConj[key]) tConjTags = tuple(lConjTags) if tConjTags not in lTags: dTags[tConjTags] = nTags lTags.append(tConjTags) nTags += 1 dVerb[sLemma] = (dVtyp[sVtyp], dTags[tConjTags]) else: print("# Error - unknown line #", n) nTab = sLine.count("\t") if nTab == 1: # new entry sLemma, sVtyp = sLine.split("\t") dConj = { ":PQ": { ":P": "", ":Q1": "", ":Q2": "", ":Q3": "", ":Q4": ""}, ":Ip": { ":1s": "", ":2s": "", ":3s": "", ":1p": "", ":2p": "", ":3p": "", ":1ś": "" }, ":Iq": { ":1s": "", ":2s": "", ":3s": "", ":1p": "", ":2p": "", ":3p": "" }, ":Is": { ":1s": "", ":2s": "", ":3s": "", ":1p": "", ":2p": "", ":3p": "" }, ":If": { ":1s": "", ":2s": "", ":3s": "", ":1p": "", ":2p": "", ":3p": "" }, ":K": { ":1s": "", ":2s": "", ":3s": "", ":1p": "", ":2p": "", ":3p": "" }, ":Sp": { ":1s": "", ":2s": "", ":3s": "", ":1p": "", ":2p": "", ":3p": "", ":1ś": "" }, ":Sq": { ":1s": "", ":2s": "", ":3s": "", ":1p": "", ":2p": "", ":3p": "", ":1ś": "" }, ":E": { ":2s": "", ":1p": "", ":2p": "" } } if sVtyp not in lVtyp: dVtyp[sVtyp] = nVtyp lVtyp.append(sVtyp) nVtyp += 1 elif nTab == 2: # flexion _, sTag, sFlex = sLine.split("\t") if sTag.count(" ") == 0: if sTag == "ppre": dConj[":PQ"][":P"] = defineSuffixCode(sLemma, sFlex) else: try: mode, g = sTag.split(maxsplit=1) mode = dTrad[mode] g = dTrad[g] if dConj[mode][g] == "": dConj[mode][g] = defineSuffixCode(sLemma, sFlex) else: # comment gérer les autres graphies ? pass except: print(sLemma.encode("utf-8").decode("ascii"), " - ", sTag, " - non géré: ", mode, " / ", g) elif sLine == "$": # we store the dictionary of rules for this lemma if dConj[":Ip"][":1ś"] == "2è": dConj[":Ip"][":1ś"] = "2é" elif sLemma == "pouvoir": dConj[":Ip"][":1ś"] = "6uis" lConjTags = [] for key in [":PQ", ":Ip", ":Iq", ":Is", ":If", ":K", ":Sp", ":Sq", ":E"]: bFound = False for i, d in enumerate(dPatternList[key]): if dConj[key] == d: bFound = True lConjTags.append(i) break if not bFound: lConjTags.append(len(dPatternList[key])) dPatternList[key].append(dConj[key]) tConjTags = tuple(lConjTags) if tConjTags not in lTags: dTags[tConjTags] = nTags lTags.append(tConjTags) nTags += 1 dVerb[sLemma] = (dVtyp[sVtyp], dTags[tConjTags]) else: print("# Error - unknown line #", n) # convert tuples to bytes string # si ça merde, toute la partie conversion peut être supprimée # lBytesTags = [] # for t in lTags: # b = b"" # for n in t:
︙
167 168 169 170 171 172 173 ~~174 175 176 177 178~~ 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242	180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252	- - - - - + + + - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +	print("(Python et JavaScript)" if bJS else "(Python seulement)") aPlurS = set() dTag = {} lTagMasForm = [] lTagMiscPlur = [] dMiscPlur = {} dMasForm = {} ~~~~# read lexicon~~ ~~with open(sp+"/data/dictDecl.txt", 'r', encoding='utf-8') as hSrc:~~ lTag = [] lTagMasPl = [] for n, line in enumerate(~~hSrc.~~readl~~ines(~~)):~~ lTag = [] lTagMasPl = [] for n, sLine in enumerate(readFile(sp+"/data/dictDecl.txt")): ~~line = line.strip()~~ nTab = line.count("\t") if nTab == 1: # new entry lTag.clear() lTagMasPl.clear() sLemma, sFlags = line.split("\t") if sFlags.startswith("S"): cType = "s" elif sFlags.startswith("X"): cType = "p" elif sFlags.startswith("A"): cType = "p" elif sFlags.startswith("I"): cType = "p" elif sFlags.startswith("F"): cType = "m" elif sFlags.startswith("W"): cType = "m" else: cType = "?" print(" > inconnu : " + sFlags) elif nTab == 2: if cType == "s": continue _, sFlexTags, sFlex = line.split("\t") if cType == "p": if sFlexTags.endswith("pl"): lTag.append(defineSuffixCode(sLemma, sFlex)) elif cType == "m": if sFlexTags.endswith("mas sg") or sFlexTags.endswith("mas inv"): lTag.append(defineSuffixCode(sLemma, sFlex)) if sFlexTags.endswith("mas pl"): lTagMasPl.append(defineSuffixCode(sLemma, sFlex)) else: print("erreur: " + cType) elif line == "$": if cType == "s": aPlurS.add(sLemma) elif cType == "p": sTag = "\|".join(lTag) if sTag not in dTag: dTag[sTag] = len(lTagMiscPlur) lTagMiscPlur.append(sTag) dMiscPlur[sLemma] = dTag[sTag] elif cType == "m": sTag = "\|".join(lTag) if lTagMasPl: sTag += "/" + "\|".join(lTagMasPl) if sTag not in dTag: dTag[sTag] = len(lTagMasForm) lTagMasForm.append(sTag) dMasForm[sLemma] = dTag[sTag] else: print("unknown tag: " + ctype) else: print("# Error - unknown line #", n) nTab = sLine.count("\t") if nTab == 1: # new entry lTag.clear() lTagMasPl.clear() sLemma, sFlags = sLine.split("\t") if sFlags.startswith("S"): cType = "s" elif sFlags.startswith("X"): cType = "p" elif sFlags.startswith("A"): cType = "p" elif sFlags.startswith("I"): cType = "p" elif sFlags.startswith("F"): cType = "m" elif sFlags.startswith("W"): cType = "m" else: cType = "?" print(" > inconnu : " + sFlags) elif nTab == 2: if cType == "s": continue _, sFlexTags, sFlex = sLine.split("\t") if cType == "p": if sFlexTags.endswith("pl"): lTag.append(defineSuffixCode(sLemma, sFlex)) elif cType == "m": if sFlexTags.endswith("mas sg") or sFlexTags.endswith("mas inv"): lTag.append(defineSuffixCode(sLemma, sFlex)) if sFlexTags.endswith("mas pl"): lTagMasPl.append(defineSuffixCode(sLemma, sFlex)) else: print("erreur: " + cType) elif sLine == "$": if cType == "s": aPlurS.add(sLemma) elif cType == "p": sTag = "\|".join(lTag) if sTag not in dTag: dTag[sTag] = len(lTagMiscPlur) lTagMiscPlur.append(sTag) dMiscPlur[sLemma] = dTag[sTag] elif cType == "m": sTag = "\|".join(lTag) if lTagMasPl: sTag += "/" + "\|".join(lTagMasPl) if sTag not in dTag: dTag[sTag] = len(lTagMasForm) lTagMasForm.append(sTag) dMasForm[sLemma] = dTag[sTag] else: print("unknown tag: " + ctype) else: print("# Error - unknown line #", n) ## write file for Python sCode = "# generated data (do not edit)\n\n" + \ "# list of affix codes\n" + \ "lTagMiscPlur = " + str(lTagMiscPlur) + "\n" + \ "lTagMasForm = " + str(lTagMasForm) + "\n\n" + \ "# dictionary of words with uncommon plurals (-x, -ux, english, latin and italian plurals) and tags to generate them\n" + \
︙
254 255 256 257 258 259 260 ~~261~~ 262 263 264 265 266 267 ~~268 269 270 271~~ ~~272 273 274 275 276 277 278 279~~ ~~280 281 282 283 284 285 286 287 288 289 290 291 292~~ 293 294 295 296 297 298 299	264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306	- + - - - - + + + - - - - - - - - + + + + + + + - - - - - - - - - - - - - + + + + + + + + + + + +	' "dMasForm": ' + json.dumps(dMasForm, ensure_ascii=False) + "\n}" open(sp+"/modules-js/mfsp_data.json", "w", encoding="utf-8", newline="\n").write(sCode) def makePhonetTable (sp, bJS=False): print("> Correspondances phonétiques ", end="") print("(Python et JavaScript)" if bJS else "(Python seulement)") try: oDict = ibdawg.IBDAWG("French.bdic") except: traceback.print_exc() return ~~~~with open(sp+"/data/phonet_simil.txt", 'r', encoding='utf-8') as hSrc:~~ # set of homophonic words lSet = [] for sLine in ~~hSrc.~~readlines():~~ # set of homophonic words lSet = [] for sLine in readFile(sp+"/data/phonet_simil.txt"): ~~if not sLine.startswith("#") and sLine.strip():~~ lWord = sLine~~.strip()~~.split() aMore = set() for sWord in lWord: if sWord.endswith("er") and conj.isVerb(sWord): aMore = aMore.union(conj.getConjSimilInfiV1(sWord)) lWord.extend(list(aMore)) lSet.append(sorted(set(lWord))) lWord = sLine.split() aMore = set() for sWord in lWord: if sWord.endswith("er") and conj.isVerb(sWord): aMore = aMore.union(conj.getConjSimilInfiV1(sWord)) lWord.extend(list(aMore)) lSet.append(sorted(set(lWord))) ~~#print(lWord)~~ # dictionary of words dWord = {} for i, aSet in enumerate(lSet): for sWord in aSet: if oDict.lookup(sWord): dWord[sWord] = i # warning, what if word in several sets? else: echo("Mot inconnu : " + sWord) # dictionary of morphologies dMorph = {} for sWord in dWord: dMorph[sWord] = oDict.getMorph(sWord) # dictionary of words dWord = {} for i, aSet in enumerate(lSet): for sWord in aSet: if oDict.lookup(sWord): dWord[sWord] = i # warning, what if word in several sets? else: echo("Mot inconnu : " + sWord) # dictionary of morphologies dMorph = {} for sWord in dWord: dMorph[sWord] = oDict.getMorph(sWord) # write file for Python sCode = "# generated data (do not edit)\n\n" + \ "dWord = " + str(dWord) + "\n\n" + \ "lSet = " + str(lSet) + "\n\n" + \ "dMorph = " + str(dMorph) + "\n" open(sp+"/modules/phonet_data.py", "w", encoding="utf-8", newline="\n").write(sCode)
︙
307 308 309 310 311 312 313 ~~314 315 316~~ ~~317 318 319 320 321 322 323~~ 324 325 ~~326~~ 327 328 ~~329~~ 330 331 332 333 334 335 336 337 338 339 340 341 342	314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357	+ + + - - - + + + + + + + - - - - - - - + + + + + + + + - + - +	open(sp+"/modules-js/phonet_data.json", "w", encoding="utf-8", newline="\n").write(sCode) def makeLocutions (sp, bJS=False): "compile list of locutions in JSON" print("> Locutions ", end="") print("(Python et JavaScript)" if bJS else "(Python seulement)") dLocGraph = {} oTokenizer = tkz.Tokenizer("fr") for sLine in itertools.chain(readFile(sp+"/data/locutions_adverbiales.txt"), \ ~~wi~~th open~~(sp+"/data/locutions.txt"~~, 'r', encoding='utf-8') as hSrc:~~ dLocutions ~~= {}~~ ~~for~~ ~~sLine~~ in ~~hSrc.~~read~~lin~~es():~~ readFile(sp+"/data/locutions_prépositives.txt"), \ readFile(sp+"/data/locutions_conjonctives.txt"), \ readFile(sp+"/data/locutions_pronominales.txt"), \ readFile(sp+"/data/locutions_adjectivales.txt"), \ readFile(sp+"/data/locutions_interjectives.txt"), \ readFile(sp+"/data/locutions_nominales.txt"), \ readFile(sp+"/data/locutions_verbales.txt")): ~~if not sLine.startswith("#") and sLine.strip():~~ ~~lElem = sLine.strip().split()~~ dCur = dLoc~~utions~~ ~~for~~ sWord in l~~Elem:~~ if sWord not in dCur: dCur[sWord] = {} dCur = dCur[sWord] dCur = dLocGraph sLoc, sTag = sLine.split("\t") for oToken in oTokenizer.genTokens(sLoc.strip()): sWord = oToken["sValue"] if sWord not in dCur: dCur[sWord] = {} dCur = dCur[sWord] dCur["_:_"] = sTag sCode = "# generated data (do not edit)\n\n" + \ ~~"dLocutions = " + str(dLoc~~utions~~) + "\n"~~ "dLocutions = " + str(dLocGraph) + "\n" open(sp+"/modules/locutions_data.py", "w", encoding="utf-8", newline="\n").write(sCode) if bJS: ~~open(sp+"/modules-js/locutions_data.json", "w", encoding="utf-8", newline="\n").write(json.dumps(dLoc~~utions~~, ensure_ascii=False))~~ open(sp+"/modules-js/locutions_data.json", "w", encoding="utf-8", newline="\n").write(json.dumps(dLocGraph, ensure_ascii=False)) def before (spLaunch, dVars, bJS=False): print("========== Build Hunspell dictionaries ==========") makeDictionaries(spLaunch, dVars['oxt_version']) def after (spLaunch, dVars, bJS=False): print("========== Build French data ==========") makeMfsp(spLaunch, bJS) makeConj(spLaunch, bJS) makePhonetTable(spLaunch, bJS) makeLocutions(spLaunch, bJS)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23	1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23	- + - +	// Grammalecte - Lexicographe // License: MPL 2 /jslint esversion: 6/ /global require,exports/ "use strict"; ${string} ${map} ~~if (typeof(require) !== 'undefined') {~~ if (typeof (require) !== 'undefined') { var helpers = require("resource://grammalecte/helpers.js"); } ~~const _dT~~AGS~~ = new Map ([~~ const _dTag = new Map([ [':G', "[mot grammatical]"], [':N', " nom,"], [':A', " adjectif,"], [':M1', " prénom,"], [':M2', " patronyme,"], [':MP', " nom propre,"], [':W', " adverbe,"],
︙
44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78	44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78	- + - +	[':Os', " pronom personnel sujet,"], [':Oo', " pronom personnel objet,"], [':C', " conjonction,"], [':Ĉ', " conjonction (él.),"], [':Cc', " conjonction de coordination,"], [':Cs', " conjonction de subordination,"], [':Ĉs', " conjonction de subordination (él.),"], [':Ŵ', " locution adverbiale (él.),"], [':Ñ', " locution nominale (él.),"], [':Â', " locution adjectivale (él.),"], [':Ṽ', " locution verbale (él.),"], [':Ŕ', " locution prépositive (él.),"], [':Ĵ', " locution interjective (él.),"], [':Zp', " préfixe,"], [':Zs', " suffixe,"], [':V1', " verbe (1ᵉʳ gr.),"], [':V2', " verbe (2ᵉ gr.),"], [':V3', " verbe (3ᵉ gr.),"], [':V0e', " verbe,"], [':V0a', " verbe,"], [':O1', " 1ʳᵉ pers.,"], [':O2', " 2ᵉ pers.,"], [':O3', " 3ᵉ pers.,"], [':e', " épicène"], [':m', " masculin"], [':f', " féminin"], [':s', " singulier"], [':p', " pluriel"], [':i', " invariable"],
︙
105 106 107 108 109 110 111 ~~112~~ 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 ~~128~~ 129 130 131 132 133 134 135 136 137 ~~138~~ 139 140 ~~141~~ 142 143 144 ~~145~~ 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 ~~164~~ 165 166 167 168 169 170 171	105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200	- + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + - + - + - + - + - +	['/C', " {classique}"], ['/M', ""], ['/R', " {réforme}"], ['/A', ""], ['/X', ""] ]); ~~const _d~~PFX~~ = new Map ([~~ const _dLocTag = new Map([ [':L', "locution"], [':LN', "locution nominale"], [':LA', "locution adjectivale"], [':LV', "locution verbale"], [':LW', "locution adverbiale"], [':LR', "locution prépositive"], [':LO', "locution pronominale"], [':LC', "locution conjonctive"], [':LJ', "locution interjective"], [':B', " cardinale"], [':e', " épicène"], [':m', " masculine"], [':f', " féminine"], [':s', " singulière"], [':p', " plurielle"], [':i', " invariable"], ['/L', " {latin}"] ]); const _dLocVerb = new Map([ ['i', " intransitive"], ['n', " transitive indirecte"], ['t', " transitive directe"], ['p', " pronominale"], ['m', " impersonnelle"], ]); const _dElidedPrefix = new Map([ ['d', "(de), déterminant épicène invariable"], ['l', "(le/la), déterminant masculin/féminin singulier"], ['j', "(je), pronom personnel sujet, 1ʳᵉ pers., épicène singulier"], ['m', "(me), pronom personnel objet, 1ʳᵉ pers., épicène singulier"], ['t', "(te), pronom personnel objet, 2ᵉ pers., épicène singulier"], ['s', "(se), pronom personnel objet, 3ᵉ pers., épicène singulier/pluriel"], ['n', "(ne), adverbe de négation"], ['c', "(ce), pronom démonstratif, masculin singulier/pluriel"], ['ç', "(ça), pronom démonstratif, masculin singulier"], ['qu', "(que), conjonction de subordination"], ['lorsqu', "(lorsque), conjonction de subordination"], ['quoiqu', "(quoique), conjonction de subordination"], ['jusqu', "(jusque), préposition"] ]); ~~const _dAD = new Map ([~~ const _dPronoms = new Map([ ['je', " pronom personnel sujet, 1ʳᵉ pers. sing."], ['tu', " pronom personnel sujet, 2ᵉ pers. sing."], ['il', " pronom personnel sujet, 3ᵉ pers. masc. sing."], ['on', " pronom personnel sujet, 3ᵉ pers. sing. ou plur."], ['elle', " pronom personnel sujet, 3ᵉ pers. fém. sing."], ['nous', " pronom personnel sujet/objet, 1ʳᵉ pers. plur."], ['vous', " pronom personnel sujet/objet, 2ᵉ pers. plur."], ['ils', " pronom personnel sujet, 3ᵉ pers. masc. plur."], ['elles', " pronom personnel sujet, 3ᵉ pers. masc. plur."], ["là", " particule démonstrative"], ["ci", " particule démonstrative"], ['le', " COD, masc. sing."], ['la', " COD, fém. sing."], ['les', " COD, plur."], ['moi', " COI (à moi), sing."], ['toi', " COI (à toi), sing."], ['lui', " COI (à lui ou à elle), sing."], ['nous2', " COI (à nous), plur."], ['vous2', " COI (à vous), plur."], ['leur', " COI (à eux ou à elles), plur."], ['y', " pronom adverbial"], ["m'y", " (me) pronom personnel objet + (y) pronom adverbial"], ["t'y", " (te) pronom personnel objet + (y) pronom adverbial"], ["s'y", " (se) pronom personnel objet + (y) pronom adverbial"], ['en', " pronom adverbial"], ["m'en", " (me) pronom personnel objet + (en) pronom adverbial"], ["t'en", " (te) pronom personnel objet + (en) pronom adverbial"], ["s'en", " (se) pronom personnel objet + (en) pronom adverbial"] ]); ~~const _dSeparator = new Map ([~~ const _dSeparator = new Map([ ['.', "point"], ['·', "point médian"], ['…', "points de suspension"], [':', "deux-points"], [';', "point-virgule"], [',', "virgule"], ['?', "point d’interrogation"],
︙
192 193 194 195 196 197 198 ~~199~~ 200 ~~201 202 203~~ 204 205 206 207 ~~208~~ 209 210 211 212 ~~213~~ 214 215 ~~216~~ 217 218 ~~219~~ 220 221 222 ~~223~~ 224 ~~225 226~~ 227 ~~228 229 230 231 232 233 234~~ ~~235 236 237 238 239 240~~ 241 242 243 ~~244 245~~ 246 ~~247 248 249 250 251~~ 252 253 254 ~~255 256~~ 257 258 259 260 261 262 263 264 265 266 ~~267~~ ~~268 269 270~~ ~~271 272~~ 273 274 275 ~~276~~ ~~277 278~~ 279 280 281 282 283 284 ~~285~~ 286 287 ~~288~~ 289 290 291 292 293 ~~294~~ 295 296 297 298 299 300 301	221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494	- + + + - - - + + + - + + + + - + + + + - + + + + + - + + + + + + - + + - - + + + + + + - - - - - - - + + + + + + + + + + - - - - - - + + + + + - - + + + + + + + + - - - - - + + + + + + + + + + + + + + + + + + + + - - + - + - - - + - - + - + - - + + + + + + + + + + + + + + + + + + + - + - + - + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +	['<', "inférieur à"], ['>', "supérieur à"], ]); class Lexicographe { ~~constructor (oDict) {~~ constructor (oDict, oTokenizer, oLocGraph) { this.oDict = oDict; this.oTokenizer = oTokenizer; this.oLocGraph = JSON.parse(oLocGraph); ~~this._zElidedPrefix = new RegExp ("^([dljmtsncç]\|quoiqu\|lorsqu\|jusqu\|puisqu\|qu)['’](.+)", "i");~~ this._zCo~~mpoundWord~~ = new RegExp ("([a-zA-Zà-ö0-9À-Öø-ÿØ-ßĀ-ʯ]+)-((?:les?\|la)-(?:moi\|toi\|lui\|[nv]ous\|leur)\|t-(?:il\|elle\|on)\|y\|en\|[mts][’'](?:y\|en)\|les?\|l[aà]\|[mt]oi\|leur\|lui\|je\|tu\|ils?\|elles?\|on\|[nv]ous)$", "i"); this._zTag = new RegExp ("[:;/][a-zA-Z~~à-ö~~0-9À-Öø-ÿØ-ßĀ-ʯ][^:;/]", "g"); this._zInterroVerb = new RegExp("([a-zA-Zà-ö0-9À-Öø-ÿØ-ßĀ-ʯ]+)-((?:les?\|la)-(?:moi\|toi\|lui\|[nv]ous\|leur)\|t-(?:il\|elle\|on)\|y\|en\|[mts][’'](?:y\|en)\|les?\|l[aà]\|[mt]oi\|leur\|lui\|je\|tu\|ils?\|elles?\|on\|[nv]ous)$", "i"); this._zTag = new RegExp("[:;/][a-zA-Z0-9ÑÂĴĈŔÔṼŴ!][^:;/]", "g"); } getInfoForToken (oToken) { // Token: .sType, .sValue, .nStart, .nEnd ~~// return a ~~lis~~t [type, ~~token_string, v~~alues]~~ // return a object {sType, sValue, aLabel} let m = null; try { switch (oToken.sType) { case 'SEPARATOR': return { sType: oToken.sType, sValue: oToken.sValue, ~~~~return { sType: oToken.sType, sValue: oToken.sValue,~~ aLabel: [_dSeparator.gl_get(oToken.sValue, "caractère indéterminé")] };~~ aLabel: [_dSeparator.gl_get(oToken.sValue, "caractère indéterminé")] }; break; case 'NUM': return { sType: oToken.sType, ~~return { sType: oToken.sType,~~ sValue: oToken.sValue, ~~aLabel: ["nombre"] };~~ sValue: oToken.sValue, aLabel: ["nombre"] }; break; case 'LINK': return { sType: oToken.sType, ~~return { sType: oToken.sType,~~ sValue: oToken.sValue.slice(0,~~40)+~~"…", ~~aLabel: ["hyperlien"] };~~ sValue: oToken.sValue.slice(0, 40) + "…", aLabel: ["hyperlien"] }; break; case 'ELPFX': let sTemp = oToken.sValue.replace("’", "").replace("'", "").replace("`", "").toLowerCase(); return { sType: oToken.sType, sValue: oToken.sValue, ~~~~return { sType: oToken.sType, sValue: oToken.sValue,~~ aLabel: [_d~~PFX~~.gl_get(sTemp, "préfixe élidé inconnu")] };~~ aLabel: [_dElidedPrefix.gl_get(sTemp, "préfixe élidé inconnu")] }; break; ~~case 'FOLDER': ~~return { sType: oToken.sType,~~ sValue: oToken.sValue.slice(0,~~40)+~~"…", ~~aLabel: ["dossier"] };~~~~ case 'FOLDERLINUX': return { sType: oToken.sType, sValue: oToken.sValue.slice(0, 40) + "…", aLabel: ["dossier Linux/Unix"] }; break; case '~~WORD~~': ~~if (~~oToken.s~~Value.gl_count("-") > 4) {~~ ~~return { sType: "COMPLEX",~~ sValue: oToken.sValue, ~~aLabel:~~ ["~~élément complexe indéterminé"] };~~ } else ~~if (this.o~~D~~ict.isValidToken(oToken.sValue)) {~~ ~~let lMorph = this.oDict.getMorph~~(oToken.sValue); let ~~aElem = [];~~ case 'FOLDERWIN': return { sType: oToken.sType, sValue: oToken.sValue.slice(0, 40) + "…", aLabel: ["dossier Windows"] }; break; case 'WORD': if (oToken.sValue.gl_count("-") > 4) { return { ~~for (let s of lMorph){~~ ~~if (s.includes(":")) aElem.push( this._formatTags(s) );~~ } ~~return { sType: oToken.sType,~~ sValue: oToken.sValue, ~~aLabel: aElem};~~ } else if (m = this._zCo~~mpoundWord~~.exec(oToken.sValue)) { sType: "COMPLEX", sValue: oToken.sValue, aLabel: ["élément complexe indéterminé"] }; } else if (m = this._zInterroVerb.exec(oToken.sValue)) { // mots composés let lMorph = this.oDict.getMorph(m[1]); let aElem = []; ~~for (let s of lMorph){ if (s.includes(":")) aElem.push( this._formatTags(s) );~~ for (let s of lMorph) { if (s.includes(":")) aElem.push(this._formatTags(s)); } return { sType: oToken.sType, sValue: oToken.sValue, aLabel: ["forme verbale interrogative"], aSubElem: [ { sType: oToken.sType, sValue: m[1], aLabel: aElem }, a~~Elem.push(~~"-" + m[2] ~~+ "~~: ~~" +~~ this._formatSuffix(m[2].toLowerCase())); ~~return { sType: oToken.sType,~~ sValue: oToken.sValue, ~~aLabel: aElem };~~ } else { ~~return { sType: "UNKNOWN", sValue: oToken.sValue,~~ aLabel: ["inconnu du dictionnaire"] }; { sType: oToken.sType, sValue: "-" + m[2], aLabel: [this._formatSuffix(m[2].toLowerCase())] } ] }; } else if (this.oDict.isValidToken(oToken.sValue)) { let lMorph = this.oDict.getMorph(oToken.sValue); let aElem = []; for (let s of lMorph) { if (s.includes(":")) aElem.push(this._formatTags(s)); } return { sType: oToken.sType, sValue: oToken.sValue, aLabel: (aElem.length > 0) ? aElem : ["mot composé indéterminé"] }; } else { return { sType: "UNKNOWN", sValue: oToken.sValue, aLabel: ["inconnu du dictionnaire"] }; } break; } ~~} catch (e) {~~ } catch (e) { helpers.logerror(e); } return null; } _formatTags (sTags) { let sRes = ""; sTags = sTags.replace(/V([0-3][ea]?)[itpqnmr_eaxz]+/, "V$1"); let m; while ((m = this._zTag.exec(sTags)) !== null) { ~~sRes += _dT~~AGS~~.get(m[0]);~~ sRes += _dTag.get(m[0]); ~~~~if (sRes.length > 100) {~~ ~~break;~~ }~~ } ~~} if (sRes.startsWith(" verbe") && !sRes.e~~ndsWith~~("infinitif")) {~~ if (sRes.startsWith(" verbe") && !sRes.includes("infinitif")) { sRes += " [" + sTags.slice(1, sTags.indexOf(" ")) + "]"; } if (!sRes) { ~~sRe~~s =~~ "#Erreur. Étiquette inconnue : [" + sTags + "]";~~ return "#Erreur. Étiquette inconnue : [" + sTags + "]"; ~~~~helpers.echo(sRes);~~ return sRes;~~ } return sRes.gl_trimRight(","); } _formatTagsLoc (sTags) { let sRes = ""; let m; while ((m = this._zTag.exec(sTags)) !== null) { if (m[0].startsWith(":LV")) { sRes += _dLocTag.get(":LV"); for (let c of m[0].slice(3)) { sRes += _dLocVerb.get(c); } } else { sRes += _dLocTag.get(m[0]); } } if (!sRes) { return "#Erreur. Étiquette inconnue : [" + sTags + "]"; } return sRes.gl_trimRight(","); } _formatSuffix (s) { if (s.startsWith("t-")) { ~~return "“t” euphonique +" + _dAD.get(s.slice(2));~~ return "“t” euphonique +" + _dPronoms.get(s.slice(2)); } if (!s.includes("-")) { ~~return _dAD.get(s.replace("’", "'"));~~ return _dPronoms.get(s.replace("’", "'")); } if (s.endsWith("ous")) { s += '2'; } let nPos = s.indexOf("-"); ~~return _dAD.get(s.slice(0, nPos)) + " +" + _dAD.get(s.slice(nPos+1));~~ return _dPronoms.get(s.slice(0, nPos)) + " +" + _dPronoms.get(s.slice(nPos + 1)); } getListOfTokens (sText, bInfo=true) { let aElem = []; if (sText !== "") { for (let oToken of this.oTokenizer.genTokens(sText)) { if (bInfo) { let aRes = this.getInfoForToken(oToken); if (aRes) { aElem.push(aRes); } } else if (oToken.sType !== "SPACE") { aElem.push(oToken); } } } return aElem; } generateInfoForTokenList (lToken) { for (let oToken of lToken) { let aRes = this.getInfoForToken(oToken); if (aRes) { yield aRes; } } } getListOfTokensReduc (sText, bInfo=true) { let aTokenList = this.getListOfTokens(sText.replace("'", "’").trim(), false); let iKey = 0; let aElem = []; do { let oToken = aTokenList[iKey]; let sMorphLoc = ''; let aTokenTempList = [oToken]; if (oToken.sType == "WORD" \|\| oToken.sType == "ELPFX"){ let iKeyTree = iKey + 1; let oLocNode = this.oLocGraph[oToken.sValue.toLowerCase()]; while (oLocNode) { let oTokenNext = aTokenList[iKeyTree]; iKeyTree++; if (oTokenNext) { oLocNode = oLocNode[oTokenNext.sValue.toLowerCase()]; } if (oLocNode && iKeyTree <= aTokenList.length) { sMorphLoc = oLocNode["_:_"]; aTokenTempList.push(oTokenNext); } else { break; } } } if (sMorphLoc) { let sValue = ''; for (let oTokenWord of aTokenTempList) { sValue += oTokenWord.sValue+' '; } let oTokenLocution = { 'nStart': aTokenTempList[0].nStart, 'nEnd': aTokenTempList[aTokenTempList.length-1].nEnd, 'sType': "LOC", 'sValue': sValue.replace('’ ','’').trim(), 'aSubToken': aTokenTempList }; if (bInfo) { let aSubElem = null; if (sMorphLoc.startsWith("*\|")) { // cette suite de tokens n’est une locution que dans certains cas minoritaires oTokenLocution.sType = "LOCP"; for (let oElem of this.generateInfoForTokenList(aTokenTempList)) { aElem.push(oElem); } sMorphLoc = sMorphLoc.slice(2); } else { aSubElem = [...this.generateInfoForTokenList(aTokenTempList)]; } // cette suite de tokens est la plupart du temps une locution let aFormatedTag = []; for (let sTagLoc of sMorphLoc.split('\|') ){ aFormatedTag.push(this._formatTagsLoc(sTagLoc)); } aElem.push({ sType: oTokenLocution.sType, sValue: oTokenLocution.sValue, aLabel: aFormatedTag, aSubElem: aSubElem }); } else { aElem.push(oTokenLocution); } iKey = iKey + aTokenTempList.length; } else { if (bInfo) { let aRes = this.getInfoForToken(oToken); if (aRes) { aElem.push(aRes); } } else { aElem.push(oToken); } iKey++; } } while (iKey < aTokenList.length); return aElem; } } if (typeof(exports) !== 'undefined') { exports.Lexicographe = Lexicographe; }

1 2 3 4 5 6 7 8 9 10 11 ~~12 13~~ 14 15 16 17 18 19 20	1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20	- - + +	/* Lexicographer */ #grammalecte_lxg_panel_content { padding: 5px; font-size: 13px; } .grammalecte_lxg_list_of_tokens { margin: 5px 0 10px 0; padding: 10px; ~~background-color: hsla(0, 0%, 96%, 1); border-radius: 2px;~~ background-color: hsla(0, 0%, 95%, 1); border-radius: 5px; } .grammalecte_lxg_list_num { float: right; margin: -12px 0 5px 10px; padding: 5px 10px; font-weight: bold;
︙
31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65	31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86	+ + + + + + + + + + + + + + + + + + - + + + +	border-radius: 5px; text-align: center; font-size: 20px; } .grammalecte_lxg_token_block { margin: 4px 0; } .grammalecte_lxg_token_subblock { margin: 2px 0 2px 20px; padding: 5px; border-left: 4px solid hsl(150, 30%, 70%); background-color: hsl(210, 10%, 90%); border-radius: 2px; } .grammalecte_lxg_token_descr { margin: 1px; padding: 1px; } .grammalecte_lxg_token { display: inline-block; background-color: hsl(150, 0%, 50%); color: hsl(0, 0%, 96%); padding: 2px 5px; border-radius: 2px; text-decoration: none; font-weight: bold; } .grammalecte_lxg_token_also { display: inline-block; margin-left: 5px; color: hsl(0, 0%, 50%); padding: 2px 5px; text-decoration: none; } .grammalecte_lxg_token_colon { display: inline-block; padding: 2px 5px; color: hsl(0, 0%, 50%); } .grammalecte_lxg_morph_list { ~~padding: 2px 0 10px 20px;~~ padding: 2px 0 2px 20px; } .grammalecte_lxg_morph_elem { color: hsl(0, 0%, 0%); } .grammalecte_lxg_token_LOC { background-color: hsla(150, 50%, 30%, 1); } .grammalecte_lxg_token_WORD { background-color: hsla(150, 50%, 50%, 1); } .grammalecte_lxg_token_ELPFX { background-color: hsla(150, 30%, 50%, 1); } .grammalecte_lxg_token_UNKNOWN {
︙

















































































































































1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145	+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +	# Locutions conjonctives afin que :LC ainsi que :LC alors que :LC après que :LC après quoi :LC attendu que :LC au cas où :LC au cas que :LC au fait :LA:e\|:LC au fur et à mesure que :LC au lieu de quoi :LC au lieu que :LC au motif que :LC au point que :LC auquel cas :LC:s aussitôt que :LC autant que :LC auxquels cas :LC:p avant que :LC bien que :LC ce qui fait que :LC ceci étant :LC\|:LJ cependant que :LC comme pour :LC comme quoi :LC\|:LJ comme si :LC considérant que :LC c’est en quoi :LC c’est pourquoi :LC c’est à savoir :LC dans ce cas :LC dans la mesure où :LC dans le temps que :LC de façon que :LC de manière à ce que :LC de même que :LC de peur que :LC de sorte que :LC de sorte qu’ :LC de telle façon que :LC de telle sorte que :LC de telle sorte qu’ :LC depuis que :LC des fois que :LC devant que :LC devant que de :LC dire que :LC du moment que :LC du plus loin que :LC durant que :LC durant qu’ :LC dès lors que :LC dès que :LC d’abord que :LC d’autant moins :LC d’autant moins que :LC d’autant plus que :LC d’autant que :LC d’où :LC en attendant que :LC en cas que :LC en dépit que :LC en dérivation :LC en l’espèce :LC en quoi :LC en sorte que :LC en sorte qu’ :LC en tant que :LC en tant qu’ :LC encore que :LC fait que :LC fait à fait que :LC fasse le ciel que :LC faute de quoi :LC histoire de :LC id est :LC il en vaut que :LC il n’est pas dit que :LC il se peut que :LC je dis pas :LC jusqu’au moment où :LC jusqu’à ce que :LC jusqu’à tant que :LC jusqu’à temps que :LC lors même que :LC lorsqu’une fois :LC maintenant que :LC malgré que :LC même si :LC ni plus ni moins que :LC nonobstant que :LC n’empêche que :LC ou bedon :LC ou bien :LC par ces motifs :LC par conséquent :LC parce que :LC parce qu’ :LC pendant que :LC pendant qu’ :LC pour ne pas dire :LC pour peu que :LC pour que :LC pourvu que :LC présentement que :LC quand bien même :LC que dis-je :LC que non pas :LC quitte à :LC sans que :LC sans ça :LC sauf que :LC selon que :LC seulement si :LC si bien que :LC si ce n’est :LC si et seulement si :LC si jamais :LC si oui ou non :LC si seulement :LC si tant est que :LC sitôt que :LC sous prétexte que :LC sous réserve que :LC suivant que :LC surtout que :LC s’il est ainsi que :LC tandis que :LC tandis qu’ :LC tant il y a que :LC tant que :LC une fois que :LC vu que :LC à cause que :LC à condition que :LC à la suite de quoi :LC à mesure que :LC à moins que :LC à peine … que :LC à présent que :LC à savoir :LC à telle enseigne que :LC étant donné que :LC





































































































































































































































































































































































































































































































































































































1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581	+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +	# Locutions interjectives à bientôt :LJ à bon entendeur salut :LJ à bon entendeur, salut :LJ à charge de revanche :LJ à demain :LJ # Locutions-phrases ainsi soit-il :LP chacun sa croix :LP c’est bonnet blanc et blanc bonnet :LP c’est dans la poche :LP c’est de l’hébreu :LP c’est du billard :LP c’est du chinois :LP c’est du gâteau :LP c’est du pipeau :LP c’est du tout cuit :LP c’est goutte d’eau qui fait déborder le vase :LP c’est la croix et la bannière :LP c’est la fin des haricots :LP c’est le moins qu’on puisse dire :LP c’est le monde à l’envers :LP c’est l’hôpital qui se fout de la charité :LP c’est vraiment l’hôpital qui se fout de la charité :LP c’était bonnet blanc et blanc bonnet :LP c’était dans la poche :LP c’était de l’hébreu :LP c’était du billard :LP c’était du chinois :LP c’était du gâteau :LP c’était du pipeau :LP c’était du tout cuit :LP c’était goutte d’eau qui faisait déborder le vase :LP c’était la croix et la bannière :LP c’était la fin des haricots :LP c’était le monde à l’envers :LP il y a anguille sous roche :LP il y a de l’orage dans l’air :LP il y a quelque chose de pourri dans le royaume du Danemark :LP il y avait anguille sous roche :LP il y avait de l’orage dans l’air :LP la balle est dans son camp :LP un train peut en cacher un autre :LP ça ne mange pas de pain :LP ça passe ou ça casse :LP ça baigne :LP ça biche :LP ça boume :LP ça craint :LP ça craint du boudin :LP ça gaze :LP __END__ a crai :LJ:i a voté :LJ à d’autres :LJ à la bonne vôtre :LJ à la lanterne :LJ à la prochaine :LJ à la revoyance :LJ à la revoyure :LJ à la tienne :LJ à la tienne, étienne :LJ à la vôtre :LJ à l’abordage :LJ à l’aide :LJ à moi :LJ à nous deux :LJ à plus :LJ à plus tard :LJ à qui tu le dis :LJ à ta santé :LJ à table :LJ à tantôt :LJ à tout à l’heure :LJ à toute :LJ à un de ces quatre :LJ à vos marques :LJ à vos marques, prêts, partez :LJ à vos rangs, fixe :LJ à votre santé :LJ à votre service :LJ âlikoum es-selam :LJ ça alors :LJ ça marche :LJ ça roule :LJ ça roule, ma poule :LJ ça suffit :LJ échec et mat :LJ\|:LN:m aïe, aïe, aïe :LJ adieu berthe :LJ age quod agis :LJ/L ah ben non :LJ ah bon :LJ ah là là :LJ:i all right :LJ aller niquer sa mère :LJ allez vous faire foutre :LJ allons-y, alonso :LJ allons bon :LJ ams tram gram :LJ:i attache ta tuque :LJ au coin :LJ au feu :LJ:i au gui l’an neuf :LJ au hasard, balthazar :LJ au plaisir :LJ au revoir :LJ\|:LN:m:s au secours :LJ:i\|:LN:m:i au temps :LJ aux armes :LJ aux chiottes :LJ aux fines herbes :LJ avec joie :LJ avec plaisir :LJ bande d’abrutis :LJ:i bas les armes :LJ bas les masques :LJ bas les pattes :LJ ben coudon :LJ ben coudonc :LJ ben ouais :LJ ben voyons :LJ ben voyons donc :LJ bien joué callaghan :LJ:i bien le bonjour :LJ bien ou bien :LJ bien reçu :LJ bien vu :LJ bien vu callaghan :LJ:i bienvenue au club :LJ big up :LJ bisque bisque rage :LJ bon anniversaire :LJ bon appétit :LJ bon bout d’an :LJ bon dieu :LJ\|:LN:m bon dieu de bon dieu :LJ bon matin :LJ:i bon sang :LJ bon sang de bon sang :LJ bon sang de bonsoir :LJ bon sang mais c’est bien sûr :LJ bon vent :LJ:m\|:LN:m:s bon voyage :LJ bon yeux :LJ bonjour hi :LJ bonne année :LJ\|:LN:f:s bonne arrivée :LJ bonne chance :LJ bonne continuation :LJ bonne journée :LJ bonne mère :LJ bonne nuit :LJ:i bonne sainte anne :LJ bonne soirée :LJ:i bonté divine :LJ bordel à cul :LJ bordel à cul de pompe à merde :LJ bordel à cul pompe à merde :LJ:m bordel de merde :LJ:m bot aux autres :LJ:i câline de bine :LJ câline de binne :LJ c’en est trop :LJ c’est cela :LJ c’est juste, auguste :LJ c’est la meilleure :LJ c’est pas possible :LJ c’est rien de le dire :LJ caca boudin :LA:e\|:LJ calme ta joie :LJ carpe diem :LJ/L carpe noctem :LJ/L carton plein :LJ:s cartons pleins :LJ:p cause toujours :LJ cause toujours tu m’intéresses :LJ chacun pour soi, dieu pour tous :LJ chaud devant :LJ:i chauffe, marcel :LJ chic à :LJ circulez y’a rien à voir :LJ cool abdoul :LJ cool, raoul :LJ coquin de sort :LJ corps dieu :LJ cul sec :LJ démerde yourself :LJ\|:LN:m dans le cul la balayette :LJ dans ton cul :LJ de bleu :LJ de quoi :LJ de rien :LJ deh mais :LJ des clous :LJ des couilles :LJ des nèfles :LJ dieu me damne :LJ dieu me pardonne :LJ dieu me pignole :LJ dieu me tripote :LJ dieux du ciel :LJ dis donc :LJ dites donc :LJ doux jésus :LJ du balai :LJ eh bé :LJ:i eh ben :LJ en revoir :LJ en voiture, simone :LJ es-salamou âlikoum :LJ et alors :LJ et avec ça :LJ et comment :LJ et encore :LJ et maintenant :LJ et mon cul, c’est du poulet :LJ et ta sœur :LJ et toc ! :LJ et voilà le travail :LJ fan de putain :LJ fant de pute :LJ fatche de con :LJ:i faut pas pousser :LJ ferme ta gueule :LJ fils de garce :LJ\|:LN foin de :LJ fonce, alphonse :LJ fouette cocher :LJ foutre ciel :LJ:i garde à vous :LJ\|:LN:m:i gardez la monnaie :LJ han lan lan :LJ haro sur le baudet :LJ:i\|:LN:m haut les cœurs :LJ haut les mains :LJ ho hisse :LJ homme de peu de foi :LJ hors de question :LJ hure à :LJ il ne m’en chaut :LJ in cha’allah :LJ inch allah :LJ jésus marie joseph :LJ jésus, marie, joseph :LJ jamais couché, jamais levé :LJ je veux mon neveu :LJ joual vert :LJ joyeuses pâques :LJ joyeux anniversaire :LJ joyeux noël :LJ:i\|:LN:m jusqu’au revoir :LJ:i la barbe :LJ:i la belle affaire :LJ la ferme :LJ la peau :LJ la pièce est tombée :LJ la tête de ma mère :LJ la vache :LJ le con de sa mère :LJ le franc est tombé :LJ les deux mon capitaine :LJ:i les deux mon général :LJ:i les deux mon neveu :LJ:i ma foi :LJ ma parole :LJ ma parole d’honneur :LJ même combat :LJ même pas dans tes rêves les plus fous :LJ même pas en rêve :LJ madame, monsieur :LJ mais bien sûr :LJ mais c’est bien sûr :LJ mais euh :LJ mais oui :LJ malheur à :LJ marché conclu :LJ mautadine de crime binne :LJ mea culpa :LJ:i/L\|:LN:m:i/L mea maxima culpa :LJ:i/L meilleurs vœux :LJ merci beaucoup :LJ merci mon chien :LJ merci quand même :LJ merdum cacatum :LJ miam miam :LJ mille mercis :LJ minute papillon :LJ misère de mes os :LJ mon œil :LJ mon cœur :LJ mon cul :LJ mon dieu :LJ mon fils :LJ mon loup :LJ mon père :LJ mon vier :LJ mords-y l’œil :LJ mords-y l’œil, t’auras l’os :LJ mort aux vaches :LJ motus et bouche cousue :LJ mystère et boule de gomme :LJ\|:LN:m:s nique sa mère :LJ nique ta mère :LJ nique ta reum :LJ no comment :LJ no souci :LJ nom d’un chien :LJ nom d’un p’tit bonhomme :LJ nom d’un petit bonhomme :LJ nom d’une pipe :LJ nom de dieu :LJ:i nom de zeus :LJ:i nombril du pape :LJ non d’un petit bonhomme :LJ non mais :LJ non merci :LJ nota bene :LJ:i/L noyeux joël :LJ:i oh boy :LJ oh fant :LJ oh hisse :LJ oh hisse, enculé :LJ oh là là :LJ ouate de phoque :LJ ouh là :LJ ouh là là :LJ ouil you uouil :LJ:i par bélénos :LJ par jupiter :LJ par toutatis :LJ parole d’honneur :LJ\|:LN:f:s parole de scout :LJ pas de ça, lisette :LJ pas de lézard :LJ pas de problème :LJ pas de quartier :LJ pas de quoi :LJ pas de souci :LJ pas folle la guêpe :LJ pas possible :LA:e:s\|:LJ pas question :LJ pas touche :LJ passez muscade :LJ passez, muscade :LJ pax omnibus :LJ/L peu m’en chaut :LJ peu me chaut :LJ pipi caca :LA:i\|:LJ:i pis après :LJ poil au cul :LJ poil au dos :LJ poil au nez :LJ poil au zizi :LJ poil aux dents :LJ point barre :LJ:i point de rancune :LJ point final :LJ\|:LN:m poisson d’avril :LJ\|:LN:m:s pou pou pidou :LJ pour vous servir :LJ première nouvelle :LJ proh pudor :LJ putain con :LJ putain de bordel de merde :LJ:i putain de merde :LJ putain de sa mère :LJ putain de sa race :LJ putain de ta race :LJ pute borgne :LJ qu’es aco :LJ qu’es aquo :LJ qu’il aille se faire foutre :LJ qu’ils aillent se faire foutre :LJ que le grand crique me croque :LJ que tu crois :LJ qui vive :LJ:i r. s. v. p. :LJ raison de plus :LJ relax max :LJ retourne aux asperges :LJ room service :LJ sa mère :LJ\|:LN s’il en est :LJ s’il te plaît :LJ s’il te plait :LJ s’il vous plaît :LJ s’il vous plait :LJ sac à papier :LJ salut et fraternité :LJ:m:i sans adieu :LJ sans déc’ :LJ sans déconner :LJ sans rancune :LJ seigneur jésus marie joseph :LJ si tu savais :LJ st st :LJ sur la tête de ma mère :LJ sursum corda :LJ:m ta bouche :LJ:p ta gueule :LJ:p ta gueule la mouette :LJ ta mère :LJ ta race :LJ ta yeule :LJ t’as raison :LJ t’es pas transparent :LJ tant mieux :LJ tant pis, tant mieux :LJ tchin tchin :LJ tiens donc :LJ tirez, tirez :LJi ton père n’est pas vitrier :LJ tonnerre de brest :LJ top chrono :LJ tout doux :LJ trêve de plaisanterie :LJ:m tranquille, émile :LJ tranquille, bill :LJ troun de l’air :LJ tu as raison :LJ tu m’étonnes :LJ tu m’étonnes, john :LJ tu m’en diras tant :LJ tu parles :LJ tu parles, charles :LJ tu vois :LJ un homme à la mer :LJ un petit beurre, des touyous :LJ un peu mon neveu :LJ une chance :LJ va-t’en voir s’ils viennent :LJ va chier :LJ va comprendre charles :LJ va te faire enculer :LJ va te faire foutre :LJ va te faire une soupe d’esques :LJ vade retro, satana :LJ/L vains dieux :LJ velci revari-volcet :LJ vingt dieux :LJ:i vive le roi :LJ voilà qui est parler :LJ vos gueules :LJ:s vos gueules là-dedans :LJ vos gueules les mouettes :LJ voyons donc :LJ voyons voir :LJ yercʼh mad :LJ youpla boom tagada tsoin tsoin :LJ youpla boum tagada tsoin tsoin :LJ:i\|:LN:m:i zut au berger :LJ rien à voir \|:L ça va \|:LP n’empêche \|:LJ n’importe \|:LJ ce n’est pas tous les jours fête :L ce n’est pas un aigle :L cela fait :L cela n’a qu’un temps :L cela vaut fait :L de quel bois on se chauffe :L il était une fois :L il en a plus bu que je ne lui en ai versé :L il est temps :L il existe :L il faut bien vivre :L il faut raison garder :LP il faut se lever bien matin pour l’attraper :LP il n’est pas question :L il n’y a pas de quoi :L il n’y a pas deux voix :L il n’y a pas mèche :L il ne faut pas mettre le doigt entre le bois et l’écorce :L il paraît :L il parait :L il se trouve :L il va sans dire :L il vaut mieux :L il y a à boire et à manger :L il y a de la dérive :L il y a gros à parier que :L il y avait une fois :L j’énergie protestement :L je boirai après vous :L je boirais la mer et les poissons :L je t’en foutrais :L je veux bien être pendu si :L le roi boit, la reine boit :L les beaux habits servent fort à la mine :L le bruit court :L le diable ne lui ferait pas faire ceci :L le pied lui a glissé :L m’est avis :L que le diable m’emporte :L que le diable l’emporte :L quelle mouche le pique :LP qui se battent en duel :L tout plaquer :L v’la-ty pas :L v’là-t-i’pas :L v’là-t’y pas :L v’là-ti pas :L v’là-ti’pas :L v’là-ty pas :L v’là t’y pas :L vla-t’y pas :L vla-ty pas :L vlà-t’y pas :L vlà-ty pas :L vlà t’y pas :L y’a pas de quoi :L rien n’y fait :L plutôt crever :L plutôt mourir :L eh bien :LJ hé bien :LJ quand les poules auront des dents :LP beaucoup de bruit pour rien :LP c’est la mer à boire :LP c’est le diable :LP c’est parti mon kiki :LP c’est toujours à recommencer :LP c’est un échappé de la pentecôte :LP c’est un autre article :LP c’est un personnage de roman :LP c’est une autre paire de manches :LP c’est une langue de la pentecôte :LP il n’y a pas de quoi fouetter un chat :LP il n’y a pas à tortiller :LP il y a à boire et à manger :LP il y avait à boire et à manger :LP ce n’est pas du caviar :LP ce n’est pas sa tasse de thé :LP ce n’est pas son trip :LP ce n’est pas son truc :LP pas besoin d’être sorti de polytechnique :LP de quel bois je me chauffe :LP la mayonnaise prend :LP la roue tourne :LP le sort en est jeté :LP le tour est joué :LP les carottes sont cuites :LP les murs ont des oreilles :LP les places sont chères :LP tout n’est pas noir :LP tout n’est pas rose :LP tu as perdu ta langue? :LP à la fleur de l’âge :LP on l’a vu :L dieu grâce :LJ dieu merci :LJ dieu soit loué :LW dieu sait comme :LW












































































1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76	+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +	# Locutions pronominales __END__ l. h. p. :LO:f:p l. m. :LO:f:p l. n. g. p. :LO:f:p l. n. p. :LO:f:p la dernière :LO:f:s l’autre :LO:e:s l’homme de la rue :LO:m:i le même :LO:m:s les autres :LO:e:p les deux :LO:e:p les mêmes :LO:m:p n. s.-p. :LO:m:s n. t. c. f. :LO:m ni dieu ni maître :LO nn. ss. :LO:m:p nn. tt. cc. ff. :LO:m peau de zob :LO:i qui de droit :LO:m:s qui que ce puisse être :LO quoi que :LO s. a. :LO:f:s s. a. é. :LO:f s. a. e. :LO:f s. a. i. :LO:f s. a. r. :LO:f s. a. s. :LO:f s. ém. :LO:f s. e. :LN\|:LO:f:s s. em. :LO:f s. ex. :LO:f s. exc. :LO:f:s s. g. :LO:f s. gr. :LO:f:s s. h. :LO:f s. m. :LO:f:s s. m. brit. :LO:f s. m. c. :LO:f s. m. dan. :LO:f s. m. i. :LO:f:s s. m. imp. :LO:f s. m. nap. :LO:f s. m. pol. :LO:f s. m. port. :LO:f s. m. suéd. :LO:f s. m. t. c. :LO:f s. s. :LO:f sa grâce :LO:f:s sa grandeur :LO:f sa majesté :LO:f:s sa majesté impériale :LO:f:s son altesse :LO:f:s son excellence :LO:f:s tous deux :LO:p tous les deux :LO:p tutti quanti :LO v. a. :LO:f:s v. a. r. :LO:f v. a. s. :LO:f v. e. :LO:f:s v. exc. :LO:f:s v. gr. :LO:f:s v. m. :LO:f:s votre altesse :LO:f:s votre altesse impériale :LO:f:s votre altesse royale :LO:f:s votre excellence :LO:f:s votre grâce :LO:f:s votre humble serviteur :LO:m:s votre humble serviteuse :LO:f:s votre majesté :LO:f:s votre majesté impériale :LO:f:s votre serviteur :LO:m:s vv. aa. ss. :LO:f:p












































































































































































































































































































































































1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364	+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +	# Locutions prépositives afin de :LR au beau milieu de :LR au bord de :LR au bout de :LR au bénéfice de :LR au bénéfice des :LR au bénéfice du :LR au contraire de :LR:i au cours de :LR au droit de :LR au détour de :LR au détriment de :LR au fil de :LR au fur de :LR au gré de :LR au hasard de :LR au lieu de :LR au lieu des :LR au lieu du :LR au lieu d’ :LR au lieu et place de :LR au milieu de :LR au moment de :LR au moment où :LR au moyen de :LR:i au mépris de :LR au même titre que :LR:i au niveau de :LR au nom de :LR au nom du :LR au nom d’ :LR au nombre de :LR au point de :LR au prix de :LR au profit de :LR au préjudice de :LR au prétexte de :LR au rebours de :LR au regard de :LR au rez de :LR au risque de :LR au sein de :LR au sein du :LR au sein d’ :LR au sortir de :LR au spectacle de :LR au sujet de :LR au temps de :LR au titre de :LR au travers de :LR au voisinage de :LR au vu de :LR au vu et au su de :LR au vu et su de :LR au-dedans de :LR:i au-dessous de :LR:i auprès de :LR aussi peu que :LR autour de :LR aux bons soins de :LR aux dépens de :LR aux fins de :LR aux lieu et place de :LR aux portes de :LR aux trousses de :LR avant de :LR avant que de :LR bien loin de :LR cela supposé :LR compte tenu de :LR conformément à :LR conséquemment à :LR crainte de :LR dans la crainte de :LR dans la mesure de :LR dans le moment où :LR dans le moment que :LR dans le viseur de :LR dans l’optique de :LR de chez :LR:i de crainte de :LR de façon à :LR de la part de :LR de la part du :LR de la part d’ :LR de l’ordre de :LR de l’ordre du :LR de l’ordre d’ :LR de manière :LR de manière à :LR de mon côté :LR de niveau avec :LR de par :LR de parmi :LR de peur de :LR de préférence à :LR de sorte à :LR devant notaire :LR dieu sait :LR du milieu de :LR du temps que :LR du vivant de :LR défense de :LR défini sur :LR d’après :LA:i\|:LR d’au milieu de :LR d’avec :LR d’entre :LR en amont de :LR en amont des :LR en amont du :LR en amont d’ :LR en arrière de :LR en aval de :LR en aval des :LR en aval du :LR en aval d’ :LR en avant de :LR en bas de :LR en ce qui concerne :LR en compagnie de :LR:i en comparaison de :LR en conformité de :LR en considération de :LR en conséquence de :LR en dehors de :LR en deçà de :LR en dépit de :LR en exécution de :LR en face de :LR en fait de :LR en fonction de :LR en fonction de :LR en fonction des :LR en fonction du :LR en forme de :LR en forme de :LR en forme d’ :LR en guise de :LR en haine de :LR en haut de :LR en la personne de :LR en lieu et place de :LR en l’honneur de :LR en matière de :LR en mémoire de :LR en même temps que :LR en partant :LR en passant :LR en passe de :LR en place de :LR en plus de :LR en présence de :LR en proie à :LR en proportion de :LR en présence de :LR:i en qualité de :LR en raison de :LR en regard de :LR en signe de :LR en suite de :LR en sus de :LR en termes de :LR en train de :LR en vertu de :LR en vue de :LR entenant de :LR entrain de :LR et de :LR eu égard à :LR face à :LR faute de :LR foi de :LR grâce à :LR grâces à :LR hors de :LR il est de fait que :LR il est possible que :LR il n’empêche que :LR:i il n’en reste pas moins que :LR il pourrait bien se faire que :LR il se pourrait que :LR il serait possible que :LR il y a :LR in illo tempore :LR:i/L jusques et y compris :LR jusques à :LR jusqu’à :LR jusqu’à concurrence de :LR le cul sur la commode :LR le diable soit de :LR le long de :LR le plus clair de :LR locution prépositive :LN:f:s\|:LR loin de :LR lors de :LR:i mort à *\|:LR non content de :LR non plus que :LR non sans :LR:i par certains côtés :LR:i par comparaison à :LR par crainte de :LR par devers :LR par l’intermédiaire de :LR par manière de :LR par manque de :LR par opposition à :LR par préférence à :LR par rapport à :LR par suite de :LR pas de :LR pas la peine de :LRv pas plus que :LR pas plus tard que :LR pour autant que :LR pour ce qui est de :LR pour comble de :LR pour le compte de :LR pour tous :LR:m:p pour tout :LR:m:s pour un peu :LR proche de :LR près de :LR préalablement à :LR prêt à :LRv quant aux :LR quant à :LR quel que soit :LR:m:s quelle que soit :LR:f:s quelles que soient :LR:f:p quels que soient :LR:m:p quoi qu’il en fût :LR relativement à :LR rien moins que :LR rien que :LR sans parler de :LR sans plus de :LR sans pour autant :LR sans préjudice de :LR sans quoi :LR sauf à :LR si peu que :LR sous couleur de :LR sous couvert de :LC\|:LR sous forme de :LR sous la coupe de :LR sous la houlette de :LR sous la plume de :LR sous le coup de :LR sous le couvert de :LR sous le prétexte de :LR sous le rapport de :LR sous les auspices de :LR sous les yeux de :LR sous l’ombre de :LR sous peine de :LR sous prétexte de :LR sous réserve de :LC\|:LR suite à :LR supposé que :LR sur le compte de :LR sur le coup de :LR sur le dos de :LR sur le pied de :LR sur le plan :LR sur le point de :LR sus le sujet de :LR s’agissant de :LR tant et si bien que :LR tant qu’à :LR va pour :LR vent debout contre :LR vis-à-vis de :LR voire même :LR y compris :LR:i à bas de :LR à base de :LR à base d’ :LR à bout de :LR à cause de :LR à cet égard :LR à charge de :LR à compter de :LR à concurrence de :LR à condition de :LR à coup de :LR à côté de :LR à dessein de :LR:i à destination de :LR à défaut de :LR à fin de :LR à fleur de :LR à force de :LR à grand renfort de :LR à hauteur de :LR à la condition de :LR à la différence de :LR à la faveur de :LR à la honte de :LR à la lumière de :LR à la lumière des :LR à la lumière du :LR à la lumière d’ :LR à la manière de :LR à la manière des :LR à la manière d’ :LR à la merci de :LR à la mémoire de :LR à la place de :LR à la réserve de :LR à la sortie de :LR à la suite de :LR à la tête de :LR à la vue de :LR à l’abri de :LR à l’adresse de :LR à l’aide de :LR à l’appui de :LR à l’attention de :LR à l’aulne de :LR à l’aune de :LR à l’effet de :LR à l’encontre de :LR à l’endroit de :LR à l’entour de :LR:i à l’envi de :LR à l’exception de :LR à l’exclusion de :LR à l’exemple de :LR à l’extérieur de :LR:i à l’imitation de :LR à l’instar de :LR à l’insu de :LR à l’intention de :LR à l’intérieur de :LR:i à l’issue de :LR à l’occasion de :LR à l’ombre de :LR à l’opposé de :LR à l’égal de :LR à l’égard de :LR à l’épreuve de :LR à mesure de :LR à partir de :LR à peine de :LR:i à proportion de :LR à propos de :LR à raison de :LR à rebours de :LR à titre de :LR à travers :LR à valeurs dans :LR à voir :LR étant donné :LR:i mis comme :LR __END__ du chef de :LW putain de :LA:s\|:LW taille de :LW

︙
136 137 138 139 140 141 142 143 144 145 146 147 148 149	136 137 138 139 140 141 142 143 144 145 146 147 148 149 150	+	let bInitDone = false; let oDict = null; let oTokenizer = null; let oLxg = null; let oTest = null; let oLocution = null; /* Technical note: This worker don’t work as a PromiseWorker (which returns a promise), so when we send request to this worker, we can’t wait the return of the answer just after the request made. The answer is received by the background in another function (onmessage).
︙
158 159 160 161 162 163 164 ~~165~~ 166 167 168 ~~169~~ 170 171 172 173 174 175 176	159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180	+ + + + - + -	conj.init(helpers.loadFile(sExtensionPath + "/grammalecte/fr/conj_data.json")); phonet.init(helpers.loadFile(sExtensionPath + "/grammalecte/fr/phonet_data.json")); mfsp.init(helpers.loadFile(sExtensionPath + "/grammalecte/fr/mfsp_data.json")); //console.log("[Worker] Modules have been initialized…"); gc_engine.load(sContext, sExtensionPath+"grammalecte/_dictionaries"); oDict = gc_engine.getDictionary(); oTest = new TestGrammarChecking(gc_engine, sExtensionPath+"/grammalecte/fr/tests_data.json"); oTokenizer = new Tokenizer("fr"); oLocution = helpers.loadFile(sExtensionPath + "/grammalecte/fr/locutions_data.json"); ~~oLxg = new Lexicographe(oDict);~~ oLxg = new Lexicographe(oDict, oTokenizer, oLocution); if (dOptions !== null) { gc_engine.setOptions(dOptions); } ~~oTokenizer = new Tokenizer("fr");~~ //tests(); bInitDone = true; } else { console.log("[Worker] Already initialized…") } // we always retrieve options from the gc_engine, for setOptions filters obsolete options postMessage(createResponse("init", gc_engine.getOptions(), dInfo, true));
︙
294 295 296 297 298 299 300 ~~301 302 303 304 305 306 307 308 309~~ 310 311 312 313 314 315 316 317 318	298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314	- - - - - - - - - +	// Lexicographer function getListOfTokens (sText, dInfo={}) { try { for (let sParagraph of text.getParagraph(sText)) { if (sParagraph.trim() !== "") { ~~let aElem = [];~~ ~~let aRes = null;~~ ~~for (let oToken of oTokenizer.genTokens(sParagraph)) {~~ ~~aRes = oLxg.getInfoForToken(oToken);~~ ~~if (aRes) {~~ ~~aElem.push(aRes);~~ } } postMessage(createResponse("getListOfTokens", ~~aElem~~, dInfo, false)); postMessage(createResponse("getListOfTokens", oLxg.getListOfTokensReduc(sParagraph, true), dInfo, false)); } } postMessage(createResponse("getListOfTokens", null, dInfo, true)); } catch (e) { helpers.logerror(e); postMessage(createResponse("getListOfTokens", createErrorResult(e, "no tokens"), dInfo, true, true)); } }

Grammalecte Changes On Branch 71c195e4f6ee607d

Changes In Branch Lexicographe Through [71c195e4f6] Excluding Merge-Ins