Grammalecte: Check-in [ab9feb3d66]

Overview

Comment:	merge trunk
Downloads:	Tarball \| ZIP archive \| SQL archive
Timelines:	family \| ancestors \| descendants \| both \| fr_killtricks
Files:	files \| file ages \| folders
SHA3-256:	ab9feb3d66db42a77d00225ed976641d7e2f8360ccf170a33eab2d9300162019
User & Date:	olr on 2017-06-08 19:38:39
Other Links:	branch diff \| manifest \| tags

Context

2017-06-20
09:49		[fr] màj: conjugaisons check-in: 6eaeac5aca user: olr tags: fr, fr_killtricks
2017-06-08
19:38		merge trunk check-in: ab9feb3d66 user: olr tags: fr_killtricks
17:52		[fr][build] merge genfrdic check-in: 3a75d57243 user: olr tags: trunk, fr
2017-06-05
08:43		[fr] nettoyage check-in: c9dedbedb4 user: olr tags: fr, fr_killtricks

Changes

Hide Diffs Unified Diffs Ignore Whitespace Patch

Modified compile_rules.py from [c24bea3108] to [20229cb495].

Renamed and modified doc/build.txt [d154148022] to doc/build.md [0d772932a8].

Modified doc/syntax.txt from [ee9590ca86] to [223b361257].

Added gc_lang/fr/build.py version [9b9cd2c271].

Modified gc_lang/fr/build_data.py from [040b9153d1] to [9294fbef92].

Modified gc_lang/fr/data/phonet_simil.txt from [049b9b49d3] to [8905288c4c].

Modified gc_lang/fr/dictionnaire/genfrdic.py from [38f9af18d9] to [5036afecd5].

Modified gc_lang/fr/rules.grx from [ed08aa24fb] to [d8a8288ded].

Added helpers.py version [dc81791c7e].

Modified make.py from [a4db34e055] to [418a36d3bb].

Modified misc/grammalecte.sublime-syntax from [5e8bef6d14] to [f7dfed6343].

Modified misc/grammalecte.tmTheme from [8385539529] to [7305de87f8].

︙			︙
156 157 158 159 160 161 162 163 164 165 166 167 168 169	entrée entrées entrer entrais entrait entrez entraient envoi envois envoie envoies envoient envol envols envole envoles envolent épais épée épées équivalant équivalent équivalents errâmes Éram essai essais essaie essaies essaient essaye essayes essayent étai étais était étaient été étés étain étains éteint éteins étal étals étale étales étalent étang étangs étant étends étend être êtres hêtre hêtres eusse eusses eussent us éveil éveils éveille éveilles éveillent	>	156 157 158 159 160 161 162 163 164 165 166 167 168 169 170	entrée entrées entrer entrais entrait entrez entraient envoi envois envoie envoies envoient envol envols envole envoles envolent épais épée épées équivalant équivalent équivalents errâmes Éram essai essais essaie essaies essaient essaye essayes essayent essor essors essore essores essorent étai étais était étaient été étés étain étains éteint éteins étal étals étale étales étalent étang étangs étant étends étend être êtres hêtre hêtres eusse eusses eussent us éveil éveils éveille éveilles éveillent
︙			︙
186 187 188 189 190 191 192 193 194 195 196 197 198 199	fi fis fit fît fief fiefs fieffe fieffes fieffent fil fils file files filent filet filets filer filais filait filaient filez film films filme filmes filment filtrat filtrats filtra filtras filtrât fin fins faim faims feins feint flan flan flanc flancs flic flics flique fliques fliquent flou flous floue floues flouent foi fois foie foies font fonts fond fonds forçat forçats força forças forçât foret forets forer forais forait foraient forêt forêts	>	187 188 189 190 191 192 193 194 195 196 197 198 199 200 201	fi fis fit fît fief fiefs fieffe fieffes fieffent fil fils file files filent filet filets filer filais filait filaient filez film films filme filmes filment filtrat filtrats filtra filtras filtrât fin fins faim faims feins feint flair flairs flaire flaires flairent flan flan flanc flancs flic flics flique fliques fliquent flou flous floue floues flouent foi fois foie foies font fonts fond fonds forçat forçats força forças forçât foret forets forer forais forait foraient forêt forêts
︙			︙
276 277 278 279 280 281 282 ~~283~~ 284 285 286 287 288 289 290	mare mares marre marres marrent marc marcs mark marks marque marques marquent mec mecs Mecque mél mêle mêles mêlent mess messe messes meurs meurt mœurs mi mie mies mis mit mît ~~mir mirs mire mires myrrhe myrrhes~~ mite mites mythe mythes mol mols mole moles molle molles môle môles mon mont monts monitorat monitorats monitora monitoras monitorât mort morts mors mords mord maure maures mot mots maux moi mois	\|	278 279 280 281 282 283 284 285 286 287 288 289 290 291 292	mare mares marre marres marrent marc marcs mark marks marque marques marquent mec mecs Mecque mél mêle mêles mêlent mess messe messes meurs meurt mœurs mi mie mies mis mit mît mir mirs mire mires mirent myrrhe myrrhes mite mites mythe mythes mol mols mole moles molle molles môle môles mon mont monts monitorat monitorats monitora monitoras monitorât mort morts mors mords mord maure maures mot mots maux moi mois
︙			︙
412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439	sommeil sommeils sommeille sommeilles sommeillent sommet sommets sommer sommais sommait sommaient sommez son sons sont sonnet sonnets sonner sonnais sonnait sonnaient sonnez sors sort sorts sortie sorties sortis sortit souci soucis soucie soucies soucient soutien soutiens soutient soufflet soufflets soufflé soufflés souffler soufflais soufflait soufflaient soufflez soufre soufres souffre souffres souffrent souk souks souque souques souquent stress stresse stresses stressent substitut substituts substitue substitues substituent sui suis suit suie suies survie survies survis survit survol survols survole survoles survolent ta tas taie taies tes thé thés tain teint teints thym thyms tin tins tint teins tant temps tends tend tante tantes tente tentes tentent tapis tapit tapît tare tares tard teinte teintes teintent tinte tintes tintent test tests teste testes testent tête têtes tète tètes tètent tic tics tique tiques tiquent tir tirs tire tires tirent	> > >	414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444	sommeil sommeils sommeille sommeilles sommeillent sommet sommets sommer sommais sommait sommaient sommez son sons sont sonnet sonnets sonner sonnais sonnait sonnaient sonnez sors sort sorts sortie sorties sortis sortit souci soucis soucie soucies soucient soupir soupirs soupire soupires soupirent soutien soutiens soutient soufflet soufflets soufflé soufflés souffler soufflais soufflait soufflaient soufflez soufre soufres souffre souffres souffrent souk souks souque souques souquent stress stresse stresses stressent substitut substituts substitue substitues substituent sui suis suit suie suies su sus sue sues suent survie survies survis survit survol survols survole survoles survolent ta tas taie taies tes thé thés tain teint teints thym thyms tin tins tint teins tant temps tends tend tante tantes tente tentes tentent tapir tapirs tapirent tapis tapit tapît tare tares tard teinte teintes teintent tinte tintes tintent test tests teste testes testent tête têtes tète tètes tètent tic tics tique tiques tiquent tir tirs tire tires tirent
︙			︙

︙			︙
547 548 549 550 551 552 553 ~~554~~ 555 556 557 558 559 560 561	dVars['version'] = self.sVersion # Dictionaries files (.dic) (.aff) self.writeAffixes(spDic, dVars, nMode, bSimplified) self.writeDictionary(spDic, dVars, nMode, bSimplified) copyTemplate('orthographe', spDic, 'README_dict_fr.txt', dVars) createZipFiles(spDic, spDst, sDicName + '.zip') ~~def createLibreOfficeExtension (self, spBuild, dTplVars, lDictVars, spGL):~~ # LibreOffice extension echo(" * Dictionnaire >> extension pour LibreOffice") dTplVars['version'] = self.sVersion sExtensionName = EXT_PREFIX_OOO + self.sVersion spExt = spBuild + '/' + sExtensionName dir_util.mkpath(spExt+'/META-INF') dir_util.mkpath(spExt+'/ui')	\|	547 548 549 550 551 552 553 554 555 556 557 558 559 560 561	dVars['version'] = self.sVersion # Dictionaries files (.dic) (.aff) self.writeAffixes(spDic, dVars, nMode, bSimplified) self.writeDictionary(spDic, dVars, nMode, bSimplified) copyTemplate('orthographe', spDic, 'README_dict_fr.txt', dVars) createZipFiles(spDic, spDst, sDicName + '.zip') def createLibreOfficeExtension (self, spBuild, dTplVars, lDictVars, spDestGL=""): # LibreOffice extension echo(" * Dictionnaire >> extension pour LibreOffice") dTplVars['version'] = self.sVersion sExtensionName = EXT_PREFIX_OOO + self.sVersion spExt = spBuild + '/' + sExtensionName dir_util.mkpath(spExt+'/META-INF') dir_util.mkpath(spExt+'/ui')
︙			︙
586 587 588 589 590 591 592 ~~593~~ 594 ~~595~~ 596 ~~597~~ 598 599 600 601 602 603 604 605 606 607 608 609 610 ~~611 612 613 614~~ 615 616 617 618 619 620 621 622 623 624 ~~625~~ 626 627 628 629 630 631 632 633 634 635 636 ~~637 638~~ 639 ~~640~~ 641 642 643 644 645 ~~646 647~~ 648 ~~649~~ 650 651 652 653 654 ~~655 656~~ 657 658 659 660 661 662 663	file_util.copy_file('césures/frhyph.tex', spExt+'/dictionaries') file_util.copy_file('césures/hyph-fr.tex', spExt+'/dictionaries') file_util.copy_file('césures/README_hyph_fr-3.0.txt', spExt+'/dictionaries') file_util.copy_file('césures/README_hyph_fr-2.9.txt', spExt+'/dictionaries') # zip createZipFiles(spExt, spBuild, sExtensionName + '.oxt') # copy to Grammalecte Project ~~if spGL:~~ echo(" extension copiée dans Grammalecte...") ~~dir_util.copy_tree(spExt+'/dictionaries', spGL)~~ ~~def createMozillaExtensions (self, spBuild, dTplVars, lDictVars, spDestGL):~~ # Mozilla extension 1 echo(" * Dictionnaire >> extension pour Mozilla") dTplVars['version'] = self.sVersion sExtensionName = EXT_PREFIX_MOZ + self.sVersion spExt = spBuild + '/' + sExtensionName dir_util.mkpath(spExt+'/dictionaries') copyTemplate('_templates/moz', spExt, 'install.rdf', dTplVars) spDict = spBuild + '/' + PREFIX_DICT_PATH + self.sVersion file_util.copy_file(spDict+'/fr-classique.dic', spExt+'/dictionaries/fr-classic.dic') file_util.copy_file(spDict+'/fr-classique.aff', spExt+'/dictionaries/fr-classic.aff') copyTemplate('orthographe', spExt, 'README_dict_fr.txt', dTplVars) createZipFiles(spExt, spBuild, sExtensionName + '.xpi') # Grammalecte echo(" * Dictionnaire >> copie des dicos dans Grammalecte") for dVars in lDictVars: file_util.copy_file(spDict+'/'+dVars['asciiName']+'.dic', spDestGL+'/'+dVars['mozAsciiName']+"/"+dVars['mozAsciiName']+'.dic') file_util.copy_file(spDict+'/'+dVars['asciiName']+'.aff', spDestGL+'/'+dVars['mozAsciiName']+"/"+dVars['mozAsciiName']+'.aff') def createFileIfqForDB (self, spBuild): echo(" * Dictionnaire >> indices de fréquence pour la DB...") with open(spBuild+'/dictIdxIfq-'+self.sVersion+'.diff.txt', 'w', encoding='utf-8', newline="\n") as hDiff, \ open(spBuild+'/dictIdxIfq-'+self.sVersion+'.notes.txt', 'w', encoding='utf-8', newline="\n") as hNotes: for oEntry in self.lEntry: if oEntry.fq != oEntry.oldFq: hDiff.write("{0.iD}\t{0.fq}\n".format(oEntry)) hNotes.write("{0.lemma}/{0.flags}\t{0.oldFq} > {0.fq}\n".format(oEntry)) ~~def createLexiconPackages (self, spBuild, version, oStatsLex, sp~~LexGL~~):~~ sLexName = LEX_PREFIX + version spLex = spBuild + '/' + sLexName dir_util.mkpath(spLex) # write Dicollecte lexicon self.sortLexiconByFreq() self.writeLexicon(spLex + '/' + sLexName + '.txt', version, oStatsLex) self.writeGrammarCheckerLexicon(spBuild + '/' + sLexName + '.lex', version) copyTemplate('lexique', spLex, 'README_lexique.txt', {'version': version}) # zip createZipFiles(spLex, spBuild, sLexName + '.zip') # copy GC lexicon to Grammalecte ~~file_util.copy_file(spBuild + '/' + sLexName + '.lex', sp~~Lex~~GL + '/French.lex') file_util.copy_file('lexique/French.tagset.txt', sp~~Lex~~GL)~~ ~~def createDictConj (self, spBuild, sp~~Copy~~):~~ echo(" * Dictionnaire >> fichier de conjugaison...") with open(spBuild+'/dictConj.txt', 'w', encoding='utf-8', newline="\n") as hDst: for oEntry in self.lEntry: if oEntry.po.startswith("v"): hDst.write(oEntry.getConjugation()) ~~echo(" Fichier de conjugaison copié dans Grammalecte...") file_util.copy_file(spBuild+'/dictConj.txt', sp~~Copy~~)~~ ~~def createDictDecl (self, spBuild, sp~~Copy~~):~~ echo(" * Dictionnaire >> fichier de déclinaison...") with open(spBuild+'/dictDecl.txt', 'w', encoding='utf-8', newline="\n") as hDst: for oEntry in self.lEntry: if re.match("[SXFWIA]", oEntry.flags) and (oEntry.po.startswith("nom") or oEntry.po.startswith("adj")): hDst.write(oEntry.getDeclination()) ~~echo(" Fichier de déclinaison copié dans Grammalecte...") file_util.copy_file(spBuild+'/dictDecl.txt', sp~~Copy~~)~~ def generateSpellVariants (self, nReq, spBuild): if nReq < 1: nReq = 1 if nReq > 2: nReq = 2 echo(" * Lexique >> variantes par suppression... n = " + str(nReq)) with open(spBuild+'/dictSpellVariants-'+str(nReq)+'.txt', 'w', encoding='utf-8', newline="\n") as hDst: for oFlex in frozenset(self.lFlexions):	\| \| \| > \| \| \| \| \| > \| \| \| > \| \| \| > \| \|	586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 645 646 647 648 649 650 651 652 653 654 655 656 657 658 659 660 661 662 663 664 665 666 667	file_util.copy_file('césures/frhyph.tex', spExt+'/dictionaries') file_util.copy_file('césures/hyph-fr.tex', spExt+'/dictionaries') file_util.copy_file('césures/README_hyph_fr-3.0.txt', spExt+'/dictionaries') file_util.copy_file('césures/README_hyph_fr-2.9.txt', spExt+'/dictionaries') # zip createZipFiles(spExt, spBuild, sExtensionName + '.oxt') # copy to Grammalecte Project if spDestGL: echo(" extension copiée dans Grammalecte...") dir_util.copy_tree(spExt+'/dictionaries', spDestGL) def createMozillaExtensions (self, spBuild, dTplVars, lDictVars, spDestGL=""): # Mozilla extension 1 echo(" * Dictionnaire >> extension pour Mozilla") dTplVars['version'] = self.sVersion sExtensionName = EXT_PREFIX_MOZ + self.sVersion spExt = spBuild + '/' + sExtensionName dir_util.mkpath(spExt+'/dictionaries') copyTemplate('_templates/moz', spExt, 'install.rdf', dTplVars) spDict = spBuild + '/' + PREFIX_DICT_PATH + self.sVersion file_util.copy_file(spDict+'/fr-classique.dic', spExt+'/dictionaries/fr-classic.dic') file_util.copy_file(spDict+'/fr-classique.aff', spExt+'/dictionaries/fr-classic.aff') copyTemplate('orthographe', spExt, 'README_dict_fr.txt', dTplVars) createZipFiles(spExt, spBuild, sExtensionName + '.xpi') # Grammalecte if spDestGL: echo(" * Dictionnaire >> copie des dicos dans Grammalecte") for dVars in lDictVars: file_util.copy_file(spDict+'/'+dVars['asciiName']+'.dic', spDestGL+'/'+dVars['mozAsciiName']+"/"+dVars['mozAsciiName']+'.dic') file_util.copy_file(spDict+'/'+dVars['asciiName']+'.aff', spDestGL+'/'+dVars['mozAsciiName']+"/"+dVars['mozAsciiName']+'.aff') def createFileIfqForDB (self, spBuild): echo(" * Dictionnaire >> indices de fréquence pour la DB...") with open(spBuild+'/dictIdxIfq-'+self.sVersion+'.diff.txt', 'w', encoding='utf-8', newline="\n") as hDiff, \ open(spBuild+'/dictIdxIfq-'+self.sVersion+'.notes.txt', 'w', encoding='utf-8', newline="\n") as hNotes: for oEntry in self.lEntry: if oEntry.fq != oEntry.oldFq: hDiff.write("{0.iD}\t{0.fq}\n".format(oEntry)) hNotes.write("{0.lemma}/{0.flags}\t{0.oldFq} > {0.fq}\n".format(oEntry)) def createLexiconPackages (self, spBuild, version, oStatsLex, spDestGL=""): sLexName = LEX_PREFIX + version spLex = spBuild + '/' + sLexName dir_util.mkpath(spLex) # write Dicollecte lexicon self.sortLexiconByFreq() self.writeLexicon(spLex + '/' + sLexName + '.txt', version, oStatsLex) self.writeGrammarCheckerLexicon(spBuild + '/' + sLexName + '.lex', version) copyTemplate('lexique', spLex, 'README_lexique.txt', {'version': version}) # zip createZipFiles(spLex, spBuild, sLexName + '.zip') # copy GC lexicon to Grammalecte if spDestGL: file_util.copy_file(spBuild + '/' + sLexName + '.lex', spDestGL + '/French.lex') file_util.copy_file('lexique/French.tagset.txt', spDestGL) def createDictConj (self, spBuild, spDestGL=""): echo(" * Dictionnaire >> fichier de conjugaison...") with open(spBuild+'/dictConj.txt', 'w', encoding='utf-8', newline="\n") as hDst: for oEntry in self.lEntry: if oEntry.po.startswith("v"): hDst.write(oEntry.getConjugation()) if spDestGL: echo(" Fichier de conjugaison copié dans Grammalecte...") file_util.copy_file(spBuild+'/dictConj.txt', spDestGL) def createDictDecl (self, spBuild, spDestGL=""): echo(" * Dictionnaire >> fichier de déclinaison...") with open(spBuild+'/dictDecl.txt', 'w', encoding='utf-8', newline="\n") as hDst: for oEntry in self.lEntry: if re.match("[SXFWIA]", oEntry.flags) and (oEntry.po.startswith("nom") or oEntry.po.startswith("adj")): hDst.write(oEntry.getDeclination()) if spDestGL: echo(" Fichier de déclinaison copié dans Grammalecte...") file_util.copy_file(spBuild+'/dictDecl.txt', spDestGL) def generateSpellVariants (self, nReq, spBuild): if nReq < 1: nReq = 1 if nReq > 2: nReq = 2 echo(" * Lexique >> variantes par suppression... n = " + str(nReq)) with open(spBuild+'/dictSpellVariants-'+str(nReq)+'.txt', 'w', encoding='utf-8', newline="\n") as hDst: for oFlex in frozenset(self.lFlexions):
︙			︙
805 806 807 808 809 810 811 ~~812 813 814~~ 815 816 817 818 819 820 821	if self.err: echo("\n## Erreur dans le dictionnaire : {}".format(self.err)) echo(" dans : " + self.lemma) def __str__ (self): return "{0.lemma}/{0.flags} {1}".format(self, self.getMorph(2)) ~~def display (self):~~ ~~echo(self.__str__())~~ def check (self): sErr = '' if self.lemma == '': sErr += 'lemme vide' if not re.match(r"[a-zA-ZéÉôÔàâÂîÎïèÈêÊÜœŒæÆçÇ0-9µåÅΩ&αβγδεζηθικλμνξοπρστυφχψωΔℓΩ_]", self.lemma): sErr += 'premier caractère inconnu: ' + self.lemma[0] if re.search(r"\s$", self.lemma):	< < <	809 810 811 812 813 814 815 816 817 818 819 820 821 822	if self.err: echo("\n## Erreur dans le dictionnaire : {}".format(self.err)) echo(" dans : " + self.lemma) def __str__ (self): return "{0.lemma}/{0.flags} {1}".format(self, self.getMorph(2)) def check (self): sErr = '' if self.lemma == '': sErr += 'lemme vide' if not re.match(r"[a-zA-ZéÉôÔàâÂîÎïèÈêÊÜœŒæÆçÇ0-9µåÅΩ&αβγδεζηθικλμνξοπρστυφχψωΔℓΩ_]", self.lemma): sErr += 'premier caractère inconnu: ' + self.lemma[0] if re.search(r"\s$", self.lemma):
︙			︙
1075 1076 1077 1078 1079 1080 1081 ~~1082~~ 1083 1084 1085 1086 1087 1088 1089	# moyenne des formes fléchies sans équivalent ou -1 self.nAKO = math.ceil(nOccur / nFlex) if nFlex > 0 else -1 def solveOccurMultipleFlexions (self, hDst, oStatsLex): sBlank = " " if self.nAKO >= 0: for oFlex in self.lFlexions: ~~if oFlex.nMulti > 0 and not oFlex.b~~Fix~~ed:~~ # on trie les entrées avec AKO et sans AKO lEntWithAKO = [] lEntNoAKO = [] for oEntry in oFlex.lMulti: if oEntry.nAKO >= 0: lEntWithAKO.append(oEntry) else:	\|	1076 1077 1078 1079 1080 1081 1082 1083 1084 1085 1086 1087 1088 1089 1090	# moyenne des formes fléchies sans équivalent ou -1 self.nAKO = math.ceil(nOccur / nFlex) if nFlex > 0 else -1 def solveOccurMultipleFlexions (self, hDst, oStatsLex): sBlank = " " if self.nAKO >= 0: for oFlex in self.lFlexions: if oFlex.nMulti > 0 and not oFlex.bBlocked: # on trie les entrées avec AKO et sans AKO lEntWithAKO = [] lEntNoAKO = [] for oEntry in oFlex.lMulti: if oEntry.nAKO >= 0: lEntWithAKO.append(oEntry) else:
︙			︙
1099 1100 1101 1102 1103 1104 1105 ~~1106~~ 1107 1108 1109 1110 1111 ~~1112~~ 1113 1114 1115 1116 1117 1118 1119 ~~1120~~ 1121 1122 1123 1124 1125 1126 1127 1128 1129 1130 1131 1132 1133 ~~1134~~ 1135 1136 1137 1138 1139 ~~1140~~ 1141 1142 1143 1144 1145 1146 1147 1148 1149 1150 1151 1152 1153 1154 1155 ~~1156~~ 1157 1158 1159 1160 1161 1162 1163 ~~1164~~ 1165 1166 ~~1167~~ 1168 1169 1170 1171 1172 1173 1174	if nDiff > 0: # on peut passer à les formes fléchies à AKO hDst.write(" * {0.sFlexion}\n".format(oFlex)) hDst.write(" moyenne connue\n") for oFlexD in self.lFlexions: if oFlex.sFlexion == oFlexD.sFlexion: hDst.write(sBlank + "{2:<30} {0.sMorph:<30} {0.nOccur:>10} >> {1:>10}\n".format(oFlexD, self.nAKO, self.getShortDescr())) ~~oFlexD.setOccur(self.nAKO)~~ for oEntry in lEntWithAKO: hDst.write(" moyenne connue\n") for oFlexM in oEntry.lFlexions: if oFlex.sFlexion == oFlexM.sFlexion: hDst.write(sBlank + "{2:<30} {0.sMorph:<30} {0.nOccur:>10} >> {1:>10}\n".format(oFlexM, oEntry.nAKO, oEntry.getShortDescr())) ~~oFlexM.setOccur(oEntry.nAKO)~~ # on répercute nDiff sur les flexions sans AKO for oEntry in lEntNoAKO: hDst.write(" sans moyenne connue\n") for oFlexM in oEntry.lFlexions: if oFlex.sFlexion == oFlexM.sFlexion: nNewOccur = oFlexM.nOccur + math.ceil((nDiff / len(lEntNoAKO)) / oFlexM.nDup) hDst.write(sBlank + "{2:<30} {0.sMorph:<30} {0.nOccur:>10} +> {1:>10}\n".format(oFlexM, nNewOccur, oEntry.getShortDescr())) ~~oFlexM.setOccur(nNewOccur)~~ else: # Toutes les entrées sont avec AKO : on pondère nFlexOccur = oStatsLex.getFlexionOccur(oFlex.sFlexion) nTotAKO = self.nAKO for oEnt in oFlex.lMulti: nTotAKO += oEnt.nAKO hDst.write(" = {0.sFlexion}\n".format(oFlex)) hDst.write(" moyennes connues\n") for oFlexD in self.lFlexions: if oFlex.sFlexion == oFlexD.sFlexion: nNewOccur = math.ceil((nFlexOccur * (self.nAKO / nTotAKO)) / oFlexD.nDup) if nTotAKO else 0 hDst.write(sBlank + "{2:<30} {0.sMorph:<30} {0.nOccur:>10} %> {1:>10}\n".format(oFlexD, nNewOccur, self.getShortDescr())) ~~oFlexD.setOccur(nNewOccur)~~ for oEntry in oFlex.lMulti: for oFlexM in oEntry.lFlexions: if oFlex.sFlexion == oFlexM.sFlexion: nNewOccur = math.ceil((nFlexOccur * (oEntry.nAKO / nTotAKO)) / oFlexM.nDup) if nTotAKO else 0 hDst.write(sBlank + "{2:<30} {0.sMorph:<30} {0.nOccur:>10} %> {1:>10}\n".format(oFlexM, nNewOccur, oEntry.getShortDescr())) ~~oFlexM.setOccur(nNewOccur)~~ def calcFreq (self, nTot): self.fFreq = (self.nOccur * 100) / nTot self.oldFq = self.fq self.fq = getIfq(self.fFreq) class Flexion: def __init__ (self, oEntry, sFlex='', sMorph='', cDic=''): self.oEntry = oEntry self.sFlexion = sFlex self.sMorph = sMorph self.cDic = cDic self.nOccur = 0 ~~self.b~~Fix~~ed = False~~ self.nDup = 0 # duplicates in the same entry self.nMulti = 0 # duplicates with other entries self.lMulti = [] # list of similar flexions self.fFreq = 0 self.cFq = '' self.metagfx = '' # métagraphe self.metaph2 = '' # métaphone 2 def setOccur (self, n): self.nOccur = n ~~self.b~~Fix~~ed = True~~ def calcOccur (self): self.nOccur = math.ceil((self.nOccur / (self.nMulti+1)) / self.nDup) def calcFreq (self, nTot): self.fFreq = (self.nOccur * 100) / nTot self.cFq = getIfq(self.fFreq)	\| \| \| \| \| \| \| > > > \|	1100 1101 1102 1103 1104 1105 1106 1107 1108 1109 1110 1111 1112 1113 1114 1115 1116 1117 1118 1119 1120 1121 1122 1123 1124 1125 1126 1127 1128 1129 1130 1131 1132 1133 1134 1135 1136 1137 1138 1139 1140 1141 1142 1143 1144 1145 1146 1147 1148 1149 1150 1151 1152 1153 1154 1155 1156 1157 1158 1159 1160 1161 1162 1163 1164 1165 1166 1167 1168 1169 1170 1171 1172 1173 1174 1175 1176 1177 1178	if nDiff > 0: # on peut passer à les formes fléchies à AKO hDst.write(" * {0.sFlexion}\n".format(oFlex)) hDst.write(" moyenne connue\n") for oFlexD in self.lFlexions: if oFlex.sFlexion == oFlexD.sFlexion: hDst.write(sBlank + "{2:<30} {0.sMorph:<30} {0.nOccur:>10} >> {1:>10}\n".format(oFlexD, self.nAKO, self.getShortDescr())) oFlexD.setOccurAndBlock(self.nAKO) for oEntry in lEntWithAKO: hDst.write(" moyenne connue\n") for oFlexM in oEntry.lFlexions: if oFlex.sFlexion == oFlexM.sFlexion: hDst.write(sBlank + "{2:<30} {0.sMorph:<30} {0.nOccur:>10} >> {1:>10}\n".format(oFlexM, oEntry.nAKO, oEntry.getShortDescr())) oFlexM.setOccurAndBlock(oEntry.nAKO) # on répercute nDiff sur les flexions sans AKO for oEntry in lEntNoAKO: hDst.write(" sans moyenne connue\n") for oFlexM in oEntry.lFlexions: if oFlex.sFlexion == oFlexM.sFlexion: nNewOccur = oFlexM.nOccur + math.ceil((nDiff / len(lEntNoAKO)) / oFlexM.nDup) hDst.write(sBlank + "{2:<30} {0.sMorph:<30} {0.nOccur:>10} +> {1:>10}\n".format(oFlexM, nNewOccur, oEntry.getShortDescr())) oFlexM.setOccurAndBlock(nNewOccur) else: # Toutes les entrées sont avec AKO : on pondère nFlexOccur = oStatsLex.getFlexionOccur(oFlex.sFlexion) nTotAKO = self.nAKO for oEnt in oFlex.lMulti: nTotAKO += oEnt.nAKO hDst.write(" = {0.sFlexion}\n".format(oFlex)) hDst.write(" moyennes connues\n") for oFlexD in self.lFlexions: if oFlex.sFlexion == oFlexD.sFlexion: nNewOccur = math.ceil((nFlexOccur * (self.nAKO / nTotAKO)) / oFlexD.nDup) if nTotAKO else 0 hDst.write(sBlank + "{2:<30} {0.sMorph:<30} {0.nOccur:>10} %> {1:>10}\n".format(oFlexD, nNewOccur, self.getShortDescr())) oFlexD.setOccurAndBlock(nNewOccur) for oEntry in oFlex.lMulti: for oFlexM in oEntry.lFlexions: if oFlex.sFlexion == oFlexM.sFlexion: nNewOccur = math.ceil((nFlexOccur * (oEntry.nAKO / nTotAKO)) / oFlexM.nDup) if nTotAKO else 0 hDst.write(sBlank + "{2:<30} {0.sMorph:<30} {0.nOccur:>10} %> {1:>10}\n".format(oFlexM, nNewOccur, oEntry.getShortDescr())) oFlexM.setOccurAndBlock(nNewOccur) def calcFreq (self, nTot): self.fFreq = (self.nOccur * 100) / nTot self.oldFq = self.fq self.fq = getIfq(self.fFreq) class Flexion: def __init__ (self, oEntry, sFlex='', sMorph='', cDic=''): self.oEntry = oEntry self.sFlexion = sFlex self.sMorph = sMorph self.cDic = cDic self.nOccur = 0 self.bBlocked = False self.nDup = 0 # duplicates in the same entry self.nMulti = 0 # duplicates with other entries self.lMulti = [] # list of similar flexions self.fFreq = 0 self.cFq = '' self.metagfx = '' # métagraphe self.metaph2 = '' # métaphone 2 def setOccur (self, n): self.nOccur = n def setOccurAndBlock (self, n): self.nOccur = n self.bBlocked = True def calcOccur (self): self.nOccur = math.ceil((self.nOccur / (self.nMulti+1)) / self.nDup) def calcFreq (self, nTot): self.fFreq = (self.nOccur * 100) / nTot self.cFq = getIfq(self.fFreq)
︙			︙
1190 1191 1192 1193 1194 1195 1196 ~~1197 1198 1199~~ 1200 1201 1202 1203 1204 1205 1206	def __str__ (self, oStatsLex): sOccurs = '' for v in oStatsLex.dFlexions[self.sFlexion]: sOccurs += str(v) + "\t" return "{0.oEntry.iD}\t{0.sFlexion}\t{0.oEntry.sRadical}\t{0.sMorph}\t{0.metagfx}\t{0.metaph2}\t{0.oEntry.lx}\t{0.oEntry.se}\t{0.oEntry.et}\t{0.oEntry.di}{2}\t{1}{0.nOccur}\t{0.nDup}\t{0.nMulti}\t{0.fFreq:.15f}\t{0.cFq}\n".format(self, sOccurs, "/"+self.cDic if self.cDic != "*" else "") ~~def display (self):~~ ~~echo(self.__str__())~~ @classmethod def simpleHeader (cls): return "# :POS ;LEX ~SEM =FQ /DIC\n" def getGrammarCheckerRepr (self): return "{0.sFlexion}\t{0.oEntry.lemma}\t{1}\n".format(self, self._getSimpleTags())	< < <	1194 1195 1196 1197 1198 1199 1200 1201 1202 1203 1204 1205 1206 1207	def __str__ (self, oStatsLex): sOccurs = '' for v in oStatsLex.dFlexions[self.sFlexion]: sOccurs += str(v) + "\t" return "{0.oEntry.iD}\t{0.sFlexion}\t{0.oEntry.sRadical}\t{0.sMorph}\t{0.metagfx}\t{0.metaph2}\t{0.oEntry.lx}\t{0.oEntry.se}\t{0.oEntry.et}\t{0.oEntry.di}{2}\t{1}{0.nOccur}\t{0.nDup}\t{0.nMulti}\t{0.fFreq:.15f}\t{0.cFq}\n".format(self, sOccurs, "/"+self.cDic if self.cDic != "*" else "") @classmethod def simpleHeader (cls): return "# :POS ;LEX ~SEM =FQ /DIC\n" def getGrammarCheckerRepr (self): return "{0.sFlexion}\t{0.oEntry.lemma}\t{1}\n".format(self, self._getSimpleTags())
︙			︙
1504 1505 1506 1507 1508 1509 1510 1511 1512 1513 1514 1515 1516 1517	xParser = argparse.ArgumentParser() xParser.add_argument("-v", "--verdic", help="set dictionary version, i.e. 5.4", type=str, default="X.Y.z") xParser.add_argument("-m", "--mode", help="0: no tags, 1: Hunspell tags (default), 2: All tags", type=int, choices=[0, 1, 2], default=1) xParser.add_argument("-u", "--uncompress", help="do not use Hunspell compression", action="store_true") xParser.add_argument("-s", "--simplify", help="no virtual lemmas", action="store_true") xParser.add_argument("-sv", "--spellvariants", help="generate spell variants", action="store_true") xArgs = xParser.parse_args() if xArgs.simplify: xArgs.mode = 0 xArgs.uncompress = True echo("Python: " + sys.version)	>	1505 1506 1507 1508 1509 1510 1511 1512 1513 1514 1515 1516 1517 1518 1519	xParser = argparse.ArgumentParser() xParser.add_argument("-v", "--verdic", help="set dictionary version, i.e. 5.4", type=str, default="X.Y.z") xParser.add_argument("-m", "--mode", help="0: no tags, 1: Hunspell tags (default), 2: All tags", type=int, choices=[0, 1, 2], default=1) xParser.add_argument("-u", "--uncompress", help="do not use Hunspell compression", action="store_true") xParser.add_argument("-s", "--simplify", help="no virtual lemmas", action="store_true") xParser.add_argument("-sv", "--spellvariants", help="generate spell variants", action="store_true") xParser.add_argument("-gl", "--grammalecte", help="copy generated files to Grammalecte folders", action="store_true") xArgs = xParser.parse_args() if xArgs.simplify: xArgs.mode = 0 xArgs.uncompress = True echo("Python: " + sys.version)
︙			︙
1551 1552 1553 1554 1555 1556 1557 1558 1559 1560 ~~1561 1562 1563~~ 1564 ~~1565 1566~~ 1567 1568 1569 1570 1571	oStatsLex.addLexFromFile('lexique/corpus_data/stats_frwikisource.txt', 'S', 'Wikisource') oStatsLex.addLexFromFile('lexique/corpus_data/stats_litterature.txt', 'L', 'Littérature') oStatsLex.write(spBuild+'/test_lex.txt') oFrenchDict.calculateStats(oStatsLex, spfStats) ### écriture des paquets echo("Création des paquets...") if not xArgs.uncompress: oFrenchDict.defineAbreviatedTags(xArgs.mode, spfStats) oFrenchDict.createFiles(spBuild, [dMODERNE, dTOUTESVAR, dCLASSIQUE, dREFORME1990], xArgs.mode, xArgs.simplify) ~~oFrenchDict.createLibreOfficeExtension(spBuild, dMOZEXT, [dMODERNE, dTOUTESVAR, dCLASSIQUE, dREFORME1990], "../oxt/Dictionnaires/dictionaries")~~ ~~oFrenchDict.createMozillaExtensions(spBuild, dMOZEXT, [dMODERNE, dTOUTESVAR, dCLASSIQUE, dREFORME1990], "../xpi/data/dictionaries")~~ oFrenchDict.createLexiconPackages(spBuild, xArgs.verdic, oStatsLex, ~~"../../../l~~exicons") oFrenchDict.createFileIfqForDB(spBuild) ~~oFrenchDict.createDictConj(spBuild, ~~"../d~~ata") oFrenchDict.createDictDecl(spBuild, ~~"../d~~ata")~~ if __name__ == '__main__': main()	> > > > > > < < \| > > \| \|	1553 1554 1555 1556 1557 1558 1559 1560 1561 1562 1563 1564 1565 1566 1567 1568 1569 1570 1571 1572 1573 1574 1575 1576 1577 1578 1579	oStatsLex.addLexFromFile('lexique/corpus_data/stats_frwikisource.txt', 'S', 'Wikisource') oStatsLex.addLexFromFile('lexique/corpus_data/stats_litterature.txt', 'L', 'Littérature') oStatsLex.write(spBuild+'/test_lex.txt') oFrenchDict.calculateStats(oStatsLex, spfStats) ### écriture des paquets echo("Création des paquets...") spLexiconDestGL = "../../../lexicons" if xArgs.grammalecte else "" spLibreOfficeExtDestGL = "../oxt/Dictionnaires/dictionaries" if xArgs.grammalecte else "" spMozillaExtDestGL = "../xpi/data/dictionaries" if xArgs.grammalecte else "" spDataDestGL = "../data" if xArgs.grammalecte else "" if not xArgs.uncompress: oFrenchDict.defineAbreviatedTags(xArgs.mode, spfStats) oFrenchDict.createFiles(spBuild, [dMODERNE, dTOUTESVAR, dCLASSIQUE, dREFORME1990], xArgs.mode, xArgs.simplify) oFrenchDict.createLexiconPackages(spBuild, xArgs.verdic, oStatsLex, spLexiconDestGL) oFrenchDict.createFileIfqForDB(spBuild) oFrenchDict.createLibreOfficeExtension(spBuild, dMOZEXT, [dMODERNE, dTOUTESVAR, dCLASSIQUE, dREFORME1990], spLibreOfficeExtDestGL) oFrenchDict.createMozillaExtensions(spBuild, dMOZEXT, [dMODERNE, dTOUTESVAR, dCLASSIQUE, dREFORME1990], spMozillaExtDestGL) oFrenchDict.createDictConj(spBuild, spDataDestGL) oFrenchDict.createDictDecl(spBuild, spDataDestGL) if __name__ == '__main__': main()

︙			︙
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109	import configparser import datetime import argparse import importlib import unittest import json ~~from string import Template~~ from distutils import dir_util, file_util import dialog_bundled import compile_rules sWarningMessage = "The content of this folder is generated by code and replaced at each build.\n" ~~class cd:~~ ~~"""Context manager for changing the current working directory"""~~ ~~def __init__ (self, newPath):~~ ~~self.newPath = os.path.expanduser(newPath)~~ ~~def __enter__ (self):~~ ~~self.savedPath = os.getcwd()~~ ~~os.chdir(self.newPath)~~ ~~def __exit__ (self, etype, value, traceback):~~ ~~os.chdir(self.savedPath)~~ ~~def fileFile (spf, dVars):~~ ~~return Template(open(spf, "r", encoding="utf-8").read()).safe_substitute(dVars)~~ ~~def copyAndFileTemplate (spfSrc, spfDst, dVars):~~ ~~s = Template(open(spfSrc, "r", encoding="utf-8").read()).safe_substitute(dVars)~~ ~~open(spfDst, "w", encoding="utf-8", newline="\n").write(s)~~ ~~def addFolderToZipAndFileFile (hZip, spSrc, spDst, dVars, bRecursive):~~ ~~# recursive function~~ ~~spSrc = spSrc.strip("/ ")~~ ~~spDst = spDst.strip("/ ")~~ ~~for sf in os.listdir(spSrc):~~ ~~spfSrc = (spSrc + "/" + sf).strip("/ ")~~ ~~spfDst = (spDst + "/" + sf).strip("/ ")~~ ~~if os.path.isdir(spfSrc):~~ ~~if bRecursive:~~ ~~addFolderToZipAndFileFile(hZip, spfSrc, spfDst, dVars, bRecursive)~~ ~~else:~~ ~~if spfSrc.endswith((".css", ".js", ".xcu", ".xul", ".rdf", ".dtd", ".properties")):~~ ~~#print(spfSrc + " > " + spfDst)~~ ~~hZip.writestr(spfDst, fileFile(spfSrc, dVars))~~ ~~else:~~ ~~#print(spfSrc + " > " + spfDst)~~ ~~hZip.write(spfSrc, spfDst)~~ ~~def unzip (spfZip, spDest, bCreatePath=False):~~ ~~if spDest:~~ ~~if bCreatePath and not os.path.exists(spDest):~~ ~~dir_util.mkpath(spDest)~~ ~~print("> unzip in: "+ spDest)~~ ~~spInstall = os.path.abspath(spDest)~~ ~~if os.path.isdir(spInstall):~~ ~~eraseFolder(spInstall)~~ ~~with zipfile.ZipFile(spfZip) as hZip:~~ ~~hZip.extractall(spDest)~~ ~~else:~~ ~~print("# folder not found")~~ ~~else:~~ ~~print("path destination is empty")~~ ~~def eraseFolder (sp):~~ ~~# recursive!!!~~ ~~for sf in os.listdir(sp):~~ ~~spf = sp + "/" + sf~~ ~~if os.path.isdir(spf):~~ ~~eraseFolder(spf)~~ ~~else:~~ ~~try:~~ ~~os.remove(spf)~~ ~~except:~~ ~~print("%s not removed" % spf)~~ ~~def createCleanFolder (sp):~~ ~~if not os.path.exists(sp):~~ ~~dir_util.mkpath(sp)~~ ~~else:~~ ~~eraseFolder(sp)~~ def getConfig (sLang): xConfig = configparser.SafeConfigParser() xConfig.optionxform = str try: xConfig.read("gc_lang/" + sLang + "/config.ini", encoding="utf-8") except:	< > < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < <	10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32	import configparser import datetime import argparse import importlib import unittest import json from distutils import dir_util, file_util import dialog_bundled import compile_rules import helpers sWarningMessage = "The content of this folder is generated by code and replaced at each build.\n" def getConfig (sLang): xConfig = configparser.SafeConfigParser() xConfig.optionxform = str try: xConfig.read("gc_lang/" + sLang + "/config.ini", encoding="utf-8") except:
︙			︙
153 154 155 156 157 158 159 ~~160 161 162 163~~ 164 165 ~~166~~ 167 168 169 170 171 172 ~~173~~ 174 175 176 177 ~~178~~ 179 180 181 182 183 ~~184 185 186~~ 187 188 189 190 191 192 193 194 195 196 197 198 199 ~~200~~ 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295	hZip = zipfile.ZipFile(spfZip, mode='w', compression=zipfile.ZIP_DEFLATED) # Package and parser copyGrammalectePyPackageInZipFile(hZip, spLangPack, dVars['py_binary_dic'], "pythonpath/") hZip.write("cli.py", "pythonpath/cli.py") # Extension files hZip.writestr("META-INF/manifest.xml", fileFile("gc_core/py/oxt/manifest.xml", dVars)) hZip.writestr("description.xml", fileFile("gc_core/py/oxt/description.xml", dVars)) hZip.writestr("Linguistic.xcu", fileFile("gc_core/py/oxt/Linguistic.xcu", dVars)) hZip.writestr("Grammalecte.py", fileFile("gc_core/py/oxt/Grammalecte.py", dVars)) for sf in dVars["extras"].split(","): ~~hZip.writestr(sf.strip(), fileFile(spLang + '/' + sf.strip(), dVars))~~ if "logo" in dVars.keys() and dVars["logo"].strip(): hZip.write(spLang + '/' + dVars["logo"].strip(), dVars["logo"].strip()) ## OPTIONS # options dialog within LO/OO options panel (legacy) ~~#hZip.writestr("pythonpath/lightproof_handler_grammalecte.py", fileFile("gc_core/py/oxt/lightproof_handler_grammalecte.py", dVars))~~ #lLineOptions = open(spLang + "/options.txt", "r", encoding="utf-8").readlines() #dialog_bundled.c(dVars["implname"], lLineOptions, hZip, dVars["lang"]) # options dialog ~~hZip.writestr("pythonpath/Options.py", fileFile("gc_core/py/oxt/Options.py", dVars))~~ hZip.write("gc_core/py/oxt/op_strings.py", "pythonpath/op_strings.py") # options dialog within Writer options panel dVars["xdl_dialog_options"] = createDialogOptionsXDL(dVars) dVars["xcs_options"] = "\n".join([ '<prop oor:name="'+sOpt+'" oor:type="xs:string"><value></value></prop>' for sOpt in dVars["dOptPython"] ]) dVars["xcu_label_values"] = "\n".join([ '<value xml:lang="'+sLang+'">' + dVars["dOptLabel"][sLang]["__optiontitle__"] + '</value>' for sLang in dVars["dOptLabel"] ]) hZip.writestr("dialog/options_page.xdl", fileFile("gc_core/py/oxt/options_page.xdl", dVars)) hZip.writestr("dialog/OptionsDialog.xcs", fileFile("gc_core/py/oxt/OptionsDialog.xcs", dVars)) hZip.writestr("dialog/OptionsDialog.xcu", fileFile("gc_core/py/oxt/OptionsDialog.xcu", dVars)) hZip.writestr("dialog/" + dVars['lang'] + "_en.default", "") for sLangLbl, dOptLbl in dVars['dOptLabel'].items(): hZip.writestr("dialog/" + dVars['lang'] + "_" + sLangLbl + ".properties", createOptionsLabelProperties(dOptLbl)) ## ADDONS OXT print("+ OXT: ", end="") for spfSrc, spfDst in dOxt.items(): print(spfSrc, end=", ") if os.path.isdir(spLang+'/'+spfSrc): for sf in os.listdir(spLang+'/'+spfSrc): hZip.write(spLang+'/'+spfSrc+"/"+sf, spfDst+"/"+sf) else: if spfSrc.endswith(('.txt', '.py')): ~~hZip.writestr(spfDst, fileFile(spLang+'/'+spfSrc, dVars))~~ else: hZip.write(spLang+'/'+spfSrc, spfDst) print() hZip.close() # Installation in Writer profile if bInstall: print("> installation in Writer") if dVars.get('unopkg', False): cmd = '"'+os.path.abspath(dVars.get('unopkg')+'" add -f '+spfZip) print(cmd) #subprocess.run(cmd) os.system(cmd) else: print("# Error: path and filename of unopkg not set in config.ini") ~~def createOptionsForFirefox (dVars):~~ ~~sHTML = ""~~ ~~for sSection, lOpt in dVars['lStructOpt']:~~ ~~sHTML += '\n<div id="subsection_' + sSection + '" class="opt_subsection">\n <h2 data-l10n-id="option_'+sSection+'"></h2>\n'~~ ~~for lLineOpt in lOpt:~~ ~~for sOpt in lLineOpt:~~ ~~sHTML += ' <p><input type="checkbox" id="option_'+sOpt+'" /><label id="option_label_'+sOpt+'" for="option_'+sOpt+'" data-l10n-id="option_'+sOpt+'"></label></p>\n'~~ ~~sHTML += '</div>\n'~~ ~~# Creating translation data~~ ~~dProperties = {}~~ ~~for sLang in dVars['dOptLabel'].keys():~~ ~~dProperties[sLang] = "\n".join( [ "option_" + sOpt + " = " + dVars['dOptLabel'][sLang][sOpt][0].replace(" [!]", " [!]") for sOpt in dVars['dOptLabel'][sLang] ] )~~ ~~return sHTML, dProperties~~ ~~def createFirefoxExtension (sLang, dVars):~~ ~~"create extension for Firefox"~~ ~~print("Building extension for Firefox")~~ ~~createCleanFolder("_build/xpi/"+sLang)~~ ~~dir_util.copy_tree("gc_lang/"+sLang+"/xpi/", "_build/xpi/"+sLang)~~ ~~dir_util.copy_tree("grammalecte-js", "_build/xpi/"+sLang+"/grammalecte")~~ ~~sHTML, dProperties = createOptionsForFirefox(dVars)~~ ~~dVars['optionsHTML'] = sHTML~~ ~~copyAndFileTemplate("_build/xpi/"+sLang+"/data/about_panel.html", "_build/xpi/"+sLang+"/data/about_panel.html", dVars)~~ ~~for sLocale in dProperties.keys():~~ ~~spfLocale = "_build/xpi/"+sLang+"/locale/"+sLocale+".properties"~~ ~~if os.path.exists(spfLocale):~~ ~~copyAndFileTemplate(spfLocale, spfLocale, dProperties)~~ ~~else:~~ ~~print("Locale file not found: " + spfLocale)~~ ~~with cd("_build/xpi/"+sLang):~~ ~~os.system("jpm xpi")~~ ~~def createOptionsForThunderbird (dVars):~~ ~~dVars['sXULTabs'] = ""~~ ~~dVars['sXULTabPanels'] = ""~~ ~~# dialog options~~ ~~for sSection, lOpt in dVars['lStructOpt']:~~ ~~dVars['sXULTabs'] += ' <tab label="&option.label.'+sSection+';"/>\n'~~ ~~dVars['sXULTabPanels'] += ' <tabpanel orient="vertical">\n <label class="section" value="&option.label.'+sSection+';" />\n'~~ ~~for lLineOpt in lOpt:~~ ~~for sOpt in lLineOpt:~~ ~~dVars['sXULTabPanels'] += ' <checkbox id="option_'+sOpt+'" class="option" label="&option.label.'+sOpt+';" />\n'~~ ~~dVars['sXULTabPanels'] += ' </tabpanel>\n'~~ ~~# translation data~~ ~~for sLang in dVars['dOptLabel'].keys():~~ ~~dVars['gc_options_labels_'+sLang] = "\n".join( [ "<!ENTITY option.label." + sOpt + ' "' + dVars['dOptLabel'][sLang][sOpt][0] + '">' for sOpt in dVars['dOptLabel'][sLang] ] )~~ ~~return dVars~~ ~~def createThunderbirdExtension (sLang, dVars, spLangPack):~~ ~~"create extension for Thunderbird"~~ ~~print("Building extension for Thunderbird")~~ ~~sExtensionName = dVars['tb_identifier'] + "-v" + dVars['version'] + '.xpi'~~ ~~spfZip = "_build/" + sExtensionName~~ ~~hZip = zipfile.ZipFile(spfZip, mode='w', compression=zipfile.ZIP_DEFLATED)~~ ~~copyGrammalecteJSPackageInZipFile(hZip, spLangPack, dVars['js_binary_dic'])~~ ~~for spf in ["LICENSE.txt", "LICENSE.fr.txt"]:~~ ~~hZip.write(spf)~~ ~~dVars = createOptionsForThunderbird(dVars)~~ ~~addFolderToZipAndFileFile(hZip, "gc_lang/"+sLang+"/tb", "", dVars, True)~~ ~~hZip.write("gc_lang/"+sLang+"/xpi/gce_worker.js", "worker/gce_worker.js")~~ ~~spDict = "gc_lang/"+sLang+"/xpi/data/dictionaries"~~ ~~for sp in os.listdir(spDict):~~ ~~if os.path.isdir(spDict+"/"+sp):~~ ~~hZip.write(spDict+"/"+sp+"/"+sp+".dic", "content/dictionaries/"+sp+"/"+sp+".dic")~~ ~~hZip.write(spDict+"/"+sp+"/"+sp+".aff", "content/dictionaries/"+sp+"/"+sp+".aff")~~ ~~hZip.close()~~ ~~unzip(spfZip, dVars['tb_debug_extension_path'])~~ def createServerOptions (sLang, dOptData): with open("server_options."+sLang+".ini", "w", encoding="utf-8", newline="\n") as hDst: hDst.write("# Server options. Lang: " + sLang + "\n\n[gc_options]\n") for sSection, lOpt in dOptData["lStructOpt"]: hDst.write("\n########## " + dOptData["dOptLabel"][sLang].get(sSection, sSection + "[no label found]")[0] + " ##########\n") for lLineOpt in lOpt:	\| \| \| \| \| \| \| \| \| \| \| < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < <	76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146	hZip = zipfile.ZipFile(spfZip, mode='w', compression=zipfile.ZIP_DEFLATED) # Package and parser copyGrammalectePyPackageInZipFile(hZip, spLangPack, dVars['py_binary_dic'], "pythonpath/") hZip.write("cli.py", "pythonpath/cli.py") # Extension files hZip.writestr("META-INF/manifest.xml", helpers.fileFile("gc_core/py/oxt/manifest.xml", dVars)) hZip.writestr("description.xml", helpers.fileFile("gc_core/py/oxt/description.xml", dVars)) hZip.writestr("Linguistic.xcu", helpers.fileFile("gc_core/py/oxt/Linguistic.xcu", dVars)) hZip.writestr("Grammalecte.py", helpers.fileFile("gc_core/py/oxt/Grammalecte.py", dVars)) for sf in dVars["extras"].split(","): hZip.writestr(sf.strip(), helpers.fileFile(spLang + '/' + sf.strip(), dVars)) if "logo" in dVars.keys() and dVars["logo"].strip(): hZip.write(spLang + '/' + dVars["logo"].strip(), dVars["logo"].strip()) ## OPTIONS # options dialog within LO/OO options panel (legacy) #hZip.writestr("pythonpath/lightproof_handler_grammalecte.py", helpers.fileFile("gc_core/py/oxt/lightproof_handler_grammalecte.py", dVars)) #lLineOptions = open(spLang + "/options.txt", "r", encoding="utf-8").readlines() #dialog_bundled.c(dVars["implname"], lLineOptions, hZip, dVars["lang"]) # options dialog hZip.writestr("pythonpath/Options.py", helpers.fileFile("gc_core/py/oxt/Options.py", dVars)) hZip.write("gc_core/py/oxt/op_strings.py", "pythonpath/op_strings.py") # options dialog within Writer options panel dVars["xdl_dialog_options"] = createDialogOptionsXDL(dVars) dVars["xcs_options"] = "\n".join([ '<prop oor:name="'+sOpt+'" oor:type="xs:string"><value></value></prop>' for sOpt in dVars["dOptPython"] ]) dVars["xcu_label_values"] = "\n".join([ '<value xml:lang="'+sLang+'">' + dVars["dOptLabel"][sLang]["__optiontitle__"] + '</value>' for sLang in dVars["dOptLabel"] ]) hZip.writestr("dialog/options_page.xdl", helpers.fileFile("gc_core/py/oxt/options_page.xdl", dVars)) hZip.writestr("dialog/OptionsDialog.xcs", helpers.fileFile("gc_core/py/oxt/OptionsDialog.xcs", dVars)) hZip.writestr("dialog/OptionsDialog.xcu", helpers.fileFile("gc_core/py/oxt/OptionsDialog.xcu", dVars)) hZip.writestr("dialog/" + dVars['lang'] + "_en.default", "") for sLangLbl, dOptLbl in dVars['dOptLabel'].items(): hZip.writestr("dialog/" + dVars['lang'] + "_" + sLangLbl + ".properties", createOptionsLabelProperties(dOptLbl)) ## ADDONS OXT print("+ OXT: ", end="") for spfSrc, spfDst in dOxt.items(): print(spfSrc, end=", ") if os.path.isdir(spLang+'/'+spfSrc): for sf in os.listdir(spLang+'/'+spfSrc): hZip.write(spLang+'/'+spfSrc+"/"+sf, spfDst+"/"+sf) else: if spfSrc.endswith(('.txt', '.py')): hZip.writestr(spfDst, helpers.fileFile(spLang+'/'+spfSrc, dVars)) else: hZip.write(spLang+'/'+spfSrc, spfDst) print() hZip.close() # Installation in Writer profile if bInstall: print("> installation in Writer") if dVars.get('unopkg', False): cmd = '"'+os.path.abspath(dVars.get('unopkg')+'" add -f '+spfZip) print(cmd) #subprocess.run(cmd) os.system(cmd) else: print("# Error: path and filename of unopkg not set in config.ini") def createServerOptions (sLang, dOptData): with open("server_options."+sLang+".ini", "w", encoding="utf-8", newline="\n") as hDst: hDst.write("# Server options. Lang: " + sLang + "\n\n[gc_options]\n") for sSection, lOpt in dOptData["lStructOpt"]: hDst.write("\n########## " + dOptData["dOptLabel"][sLang].get(sSection, sSection + "[no label found]")[0] + " ##########\n") for lLineOpt in lOpt:
︙			︙
303 304 305 306 307 308 309 ~~310~~ 311 312 313 314 315 316 317 318 319 320 321 ~~322 323 324 325 326 327 328 329 330 331~~ 332 333 334 335 336 337 338	"create server zip" spfZip = "_build/" + dVars['name'] + "-"+ dVars['lang'] +"-v" + dVars['version'] + '.zip' hZip = zipfile.ZipFile(spfZip, mode='w', compression=zipfile.ZIP_DEFLATED) copyGrammalectePyPackageInZipFile(hZip, spLangPack, dVars['py_binary_dic']) for spf in ["cli.py", "server.py", "bottle.py", "server_options._global.ini", "server_options."+sLang+".ini", \ "README.txt", "LICENSE.txt", "LICENSE.fr.txt"]: hZip.write(spf) ~~hZip.writestr("setup.py", fileFile("gc_lang/fr/setup.py", dVars))~~ def copyGrammalectePyPackageInZipFile (hZip, spLangPack, sDicName, sAddPath=""): for sf in os.listdir("grammalecte"): if not os.path.isdir("grammalecte/"+sf): hZip.write("grammalecte/"+sf, sAddPath+"grammalecte/"+sf) for sf in os.listdir(spLangPack): if not os.path.isdir(spLangPack+"/"+sf): hZip.write(spLangPack+"/"+sf, sAddPath+spLangPack+"/"+sf) hZip.write("grammalecte/_dictionaries/"+sDicName, sAddPath+"grammalecte/_dictionaries/"+sDicName) ~~def copyGrammalecteJSPackageInZipFile (hZip, spLangPack, sDicName, sAddPath=""):~~ ~~for sf in os.listdir("grammalecte-js"):~~ ~~if not os.path.isdir("grammalecte-js/"+sf):~~ ~~hZip.write("grammalecte-js/"+sf, sAddPath+"grammalecte-js/"+sf)~~ ~~for sf in os.listdir(spLangPack):~~ ~~if not os.path.isdir(spLangPack+"/"+sf):~~ ~~hZip.write(spLangPack+"/"+sf, sAddPath+spLangPack+"/"+sf)~~ ~~hZip.write("grammalecte-js/_dictionaries/"+sDicName, sAddPath+"grammalecte-js/_dictionaries/"+sDicName)~~ def create (sLang, xConfig, bInstallOXT, bJavaScript): oNow = datetime.datetime.now() print("============== MAKE GRAMMALECTE [{0}] at {1.hour:>2} h {1.minute:>2} min {1.second:>2} s ==============".format(sLang, oNow)) #### READ CONFIGURATION print("> read configuration...")	\| < < < < < < < < < <	154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179	"create server zip" spfZip = "_build/" + dVars['name'] + "-"+ dVars['lang'] +"-v" + dVars['version'] + '.zip' hZip = zipfile.ZipFile(spfZip, mode='w', compression=zipfile.ZIP_DEFLATED) copyGrammalectePyPackageInZipFile(hZip, spLangPack, dVars['py_binary_dic']) for spf in ["cli.py", "server.py", "bottle.py", "server_options._global.ini", "server_options."+sLang+".ini", \ "README.txt", "LICENSE.txt", "LICENSE.fr.txt"]: hZip.write(spf) hZip.writestr("setup.py", helpers.fileFile("gc_lang/fr/setup.py", dVars)) def copyGrammalectePyPackageInZipFile (hZip, spLangPack, sDicName, sAddPath=""): for sf in os.listdir("grammalecte"): if not os.path.isdir("grammalecte/"+sf): hZip.write("grammalecte/"+sf, sAddPath+"grammalecte/"+sf) for sf in os.listdir(spLangPack): if not os.path.isdir(spLangPack+"/"+sf): hZip.write(spLangPack+"/"+sf, sAddPath+spLangPack+"/"+sf) hZip.write("grammalecte/_dictionaries/"+sDicName, sAddPath+"grammalecte/_dictionaries/"+sDicName) def create (sLang, xConfig, bInstallOXT, bJavaScript): oNow = datetime.datetime.now() print("============== MAKE GRAMMALECTE [{0}] at {1.hour:>2} h {1.minute:>2} min {1.second:>2} s ==============".format(sLang, oNow)) #### READ CONFIGURATION print("> read configuration...")
︙			︙
360 361 362 363 364 365 366 ~~367~~ 368 369 ~~370~~ 371 372 373 374 375 376 377	sCodePlugins += "\n\n" + open(spLang+'/modules/'+sf, "r", encoding="utf-8").read() print(sf, end=", ") print() dVars["plugins"] = sCodePlugins ## CREATE GRAMMAR CHECKER PACKAGE spLangPack = "grammalecte/"+sLang ~~createCleanFolder(spLangPack)~~ for sf in os.listdir("gc_core/py/lang_core"): if not os.path.isdir("gc_core/py/lang_core/"+sf): ~~copyAndFileTemplate("gc_core/py/lang_core/"+sf, spLangPack+"/"+sf, dVars)~~ print("+ Modules: ", end="") for sf in os.listdir(spLang+"/modules"): if not sf.startswith("gce_"): file_util.copy_file(spLang+"/modules/"+sf, spLangPack) print(sf, end=", ") print()	\| \|	201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218	sCodePlugins += "\n\n" + open(spLang+'/modules/'+sf, "r", encoding="utf-8").read() print(sf, end=", ") print() dVars["plugins"] = sCodePlugins ## CREATE GRAMMAR CHECKER PACKAGE spLangPack = "grammalecte/"+sLang helpers.createCleanFolder(spLangPack) for sf in os.listdir("gc_core/py/lang_core"): if not os.path.isdir("gc_core/py/lang_core/"+sf): helpers.copyAndFileTemplate("gc_core/py/lang_core/"+sf, spLangPack+"/"+sf, dVars) print("+ Modules: ", end="") for sf in os.listdir(spLang+"/modules"): if not sf.startswith("gce_"): file_util.copy_file(spLang+"/modules/"+sf, spLangPack) print(sf, end=", ") print()
︙			︙
398 399 400 401 402 403 404 ~~405~~ 406 407 408 409 410 411 412 ~~413~~ 414 415 416 ~~417~~ 418 419 420 ~~421~~ 422 423 424 ~~425~~ ~~426~~ 427 428 429 430 431 432 433	dVars["pluginsJS"] = sCodePlugins # options data struct dVars["dOptJavaScript"] = json.dumps(list(dVars["dOptJavaScript"].items())) # create folder spLangPack = "grammalecte-js/"+sLang ~~createCleanFolder(spLangPack)~~ # create files for sf in os.listdir("gc_core/js"): if not os.path.isdir("gc_core/js/"+sf) and sf.startswith("jsex_"): dVars[sf[5:-3]] = open("gc_core/js/"+sf, "r", encoding="utf-8").read() for sf in os.listdir("gc_core/js"): if not os.path.isdir("gc_core/js/"+sf) and not sf.startswith("jsex_"): ~~copyAndFileTemplate("gc_core/js/"+sf, "grammalecte-js/"+sf, dVars)~~ open("grammalecte-js/WARNING.txt", "w", encoding="utf-8", newline="\n").write(sWarningMessage) for sf in os.listdir("gc_core/js/lang_core"): if not os.path.isdir("gc_core/js/lang_core/"+sf) and sf.startswith("gc_"): ~~copyAndFileTemplate("gc_core/js/lang_core/"+sf, spLangPack+"/"+sf, dVars)~~ print("+ Modules: ", end="") for sf in os.listdir(spLang+"/modules-js"): if not sf.startswith("gce_"): ~~copyAndFileTemplate(spLang+"/modules-js/"+sf, spLangPack+"/"+sf, dVars)~~ print(sf, end=", ") print() ~~crea~~teFirefoxExtension(~~sLang, d~~Vars~~)~~ ~~cre~~ateTh~~u~~nderbirdExtension~~(sLang, dVars, spLangPack)~~ return dVars['version'] def main (): print("Python: " + sys.version) xParser = argparse.ArgumentParser()	\| \| \| \| > \| > > > \|	239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278	dVars["pluginsJS"] = sCodePlugins # options data struct dVars["dOptJavaScript"] = json.dumps(list(dVars["dOptJavaScript"].items())) # create folder spLangPack = "grammalecte-js/"+sLang helpers.createCleanFolder(spLangPack) # create files for sf in os.listdir("gc_core/js"): if not os.path.isdir("gc_core/js/"+sf) and sf.startswith("jsex_"): dVars[sf[5:-3]] = open("gc_core/js/"+sf, "r", encoding="utf-8").read() for sf in os.listdir("gc_core/js"): if not os.path.isdir("gc_core/js/"+sf) and not sf.startswith("jsex_"): helpers.copyAndFileTemplate("gc_core/js/"+sf, "grammalecte-js/"+sf, dVars) open("grammalecte-js/WARNING.txt", "w", encoding="utf-8", newline="\n").write(sWarningMessage) for sf in os.listdir("gc_core/js/lang_core"): if not os.path.isdir("gc_core/js/lang_core/"+sf) and sf.startswith("gc_"): helpers.copyAndFileTemplate("gc_core/js/lang_core/"+sf, spLangPack+"/"+sf, dVars) print("+ Modules: ", end="") for sf in os.listdir(spLang+"/modules-js"): if not sf.startswith("gce_"): helpers.copyAndFileTemplate(spLang+"/modules-js/"+sf, spLangPack+"/"+sf, dVars) print(sf, end=", ") print() try: build_module = importlib.import_module("gc_lang."+sLang+".build") except ImportError: print("# No complementary builder <build.py> in folder gc_lang/"+sLang) else: build_module.build(sLang, dVars, spLangPack) return dVars['version'] def main (): print("Python: " + sys.version) xParser = argparse.ArgumentParser()
︙			︙
451 452 453 454 455 456 457 ~~458~~ 459 460 461 ~~462~~ 463 464 465 ~~466~~ 467 468 ~~469 470~~ 471 472 473 474 475 476 477 478 479 480 481 482 483 ~~484 485~~ 486 487 488 489 490 491 492	if os.path.exists("gc_lang/"+sLang) and os.path.isdir("gc_lang/"+sLang): xConfig = getConfig(sLang) dVars = xConfig._sections['args'] # copy gc_core common file in Python now to be able to compile dictionary if required for sf in os.listdir("gc_core/py"): if not os.path.isdir("gc_core/py/"+sf): ~~copyAndFileTemplate("gc_core/py/"+sf, "grammalecte/"+sf, dVars)~~ open("grammalecte/WARNING.txt", "w", encoding="utf-8", newline="\n").write(sWarningMessage) # build data ~~build_module = None~~ if xArgs.build_data: # lang data try: ~~build_module = importlib.import_module("gc_lang."+sLang+".build_data")~~ except ImportError: print("# Error. Couldn’t import file build_data.py in folder gc_lang/"+sLang) ~~if build_module: build_module.before('gc_lang/'+sLang, dVars, xArgs.javascript)~~ if xArgs.dict or not os.path.exists("grammalecte/_dictionaries"): import grammalecte.dawg as fsa from grammalecte.ibdawg import IBDAWG # fsa builder oDAWG = fsa.DAWG(dVars['lexicon_src'], dVars['lang_name'], dVars['stemming_method']) dir_util.mkpath("grammalecte/_dictionaries") oDAWG.writeInfo("grammalecte/_dictionaries/" + dVars['py_binary_dic'] + ".info.txt") oDAWG.createBinary("grammalecte/_dictionaries/" + dVars['py_binary_dic'], int(dVars['fsa_method'])) if xArgs.javascript: dir_util.mkpath("grammalecte-js/_dictionaries") oDic = IBDAWG(dVars['py_binary_dic']) #oDic.writeAsJSObject("gc_lang/"+sLang+"/modules-js/dictionary.js") oDic.writeAsJSObject("grammalecte-js/_dictionaries/"+dVars['js_binary_dic']) ~~if build_module: build_module.after('gc_lang/'+sLang, dVars, xArgs.javascript)~~ # make sVersion = create(sLang, xConfig, xArgs.install, xArgs.javascript, ) # tests if xArgs.tests or xArgs.perf or xArgs.perf_memo: print("> Running tests")	\| \| \| \| \| \| \|	296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337	if os.path.exists("gc_lang/"+sLang) and os.path.isdir("gc_lang/"+sLang): xConfig = getConfig(sLang) dVars = xConfig._sections['args'] # copy gc_core common file in Python now to be able to compile dictionary if required for sf in os.listdir("gc_core/py"): if not os.path.isdir("gc_core/py/"+sf): helpers.copyAndFileTemplate("gc_core/py/"+sf, "grammalecte/"+sf, dVars) open("grammalecte/WARNING.txt", "w", encoding="utf-8", newline="\n").write(sWarningMessage) # build data build_data_module = None if xArgs.build_data: # lang data try: build_data_module = importlib.import_module("gc_lang."+sLang+".build_data") except ImportError: print("# Error. Couldn’t import file build_data.py in folder gc_lang/"+sLang) if build_data_module: build_data_module.before('gc_lang/'+sLang, dVars, xArgs.javascript) if xArgs.dict or not os.path.exists("grammalecte/_dictionaries"): import grammalecte.dawg as fsa from grammalecte.ibdawg import IBDAWG # fsa builder oDAWG = fsa.DAWG(dVars['lexicon_src'], dVars['lang_name'], dVars['stemming_method']) dir_util.mkpath("grammalecte/_dictionaries") oDAWG.writeInfo("grammalecte/_dictionaries/" + dVars['py_binary_dic'] + ".info.txt") oDAWG.createBinary("grammalecte/_dictionaries/" + dVars['py_binary_dic'], int(dVars['fsa_method'])) if xArgs.javascript: dir_util.mkpath("grammalecte-js/_dictionaries") oDic = IBDAWG(dVars['py_binary_dic']) #oDic.writeAsJSObject("gc_lang/"+sLang+"/modules-js/dictionary.js") oDic.writeAsJSObject("grammalecte-js/_dictionaries/"+dVars['js_binary_dic']) if build_data_module: build_data_module.after('gc_lang/'+sLang, dVars, xArgs.javascript) # make sVersion = create(sLang, xConfig, xArgs.install, xArgs.javascript, ) # tests if xArgs.tests or xArgs.perf or xArgs.perf_memo: print("> Running tests")
︙			︙
501 502 503 504 505 506 507 ~~508~~ 509 510 511 512 513 514 515 516 517 518 519	unittest.TextTestRunner().run(xTestSuite) if xArgs.perf or xArgs.perf_memo: hDst = open("./gc_lang/"+sLang+"/perf_memo.txt", "a", encoding="utf-8", newline="\n") if xArgs.perf_memo else None tests.perf(sVersion, hDst) # Firefox if xArgs.firefox: ~~with cd("_build/xpi/"+sLang):~~ os.system("jpm run -b nightly") # Thunderbird if xArgs.thunderbird: os.system("thunderbird -jsconsole -P debug") else: print("Folder not found: gc_lang/"+sLang) if __name__ == '__main__': main()	\|	346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364	unittest.TextTestRunner().run(xTestSuite) if xArgs.perf or xArgs.perf_memo: hDst = open("./gc_lang/"+sLang+"/perf_memo.txt", "a", encoding="utf-8", newline="\n") if xArgs.perf_memo else None tests.perf(sVersion, hDst) # Firefox if xArgs.firefox: with helpers.cd("_build/xpi/"+sLang): os.system("jpm run -b nightly") # Thunderbird if xArgs.thunderbird: os.system("thunderbird -jsconsole -P debug") else: print("Folder not found: gc_lang/"+sLang) if __name__ == '__main__': main()

︙			︙
41 42 43 44 45 46 47 ~~48 49 50~~ 51 52 53 54 55 56 57	# Fin d’interprétation du fichier avec une ligne commençant par #END # ERREURS COURANTES # http://fr.wikipedia.org/wiki/Wikip%C3%A9dia:Fautes_d%27orthographe/Courantes ~~# ~~# OPTIONS ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++~~ #~~ OPTGROUP/basic: typo apos, esp tab, nbsp unit, tu maj, num virg, nf chim, ocr mapos, liga OPTGROUP/gramm: conf sgpl gn OPTGROUP/verbs: infi conj ppas, imp inte vmode OPTGROUP/style: bs pleo, redon1 redon2, neg OPTGROUP/misc: date mc OPTGROUP/debug: idrule	> > > > > \| < <	41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60	# Fin d’interprétation du fichier avec une ligne commençant par #END # ERREURS COURANTES # http://fr.wikipedia.org/wiki/Wikip%C3%A9dia:Fautes_d%27orthographe/Courantes !! !! !! Options !! !! OPTGROUP/basic: typo apos, esp tab, nbsp unit, tu maj, num virg, nf chim, ocr mapos, liga OPTGROUP/gramm: conf sgpl gn OPTGROUP/verbs: infi conj ppas, imp inte vmode OPTGROUP/style: bs pleo, redon1 redon2, neg OPTGROUP/misc: date mc OPTGROUP/debug: idrule
︙			︙
189 190 191 192 193 194 195 ~~196 197 198~~ 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 ~~217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236~~ ~~237 238 239 240~~ ~~241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265~~ 266 267 268 269 270 271 272	OPTLABEL/date: Date validity. OPTLABEL/debug: Debug OPTLABEL/idrule: Display control rule identifier [!]\|Display control rule identifier in the context menu message. ~~# # DÉFINITIONS ************************************************************************************ #~~ DEF: avoir [aeo]\w* DEF: etre [êeésf]\w+ DEF: avoir_etre [aeêésfo]\w* DEF: aller (?:all\|v\|ir)\w+ DEF: ppas \w[\w-]+[éiust]e?s? DEF: infi \w[\w-]+(?:er\|ir\|re) DEF: w_1 \w[\w-]* DEF: w_2 \w[\w-]+ DEF: w_3 \w[\w-]+\w DEF: w_4 \w[\w-][\w-]+\w DEF: w1 \w+ DEF: w2 \w\w+ DEF: w3 \w\w\w+ DEF: w4 \w\w\w\w+ ~~# # # # # # # # # # # # # # # # # # # #~~ ~~~~# ////////////////////////////////////////~~ PASSE 0 ~~////////////////////////////////////////~~ ~~# paragraphe par paragraphe~~ # #~~ ~~# # # # # # # # # # # # # # # # # # # ~~# //////////////////////////////////////// CONTRÔLE DES ESPACES ////////////////////////////////////////~~ #~~ # Espaces surnuméraires # Note : les tabulations ne sont pas soulignées dans LibreOffice. Mais l’erreur est bien présente. __<s>/tab(tab_début_ligne)__ ^[   ]+ <<- ->> "" # Espace(s) en début de ligne à supprimer : utilisez les retraits de paragraphe. __<s>/tab(tab_fin_ligne)__ [   ]+$ <<- ->> "" # Espace(s) en fin de ligne à supprimer. TEST: __tab__ {{ }}Espaces surnuméraires. ->> ""	> > > > > \| < < < < < < < < < < < < < < < < < < < < < < > > > > > > > > > > > > > > > > > > > > \| < < < > > > > > > > > > > > > > > > > > > > > \| \| \| < < < < < < < < < < < < < < < \| \| \| < < < \| >	192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278	OPTLABEL/date: Date validity. OPTLABEL/debug: Debug OPTLABEL/idrule: Display control rule identifier [!]\|Display control rule identifier in the context menu message. !! !! !! Définitions pour les regex !! !! DEF: avoir [aeo]\w* DEF: etre [êeésf]\w+ DEF: avoir_etre [aeêésfo]\w* DEF: aller (?:all\|v\|ir)\w+ DEF: ppas \w[\w-]+[éiust]e?s? DEF: infi \w[\w-]+(?:er\|ir\|re) DEF: w_1 \w[\w-]* DEF: w_2 \w[\w-]+ DEF: w_3 \w[\w-]+\w DEF: w_4 \w[\w-][\w-]+\w DEF: w1 \w+ DEF: w2 \w\w+ DEF: w3 \w\w\w+ DEF: w4 \w\w\w\w+ !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! PASSE 0: PARAGRAPHE PAR PARAGRAPHE !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !!! Espaces & tabulations !! !! # Espaces surnuméraires # Note : les tabulations ne sont pas soulignées dans LibreOffice. Mais l’erreur est bien présente. __<s>/tab(tab_début_ligne)__ ^[   ]+ <<- ->> "" # Espace(s) en début de ligne à supprimer : utilisez les retraits de paragraphe. __<s>/tab(tab_fin_ligne)__ [   ]+$ <<- ->> "" # Espace(s) en fin de ligne à supprimer. TEST: __tab__ {{ }}Espaces surnuméraires. ->> ""
︙			︙
373 374 375 376 377 378 379 ~~380 381 382 383~~ 384 385 386 387 388 389 390	# Tout contrôle des espaces doit se faire avant ce point. # À partir d’ici, toute règle est susceptible de supprimer des caractères et les remplacer par des espaces ou des chaînes de longueur égale. ~~# ~~# //////////////////////////////////////// PRÉPROCESSEUR ////////////////////////////////////////~~ #~~ # e-mail __<i>(p_email)__ \w[\w.-]@\w[\w.-]\w[.]\w+ <<- ~>> * # URL __<i>(p_URL)__	< < < \| > > > >	379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397	# Tout contrôle des espaces doit se faire avant ce point. # À partir d’ici, toute règle est susceptible de supprimer des caractères et les remplacer par des espaces ou des chaînes de longueur égale. !!! !!! !!! Processeur: efface les ponctuations gênantes (URL, sigles, abréviations, IP, heures, etc.) !!! !!! # e-mail __<i>(p_email)__ \w[\w.-]@\w[\w.-]\w[.]\w+ <<- ~>> * # URL __<i>(p_URL)__
︙			︙
500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 ~~525 526 527 528 529 530 531 532~~ 533 534 535 536 537 538 539	TEST: C’est le b.a.-ba du métier. TEST: qui a été le plus honnête [Rires] TEST: Marion Maréchal-Le Pen. Afin que Maréchal ne soit pas analysé comme un impératif, “Le Pen” devient “Le_Pen”. TEST: Car [je] deviendrai plus insaisissable que jamais. #TEST: des <b>{{homme}}</b> #TEST: des [b]{{femme}}[/b] # HTML __<i>/html(p_html_amp_xxx)__ &[a-zA-Z]+; <<- ~>> _ __<i>/html(p_html_lt)__ < <<- ~>> " <" __<i>/html(p_html_gt)__ > <<- ~>> > __<i>/html(p_html_amp)__ & <<- ~>> & __<i>/html(p_html_nbsp)__   <<- ~>> * __<i>/html(p_html_balise_ouvrante)__ <\w+.?> <<- ~>> __<i>/html(p_html_balise_fermante)__ </\w+ > <<- ~>> __<i>/html(p_html_pseudo_balise)__ \[/?\w+\] <<- ~>> * # LATEX __<i]/latex(p_latex1)__ \\[a-z]+ <<- ~>> * __<i>/latex(p_latex2)__ \\[,;/\\] <<- ~>> * __<s>/latex(p_latex3)__ \{(?:abstract\|align\|cases\|center\|description\|enumerate\|equation\|figure\|flush(?:left\|right)\|gather\|minipage\|multline\|quot(?:ation\|e)\|SaveVerbatim\|table\|tabular\|thebibliography\|[vV]erbatim\|verse\|wrapfigure)\} <<- ~>> * ~~# ~~# //////////////////////////////////////// RÈGLES DE CONTRÔLE ////////////////////////////////////////~~ # ~~############################## TYPOGRAPHIE ##############################~~~~ ### Écritures épicènes invariables # Attention, lors de la deuxième passe, on se sert du désambiguïsateur __[u](typo_écriture_épicène_pluriel)__ ({w_1}[éuitsrn])[-·–—.(/]([nt]\|)e[-·–—.)/]s @@0,** <<- option("typo") and not \0.endswith("·e·s") ->> \1s et \1\2es\|\1\2es et \1s\|\1·\2e·s # Écriture épicène brouillon. Préférez écrire lisiblement. Sinon, utilisez les points médians.	> > > > > > \| < < < \| \| < \| >	507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549	TEST: C’est le b.a.-ba du métier. TEST: qui a été le plus honnête [Rires] TEST: Marion Maréchal-Le Pen. Afin que Maréchal ne soit pas analysé comme un impératif, “Le Pen” devient “Le_Pen”. TEST: Car [je] deviendrai plus insaisissable que jamais. #TEST: des <b>{{homme}}</b> #TEST: des [b]{{femme}}[/b] !!! !!! !!! Processeur: balises HTML et LaTeX !!! !!! # HTML __<i>/html(p_html_amp_xxx)__ &[a-zA-Z]+; <<- ~>> _ __<i>/html(p_html_lt)__ < <<- ~>> " <" __<i>/html(p_html_gt)__ > <<- ~>> > __<i>/html(p_html_amp)__ & <<- ~>> & __<i>/html(p_html_nbsp)__   <<- ~>> * __<i>/html(p_html_balise_ouvrante)__ <\w+.?> <<- ~>> __<i>/html(p_html_balise_fermante)__ </\w+ > <<- ~>> __<i>/html(p_html_pseudo_balise)__ \[/?\w+\] <<- ~>> * # LATEX __<i]/latex(p_latex1)__ \\[a-z]+ <<- ~>> * __<i>/latex(p_latex2)__ \\[,;/\\] <<- ~>> * __<s>/latex(p_latex3)__ \{(?:abstract\|align\|cases\|center\|description\|enumerate\|equation\|figure\|flush(?:left\|right)\|gather\|minipage\|multline\|quot(?:ation\|e)\|SaveVerbatim\|table\|tabular\|thebibliography\|[vV]erbatim\|verse\|wrapfigure)\} <<- ~>> * !! !! !!!! Typographie, virgules, espaces insécables, unités de mesure… !! !! ### Écritures épicènes invariables # Attention, lors de la deuxième passe, on se sert du désambiguïsateur __[u](typo_écriture_épicène_pluriel)__ ({w_1}[éuitsrn])[-·–—.(/]([nt]\|)e[-·–—.)/]s @@0,** <<- option("typo") and not \0.endswith("·e·s") ->> \1s et \1\2es\|\1\2es et \1s\|\1·\2e·s # Écriture épicène brouillon. Préférez écrire lisiblement. Sinon, utilisez les points médians.
︙			︙
903 904 905 906 907 908 909 ~~910 911 912~~ 913 914 915 916 917 918 919	__[s]/chim(chim_molécules)__ (?:Ca(?:CO3\|SO4)\|CO2\|(?:H2\|Na2)(?:CO3\|O\|SO4)\|[HNO]2\|HNO3\|Fe2O3\|KMnO4\|NO2\|SiO2\|SO[23]) <<- ->> =\0.replace("2", "₂").replace("3", "₃").replace("4", "₄") # Typographie des composés chimiques. [!] TEST: __chim__ les molécules {{CaCO3}} et {{H2O}}… ~~# ~~# GRANDS NOMBRES ---------------------------------------------------------------------------------~~ #~~ __[s]/num(num_grand_nombre_soudé)__ \d\d\d\d\d+ <<- not before("NF[ -]?(C\|E\|P\|Q\|X\|Z\|EN(?:[ -]ISO\|)) *") ->> =formatNumber(\0) # Formatage des grands nombres. TEST: {{12345}} ->> 12 345 TEST: {{123456}} ->> 123 456	< < < >	913 914 915 916 917 918 919 920 921 922 923 924 925 926 927	__[s]/chim(chim_molécules)__ (?:Ca(?:CO3\|SO4)\|CO2\|(?:H2\|Na2)(?:CO3\|O\|SO4)\|[HNO]2\|HNO3\|Fe2O3\|KMnO4\|NO2\|SiO2\|SO[23]) <<- ->> =\0.replace("2", "₂").replace("3", "₃").replace("4", "₄") # Typographie des composés chimiques. [!] TEST: __chim__ les molécules {{CaCO3}} et {{H2O}}… !!!! Grands nombres __[s]/num(num_grand_nombre_soudé)__ \d\d\d\d\d+ <<- not before("NF[ -]?(C\|E\|P\|Q\|X\|Z\|EN(?:[ -]ISO\|)) *") ->> =formatNumber(\0) # Formatage des grands nombres. TEST: {{12345}} ->> 12 345 TEST: {{123456}} ->> 123 456
︙			︙
939 940 941 942 943 944 945 ~~946 947 948~~ 949 950 951 952 953 954 955 956 957 958 959 960 ~~961 962 963~~ 964 965 966 967 968 969 970 971 972 973 974 ~~975 976 977 978 979 980~~ 981 982 983 984 985 986 987 988 989 990 991 992 993 994 995 ~~996 997 998 999 1000 1001 1002 1003 1004 1005 1006 1007 1008 1009 1010 1011 1012 1013 1014 1015 1016~~ ~~1017 1018~~ ~~1019 1020 1021 1022 1023 1024 1025 1026 1027 1028 1029 1030 1031 1032 1033 1034 1035 1036 1037 1038~~ 1039 1040 1041 1042 ~~1043 1044 1045~~ 1046 1047 1048 1049 1050 1051 1052 1053 1054 1055 ~~1056 1057 1058~~ 1059 1060 1061 1062 1063 1064 1065	<<- option("num") ->> =\0.replace(" ", " ") # Grands nombres : utilisez des espaces insécables. <<- ~>> =\0.replace(" ", "") TEST: Il a perdu {{20 000}} euros à la Bourse en un seul mois. ~~# ~~# DATES ------------------------------------------------------------------------------------------~~ #~~ __[i]/date(date_nombres)__ (?<!\d[ /.-])(\d\d?)[ /.-](\d\d?)[ /.-](\d\d\d+)(?![ /.-]\d) @@0,w,$ <<- not checkDate(\1, \2, \3) and not before(r"(?i)\bversions? +$") ->> _ # Cette date est invalide. <<- ~>> =\0.replace(".", "-").replace(" ", "-").replace("\/", "-") TEST: le {{29 02 2011}} TEST: le {{40-02-2011}} TEST: le {{32.03.2018}} TEST: le {{81/01/2012}} TEST: 12-12-2012 ~~# ~~# REDONDANCES (dans le paragraphe) ---------------------------------------------------------------~~ #~~ __[i]/redon1(redondances_paragraphe)__ ({w_4})[ ,.;!?:].[ ](\1) @@0,$ <<- not morph(\1, ":(?:G\|V0)\|>(?:t(?:antôt\|emps\|rès)\|loin\|souvent\|parfois\|quelquefois\|côte\|petit\|même) ", False) and not \1[0].isupper() -2>> _ # Dans ce paragraphe, répétition de « \1 » (à gauche). <<- __also__ -1>> _ # Dans ce paragraphe, répétition de « \1 » (à droite). TEST: __redon1__ Tu es son {{avenir}}. Et lui aussi est ton {{avenir}}. TEST: __redon1__ Car parfois il y en a. Mais parfois il n’y en a pas. ~~# ~~# //////////////////////////////////////// PRÉPROCESSEUR ////////////////////////////////////////~~ # Dernier nettoyage avant coupure du paragraphe en phrases #~~ # Trait d’union conditionnel (u00AD) __<i>(p_trait_union_conditionnel1)__ \w+‑\w+‑\w+ <<- ~>> =\0.replace("‑", "") __<i>(p_trait_union_conditionnel2)__ \w+‑\w+ <<- ~>> =\0.replace("‑", "") # empêcher la scission en fin de dialogue __<s>(p_fin_dialogue1)__ ([?!…][?!… ])[ "'”» ], @@0 <<- ~1>> __<s>(p_fin_dialogue2)__ ([?!…][?!… ])[ "'”» ][a-zéèêîô] @@0 <<- ~1>> , TEST: « Je suis donc perdu ? », dit Paul. TEST: “C’est bon !”, croit savoir Marie. TEST: “Parce que… ?” finit par demander Paul. TEST: « Dans quel pays sommes-nous ? » demanda un manifestant. ~~# # # # # # # # # # # # # # # # # # # #~~ ~~# ////////////////////////////////////////~~ PASSE 1 ~~////////////////////////////////////////~~ ~~# phrase par phrase~~ ~~# # # # # # # # # # # # # # # # # # # #~~ [++] ~~# # D~~OUBLONS~~ (casse identique) ~~---------------------------------------------------------------------~~ #~~ __[s](doublon)__ ({w1}) {1,3}\1 @@0 <<- not re.search("(?i)^([nv]ous\|faire\|en\|la\|lui\|donnant\|œuvre\|h[éoa]\|hou\|olé\|joli\|Bora\|couvent\|dément\|sapiens\|très\|vroum\|[0-9]+)$", \1) and not (re.search("^(?:est\|une?)$", \1) and before("[’']$")) and not (\1 == "mieux" and before("(?i)qui +$")) ->> \1 # Doublon. TEST: Il y a un {{doublon doublon}}. ~~# ~~# NOMBRES : TYPOGRAPHIE --------------------------------------------------------------------------~~ #~~ #(\d\d\d\d)-(\d\d\d\d) <<- ->> \1–\2 # Ne pas séparer deux dates par un trait d’union, mais par un tiret demi-cadratin. __[s]/num(num_lettre_O_zéro1)__ [\dO]+[O][\dO]+ <<- not option("ocr") ->> =\0.replace("O", "0") # S’il s’agit d’un nombre, utilisez le chiffre « 0 » plutôt que la lettre « O ». __[s]/num(num_lettre_O_zéro2)__ [1-9]O <<- not option("ocr") ->> =\0.replace("O", "0") # S’il s’agit d’un nombre, utilisez le chiffre « 0 » plutôt que la lettre « O ». TEST: année {{2O11}} ->> 2011	> \| < < < < < > \| \| < < \| < > > \| < < < < < < < < < < < < < < < < < < < < > > > > > > > > > > > > > > > > > > > \| < > > > > > > > > > > > > > > > > > > > > \| < < < < < < < < < < < < < < < < < < < < \| \| < < < >	947 948 949 950 951 952 953 954 955 956 957 958 959 960 961 962 963 964 965 966 967 968 969 970 971 972 973 974 975 976 977 978 979 980 981 982 983 984 985 986 987 988 989 990 991 992 993 994 995 996 997 998 999 1000 1001 1002 1003 1004 1005 1006 1007 1008 1009 1010 1011 1012 1013 1014 1015 1016 1017 1018 1019 1020 1021 1022 1023 1024 1025 1026 1027 1028 1029 1030 1031 1032 1033 1034 1035 1036 1037 1038 1039 1040 1041 1042 1043 1044 1045 1046 1047 1048 1049 1050 1051 1052 1053 1054 1055 1056 1057 1058 1059 1060 1061 1062 1063 1064 1065	<<- option("num") ->> =\0.replace(" ", " ") # Grands nombres : utilisez des espaces insécables. <<- ~>> =\0.replace(" ", "") TEST: Il a perdu {{20 000}} euros à la Bourse en un seul mois. !!!! Dates __[i]/date(date_nombres)__ (?<!\d[ /.-])(\d\d?)[ /.-](\d\d?)[ /.-](\d\d\d+)(?![ /.-]\d) @@0,w,$ <<- not checkDate(\1, \2, \3) and not before(r"(?i)\bversions? +$") ->> _ # Cette date est invalide. <<- ~>> =\0.replace(".", "-").replace(" ", "-").replace("\/", "-") TEST: le {{29 02 2011}} TEST: le {{40-02-2011}} TEST: le {{32.03.2018}} TEST: le {{81/01/2012}} TEST: 12-12-2012 !!!! Redondances __[i]/redon1(redondances_paragraphe)__ ({w_4})[ ,.;!?:].[ ](\1) @@0,$ <<- not morph(\1, ":(?:G\|V0)\|>(?:t(?:antôt\|emps\|rès)\|loin\|souvent\|parfois\|quelquefois\|côte\|petit\|même) ", False) and not \1[0].isupper() -2>> _ # Dans ce paragraphe, répétition de « \1 » (à gauche). <<- __also__ -1>> _ # Dans ce paragraphe, répétition de « \1 » (à droite). TEST: __redon1__ Tu es son {{avenir}}. Et lui aussi est ton {{avenir}}. TEST: __redon1__ Car parfois il y en a. Mais parfois il n’y en a pas. !!! !!! !!! Processeur: Dernier nettoyage avant coupure du paragraphe en phrases !!! !!! # Trait d’union conditionnel (u00AD) __<i>(p_trait_union_conditionnel1)__ \w+‑\w+‑\w+ <<- ~>> =\0.replace("‑", "") __<i>(p_trait_union_conditionnel2)__ \w+‑\w+ <<- ~>> =\0.replace("‑", "") # empêcher la scission en fin de dialogue __<s>(p_fin_dialogue1)__ ([?!…][?!… ])[ "'”» ], @@0 <<- ~1>> __<s>(p_fin_dialogue2)__ ([?!…][?!… ])[ "'”» ][a-zéèêîô] @@0 <<- ~1>> , TEST: « Je suis donc perdu ? », dit Paul. TEST: “C’est bon !”, croit savoir Marie. TEST: “Parce que… ?” finit par demander Paul. TEST: « Dans quel pays sommes-nous ? » demanda un manifestant. !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! PASSE 1: PHRASE PAR PHRASE !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! !! [++] !!!! Doublons (casse identique) __[s](doublon)__ ({w1}) {1,3}\1 @@0 <<- not re.search("(?i)^([nv]ous\|faire\|en\|la\|lui\|donnant\|œuvre\|h[éoa]\|hou\|olé\|joli\|Bora\|couvent\|dément\|sapiens\|très\|vroum\|[0-9]+)$", \1) and not (re.search("^(?:est\|une?)$", \1) and before("[’']$")) and not (\1 == "mieux" and before("(?i)qui +$")) ->> \1 # Doublon. TEST: Il y a un {{doublon doublon}}. !!!! Nombres: typographie #(\d\d\d\d)-(\d\d\d\d) <<- ->> \1–\2 # Ne pas séparer deux dates par un trait d’union, mais par un tiret demi-cadratin. __[s]/num(num_lettre_O_zéro1)__ [\dO]+[O][\dO]+ <<- not option("ocr") ->> =\0.replace("O", "0") # S’il s’agit d’un nombre, utilisez le chiffre « 0 » plutôt que la lettre « O ». __[s]/num(num_lettre_O_zéro2)__ [1-9]O <<- not option("ocr") ->> =\0.replace("O", "0") # S’il s’agit d’un nombre, utilisez le chiffre « 0 » plutôt que la lettre « O ». TEST: année {{2O11}} ->> 2011
︙			︙
1073 1074 1075 1076 1077 1078 1079 ~~1080 1081 1082~~ 1083 1084 1085 1086 1087 1088 1089 1090 1091 ~~1092 1093 1094~~ 1095 1096 1097 1098 1099 1100 1101	TEST: le {{VIième}} siècle ->> VIᵉ\|VIe TEST: C’est la {{3ème}} fois… ->> 3ᵉ\|3e TEST: Non, la {{2è}} fois. ->> 2ᵉ\|2e TEST: Le {{XXIème}} siècle. ->> XXIᵉ\|XXIe TEST: le {{XXè}} siècle. ->> XXᵉ\|XXe ~~# # Écritures épicènes invariables #~~ __[i](d_typo_écriture_épicène_pluriel)__ ({w_1}[éuitsrn])-(?:[nt]\|)e-s @@0 <<- morphex(\1, ":[NAQ]", ":G") =>> define(\1, [":N:A:Q:e:p"]) __[i](d_typo_écriture_épicène_singulier)__ ({w_2}[éuitsrn])-e @@0 <<- morph(\1, ":[NAQ]", False) =>> define(\1, [":N:A:Q:e:s"]) ~~# ~~# DATES ------------------------------------------------------------------------------------------~~ #~~ __[i]/date(date_jour_mois_année)__ (\d\d?) (janvier\|février\|ma(?:rs\|i)\|a(?:vril\|o[ûu]t)\|jui(?:n\|llet)\|septembre\|octobre\|novembre\|décembre) (\d\d\d+) @@0,w,$ <<- not checkDateWithString(\1, \2, \3) ->> _ # Cette date est invalide. TEST: {{29 février 2011}}	\| \| \| < < < >	1073 1074 1075 1076 1077 1078 1079 1080 1081 1082 1083 1084 1085 1086 1087 1088 1089 1090 1091 1092 1093 1094 1095 1096 1097 1098 1099	TEST: le {{VIième}} siècle ->> VIᵉ\|VIe TEST: C’est la {{3ème}} fois… ->> 3ᵉ\|3e TEST: Non, la {{2è}} fois. ->> 2ᵉ\|2e TEST: Le {{XXIème}} siècle. ->> XXIᵉ\|XXIe TEST: le {{XXè}} siècle. ->> XXᵉ\|XXe !!!! Écritures épicènes invariables __[i](d_typo_écriture_épicène_pluriel)__ ({w_1}[éuitsrn])-(?:[nt]\|)e-s @@0 <<- morphex(\1, ":[NAQ]", ":G") =>> define(\1, [":N:A:Q:e:p"]) __[i](d_typo_écriture_épicène_singulier)__ ({w_2}[éuitsrn])-e @@0 <<- morph(\1, ":[NAQ]", False) =>> define(\1, [":N:A:Q:e:s"]) !!!! Dates __[i]/date(date_jour_mois_année)__ (\d\d?) (janvier\|février\|ma(?:rs\|i)\|a(?:vril\|o[ûu]t)\|jui(?:n\|llet)\|septembre\|octobre\|novembre\|décembre) (\d\d\d+) @@0,w,$ <<- not checkDateWithString(\1, \2, \3) ->> _ # Cette date est invalide. TEST: {{29 février 2011}}
︙			︙
1127 1128 1129 1130 1131 1132 1133 ~~1134 1135~~ ~~1136 1137~~ 1138 1139 1140 1141 1142 1143 1144	__[i]/date(date_février)__ 3[01] février <<- ->> 28 février\|29 février # Cette date est invalide. Il n’y a que 28 ou 29 jours en février. TEST: le {{30 février}} ~~# ~~# //////////////////////////////////////// PRÉPROCESSEUR ////////////////////////////////////////~~~~ ~~# épuration des signes inutiles et quelques simplifications #~~ # fin de phrase __<s>(p_fin_de_phrase)__ [.?!:;…][ .?!… »”")]$ <<- ~>> # début de phrase __<s>(p_début_de_phrase)__ ^ [-–—] <<- ~>>	< < > > \| < > >	1125 1126 1127 1128 1129 1130 1131 1132 1133 1134 1135 1136 1137 1138 1139 1140 1141 1142 1143	__[i]/date(date_février)__ 3[01] février <<- ->> 28 février\|29 février # Cette date est invalide. Il n’y a que 28 ou 29 jours en février. TEST: le {{30 février}} !!! !!! !!! Processeur: épuration des signes inutiles et quelques simplifications !!! !!! # fin de phrase __<s>(p_fin_de_phrase)__ [.?!:;…][ .?!… »”")]$ <<- ~>> # début de phrase __<s>(p_début_de_phrase)__ ^ [-–—] <<- ~>>
︙			︙
1196 1197 1198 1199 1200 1201 1202 ~~1203 1204~~ ~~1205 1206 1207 1208 1209~~ 1210 1211 1212 1213 1214 1215 1216	[A-Z][a-z]+ [A-Z][a-z]+ <<- spell(\0.replace(" ", "_")) ~>> =\0.replace(" ", "_") TEST: New York {{étaient}} {{devenue}} la plaque tournante de tous les trafics. # # ~~////////////////////////////////////////~~ ~~RÈGLES~~ DE ~~CONTRÔLE~~ ~~////////////////////////////////////////~~ # ~~############################## LIAISONS - TRAITS D’UNION ##############################~~ __<i]/tu(tu_t_euphonique1)__ (-t[’' ])(il\|elle\|on) @@0,$ <<- -1>> -t- # Pour le “t” euphonique, il faut deux traits d’union. __<i]/tu(tu_t_euphonique2)__ ( t[-’' –—])(il\|elle\|on) @@0,$ <<- -1>> -t- # Pour le “t” euphonique, il faut deux traits d’union. __<i]/tu(tu_t_euphonique3)__ ([- ]t[-’'])tu @@0	\| < > \| < \| \| <	1195 1196 1197 1198 1199 1200 1201 1202 1203 1204 1205 1206 1207 1208 1209 1210 1211 1212 1213	[A-Z][a-z]+ [A-Z][a-z]+ <<- spell(\0.replace(" ", "_")) ~>> =\0.replace(" ", "_") TEST: New York {{étaient}} {{devenue}} la plaque tournante de tous les trafics. !! !! !!!! Traits d’union !! !! __<i]/tu(tu_t_euphonique1)__ (-t[’' ])(il\|elle\|on) @@0,$ <<- -1>> -t- # Pour le “t” euphonique, il faut deux traits d’union. __<i]/tu(tu_t_euphonique2)__ ( t[-’' –—])(il\|elle\|on) @@0,$ <<- -1>> -t- # Pour le “t” euphonique, il faut deux traits d’union. __<i]/tu(tu_t_euphonique3)__ ([- ]t[-’'])tu @@0
︙			︙
1598 1599 1600 1601 1602 1603 1604 1605 1606 1607 1608 1609 1610 1611	lors que? <<- not before(r"(?i)\bd[eè]s +$") ->> =\0.replace(" ", "") # Attachez les deux mots.\|https://fr.wiktionary.org/wiki/lorsque TEST: Elle y arriva {{lors qu}}’elle trouva l’astuce permettant l’ouverture de la porte. TEST: Dès lors qu’on sait comment s’y prendre, aucune raison de faillir. # Dialogues __[u]/virg(virgule_dialogue_après_nom_propre)__ ([A-ZÉÈ][\w-]+) (\w+-(?:moi\|toi\|l(?:ui\|a\|e(?:ur\|s\|))\|nous\|vous\|je\|tu\|ils\|elles)) @@0,$ <<- morphex(\1, ":M", ":G") and not morph(\2, ":N", False) and isStart() -1>> \1, # Dialogue ? Ajoutez une virgule pour mettre en incise la personne à qui s’adresse la réplique. TEST: {{Maria}} donnez-vous du temps ?	> >	1595 1596 1597 1598 1599 1600 1601 1602 1603 1604 1605 1606 1607 1608 1609 1610	lors que? <<- not before(r"(?i)\bd[eè]s +$") ->> =\0.replace(" ", "") # Attachez les deux mots.\|https://fr.wiktionary.org/wiki/lorsque TEST: Elle y arriva {{lors qu}}’elle trouva l’astuce permettant l’ouverture de la porte. TEST: Dès lors qu’on sait comment s’y prendre, aucune raison de faillir. !!!! Virgules # Dialogues __[u]/virg(virgule_dialogue_après_nom_propre)__ ([A-ZÉÈ][\w-]+) (\w+-(?:moi\|toi\|l(?:ui\|a\|e(?:ur\|s\|))\|nous\|vous\|je\|tu\|ils\|elles)) @@0,$ <<- morphex(\1, ":M", ":G") and not morph(\2, ":N", False) and isStart() -1>> \1, # Dialogue ? Ajoutez une virgule pour mettre en incise la personne à qui s’adresse la réplique. TEST: {{Maria}} donnez-vous du temps ?
︙			︙
1632 1633 1634 1635 1636 1637 1638 ~~1639~~ 1640 1641 1642 1643 1644 1645 1646 ~~1647 1648~~ 1649 1650 1651 1652 1653 1654 1655 1656 1657 1658 1659 1660 1661 1662 1663 1664 1665 ~~1666 1667 1668~~ 1669 1670 1671 1672 1673 1674 1675	-1>> \1, # Une virgule est probablement souhaitable. TEST: Tu vas les {{donner}} Rachel. TEST: Il va la {{tuer}} Paul. TEST: Cependant les promesses n’engagent que ceux qui les croient, comme aimait à le dire Jacques Chirac. ~~# Apostrophe manquante (~~voir~~ ~~règle~~ à la ~~passe~~ ~~précédente)~~~~ __<s>/typo(typo_apostrophe_manquante_audace2)__ ^ ([LDSNCJMTÇ] )[aeéiouhAEÉIOUHyîèêôûYÎÈÊÔÛ] @@ <<- option("mapos") -1>> =\1[:-1]+"’" # Il manque peut-être une apostrophe. TEST: __mapos__ {{L }}opinion des gens, elle s’en moquait. ~~~~## A / À~~ # accentuation la préposition en début de phrase~~ __<s]/typo(typo_À_début_phrase1)__ ^ (A) (?!t[’-](?:ils?\|elles?\|on))({w_2}) @@,$ <<- morphex(\2, ":[GNAY]", ":(?:Q\|3s)\|>(?:priori\|post[eé]riori\|contrario\|capella\|fortiori) ") -1>> À # S’il s’agit de la préposition « à », il faut accentuer la majuscule. __<s>/typo(typo_À_début_phrase2)__ ^ (A) [ldnms]’ @@ <<- -1>> À # S’il s’agit de la préposition « à », il faut accentuer la majuscule. __<s>/typo(typo_À_début_phrase3)__ ^ (A) t’(?!il \|elle \|ont? ) @@ <<- -1>> À # S’il s’agit de la préposition « à », il faut accentuer la majuscule. TEST: {{A}} vaincre sans péril, on triomphe sans gloire. TEST: « {{A}} partir de maintenant, ce ne sera plus comme avant. TEST: — {{A}} n’en plus pouvoir TEST: — {{A}} t’emmener loin de tout ceci. TEST: A priori, nul ne peut y parvenir sans une aide extérieure. ~~# ~~# //////////////////////////////////////// DÉSAMBIGUÏSATEUR ////////////////////////////////////////~~ #~~ # mots grammaticaux __[i](d_dans)__ dans <<- not morph(word(-1), ":D.*:p\|>[a-z]+ièmes ", False, False) =>> select(\0, ":R") # verbe	> \| > \| \| > < < < > > > > >	1631 1632 1633 1634 1635 1636 1637 1638 1639 1640 1641 1642 1643 1644 1645 1646 1647 1648 1649 1650 1651 1652 1653 1654 1655 1656 1657 1658 1659 1660 1661 1662 1663 1664 1665 1666 1667 1668 1669 1670 1671 1672 1673 1674 1675 1676 1677 1678 1679	-1>> \1, # Une virgule est probablement souhaitable. TEST: Tu vas les {{donner}} Rachel. TEST: Il va la {{tuer}} Paul. TEST: Cependant les promesses n’engagent que ceux qui les croient, comme aimait à le dire Jacques Chirac. !!!! Apostrophe manquante (2) __<s>/typo(typo_apostrophe_manquante_audace2)__ ^ ([LDSNCJMTÇ] )[aeéiouhAEÉIOUHyîèêôûYÎÈÊÔÛ] @@ <<- option("mapos") -1>> =\1[:-1]+"’" # Il manque peut-être une apostrophe. TEST: __mapos__ {{L }}opinion des gens, elle s’en moquait. !!!! A / À: accentuation la préposition en début de phrase __<s]/typo(typo_À_début_phrase1)__ ^ (A) (?!t[’-](?:ils?\|elles?\|on))({w_2}) @@,$ <<- morphex(\2, ":[GNAY]", ":(?:Q\|3s)\|>(?:priori\|post[eé]riori\|contrario\|capella\|fortiori) ") -1>> À # S’il s’agit de la préposition « à », il faut accentuer la majuscule. __<s>/typo(typo_À_début_phrase2)__ ^ (A) [ldnms]’ @@ <<- -1>> À # S’il s’agit de la préposition « à », il faut accentuer la majuscule. __<s>/typo(typo_À_début_phrase3)__ ^ (A) t’(?!il \|elle \|ont? ) @@ <<- -1>> À # S’il s’agit de la préposition « à », il faut accentuer la majuscule. TEST: {{A}} vaincre sans péril, on triomphe sans gloire. TEST: « {{A}} partir de maintenant, ce ne sera plus comme avant. TEST: — {{A}} n’en plus pouvoir TEST: — {{A}} t’emmener loin de tout ceci. TEST: A priori, nul ne peut y parvenir sans une aide extérieure. !!! !!! !!! Désambiguïsation !!! !!! # mots grammaticaux __[i](d_dans)__ dans <<- not morph(word(-1), ":D.*:p\|>[a-z]+ièmes ", False, False) =>> select(\0, ":R") # verbe
︙			︙
1733 1734 1735 1736 1737 1738 1739 ~~1740 1741 1742 1743 1744 1745~~ 1746 1747 1748 1749 1750 1751 1752	TEST: il s’agit d’{{un}} {{anagramme}} TEST: nul ne sait qui arriva à ce pauvre Paul surpris par la pluie. TEST: elle finit par être très fière de son fils. # ~~# //////////////////////////////////////// RÈGLES DE CONTRÔLE ////////////////////////////////////////~~ # ~~############################## OCR (expérimental) ##############################~~ # ? __<s]/ocr(ocr_point_interrogation)__ [ ]7 <<- after0("^(?: +[A-ZÉÈÂ(]\|…\|[.][.]+\| *$)") ->> " ?" # Erreur de numérisation ? TEST: __ocr__ des chiffrements{{ 7}} Paul n’en sait rien.	\| < \| \| \| < > > >	1737 1738 1739 1740 1741 1742 1743 1744 1745 1746 1747 1748 1749 1750 1751 1752 1753 1754 1755 1756 1757	TEST: il s’agit d’{{un}} {{anagramme}} TEST: nul ne sait qui arriva à ce pauvre Paul surpris par la pluie. TEST: elle finit par être très fière de son fils. !! !! !!!! OCR !! !! # ? __<s]/ocr(ocr_point_interrogation)__ [ ]7 <<- after0("^(?: +[A-ZÉÈÂ(]\|…\|[.][.]+\| *$)") ->> " ?" # Erreur de numérisation ? TEST: __ocr__ des chiffrements{{ 7}} Paul n’en sait rien.
︙			︙
2369 2370 2371 2372 2373 2374 2375 ~~2376 2377~~ 2378 2379 2380 2381 2382 2383 2384	<<- \0 != "<" and \0 != ">" ->> _ # Erreur de numérisation ? Cette chaîne contient un caractère de fréquence rare. TEST: __ocr__ trouve {{l£}} temps TEST: __ocr__ elle s’{{avance*}} sur le seuil TEST: __ocr__ par beaucoup d’argent ? {{{Il}} débouche le Jack Daniels ~~############################## RÈGLES DE BASE ##############################~~ ### double négation __[i](double_négation)__ pas (personne\|aucune?\|jamais) @@4 <<- not morph(word(-1), ":D:[me]" ,False, False) ->> \1\|pas, \1 # Double négation : les mots « pas \1 » ne devraient pas se succéder. Si ces mots appartiennent à des propositions distinctes, une virgule est peut-être préférable.	< \| > > > >	2374 2375 2376 2377 2378 2379 2380 2381 2382 2383 2384 2385 2386 2387 2388 2389 2390 2391 2392	<<- \0 != "<" and \0 != ">" ->> _ # Erreur de numérisation ? Cette chaîne contient un caractère de fréquence rare. TEST: __ocr__ trouve {{l£}} temps TEST: __ocr__ elle s’{{avance*}} sur le seuil TEST: __ocr__ par beaucoup d’argent ? {{{Il}} débouche le Jack Daniels !! !! !!!! Incohérences de base !! !! ### double négation __[i](double_négation)__ pas (personne\|aucune?\|jamais) @@4 <<- not morph(word(-1), ":D:[me]" ,False, False) ->> \1\|pas, \1 # Double négation : les mots « pas \1 » ne devraient pas se succéder. Si ces mots appartiennent à des propositions distinctes, une virgule est peut-être préférable.
︙			︙
2400 2401 2402 2403 2404 2405 2406 ~~2407 2408~~ ~~2409~~ 2410 2411 2412 2413 2414 2415 2416	TEST: Au MES, rien de nouveau TEST: {{Ces}} {{cette}} canaille qui nous a donné tant de fil à retordre. TEST: Mon {{il}} est une merveille. TEST: je ne sais {{des}} {{ses}} choses. ~~################################################## STYLE ##################################################~~ ~~~~##########~~ ~~Basiqu~~e~~ #__bs__ Mr <<- ->> M. # M. est l’usage courant pour “Monsieur”. « Mr » est l’abréviation ancienne, française. # à / en __[i]/bs(bs_en_à_ville)__ (en) A(?:gen\|miens\|ngers\|jjacio\|rles\|vignon) @@0 <<- -1>> à # On utilise la préposition “à” avant les villes (à Avignon, à Arles…), la préposition “en” avant les régions (en Amérique, en Afrique…).	< \| > \| > >	2408 2409 2410 2411 2412 2413 2414 2415 2416 2417 2418 2419 2420 2421 2422 2423 2424 2425 2426	TEST: Au MES, rien de nouveau TEST: {{Ces}} {{cette}} canaille qui nous a donné tant de fil à retordre. TEST: Mon {{il}} est une merveille. TEST: je ne sais {{des}} {{ses}} choses. !! !! !!!! Style !! !! #__bs__ Mr <<- ->> M. # M. est l’usage courant pour “Monsieur”. « Mr » est l’abréviation ancienne, française. # à / en __[i]/bs(bs_en_à_ville)__ (en) A(?:gen\|miens\|ngers\|jjacio\|rles\|vignon) @@0 <<- -1>> à # On utilise la préposition “à” avant les villes (à Avignon, à Arles…), la préposition “en” avant les régions (en Amérique, en Afrique…).
︙			︙
2499 2500 2501 2502 2503 2504 2505 ~~2506 2507~~ 2508 2509 2510 2511 2512 2513 2514 2515 2516 ~~2517~~ 2518 2519 2520 2521 2522 2523 2524	malgré (que?) @@7 <<- not after_chk1(r" \w[\w-]+ en ([aeo][a-zû]*)", ":V0a") ->> bien \1 # Tournure populaire. Utilisez « bien que ». TEST: {{Malgré que}} je sois fou. ######### Expressions impropres #([mts]e\|[nv]ous) (rappel\w+) (de) <<- word(1) != "ne" and not morph(word(1), ":V") # -3>> _ # Expression impropre. « Se rappeler quelque chose » ou « Se souvenir de quelque chose ». #Se rappelle de l’amour #enjoindre à qqn de faire qqch ~~~~##########~~ Pléonasmes~~ __[i]/pleo(pleo_abolir)__ (abol\w+) (?:absolument\|entièrement\|compl[èé]tement\|totalement) @@0 <<- morph(\1, ">abolir ", False) ->> \1 # Pléonasme. __[i]/pleo(pleo_acculer)__ (accul\w+) aux? pieds? du mur @@0 <<- morph(\1, ">acculer ", False) ->> \1 # Pléonasme. __[i]/pleo(pleo_achever)__ (ach[eè]v\w+) (?:absolument\|entièrement\|compl[èé]tement\|totalement) @@0 <<- morph(\1, ">achever ", False) ->> \1 # Pléonasme. __[i]/pleo(pleo_en_cours)__ actuellement en cours <<- not after(r" +de?\b") ->> en cours # Pléonasme. __[i]/pleo(pleo_en_train_de)__ (actuellement en train) d(?:e(?! nuit)\|’{w_2}) @@0 <<- -1>> en train # Pléonasme. __[i]/pleo(pleo_ajouter)__ (ajout\w+) en plus @@0 <<- ->> \1 # Pléonasme.	< < > > \| > >	2509 2510 2511 2512 2513 2514 2515 2516 2517 2518 2519 2520 2521 2522 2523 2524 2525 2526 2527 2528 2529 2530 2531 2532 2533 2534 2535 2536	malgré (que?) @@7 <<- not after_chk1(r" \w[\w-]+ en ([aeo][a-zû]*)", ":V0a") ->> bien \1 # Tournure populaire. Utilisez « bien que ». TEST: {{Malgré que}} je sois fou. ######### Expressions impropres #([mts]e\|[nv]ous) (rappel\w+) (de) <<- word(1) != "ne" and not morph(word(1), ":V") # -3>> _ # Expression impropre. « Se rappeler quelque chose » ou « Se souvenir de quelque chose ». #Se rappelle de l’amour #enjoindre à qqn de faire qqch !! !! !!!! Pléonasmes !! !! __[i]/pleo(pleo_abolir)__ (abol\w+) (?:absolument\|entièrement\|compl[èé]tement\|totalement) @@0 <<- morph(\1, ">abolir ", False) ->> \1 # Pléonasme. __[i]/pleo(pleo_acculer)__ (accul\w+) aux? pieds? du mur @@0 <<- morph(\1, ">acculer ", False) ->> \1 # Pléonasme. __[i]/pleo(pleo_achever)__ (ach[eè]v\w+) (?:absolument\|entièrement\|compl[èé]tement\|totalement) @@0 <<- morph(\1, ">achever ", False) ->> \1 # Pléonasme. __[i]/pleo(pleo_en_cours)__ actuellement en cours <<- not after(r" +de?\b") ->> en cours # Pléonasme. __[i]/pleo(pleo_en_train_de)__ (actuellement en train) d(?:e(?! nuit)\|’{w_2}) @@0 <<- -1>> en train # Pléonasme. __[i]/pleo(pleo_ajouter)__ (ajout\w+) en plus @@0 <<- ->> \1 # Pléonasme.
︙			︙
2660 2661 2662 2663 2664 2665 2666 2667 2668 2669 2670 2671 2672 2673 2674 2675 2676 2677 2678 2679 2680 2681 2682 2683 2684 2685 2686 ~~2687~~ 2688 2689 2690 2691 2692 2693 2694	<<- morph(\1, ">(?:ajourner\|différer\|reporter) ", False) ->> \1 # Pléonasme. TEST: {{Ajourner à une date ultérieure}} ->> Ajourner TEST: {{différer à une date ultérieure}} ->> différer TEST: {{reporter à plus tard}} ->> reporter # ayants droit __[i]/sgpl(sgpl_ayants_droit)__ [ldcs]es (ayant[- ]droits?) @@4 <<- -1>> ayants droit # Au singulier : « un ayant droit ». Au pluriel : « des ayants droit ». TEST: Comment lutter contre la cupidité des {{ayant droits}} # Note: À supprimer? Graphie qui tend vers la soudure et le pluriel régulier (ayant-droit(s)) # Mon, ton, son : euphonie __[i]/gn(gn_mon_ton_son_euphonie)__ ([mts]a) +({w_2}) @@0,$ <<- morphex(\2, ">[aâeéèêiîoôuûyœæ].+:[NAQ].*:f", ":[eGW]") -1>> =\1.replace("a", "on") # Même si « \2 » est féminin, on utilise « mon/ton/son » pour faire la liaison.\|http://fr.wikipedia.org/wiki/Euphonie TEST: {{ta}} aimée ->> ton TEST: {{ma}} obligée ->> mon TEST: Ce couple va donner à la France sa très importante collection qui rejoindra le musée d’Orsay ~~#### CONFUSIONS~~ __[s>/conf(conf_ne_n)__ [nN]e n’ <<- ->> ne m’\|n’ # Incohérence. Double négation. __[s>/conf(conf_pronoms1)__ [mtMT]e ([nmst](?:’\|e )) @@$ <<- ->> \1 # Incohérence. __[s>/conf(conf_pronoms2)__ [sS]e ([mst](?:’\|e )) @@$ <<- ->> \1 # Incohérence. __[s>/conf(conf_de_d)__ [dD][eu] d’(?![A-ZÉÂÔÈ]) <<- ->> d’ # Incohérence. TEST: Il {{ne n’}}arrive jamais à l’heure. TEST: Ça {{me te }}prend la tête, toutes ces complications vaines.	> > > > > > <	2672 2673 2674 2675 2676 2677 2678 2679 2680 2681 2682 2683 2684 2685 2686 2687 2688 2689 2690 2691 2692 2693 2694 2695 2696 2697 2698 2699 2700 2701 2702 2703 2704 2705 2706 2707 2708 2709 2710 2711	<<- morph(\1, ">(?:ajourner\|différer\|reporter) ", False) ->> \1 # Pléonasme. TEST: {{Ajourner à une date ultérieure}} ->> Ajourner TEST: {{différer à une date ultérieure}} ->> différer TEST: {{reporter à plus tard}} ->> reporter # ayants droit __[i]/sgpl(sgpl_ayants_droit)__ [ldcs]es (ayant[- ]droits?) @@4 <<- -1>> ayants droit # Au singulier : « un ayant droit ». Au pluriel : « des ayants droit ». TEST: Comment lutter contre la cupidité des {{ayant droits}} # Note: À supprimer? Graphie qui tend vers la soudure et le pluriel régulier (ayant-droit(s)) # Mon, ton, son : euphonie __[i]/gn(gn_mon_ton_son_euphonie)__ ([mts]a) +({w_2}) @@0,$ <<- morphex(\2, ">[aâeéèêiîoôuûyœæ].+:[NAQ].*:f", ":[eGW]") -1>> =\1.replace("a", "on") # Même si « \2 » est féminin, on utilise « mon/ton/son » pour faire la liaison.\|http://fr.wikipedia.org/wiki/Euphonie TEST: {{ta}} aimée ->> ton TEST: {{ma}} obligée ->> mon TEST: Ce couple va donner à la France sa très importante collection qui rejoindra le musée d’Orsay !! !! !!!! Confusions !! !! __[s>/conf(conf_ne_n)__ [nN]e n’ <<- ->> ne m’\|n’ # Incohérence. Double négation. __[s>/conf(conf_pronoms1)__ [mtMT]e ([nmst](?:’\|e )) @@$ <<- ->> \1 # Incohérence. __[s>/conf(conf_pronoms2)__ [sS]e ([mst](?:’\|e )) @@$ <<- ->> \1 # Incohérence. __[s>/conf(conf_de_d)__ [dD][eu] d’(?![A-ZÉÂÔÈ]) <<- ->> d’ # Incohérence. TEST: Il {{ne n’}}arrive jamais à l’heure. TEST: Ça {{me te }}prend la tête, toutes ces complications vaines.
︙			︙
3846 3847 3848 3849 3850 3851 3852 3853 3854 3855 3856 3857 3858 3859	TEST: M’enfin, c’est absurde TEST: il est normal de ne presque pas payer des gens qui effectuent un travail TEST: j’ai l’impression de ne même pas savoir ce qu’est un « juif français ». TEST: C’que j’comprends, c’est qu’il y a des limites à ce qu’on peut supporter. TEST: la tentation pour certains médias de ne tout simplement pas rémunérer notre travail si celui-ci n’est finalement pas publié. TEST: Ne parfois pas être celui qui sabote l’ambiance. ## Incohérences avec formes verbales 1sg et 2sg sans sujet __[i](p_notre_père_qui_es_au_cieux)__ notre père (qui est? aux cieux) @@11 <<- ~1>> * __[i]/conj(conj_xxxai_sans_sujet)!3__ \w*ai(?! je) <<- ( morph(\0, ":1s") or ( before("> +$") and morph(\0, ":1s", False) ) ) and not (\0[0:1].isupper() and before0(r"\w"))	> > > > >	3863 3864 3865 3866 3867 3868 3869 3870 3871 3872 3873 3874 3875 3876 3877 3878 3879 3880 3881	TEST: M’enfin, c’est absurde TEST: il est normal de ne presque pas payer des gens qui effectuent un travail TEST: j’ai l’impression de ne même pas savoir ce qu’est un « juif français ». TEST: C’que j’comprends, c’est qu’il y a des limites à ce qu’on peut supporter. TEST: la tentation pour certains médias de ne tout simplement pas rémunérer notre travail si celui-ci n’est finalement pas publié. TEST: Ne parfois pas être celui qui sabote l’ambiance. !! !! !!!! Formes verbales sans sujet !! !! ## Incohérences avec formes verbales 1sg et 2sg sans sujet __[i](p_notre_père_qui_es_au_cieux)__ notre père (qui est? aux cieux) @@11 <<- ~1>> * __[i]/conj(conj_xxxai_sans_sujet)!3__ \w*ai(?! je) <<- ( morph(\0, ":1s") or ( before("> +$") and morph(\0, ":1s", False) ) ) and not (\0[0:1].isupper() and before0(r"\w"))
︙			︙
3938 3939 3940 3941 3942 3943 3944 ~~3945~~ 3946 3947 3948 3949 3950 3951 3952	TEST: plus rapide que {{prévues}} ->> prévu TEST: autant d’hommes que {{prévus}} ->> prévu TEST: il y en a moins que {{prévues}} ->> prévu TEST: comme {{convenus}} ->> convenu ~~#### TOUT / TOUS / TOUTE / TOUTES~~ __[i](p_fais_les_tous)__ fai(?:tes\|sons\|s)-(?:les\|[nv]ous) (tou(?:te\|)s) @@$ <<- ~1>> * __[i](p_tout_débuts_petits)__ (tout) (?:débuts\|petits) @@0 <<- before(r"\b(aux\|[ldmtsc]es\|[nv]os\|leurs) +$") ~1>> * __[i](p_les_tout_xxx)__ (?:[ldmtsc]es\|[nv]os\|leurs\|aux) (tout) ({w_2}) @@w,$	< > > > > >	3960 3961 3962 3963 3964 3965 3966 3967 3968 3969 3970 3971 3972 3973 3974 3975 3976 3977 3978	TEST: plus rapide que {{prévues}} ->> prévu TEST: autant d’hommes que {{prévus}} ->> prévu TEST: il y en a moins que {{prévues}} ->> prévu TEST: comme {{convenus}} ->> convenu !! !! !!!! Tout, tous, toute, toutes !! !! __[i](p_fais_les_tous)__ fai(?:tes\|sons\|s)-(?:les\|[nv]ous) (tou(?:te\|)s) @@$ <<- ~1>> * __[i](p_tout_débuts_petits)__ (tout) (?:débuts\|petits) @@0 <<- before(r"\b(aux\|[ldmtsc]es\|[nv]os\|leurs) +$") ~1>> * __[i](p_les_tout_xxx)__ (?:[ldmtsc]es\|[nv]os\|leurs\|aux) (tout) ({w_2}) @@w,$
︙			︙
4036 4037 4038 4039 4040 4041 4042 ~~4043~~ 4044 4045 4046 4047 4048 4049 4050	TEST: Tout les sépare. TEST: les tout débuts du mouvement ouvrier TEST: vos tout débuts furent difficiles TEST: aux tout débuts, il y eut bien des erreurs TEST: comment les inégalités sociales impactent la santé des tout petits ~~#### ADVERBES DE NÉGATION~~ __[i]/neg(ne_manquant1)__ (?:je\|tu\|ils?\|on\|elles?) ([bcdfgjklmnpqrstvwxz][\w-]*) (pas\|rien\|jamais\|guère) @@w,$ <<- morph(\1, ":[123][sp]", False) and not (re.search("(?i)^(?:jamais\|rien)$", \2) and before(r"\b(?:que?\|plus\|moins) ")) -1>> ne \1 # Ne … \2 : il manque l’adverbe de négation. __[i]/neg(ne_manquant2)__	\| > > > > >	4062 4063 4064 4065 4066 4067 4068 4069 4070 4071 4072 4073 4074 4075 4076 4077 4078 4079 4080 4081	TEST: Tout les sépare. TEST: les tout débuts du mouvement ouvrier TEST: vos tout débuts furent difficiles TEST: aux tout débuts, il y eut bien des erreurs TEST: comment les inégalités sociales impactent la santé des tout petits !! !! !!!! Adverbes de négation !! !! __[i]/neg(ne_manquant1)__ (?:je\|tu\|ils?\|on\|elles?) ([bcdfgjklmnpqrstvwxz][\w-]*) (pas\|rien\|jamais\|guère) @@w,$ <<- morph(\1, ":[123][sp]", False) and not (re.search("(?i)^(?:jamais\|rien)$", \2) and before(r"\b(?:que?\|plus\|moins) ")) -1>> ne \1 # Ne … \2 : il manque l’adverbe de négation. __[i]/neg(ne_manquant2)__
︙			︙
4098 4099 4100 4101 4102 4103 4104 ~~4105 4106 4107~~ ~~4108 4109~~ 4110 4111 4112 4113 4114 4115 4116	TEST: déterminés à ne pas se laisser récupérer TEST: de ne pas en élire du tout TEST: Mais gare à ne pas non plus trop surestimer la menace TEST: ne jamais beaucoup bosser, c’est sa devise. ~~# ~~# //////////////////////////////////////// PRÉPROCESSEUR ////////////////////////////////////////~~~~ ~~# épuration des adverbes, locutions adverbiales, interjections et expressions usuelles #~~ # Dates __[s](p_date)__ (?:[dD]epuis le\|[lL]e\|[dD]u\|[aA]u\|[jJ]usqu au\|[àÀ] compter du) (?:1(?:er\|ᵉʳ)\|\d\d?) (?:janvier\|février\|mars\|avril\|mai\|juin\|juillet\|ao[ûu]t\|septembre\|octobre\|novembre\|décembre\|vendémiaire\|brumaire\|frimaire\|nivôse\|pluviôse\|ventôse\|germinal\|floréal\|prairial\|messidor\|thermidor\|fructidor)(?: \d+\| dernier\| prochain\|) <<- ~>> * __[i](p_en_l_an_de_grâce_année)__ en l’an (?:de grâce \|)\d+ <<- ~>> * __[s](p_en_de_mois_année)__	\| < < > \| < > >	4129 4130 4131 4132 4133 4134 4135 4136 4137 4138 4139 4140 4141 4142 4143 4144 4145 4146 4147	TEST: déterminés à ne pas se laisser récupérer TEST: de ne pas en élire du tout TEST: Mais gare à ne pas non plus trop surestimer la menace TEST: ne jamais beaucoup bosser, c’est sa devise. !!! !!! !!! Processeur: épuration des adverbes, locutions adverbiales, interjections et expressions usuelles !!! !!! # Dates __[s](p_date)__ (?:[dD]epuis le\|[lL]e\|[dD]u\|[aA]u\|[jJ]usqu au\|[àÀ] compter du) (?:1(?:er\|ᵉʳ)\|\d\d?) (?:janvier\|février\|mars\|avril\|mai\|juin\|juillet\|ao[ûu]t\|septembre\|octobre\|novembre\|décembre\|vendémiaire\|brumaire\|frimaire\|nivôse\|pluviôse\|ventôse\|germinal\|floréal\|prairial\|messidor\|thermidor\|fructidor)(?: \d+\| dernier\| prochain\|) <<- ~>> * __[i](p_en_l_an_de_grâce_année)__ en l’an (?:de grâce \|)\d+ <<- ~>> * __[s](p_en_de_mois_année)__

Grammalecte Check-in [ab9feb3d66]