[Trennmuster] Fechterhalle
Werner LEMBERG
wl at gnu.org
Do Apr 26 17:45:51 CEST 2018
> Wir haben u.a. folgenden Eintrag:
>
> aufrechterhalten;auf<recht=er<.hal-ten
>
> »pattmp.7« zeigt, daß noch Fehltrennungen auftreten würden:
>
> auf*rech.t*er.hal*te*nen
>
> Das wird in »pattmp.8« korrigiert. Allerdings wird deswegen – zum
> ersten mal seit vielen Jahren – eine Trennstelle in den finalen
> Mustern nicht gefunden:
>
> fech*ter-hal*le
>
> Wie man sehen kann, reichen tatsächlich acht Buchstaben nicht auf,
> um die fehlende Trennung darzustellen. Soweit ich erkennen kann,
> ist dieses Problem nicht durch Fehler in der Wortliste bedingt; es
> schaut daher so aus, als ob wir den Kontext auf neun Buchstaben
> (also einen neunten »hyphenation level«) vergrößern müssen.
Ich nehme das zurück. Wenn ich folgende Parameter setze
1 1 | 1 5 | 1 1 1
2 2 | 2 6 | 1 2 1
3 3 | 3 7 | 1 1 1
4 4 | 4 8 | 1 4 1
5 5 | 5 9 | 1 1 1
6 6 | 6 10 | 1 6 1
7 7 | 7 11 | 1 4 1
8 8 | 8 12 | 1 8 1
gibt's keine fehlenden Trennungen mit einer Kontextlänge von acht
Buchstaben. Allerdings, um diese (wahrscheinlich besseren) Werte zu
verwenden, muß man patgen selbst kompilieren, wobei in der Datei
»patgen.ch« die Werte
trie_size=5500000;
triec_size=2600000;
zu setzen sind (also zehnmal größer machen).
Anbei die so generierten Muster für NR zur Ansicht.
Werner
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname : dehyphn-x-2018-04-26.zip
Dateityp : application/zip
Dateigröße : 85487 bytes
Beschreibung: nicht verfügbar
URL : <https://listi.jpberlin.de/pipermail/trennmuster/attachments/20180426/8117c46a/attachment.zip>
Mehr Informationen über die Mailingliste Trennmuster