[Trennmuster] Fechterhalle

Werner LEMBERG wl at gnu.org
Do Apr 26 17:45:51 CEST 2018


> Wir haben u.a. folgenden Eintrag:
>
>   aufrechterhalten;auf<recht=er<.hal-ten
>
> »pattmp.7« zeigt, daß noch Fehltrennungen auftreten würden:
>
>   auf*rech.t*er.hal*te*nen
>
> Das wird in »pattmp.8« korrigiert.  Allerdings wird deswegen – zum
> ersten mal seit vielen Jahren – eine Trennstelle in den finalen
> Mustern nicht gefunden:
>
>   fech*ter-hal*le
>
> Wie man sehen kann, reichen tatsächlich acht Buchstaben nicht auf,
> um die fehlende Trennung darzustellen.  Soweit ich erkennen kann,
> ist dieses Problem nicht durch Fehler in der Wortliste bedingt; es
> schaut daher so aus, als ob wir den Kontext auf neun Buchstaben
> (also einen neunten »hyphenation level«) vergrößern müssen.

Ich nehme das zurück.  Wenn ich folgende Parameter setze

  1 1 | 1 5 | 1 1 1
  2 2 | 2 6 | 1 2 1
  3 3 | 3 7 | 1 1 1
  4 4 | 4 8 | 1 4 1
  5 5 | 5 9 | 1 1 1
  6 6 | 6 10 | 1 6 1
  7 7 | 7 11 | 1 4 1
  8 8 | 8 12 | 1 8 1

gibt's keine fehlenden Trennungen mit einer Kontextlänge von acht
Buchstaben.  Allerdings, um diese (wahrscheinlich besseren) Werte zu
verwenden, muß man patgen selbst kompilieren, wobei in der Datei
»patgen.ch« die Werte

  trie_size=5500000;
  triec_size=2600000;

zu setzen sind (also zehnmal größer machen).

Anbei die so generierten Muster für NR zur Ansicht.


    Werner
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : dehyphn-x-2018-04-26.zip
Dateityp    : application/zip
Dateigröße  : 85487 bytes
Beschreibung: nicht verfügbar
URL         : <https://listi.jpberlin.de/pipermail/trennmuster/attachments/20180426/8117c46a/attachment.zip>


Mehr Informationen über die Mailingliste Trennmuster