[Trennmuster] Beschreibung von patgen?
Arthur Reutenauer
arthur.reutenauer at normalesup.org
Di Apr 24 19:12:30 CEST 2018
> kennt Ihr eine gute Beschreibung von patgen? Wisst Ihr, ob patgen einen
> Parameter akzeptiert, um Trennwörterbücher in UTF-8-Kodierung zu erstellen?
Mit patgen selbst kann man das nicht, aber ich habe es vor einigen
Jahren für UTF-8 angepasst: https://github.com/hyphenation/hydra (in
Ruby), und es gibt meines Wissens wenigstens eine andere Adaptierung
https://github.com/mnater/orthos (in JavaScript), die ich zwar nicht
getestet habe.
> Google hat für eine Handvoll von Sprachen, die zur Zeit aus
> lizenzrechtlichen Gründen noch keine Trennmuster in Android haben
Welche Sprache? Mojca und ich haben sehr große Anstrengungen gemacht,
die Urheber von ganz vielen Trennmuster-Dateien um eine Lizenz-Änderung
zu bitten, ausgerechnet für eine Kollegin von dir bei Google. Du warst
auch dabei während der Email-Gespräche. Dass wir diese Arbeit nie
vollendeten, beruht teilweise darauf, dass wir nach einer Weile keine
Rückmeldung von euch bekamen.
> Die Trennwörterbücher für fünf weitere Sprachen (Russisch, Indonesisch,
> Niederländisch, Polnisch, Türkisch) lade ich in den nächsten Tagen ins
> Unilex-Repositorium hoch. Mir ist nicht klar, ob ein paar tausend Wörter
> ausreichen, um qualitativ gute Trennmuster zu erzeugen.
Ich zweifle daran.
Mit freundlichen Grüßen,
Arthur
Mehr Informationen über die Mailingliste Trennmuster