[Trennmuster] Kombinationen mit s-Genitiv
Tobias Wendorff
tobias.wendorff at tu-dortmund.de
Do Jan 23 22:00:18 CET 2014
Am 23.01.2014 21:39, schrieb Guenter Milde:
> Meinst Du das Bindungs-s? Das ist kein Genitiv-s.
Oh Gott, das Bier war doch nicht Alkoholfrei.
> Und natürlich ist die Trennung (mit Panders Auszeichnungszeichenset)
> -s=an|lei~he, -s=an|la~ge,
Ist das jetzt unser neuer Syntax?
> Der derzeitige TeX-Trennalgorithmus hat ja die Besonderheit, daß die
> Effizienz nicht auf Vorkenntnissen über die Sprache beruht, womit er ohne
> Änderungen für viele Sprachen einzusetzen geht.
Yop, dafür muss die Wortliste ja möglichst vollständig sein.
Du hast Recht, eine Optimierung wäre hier eigentlich blöd, da das
Ganze ziemlich effizient läuft.
> Es gibt die interessante Möglichkeit, einen Mustersatz iterativ zu
> erstellen, d.h. `patgen` mit einem generierten Mustersatz und einer
> "Wortliste" zu starten: der Mustersatz wird dann um die Muster erweitert,
> die nötig sind die Wortliste korrekt zu trennen.
Und dann mit der Ursprungsliste vergleichen, ob das mit dem iterativen
Ansatz funktioniert hat?
> Mich würde interessieren, ob es für die deutschen Trennmuster vor- oder
> nachteilhaft ist, wenn zunächst nur Muster mit Haupttrennstellen erzeugt
> werden oder ggf. andersherum (zunächst nur Muster für Einzelwörter, im
> zweiten Durchlauf dann auch Wortverbindungen).
Wie könnte man das denn sinnvoll benchmarken?
Mehr Informationen über die Mailingliste Trennmuster