[Trennmuster] Kombinationen mit s-Genitiv

Tobias Wendorff tobias.wendorff at tu-dortmund.de
Do Jan 23 22:00:18 CET 2014


Am 23.01.2014 21:39, schrieb Guenter Milde:
> Meinst Du das Bindungs-s? Das ist kein Genitiv-s.

Oh Gott, das Bier war doch nicht Alkoholfrei.

> Und natürlich ist die Trennung (mit Panders Auszeichnungszeichenset)
> -s=an|lei~he, -s=an|la~ge,

Ist das jetzt unser neuer Syntax?

> Der derzeitige TeX-Trennalgorithmus hat ja die Besonderheit, daß die
> Effizienz nicht auf Vorkenntnissen über die Sprache beruht, womit er ohne
> Änderungen für viele Sprachen einzusetzen geht.

Yop, dafür muss die Wortliste ja möglichst vollständig sein.
Du hast Recht, eine Optimierung wäre hier eigentlich blöd, da das
Ganze ziemlich effizient läuft.

> Es gibt die interessante Möglichkeit, einen Mustersatz iterativ zu
> erstellen, d.h. `patgen` mit einem generierten Mustersatz und einer
> "Wortliste" zu starten: der Mustersatz wird dann um die Muster erweitert,
> die nötig sind die Wortliste korrekt zu trennen.

Und dann mit der Ursprungsliste vergleichen, ob das mit dem iterativen
Ansatz funktioniert hat?

> Mich würde interessieren, ob es für die deutschen Trennmuster vor- oder
> nachteilhaft ist, wenn zunächst nur Muster mit Haupttrennstellen erzeugt
> werden oder ggf. andersherum (zunächst nur Muster für Einzelwörter, im
> zweiten Durchlauf dann auch Wortverbindungen).

Wie könnte man das denn sinnvoll benchmarken?



Mehr Informationen über die Mailingliste Trennmuster