[Trennmuster] Grundwortschatz

Stephan Hennig mailing_list at arcor.de
Fr Aug 9 20:42:03 CEST 2013


Am 07.08.2013 18:38, schrieb Tobias Wendorff:

> "Bäcker" und "Mütze" sind ja drin, erkennen TeX und
> Libhyphen das?

Grundsätzlich werden nur die Wörter sicher richtig getrennt, die auch in
der Ursprungsliste vorhanden waren.  (Vorausgesetzt, der patgen-Lauf
endete mit 'x good, 0 bad, 0 missed'.)  Bei allen anderen Wörtern kann
es durch 'seltsame' Buchstabenkombinationen immer vorkommen, dass sie
falsch getrennt werden.  Das Vorhandensein in der Wortliste würde dann
ein weiteres Korrekturmuster erzeugen, welches nicht selten nur bei
diesem einen Wort verwendet wird.

Um eine ältere Zahl zu nennen, vor etwa zwei Jahren wurden ca. 17 % der
Muster (2480 von 14379) bei der Trennung von nur einem Wort in der
Wortliste verwendet.  Anlass sind häufig Fugen-s gefolgt von p
(Schafspelz) und -- in der traditionellen Rechtschreibung -- auch t
(Verkaufstresen) sowie grundsätzlich Zusammensetzungen bei denen
Konsonant und Vokal aneinanderstoßen.  Dem üblichen Schema nach wird in
einfachen Wörtern vor dem Konsonanten getrennt, bei Zusammensetzungen
ist das jedoch falsch (Materialermüdung).

Solche wenig effektiven Muster sind übrigens auch ein Indikator für
fehlende Flexionsformen.


> Generell fehlen auf der Liste sehr, sehr viele Genitive.

Stimmt.  Ist das ein Angebot?

Viele Grüße,
Stephan Hennig




Mehr Informationen über die Mailingliste Trennmuster