[Trennmuster] Warum nicht sisisi

Herbert Voss Herbert.Voss at FU-Berlin.DE
Fr Nov 29 22:39:43 CET 2013


Am 29.11.2013 22:29, schrieb Werner LEMBERG:
>
>> Es gibt keinerlei Untersuchungen über die Qualität der Trennmuster
>> in Bezug auf den zugrundeliegenden Datenbestand.
>
> Im Prinzip enthält die Liste die Worte der Mannheimer Liste bis
> Häufigkeitsklasse 19 oder so, wenn ich mich richtig erinnere.  Wir
> haben das bereinigt, und ich glaube, daß die Qualität nicht schlecht
> ist.

Ich habe doch kein Wort überdie Güte der Liste verloren.

>> Aber aus meinen Spielereien mit PaTgen schließe ich, dass man ab
>> 200.000 richtig getrennten Wörtern keine wesentliche Verbesserung
>> der Trennmuster wird erzeugen können.  Falsche Trennungen über eine
>> Ausnahmeliste zu erfassen, erscheint mir sinnvoller, als den
>> Datenbestand permanent zu erhöhen.
>
> Dieser Meinung bin ich nicht.  Abgesehen davon, daß die Liste auch für
> anderes als Trennstellen verwendet werden kann, *werden* die Muster
> verbessert, weil eben mehr Wörter korrekt getrennt werden können.

Das habe ich doch auch schon gesagt.

Ein Beispiel, was ich meine:
Das Ausgangsdokument, ergibt Trennung "hochge-schaukelt"

\documentclass[paper=a5]{scrartcl}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage[ngerman]{babel}
\begin{document}
\title{China und Japan drohen sich offen mit Krieg -- Die Rückkehr der 
Samurai}
\author{Felix Lill}
\maketitle
Mittlerweile hat sich der Streit zwischen China und Japan
um eine Inselgruppe im Ostchinesischen Meer derart
hochgeschaukelt, dass von beiden Seiten offen mit Krieg
gedroht wird. Japans Premier Abe kommt das nur gelegen.
Er will sein Land als neue regionale Militärmacht
aufbauen. Ein riskantes Spiel?
\end{document}


Nehmen wir an in eurer Liste steht "hoch=ge-schau-kelt".
Mein Skript liest eure Liste ein und erzeugt damit dieses
temporäre Dokument, und siehe da, ich erhalte "hoch-geschaukelt":

\documentclass[paper=a5]{scrartcl}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage[ngerman]{babel}
\begin{document}
\title{China und Japan drohen sich offen mit Krieg -- Die Rückkehr der 
Samurai}
\author{Felix Lill}
\maketitle
Mittler\-weile hat sich der Streit zwischen China und Japan
um eine Insel\-gruppe im Ost\-chine\-sischen Meer derart
hoch\-geschaukelt, dass von beiden Sei\-ten offen mit Krieg
gedroht wird. Japans Premier Abe kommt das nur gele\-gen.
Er will sein Land als neue regio\-nale Militär\-macht
auf\-bauen. Ein ris\-kantes Spiel?
\end{document}


Herbert



Mehr Informationen über die Mailingliste Trennmuster