[Trennmuster] Trasse
Werner LEMBERG
wl at gnu.org
Mo Dez 31 15:35:47 CET 2012
>> [...] außerdem (was ich als fast noch dringender erachte) gehört
>> die Ausarbeitung von Haupt- und Nebentrennstellen abgeschlossen,
>> sodaß wir endlich Trennmuster für die im Deutschen so wichtigen
>> Haupttrennstellen erstellen können, von denen wohl alle Projekte
>> profitieren würden.
>
> Meinst Du die Wörter in der vorhandenen Liste, bei denen derzeit nur
> ein Punkt als Trennzeichen vorhanden ist?
Nein, nicht in erster Linie. Commit
cd832a9703c51521cf054f6770e44c65c187fe75 z.B. behandelt folgendes:
Komposita mit "ander", Praefixe "angia|", "anthropo|".
und beginnt mit
ändere;än-de-re
anderem;an-de-rem
anderen;an-de-ren
-anderenfalls;an-de-ren-falls
-anderenorts;an-de-ren-orts
+anderenfalls;an-de-ren=falls
+anderenorts;an-de-ren=orts
anderer;an-de-rer
-andererseits;an-de-rer-seits
+andererseits;an-de-rer--seits
anderes;an-de-res
Anderkonten;An-der=kon-ten
Anderkonto;An-der=kon-to
Es geht also um die Konversion von »-« in »=« und ähnliche Trenner.
Günther hat einen großen Teil von Prä- und Postfixen abgearbeitet
(hauptsächlich, um zuverlässig langes und rundes »s« unterscheiden zu
können), aber eben nicht alle. Beispielsweise fehlt noch die
Bearbeitung von »ge-«:
ge-achtet -> ge|ach-tet
Die Idee von Wörtern mit »·« ist, diese anfangs auszulassen und,
sobald die Arbeit an den anderen Wörtern abgeschlossen ist,
Hauptstellen-Trennmuster zu generieren und damit alle »·« zu
verarbeiten.
Werner
Mehr Informationen über die Mailingliste Trennmuster