[Trennmuster] Trasse

Werner LEMBERG wl at gnu.org
Mo Dez 31 15:35:47 CET 2012


>> [...]  außerdem (was ich als fast noch dringender erachte) gehört
>> die Ausarbeitung von Haupt- und Nebentrennstellen abgeschlossen,
>> sodaß wir endlich Trennmuster für die im Deutschen so wichtigen
>> Haupttrennstellen erstellen können, von denen wohl alle Projekte
>> profitieren würden.
> 
> Meinst Du die Wörter in der vorhandenen Liste, bei denen derzeit nur
> ein Punkt als Trennzeichen vorhanden ist?

Nein, nicht in erster Linie.  Commit
cd832a9703c51521cf054f6770e44c65c187fe75 z.B. behandelt folgendes:

  Komposita mit "ander", Praefixe "angia|", "anthropo|".

und beginnt mit

   ändere;än-de-re
   anderem;an-de-rem
   anderen;an-de-ren
  -anderenfalls;an-de-ren-falls
  -anderenorts;an-de-ren-orts
  +anderenfalls;an-de-ren=falls
  +anderenorts;an-de-ren=orts
   anderer;an-de-rer
  -andererseits;an-de-rer-seits
  +andererseits;an-de-rer--seits
   anderes;an-de-res
   Anderkonten;An-der=kon-ten
   Anderkonto;An-der=kon-to

Es geht also um die Konversion von »-« in »=« und ähnliche Trenner.
Günther hat einen großen Teil von Prä- und Postfixen abgearbeitet
(hauptsächlich, um zuverlässig langes und rundes »s« unterscheiden zu
können), aber eben nicht alle.  Beispielsweise fehlt noch die
Bearbeitung von »ge-«:

  ge-achtet -> ge|ach-tet

Die Idee von Wörtern mit »·« ist, diese anfangs auszulassen und,
sobald die Arbeit an den anderen Wörtern abgeschlossen ist,
Hauptstellen-Trennmuster zu generieren und damit alle »·« zu
verarbeiten.


     Werner



Mehr Informationen über die Mailingliste Trennmuster