[Trennmuster] naechste Version: dehyph-exptl v0.23

Guenter Milde milde at users.sf.net
Mi Apr 18 15:05:26 CEST 2012


On 18.04.12, Werner LEMBERG wrote:
> >   Abenddienste;-2-;Abend=dien-ste;Abend=diens-te
> >
> > lauten?  Günter, ist da irgend etwas schiefgelaufen?

> Wohl ein Irrtum in einem seiner Adaptionsskripte.

Ich bitte diesen Fehler zu entschuldigen.

> Es kommen jetzt auch eine Reihe von Wörtern mit »ß« in der
> reformierten Liste vor, die dort aber nicht hingehören.  Das ist
> ebenfalls ein Skriptfehler.

Ich habe jetzt über eine Vergleich mit der Version vor dem Beginn meiner
Änderungen die Sprachvariantentrennung wiederhergestellt, und (soweit
automatisch möglich) die Kategorisierungen übertragen.

Kannst Du bitte prüfen, ob dies alle "st"- und "ß"-Fälle bereinigt?

> Der Einfachheit halber habe ich die Differenzen angehängt.

Dabei sind mir noch ein paar Probleme aufgefallen, die ich auch z.T. schon
korrigiert habe (Willi-am, Klo-thilde, semantiker-halt).

Noch offen: 

Die aus

  Staubeckens;-2-;Stau=be{ck/k-k}ens;Stau=be-ckens

neu bestimmten Trennungen in "stau-be-ckens" lassen vermuten, daß die
Unterdrückung von Nebentrennstellen in der Nähe einer Wortfuge nicht wie
(von mir) erwartet funktioniert. Ich dachte, daß Trennungen erst im
Abstand von mindestens 3 Buchstaben zugelassen werden.

Wie ist das Resultat in ähnlichen Fällen (die nicht im Diff auftauchen,
da sie nicht neu sind)?

> Ich habe gestern abend die Perl-Skripte fast unverändert von meinem
> Zweig in den Hauptzweig kopiert, 

Bitte beachten, daß in "keine Haupttrennstellen ..." die Bedeutung
der Trennzeichen anders ist ("|" -> Fuge, "=" -> Hauptrennstelle 2. Ordnung).

Achtung: mit Zei-tungs==her|aus=ge-ber gibt es jetzt auch den ersten Eintrag
mit Doppel-Trennzeichen.


> deswegen wird »_« jetzt als
> untrennbar behandelt, z.B.

>   einschl.

> Soll ich das (wieder) in

>   ein-schl.

> ändern?

Wollen wir wirklich Trennungen wie „ab-
zgl.“, „best-
nr.“ oder „an-
schl.“ zulassen? 

Ansonsten  mit '.' markieren.

Zumindest bei der Bestnr. ist die Trennung meines Erachtens
irreführend, denn mit Abteilung müßte es Best.-Nr. sein.


Danke,

Günter




Mehr Informationen über die Mailingliste Trennmuster