[Trennmuster] Paket fuer Sondertrennungen
Stephan Hennig
mailing_list at arcor.de
Sa Jan 25 15:09:04 CET 2014
Am 25.01.2014 14:11, schrieb Werner LEMBERG:
> Es sollen also beispielsweise die Einträge
>
> Flecken;-2-;Fle{ck/k-k}en;Fle-cken
> Baustoffirma;-2-;Bau-sto{ff/ff=f}ir-ma;-4-
>
> als
>
> Flec-ken
> Baustof-firma
>
> getrennt werden?
Ja, dachte ich so.
> Wenn ja, dann benütze das angehängte Skript, um alle
> »{...}«-Konstruktionen zu verarbeiten. Ich habe auch die Muster
> angehängt.
Vielen Dank, das funktioniert schon ganz gut (habe die Anhänge wegen To:
erhalten). Allerdings erhalte ich noch Trennungen wie
Stok-k-werk
Schok-k-wel-le
und ich möchte nicht hoffen, dass das an den Lua-Modulen liegt. ;-) Die
Liste für Patgen muss wohl doch sämtliche Wörter oder zumindest
alle mit Doppelkonsonanten und ck enthalten. Also auch
Stockwerk
Schockwelle
Baustoffindustrie
(alle ohne Trennung).
Zum besseren Verständnis für Nicht-Deutsche wäre es für das Beispiel
im Repositorium auch nicht schlecht, wenn es eine Version der Muster nur
für ck-Trennung gäbe.
Ansonsten ziehe ich gemischte Muster vor. Zwei oder noch mehr
verschiedene Mustersätze auf die Wörter anzuwenden, ist aufwendiger als
eine Abfrage, welches Buchstabenpaar denn nun vorliegt. Die ck-Regel
und die Dreikonsonantenregel sind ja auf Buchstabenebene eindeutig
aus ein an der zu hal ten.
Viele Grüße,
Stephan Hennig
Mehr Informationen über die Mailingliste Trennmuster