[Trennmuster] Paket fuer Sondertrennungen

Stephan Hennig mailing_list at arcor.de
Sa Jan 25 15:09:04 CET 2014


Am 25.01.2014 14:11, schrieb Werner LEMBERG:

> Es sollen also beispielsweise die Einträge
> 
>   Flecken;-2-;Fle{ck/k-k}en;Fle-cken
>   Baustoffirma;-2-;Bau-sto{ff/ff=f}ir-ma;-4-
> 
> als
> 
>   Flec-ken
>   Baustof-firma
> 
> getrennt werden?

Ja, dachte ich so.


> Wenn ja, dann benütze das angehängte Skript, um alle
> »{...}«-Konstruktionen zu verarbeiten.  Ich habe auch die Muster
> angehängt.

Vielen Dank, das funktioniert schon ganz gut (habe die Anhänge wegen To:
erhalten).  Allerdings erhalte ich noch Trennungen wie

  Stok-k-werk
  Schok-k-wel-le

und ich möchte nicht hoffen, dass das an den Lua-Modulen liegt. ;-)  Die
Liste für Patgen muss wohl doch sämtliche Wörter oder zumindest
alle mit Doppelkonsonanten und ck enthalten.  Also auch

  Stockwerk
  Schockwelle
  Baustoffindustrie

(alle ohne Trennung).

Zum besseren Verständnis für Nicht-Deutsche wäre es für das Beispiel
im Repositorium auch nicht schlecht, wenn es eine Version der Muster nur
für ck-Trennung gäbe.

Ansonsten ziehe ich gemischte Muster vor.  Zwei oder noch mehr
verschiedene Mustersätze auf die Wörter anzuwenden, ist aufwendiger als
eine Abfrage, welches Buchstabenpaar denn nun vorliegt.  Die ck-Regel
und die Dreikonsonantenregel sind ja auf Buchstabenebene eindeutig
aus ein an der zu hal ten.

Viele Grüße,
Stephan Hennig




Mehr Informationen über die Mailingliste Trennmuster