[Trennmuster] Nottrennstellen
Keno Wehr
keno.wehr at abgol.de
Do Sep 6 13:18:35 CEST 2018
Am 06.09.2018 um 01:07 schrieb Guenter Milde:
>
> Im bisher genutzten Trennstil `standard()` werden Trennstellen aus folgenden
> Gründen unterdrückt:
>
> Randtrennung [-<>=]*· A<·sphalt, O·bo·e
>
> ungünstig [-<>=]+\.+ Bür-ger=in-.ter<es-se, Rahm=sau-.ce
>
> sehr ungünstig [-<>=]+\.\.+ Sau-..er=län-de-rin, Ur<..in-stinkt
>
> Nottrennung \. Oze.an, De<po-ni.en, Tel-tow.er
>
> ~ Flattervokal \..- oze.a-nisch, Ru.i-ne, The.o-rie
> -.\. Athe-i.sten, Ale-u.ten, Schi-i.ten
>
> ~ Schwankungsfall Na-ti*on, Rivi*e-ra
>
> ~ Schwankung+Flatter na-ti*o-nal, tan-gen-ti*a-le
>
>
Danke für die schöne Zusammenstellung. Allerdings sind Fälle wie
»Oze-an« bisher nicht als Nottrennstelle markiert. Hierüber gab es noch
keinen Konsens.
>
> a) „·“ = Nottrennstelle (auch im Notentext) Oze·an, oze·a-nisch
> „.“ = Nottrennstelle (Schwankungsfall) Na-ti.on, na-ti.o-nal
>
>
> Problem: Unterscheidung von Randtrennstellen (O·bo·e)
>
> a1) durch Randlage, Regexp: (^.·|·.$) O·bo·e, Oze·an
>
> a2) Randstellen normal, Regexp: (^.[-<>]|[-<>].$) O-bo-e, Oze·an
>
> -1 Beides ist verwirrend beim Betrachten der Wortliste.
>
>
> b) „.“ = Nottrennstelle (auch im Notentext) Oze.an, oze.a-nisch
> „..“ = Nottrennstelle (Schwankungsfall) Na-ti..on, na-ti..o-nal
>
> +1 analog zu „besonders ungünstig“ (Ur<..in-stinkt)
> -1 unschön: breite Lücke bei fast nie gewollter/genutzter Trennung
>
>
> c) „-“ = Nottrennstelle (auch im Notentext) Oze-an, oze-a-nisch
> „.“ = Nottrennstelle (Schwankungsfall) Na-ti.on, na-ti.o-nal
>
> Unterdrückung der „Flattervokale“ mit Filter. Regexp: -.-
>
> +1 einfache Auszeichnung
> -1 „normal“ markierte Trennungen an Stellen, wo im Einheitsduden
> keine Trennung steht (The-a-ter, oze-a-nisch)
>
>
> d) „.“ = Nottrennstelle Oze.an, oze.a-nisch Na-ti.on, na-ti.o-nal
>
> Problem: keine Unterscheidung der Schwankungsfälle
>
> d1) Trennung auch im Notentext
>
> -1 viel Handkorrekturen
>
> d2) Filter für Notentext ([tsz]i.o-?n|ti.a-?l|…)
>
> -1 komplexe Regexp, Gefahr von false positives
>
>
> Es sieht für mich nach einer Wahl des geringsten Übels aus. Was meint Ihr?
>
a oder b könnte ich mir gut vorstellen, bei c und d überwiegen die
Nachteile.
Gruß
Keno
Mehr Informationen über die Mailingliste Trennmuster