[Trennmuster] Nottrennstellen

Keno Wehr keno.wehr at abgol.de
Do Sep 6 13:18:35 CEST 2018


Am 06.09.2018 um 01:07 schrieb Guenter Milde:
>
> Im bisher genutzten Trennstil `standard()` werden Trennstellen aus folgenden
> Gründen unterdrückt:
>
> Randtrennung    [-<>=]*·       A<·sphalt, O·bo·e
>
> ungünstig       [-<>=]+\.+     Bür-ger=in-.ter<es-se, Rahm=sau-.ce
>
> sehr ungünstig  [-<>=]+\.\.+   Sau-..er=län-de-rin, Ur<..in-stinkt
>
> Nottrennung     \.             Oze.an, De<po-ni.en, Tel-tow.er
>
> ~ Flattervokal  \..-           oze.a-nisch, Ru.i-ne, The.o-rie
>                  -.\.           Athe-i.sten, Ale-u.ten, Schi-i.ten
>
> ~ Schwankungsfall              Na-ti*on, Rivi*e-ra
>
> ~ Schwankung+Flatter           na-ti*o-nal, tan-gen-ti*a-le
>
>

Danke für die schöne Zusammenstellung. Allerdings sind Fälle wie 
»Oze-an« bisher nicht als Nottrennstelle markiert. Hierüber gab es noch 
keinen Konsens.

>
> a) „·“ = Nottrennstelle (auch im Notentext)   Oze·an, oze·a-nisch
>     „.“ = Nottrennstelle (Schwankungsfall)     Na-ti.on, na-ti.o-nal
>     
>    
>     Problem: Unterscheidung von Randtrennstellen (O·bo·e)
>     
>     a1) durch Randlage, Regexp: (^.·|·.$)                 O·bo·e, Oze·an
>         
>     a2) Randstellen normal, Regexp: (^.[-<>]|[-<>].$)      O-bo-e, Oze·an
>     
>     -1 Beides ist verwirrend beim Betrachten der Wortliste.
>     
>
> b) „.“ = Nottrennstelle (auch im Notentext)   Oze.an, oze.a-nisch
>     „..“ = Nottrennstelle (Schwankungsfall)    Na-ti..on, na-ti..o-nal
>
>     +1 analog zu „besonders ungünstig“ (Ur<..in-stinkt)
>     -1 unschön: breite Lücke bei fast nie gewollter/genutzter Trennung
>
>
> c) „-“ = Nottrennstelle (auch im Notentext)   Oze-an, oze-a-nisch
>     „.“ = Nottrennstelle (Schwankungsfall)     Na-ti.on, na-ti.o-nal
>     
>     Unterdrückung der „Flattervokale“ mit Filter. Regexp: -.-
>     
>     +1 einfache Auszeichnung
>     -1 „normal“ markierte Trennungen an Stellen, wo im Einheitsduden
>        keine Trennung steht (The-a-ter, oze-a-nisch)
>        
>
> d) „.“ = Nottrennstelle       Oze.an, oze.a-nisch Na-ti.on, na-ti.o-nal
>
>     Problem: keine Unterscheidung der Schwankungsfälle
>     
>     d1) Trennung auch im Notentext
>     
>         -1 viel Handkorrekturen
>         
>     d2) Filter für Notentext ([tsz]i.o-?n|ti.a-?l|…)
>
>         -1 komplexe Regexp, Gefahr von false positives
>
>
> Es sieht für mich nach einer Wahl des geringsten Übels aus. Was meint Ihr?
>

a oder b könnte ich mir gut vorstellen, bei c und d überwiegen die 
Nachteile.

Gruß
Keno



Mehr Informationen über die Mailingliste Trennmuster