[Trennmuster] Power to the people

Keno Wehr wehr at abgol.de
Mi Apr 5 20:17:27 CEST 2023


Am 03.04.23 um 12:38 schrieb Guenter Milde:
> Meine anekdotische, subjektive Wahrnehmung ist, dass eigentlich nur noch die
> "englische" Deutung vorkommt. Evt. komme ich ja aber auch aus der "falschen"
> Gegend.
>
> Also wollen wir
>
>    Pow-er  aus<pow-ern  aus<ge<pow-ert     # immer getrennt
>
>    Pow.-er  aus<pow.-ern  aus<ge<pow.-ert  # im Gesangstext und engen Spalten
>    	   		 		  # gegtrennt, standardmäßig unterdrückt
>
>    Po[w-/-w]er aus<po[w-/-w]ern aus<ge<po[w-/-w]ert # immer unterdrückt
>      
> oder eine Mischung?

Nach unseren allgemeinen Prinzipien müsste es eigentlich die letzte 
Variante sein.
Bei Alternativtrennungen nehmen wir bisher keine Priorisierung nach 
Häufigkeit vor und wir wollen, dass auch ältere Texte korrekt getrennt 
werden.

Immerhin könnten wir „po-we-re“, „po-we-ren“ etc. mit eindeutiger 
Trennung aufnehmen.

Für Gesangstexte ignoriert „extract-tex.pl“ Einträge mit eckigen 
Klammern jetzt völlig. Die Trennung solcher Wörter in Gesangstexten 
hängt damit vom Zufall ab (oder genauer gesagt, von ähnlichen Einträgen 
ohne eckige Klammern und den gewählten patgen-Parametern).
„sprachauszug.py“ unterdrückt die fraglichen Trennstellen im Gesangstext 
(was auf jeden Fall falsch, aber immerhin vorhersehbar ist). Was nun 
besser ist, weiß ich auch nicht.

Gruß
Keno



Mehr Informationen über die Mailingliste Trennmuster