[Trennmuster] Power to the people
Keno Wehr
wehr at abgol.de
Mi Apr 5 20:17:27 CEST 2023
Am 03.04.23 um 12:38 schrieb Guenter Milde:
> Meine anekdotische, subjektive Wahrnehmung ist, dass eigentlich nur noch die
> "englische" Deutung vorkommt. Evt. komme ich ja aber auch aus der "falschen"
> Gegend.
>
> Also wollen wir
>
> Pow-er aus<pow-ern aus<ge<pow-ert # immer getrennt
>
> Pow.-er aus<pow.-ern aus<ge<pow.-ert # im Gesangstext und engen Spalten
> # gegtrennt, standardmäßig unterdrückt
>
> Po[w-/-w]er aus<po[w-/-w]ern aus<ge<po[w-/-w]ert # immer unterdrückt
>
> oder eine Mischung?
Nach unseren allgemeinen Prinzipien müsste es eigentlich die letzte
Variante sein.
Bei Alternativtrennungen nehmen wir bisher keine Priorisierung nach
Häufigkeit vor und wir wollen, dass auch ältere Texte korrekt getrennt
werden.
Immerhin könnten wir „po-we-re“, „po-we-ren“ etc. mit eindeutiger
Trennung aufnehmen.
Für Gesangstexte ignoriert „extract-tex.pl“ Einträge mit eckigen
Klammern jetzt völlig. Die Trennung solcher Wörter in Gesangstexten
hängt damit vom Zufall ab (oder genauer gesagt, von ähnlichen Einträgen
ohne eckige Klammern und den gewählten patgen-Parametern).
„sprachauszug.py“ unterdrückt die fraglichen Trennstellen im Gesangstext
(was auf jeden Fall falsch, aber immerhin vorhersehbar ist). Was nun
besser ist, weiß ich auch nicht.
Gruß
Keno
Mehr Informationen über die Mailingliste Trennmuster