[Trennmuster] Überkategorisierung?
Guenter Milde
milde at users.sf.net
Fr Jul 18 19:09:20 CEST 2014
On 18.07.14, Werner LEMBERG wrote:
> > die letzten Kommits lassen mich fragen, ob wir es nun mit der
> > Trennstellenkategorisierung nicht eventuell zu weit treiben. Wollen
> > wir eine ethymologische Liste oder eine Trennliste oder beides?
> Tja! Mir scheint, daß wohl beides derzeit das Ziel ist. :-)
> Das Problem des Nichtzusammenfallens von Präfix oder Postfix mit der
> besten Trennstelle ist ja nicht neu, und wir handhaben das nicht
> konsequent, was mich stört.
Da gibt es zwei Fälle:
a) Morphemgrenze != Trennstelle (einbuchstabige Präfixe und alle Suffixe,
die nicht "zufällig sowieso" an Sprechsilbengrenzen liegen)
Hier herscht bisher Konsens: die Trennmusterliste markiert nur
Trennstellen
b) Morphemgrenze == Trennstelle aber nicht "beste"
> > Wir können, so wir dies wollen, natürlich trotzdem "prä<si-die-ren"
> > etc. auszeichnen, ABER das erschwert erheblich die Bestimmung
> > "guter" (lesefreundlicher) Trennstellen, da die Unterscheidung zu
> > Präfixtrennungen welche auch im heutigen Sprachverständnis als
> > solche wahrgenommen werden unmöglich wird.
> Inzwischen denke ich, daß wir einen separaten Marker brauchen, falls
> die etymologische Herleitung nicht die beste Trennstelle gibt. Im
> besonderen natürlich, wenn der Wortakzent woanders liegt. Es bietet
> sich beispielsweise »--« an, der ja bereits genau für diese Zwecke
> verwendet wird, falls nämlich die von uns verwendeten anderen Marker
> nicht greifen.
Der Marker "--" ist aber schon genau für das Gegenteil reserviert: eine
"gute Binnentrennstelle" (Vorzugstrennung ohne Morphemgrenze)!
Das ist so dokumentiert und etspricht auch der Logik
Zeichenart = Trennstellenart (Kategorie)
Zeichenzahl = Gewicht ("Güte")
Wir können bestimmt eine Lösung mit noch nuancierteren
Auszeichnungsstufen finden. Die Frage ist, bringt es außer erhöhter
Komplexität auch Vorteile?
Bereits jetzt finde ich die Lesbarkeit der Trennmusterliste gegenüber
dem Stand vor dem Beginn der Kategorisierung deutlich vermindert.
Und die Skripte zur Verarbeitung der Informationen werden notwendigermaßen
ebebfalls komplexer, i.e. schwerer zu durchschauen, zu dokumentieren und zu
warten.
Konkrete Vorteile sehe ich bei der Lang-S-Wandlung (Wortfugen und
Präfixe), bei lesefreundlicher Trennung (Wichtung nach Kategorie und
Abständen, noch Zukunftsmusik) und bei Ligaturverhinderung
(Anwendungsfall für make major, Skript folgt).
Überspitzt gefragt: wo hilft "En<er-gie"?
(z.B. Beim Erkennen des Zusammenhangs mit "Syn<er-gie" - wieviel Komlexität
in der Wortliste wollen wir dafür in Kauf nehmen?)
Natürliche Sprachen sind immer mehr pragmatisch als systematisch.
Viele Grüße
Günter
Mehr Informationen über die Mailingliste Trennmuster