[Trennmuster] Problem mit Ein-Buchstaben-Trennungen
Werner LEMBERG
wl at gnu.org
Mi Jan 20 15:42:43 CET 2021
> Alle unsere Trennstile verlangen die Wahl zwischen morphemisch oder
> syllabisch [...]
OK.
>> Ungünstigkeitsmarker werden in diesem Schritt nicht
>> berücksichtigt (wohl aber entfernt, wenn die entsprechende
>> Trennstelle entfällt).
>
> Logo, Ungünstigkeitsmarker ohne Trennstelle gibt es nicht.
Ich bin lieber explizit hier :-)
> - Diese Regel gilt *nicht* für »>x-« und »-x>«.
> + Diese Regel gilt *nicht* für Suffixe (»>x-« und »-x>«).
OK.
>> Beachte weiters, daß es die Bezeichnung »=x-« nicht gibt.
>
> Theoretisch schon, praktisch nutzen wir sie nicht.
Also im Deutschen kann das auch theoretisch nicht auftreten, oder?
Ebensowenig gibt es »=i-«, höchstens »=i·« kann auftreten.
>> (c) Die Bezeichner werden repetitiv von links nach rechts
>> abgearbeitet.
>
>> Das Beispiel
>
>> Di-a<s-po-ra
>
>> wird im morphemischen Trennstil zuerst zu
>
>> Di·a<s-po-ra
>
>> (Regel 1b) und dann zu
>
>> Di·a<spo-ra
>
>> (Regel 1a) umgeformt. [...]
>
> Die Reihenfolge ist hier unerheblich. Punkt (c) kann damit
> entfallen.
Finde ich nicht. Punkt (c) ist eher ein Implementationshinweis, daß
bei »a<b<c« nach »a<b« auch »b<c« zu verarbeiten ist. Das ist bei
regulären Ausdrücken nicht selbstverständlich. Auch hier bin ich
lieber überdeutlich.
> Die Schritte (2) und (3) können auch vertauscht werden, das ist für
> die Wirkung egal.
Ja, aber ich denke, es hat keinen Sinn, das explizit zu erwähnen.
> - (4) Entferne Flattervokale (also Einbuchstaben-Trennstellen), falls
> + (4) Entferne Flattervokale (Einbuchstaben-Silben), falls
OK.
> In der Dokumentation sollte klar werden:
>
> Wir haben 3 Fälle von Trennstellen im Abstand 1:
>
> Flattervokale:
> reguläre Sprechsilben im Wortinneren,
> erlaubt (§109 (de-1996) und K81 (Duden 72)) aber nicht empfohlen.
>
> Gesangstrennungen:
> Einzelvokale am Wortrand und vor/nach Wortfugen [<=],
> Nur im Notentext erlaubt (§107 E1 und K79)
>
> verblasste Wortfugen:
> Einzelbuchstaben vor/nach Wortfugen, die nicht erkannt/empfunden werden.
> Nur in de-1996 (§113).
Mhmm, das hast Du ja bereits in der Dokumentation sehr ausführlich
abgedeckt. Ich will obiges eher als Erklärung des Algorithmus haben
und daher präzise sein – mit Beispielen –, nicht aber übermäßig in die
Breite gehen.
> Außerdem hilft die beste Dokumentation nichts, wenn sie nicht
> gefunden wird, es ist also zu überlegen, wohin damit.
Ich bin gerade dabei, mein »extract-tex.pl«-Skript zu aktualisieren,
da geb' ich die Beschreibung einmal hinein. Später kann man das
woanders unterbringen.
Werner
Mehr Informationen über die Mailingliste Trennmuster