[Trennmuster] Problem mit Ein-Buchstaben-Trennungen

Werner LEMBERG wl at gnu.org
Mi Jan 20 15:42:43 CET 2021


> Alle unsere Trennstile verlangen die Wahl zwischen morphemisch oder
> syllabisch [...]

OK.

>>     Ungünstigkeitsmarker werden in diesem Schritt nicht
>>     berücksichtigt (wohl aber entfernt, wenn die entsprechende
>>     Trennstelle entfällt).
> 
> Logo, Ungünstigkeitsmarker ohne Trennstelle gibt es nicht.

Ich bin lieber explizit hier :-)

> -         Diese Regel gilt *nicht* für »>x-« und »-x>«.
> +         Diese Regel gilt *nicht* für Suffixe (»>x-« und »-x>«).

OK.

>>         Beachte weiters, daß es die Bezeichnung »=x-« nicht gibt.
> 
> Theoretisch schon, praktisch nutzen wir sie nicht.

Also im Deutschen kann das auch theoretisch nicht auftreten, oder?
Ebensowenig gibt es »=i-«, höchstens »=i·« kann auftreten.

>>     (c) Die Bezeichner werden repetitiv von links nach rechts
>>         abgearbeitet.
> 
>>         Das Beispiel
> 
>>           Di-a<s-po-ra
> 
>>         wird im morphemischen Trennstil zuerst zu
> 
>>           Di·a<s-po-ra
> 
>>         (Regel 1b) und dann zu
> 
>>           Di·a<spo-ra
> 
>>         (Regel 1a) umgeformt.  [...]
> 
> Die Reihenfolge ist hier unerheblich. Punkt (c) kann damit
> entfallen.

Finde ich nicht.  Punkt (c) ist eher ein Implementationshinweis, daß
bei »a<b<c« nach »a<b« auch »b<c« zu verarbeiten ist.  Das ist bei
regulären Ausdrücken nicht selbstverständlich.  Auch hier bin ich
lieber überdeutlich.

> Die Schritte (2) und (3) können auch vertauscht werden, das ist für
> die Wirkung egal.

Ja, aber ich denke, es hat keinen Sinn, das explizit zu erwähnen.

> - (4) Entferne Flattervokale (also Einbuchstaben-Trennstellen), falls
> + (4) Entferne Flattervokale (Einbuchstaben-Silben), falls

OK.

> In der Dokumentation sollte klar werden:
> 
> Wir haben 3 Fälle von Trennstellen im Abstand 1:
> 
>   Flattervokale: 
>     reguläre Sprechsilben im Wortinneren,
>     erlaubt (§109 (de-1996) und K81 (Duden 72)) aber nicht empfohlen.
>    
>   Gesangstrennungen:   
>     Einzelvokale am Wortrand und vor/nach Wortfugen [<=],
>     Nur im Notentext erlaubt (§107 E1 und K79)
>  
>   verblasste Wortfugen:
>     Einzelbuchstaben vor/nach Wortfugen, die nicht erkannt/empfunden werden.
>     Nur in de-1996 (§113).

Mhmm, das hast Du ja bereits in der Dokumentation sehr ausführlich
abgedeckt.  Ich will obiges eher als Erklärung des Algorithmus haben
und daher präzise sein – mit Beispielen –, nicht aber übermäßig in die
Breite gehen.

> Außerdem hilft die beste Dokumentation nichts, wenn sie nicht
> gefunden wird, es ist also zu überlegen, wohin damit.

Ich bin gerade dabei, mein »extract-tex.pl«-Skript zu aktualisieren,
da geb' ich die Beschreibung einmal hinein.  Später kann man das
woanders unterbringen.


    Werner




Mehr Informationen über die Mailingliste Trennmuster