[Trennmuster] Flatterbuchstabe

Stephan Hennig sh-list at posteo.net
Di Nov 1 18:54:47 CET 2016


Am 31.10.2016 um 00:30 schrieb Guenter Milde:
> On 29.10.16, Stephan Hennig wrote:
>> Am 29.10.2016 um 14:13 schrieb Stephan Hennig:
> 
>> Ich habe sicher nicht lange genug überlegt/geprüft, aber hier mal ein
>> Versuch, Einbuchstabentrennungen zu kategorisieren:
> 
>> A. Flatterbuchstaben:
> 
>>   * Flattervokale (genau-e-re, de-1901 und de-1996)
> 
> Das sind ja eigentlich "Flattersilben", denn nur wenn Vokale als einzelne
> Sprechsilbe vorkommen, darf vor und nach ihnen getrennt werden (seit
> mindestens 1901).

Sehr gern, ich hänge nicht an der Benennung. :-)


> Ich plädiere in diesem Fall für die Markierung und Zulassung aller
> Trennstellen (ggf. mit expliziter Unterdrückung unerwünschter/ungünstiger
> Trennungen). 

Andererseits, so denke ich, lassen sich zumindest Flattervokale relativ
einfach aus der bisherigen Auszeichnung ableiten, falls jemand
entsprechenden Bedarf hat.


>>   * Flatterkonsonanten (Indus-t-rie, nur de-1996)
> 
> Diesen Fall (§112) würde ich als "herkunftsmäßige" vs. "eingedeutschte"
> Trennung bezeichnen. In beiden Fällen ist es Sprechsilbentrennung, nur
> daß die Sprechsilben eben entweder nach Herkunftssprachregeln oder
> Standardregeln gebildet werden (Ma - gnet vs. Mag - net usw.).
> 
> Ich plädiere für vollständige Markierung und Unterdrückung der
> "eingedeutschten" Trennung bei der Extraktion von 
> "patgen"-Eingabemustern (und bei der Ableitung von de-1901 aus de-1996).

Was meinst du mit "vollständiger Markierung" genau?  Mit . zur
Unterdrückung?


>> Es gibt mindestens zwei Fälle, wie ein Konsonant an den
>> Trennsilbenanfang gelangen kann (k und v bezeichnen beliebige
>> Konsonanten und Vokale):
> 
>>   * Konsonantensprung:
>>       vk<v, ein<ander, Inter<esse
>>       v-kv, ei-nander, Inte-resse
> 
>>   * Vokalsprung:
>>       k<vkv, In<itiative, Ex<amen
>>       kv-kv, Ini-tiative, Exa-men
> 
> In diesen Beispielen wäre die vollständige Auszeichnung der Trennstellen:
> 
>      Inte-r<esse
>      Ex<a-men

Meine hier notizartig abgelegten Überlegungen hatten das Ziel,
Sprechsilbentrennungen /ohne weitere Auszeichnung/ abzuleiten.

Möchte man auf die Auszeichnung "de-1996/etymologisch+Sprechsilben"
(weitgehend) verzichten, scheinen mir von den drei Ausgangsmöglichkeiten

  * de-1901 (etymologisch)
  * de-1996/etymologisch
  * de-1996/Sprechsilben

interessanterweise nur aus "de-1996/etymologisch" die beiden anderen
Formen (Schreibung + Trennung) einfach durch Zeichenkettenoperationen
ableitbar, also aus der derzeit verwendeten Form.


> * Die Ausdrücke sollten vor dem Beginn der vollständigen
>   Trennstellenmarkierung in die Extraktionsskripte eingebaut und auf
>   "false positives" getestet werden.
>   
> * Vor und nach dem Einfügen von "Flattertrennungen"/Trennalternativen
>   sollten die Extraktionsskripte auf unerwünschte Effekte oder vergessene
>   Unterdrückung getestet werden.

Ja.  Mit der Umstellung auf automatische Ableitungen wären weitere
Testverfahren sinnvoll.

Viele Grüße,
Stephan Hennig



Mehr Informationen über die Mailingliste Trennmuster