[Trennmuster] Flatterbuchstabe
Stephan Hennig
sh-list at posteo.net
Di Nov 1 18:54:47 CET 2016
Am 31.10.2016 um 00:30 schrieb Guenter Milde:
> On 29.10.16, Stephan Hennig wrote:
>> Am 29.10.2016 um 14:13 schrieb Stephan Hennig:
>
>> Ich habe sicher nicht lange genug überlegt/geprüft, aber hier mal ein
>> Versuch, Einbuchstabentrennungen zu kategorisieren:
>
>> A. Flatterbuchstaben:
>
>> * Flattervokale (genau-e-re, de-1901 und de-1996)
>
> Das sind ja eigentlich "Flattersilben", denn nur wenn Vokale als einzelne
> Sprechsilbe vorkommen, darf vor und nach ihnen getrennt werden (seit
> mindestens 1901).
Sehr gern, ich hänge nicht an der Benennung. :-)
> Ich plädiere in diesem Fall für die Markierung und Zulassung aller
> Trennstellen (ggf. mit expliziter Unterdrückung unerwünschter/ungünstiger
> Trennungen).
Andererseits, so denke ich, lassen sich zumindest Flattervokale relativ
einfach aus der bisherigen Auszeichnung ableiten, falls jemand
entsprechenden Bedarf hat.
>> * Flatterkonsonanten (Indus-t-rie, nur de-1996)
>
> Diesen Fall (§112) würde ich als "herkunftsmäßige" vs. "eingedeutschte"
> Trennung bezeichnen. In beiden Fällen ist es Sprechsilbentrennung, nur
> daß die Sprechsilben eben entweder nach Herkunftssprachregeln oder
> Standardregeln gebildet werden (Ma - gnet vs. Mag - net usw.).
>
> Ich plädiere für vollständige Markierung und Unterdrückung der
> "eingedeutschten" Trennung bei der Extraktion von
> "patgen"-Eingabemustern (und bei der Ableitung von de-1901 aus de-1996).
Was meinst du mit "vollständiger Markierung" genau? Mit . zur
Unterdrückung?
>> Es gibt mindestens zwei Fälle, wie ein Konsonant an den
>> Trennsilbenanfang gelangen kann (k und v bezeichnen beliebige
>> Konsonanten und Vokale):
>
>> * Konsonantensprung:
>> vk<v, ein<ander, Inter<esse
>> v-kv, ei-nander, Inte-resse
>
>> * Vokalsprung:
>> k<vkv, In<itiative, Ex<amen
>> kv-kv, Ini-tiative, Exa-men
>
> In diesen Beispielen wäre die vollständige Auszeichnung der Trennstellen:
>
> Inte-r<esse
> Ex<a-men
Meine hier notizartig abgelegten Überlegungen hatten das Ziel,
Sprechsilbentrennungen /ohne weitere Auszeichnung/ abzuleiten.
Möchte man auf die Auszeichnung "de-1996/etymologisch+Sprechsilben"
(weitgehend) verzichten, scheinen mir von den drei Ausgangsmöglichkeiten
* de-1901 (etymologisch)
* de-1996/etymologisch
* de-1996/Sprechsilben
interessanterweise nur aus "de-1996/etymologisch" die beiden anderen
Formen (Schreibung + Trennung) einfach durch Zeichenkettenoperationen
ableitbar, also aus der derzeit verwendeten Form.
> * Die Ausdrücke sollten vor dem Beginn der vollständigen
> Trennstellenmarkierung in die Extraktionsskripte eingebaut und auf
> "false positives" getestet werden.
>
> * Vor und nach dem Einfügen von "Flattertrennungen"/Trennalternativen
> sollten die Extraktionsskripte auf unerwünschte Effekte oder vergessene
> Unterdrückung getestet werden.
Ja. Mit der Umstellung auf automatische Ableitungen wären weitere
Testverfahren sinnvoll.
Viele Grüße,
Stephan Hennig
Mehr Informationen über die Mailingliste Trennmuster