[Trennmuster] Flatterbuchstabe

Guenter Milde milde at users.sf.net
Mo Okt 31 00:30:36 CET 2016


On 29.10.16, Stephan Hennig wrote:
> Am 29.10.2016 um 14:13 schrieb Stephan Hennig:

> Ich habe sicher nicht lange genug überlegt/geprüft, aber hier mal ein
> Versuch, Einbuchstabentrennungen zu kategorisieren:

> A. Flatterbuchstaben:

>   * Flattervokale (genau-e-re, de-1901 und de-1996)

Das sind ja eigentlich "Flattersilben", denn nur wenn Vokale als einzelne
Sprechsilbe vorkommen, darf vor und nach ihnen getrennt werden (seit
mindestens 1901).

Ich plädiere in diesem Fall für die Markierung und Zulassung aller
Trennstellen (ggf. mit expliziter Unterdrückung unerwünschter/ungünstiger
Trennungen). 


>   * Flatterkonsonanten (Indus-t-rie, nur de-1996)

Diesen Fall (§112) würde ich als "herkunftsmäßige" vs. "eingedeutschte"
Trennung bezeichnen. In beiden Fällen ist es Sprechsilbentrennung, nur
daß die Sprechsilben eben entweder nach Herkunftssprachregeln oder
Standardregeln gebildet werden (Ma - gnet vs. Mag - net usw.).

Ich plädiere für vollständige Markierung und Unterdrückung der
"eingedeutschten" Trennung bei der Extraktion von 
"patgen"-Eingabemustern (und bei der Ableitung von de-1901 aus de-1996).
 

> B. Etymologische vs. sprachrhythmische (naive) Trennung

> Diese Trennungen sind nur in de-1996 gültig und leiten sich aus der
> Grundregel ab, dass Trennungen im Stamm in der Regel vor einem
> Konsonanten erfolgen.  Wird die Etymologie eines Wortes nicht erkannt,
> wird diese Regel irrtümlich auf Wortfugen angewendet (ein-ander =>
> ei-nander).

Nicht nur bei Fugen (=) sondern auch nach Präfixen (<), z.B. De<s-pe-ra-do.
Ob die Anwendung der Standardsilbentrennung nun irrtümlich oder bewußt
eindeutschend erfolgt ist egal, seit 1996 ist sie zulässig:

  § 113: Wörter, die sprachhistorische oder von der Herkunftssprache her
  gesehen Zusammensetzungen oder Präfigierungen sind, aber nicht mehr als
  solche empfunden oder erkannt werden kann man entweder nach § 108 oder
  nach § 109 bis § 112 trennen.

In Einzelfällen ist eine entsprechende Eindeutschung der Trennung schon
vor 1996 erfolgt, z.B.

  Hospiz;-2-;Ho-spiz;Hos-piz # seit 1976 auch Hos-piz


> Es gibt mindestens zwei Fälle, wie ein Konsonant an den
> Trennsilbenanfang gelangen kann (k und v bezeichnen beliebige
> Konsonanten und Vokale):

>   * Konsonantensprung:
>       vk<v, ein<ander, Inter<esse
>       v-kv, ei-nander, Inte-resse

>   * Vokalsprung:
>       k<vkv, In<itiative, Ex<amen
>       kv-kv, Ini-tiative, Exa-men

In diesen Beispielen wäre die vollständige Auszeichnung der Trennstellen:

     Inte-r<esse
     Ex<a-men

Die Ausdrücke

     "-(.)([<=]+)"   ==>  "\1\2"
     "([<=]+)(.)-"   ==>  "\1\2"

müssten die beiden Fälle des § 113 abdecken. Ggf. sind noch Fälle von
"Konsonantensprung" mit mehrbuchstabigen Konsonanten (th, rh, sh, ch, ck) zu
berücksichtigen.
 
> Ich bin mir nicht sicher, ob es sinnvoll ist, alle diese Fälle
> automatisch abzuleiten oder ob zumindest für einen Teil der Fälle ein
> eigenes Zeichen sinnvoll wäre.  Ich bin mir auch nicht sicher, ob mit
> diesem Schema alle Fälle erfasst werden.  Eine Beteiligung von
> Konsonantenklustern kann ich mir in diesen beiden Fällen jedenfalls
> nicht vorstellen.


* Die Ausdrücke sollten vor dem Beginn der vollständigen
  Trennstellenmarkierung in die Extraktionsskripte eingebaut und auf
  "false positives" getestet werden.
  
* Vor und nach dem Einfügen von "Flattertrennungen"/Trennalternativen
  sollten die Extraktionsskripte auf unerwünschte Effekte oder vergessene
  Unterdrückung getestet werden.
  
Günter     


----- End forwarded message -----



Mehr Informationen über die Mailingliste Trennmuster