[Trennmuster] Flatterbuchstabe
Stephan Hennig
sh-list at posteo.net
Mi Nov 2 19:25:23 CET 2016
[FQ+CC]
Am 01.11.2016 um 21:06 schrieb Guenter Milde:
> Hallo Stephan,
>
> On 1.11.16, Stephan Hennig wrote:
>> Am 31.10.2016 um 00:30 schrieb Guenter Milde:
>
> Vokale:
>
>> > Ich plädiere in diesem Fall für die Markierung und Zulassung aller
>> > Trennstellen (ggf. mit expliziter Unterdrückung unerwünschter/ungünstiger
>> > Trennungen).
>
>> Andererseits, so denke ich, lassen sich zumindest Flattervokale relativ
>> einfach aus der bisherigen Auszeichnung ableiten, falls jemand
>> entsprechenden Bedarf hat.
>
> Mein Hauptziel ist, daß in der Wortliste als Quelldatei alle zulässigen
> Trennungen markiert sind, z.B. "genauere;ge<nau-e-re".
Wenn es nicht anders geht, ist das schon klar. Meine Idee war, das jene
Trennungen abgeleitet werden können. War ...
>> >> * Flatterkonsonanten (Indus-t-rie, nur de-1996)
>> >
>> > Diesen Fall (§112) würde ich als "herkunftsmäßige" vs. "eingedeutschte"
>> > Trennung bezeichnen. In beiden Fällen ist es Sprechsilbentrennung, nur
>> > daß die Sprechsilben eben entweder nach Herkunftssprachregeln oder
>> > Standardregeln gebildet werden (Ma - gnet vs. Mag - net usw.).
>> >
>> > Ich plädiere für vollständige Markierung und Unterdrückung der
>> > "eingedeutschten" Trennung bei der Extraktion von
>> > "patgen"-Eingabemustern (und bei der Ableitung von de-1901 aus de-1996).
>
>> Was meinst du mit "vollständiger Markierung" genau?
>
> In der "wortliste":
>
> Magnet;-2-;Ma-gnet;Ma-g-net
> Arthrose;-2-;Ar-thro-se;Ar-th-ro-se
>
> in den Patgen-Mustern (words.hyphenated.refo)
>
> Ma-gnet
> Ar-thro-se
>
> Wenn ein Anwender Muster für "moderne" Trennung bauen will, kann er diese
> aus der Quelle einfach ableiten.
>
>> Mit . zur Unterdrückung?
>
> Nur, wenn es Unregelmäßigkeiten gibt, die eine explizite Markierung
> rechtfertigen.
>
>
>> >> Es gibt mindestens zwei Fälle, wie ein Konsonant an den
>> >> Trennsilbenanfang gelangen kann
> ...
>
>> Meine hier notizartig abgelegten Überlegungen hatten das Ziel,
>> Sprechsilbentrennungen /ohne weitere Auszeichnung/ abzuleiten.
>
> Da unterscheiden sich unsere Ziele also. Ich möchte keine neuen
> Spezialzeichen, aber eine vollständige Auszeichnung in der Quelle.
Ja, ich bin im Zweifel für weniger explizite Auszeichnung -- sofern es
denn geht.
>> Möchte man auf die Auszeichnung "de-1996/etymologisch+Sprechsilben"
>> (weitgehend) verzichten, scheinen mir von den drei Ausgangsmöglichkeiten
>
>> * de-1901 (etymologisch)
>> * de-1996/etymologisch
>> * de-1996/Sprechsilben
>
>> interessanterweise nur aus "de-1996/etymologisch" die beiden anderen
>> Formen (Schreibung + Trennung) einfach durch Zeichenkettenoperationen
>> ableitbar, also aus der derzeit verwendeten Form.
>
> Das ist meines Erachtens nicht möglich, da keine Zeichenkettenoperation
> entscheiden kann, ob "Zusammensetzungen oder Präfigierungen [...] nicht
> mehr als solche empfunden oder erkannt werden" und somit § 113 greift.
Die ganze Passivkonstruktion "nicht mehr empfunden werden" ist natürlich
erbärmlich für ein Regelwerk.
> Irgendwie müssen wir also den Unterschied zwischen
> Kor<re<s-pon-denz oder prä<g-nant und Ver<ar-bei-tung oder
> Des<il<lu-si-on markieren damit die Automatik nich bei Ve-rar-bei-tung und
> De-sil-lu-si-on landet.
Hm, die "Verarbeitung" u. ä. kann man anhand der Vorsilben noch
herausfischen. Aber, wie du zeigst, wird es anhand der Buchstaben
schwierig. Ich habe leider keine Zeit, aber könnte es sein, dass
zumindest der Konsonantensprung nach /zwei- oder mehrfachem/ Präfix
(Korres-pondenz) automatisch erkannt werden kann? Die Chance, dass
solche Präfixe "nicht mehr als solche empfunden werden" erscheint höher.
Zumindest für die Konvertierung könnte so ein Automatismus hilfreich sein.
BTW, präg-nant ist irreführend: prä<g-.nant.
Viele Grüße,
Stephan Hennig
Mehr Informationen über die Mailingliste Trennmuster