[Trennmuster] Flatterbuchstabe

Werner LEMBERG wl at gnu.org
Di Nov 1 06:38:27 CET 2016


>>   * Flattervokale (genau-e-re, de-1901 und de-1996)
> 
> Ich plädiere in diesem Fall für die Markierung und Zulassung aller
> Trennstellen (ggf. mit expliziter Unterdrückung
> unerwünschter/ungünstiger Trennungen).

OK.

>>   * Flatterkonsonanten (Indus-t-rie, nur de-1996)
> 
> Ich plädiere für vollständige Markierung und Unterdrückung der
> "eingedeutschten" Trennung bei der Extraktion von
> "patgen"-Eingabemustern (und bei der Ableitung von de-1901 aus
> de-1996).

Auch OK.  Allerdings bitte ich, jetzt noch keine flatterhaften
Änderungen einzupflegen, sondern ein bißchen abzuwarten, bis das neue
interne Format »steht«.

> Die Ausdrücke
> 
>      "-(.)([<=]+)"   ==>  "\1\2"
>      "([<=]+)(.)-"   ==>  "\1\2"
> 
> müssten die beiden Fälle des § 113 abdecken.  Ggf. sind noch Fälle
> von "Konsonantensprung" mit mehrbuchstabigen Konsonanten (th, rh,
> sh, ch, ck) zu berücksichtigen.

Mit regulären Ausdrücken in Python kenne ich mich nicht so gut aus,
aber in Perl gibt's auch »look-around assertions«, die äußerst
hilfreich sind.

  (?=pattern)
    A zero-width positive look-ahead assertion.  For example,
    »/\w+(?=\t)/« matches a word followed by a tab, without including
    the tab in $&.

  (?!pattern)
    A zero-width negative look-ahead assertion.  For example
    »/foo(?!bar)/« matches any occurrence of »foo« that isn't followed
    by »bar«.  Note however that look-ahead and look-behind are NOT
    the same thing.  You cannot use this for look-behind.

  (?<=pattern)
    A zero-width positive look-behind assertion.  For example,
    »/(?<=\t)\w+/« matches a word that follows a tab, without
    including the tab in $&.  Works only for fixed-width look-behind.

  (?<!pattern)
    A zero-width negative look-behind assertion.  For example
    »/(?<!bar)foo/« matches any occurrence of »foo« that does not
    follow »bar«.  Works only for fixed-width look-behind.


    Werner




Mehr Informationen über die Mailingliste Trennmuster