[Trennmuster] Flatterbuchstabe
Werner LEMBERG
wl at gnu.org
Di Nov 1 06:38:27 CET 2016
>> * Flattervokale (genau-e-re, de-1901 und de-1996)
>
> Ich plädiere in diesem Fall für die Markierung und Zulassung aller
> Trennstellen (ggf. mit expliziter Unterdrückung
> unerwünschter/ungünstiger Trennungen).
OK.
>> * Flatterkonsonanten (Indus-t-rie, nur de-1996)
>
> Ich plädiere für vollständige Markierung und Unterdrückung der
> "eingedeutschten" Trennung bei der Extraktion von
> "patgen"-Eingabemustern (und bei der Ableitung von de-1901 aus
> de-1996).
Auch OK. Allerdings bitte ich, jetzt noch keine flatterhaften
Änderungen einzupflegen, sondern ein bißchen abzuwarten, bis das neue
interne Format »steht«.
> Die Ausdrücke
>
> "-(.)([<=]+)" ==> "\1\2"
> "([<=]+)(.)-" ==> "\1\2"
>
> müssten die beiden Fälle des § 113 abdecken. Ggf. sind noch Fälle
> von "Konsonantensprung" mit mehrbuchstabigen Konsonanten (th, rh,
> sh, ch, ck) zu berücksichtigen.
Mit regulären Ausdrücken in Python kenne ich mich nicht so gut aus,
aber in Perl gibt's auch »look-around assertions«, die äußerst
hilfreich sind.
(?=pattern)
A zero-width positive look-ahead assertion. For example,
»/\w+(?=\t)/« matches a word followed by a tab, without including
the tab in $&.
(?!pattern)
A zero-width negative look-ahead assertion. For example
»/foo(?!bar)/« matches any occurrence of »foo« that isn't followed
by »bar«. Note however that look-ahead and look-behind are NOT
the same thing. You cannot use this for look-behind.
(?<=pattern)
A zero-width positive look-behind assertion. For example,
»/(?<=\t)\w+/« matches a word that follows a tab, without
including the tab in $&. Works only for fixed-width look-behind.
(?<!pattern)
A zero-width negative look-behind assertion. For example
»/(?<!bar)foo/« matches any occurrence of »foo« that does not
follow »bar«. Works only for fixed-width look-behind.
Werner
Mehr Informationen über die Mailingliste Trennmuster