[Trennmuster] Trennstellenunterdrückung
Werner LEMBERG
wl at gnu.org
So Mai 20 16:45:05 CEST 2018
>> Danke. Ich denke, es wird wohl das beste sein, mein
>> »extract-tex.pl«-Skript in die Pension zu schicken und es durch
>> »sprachauszug.py« zu ersetzen, das doch deutlich flexibler ist.
>
> Das wäre eine Möglichkeit, aber
> * noch ist nicht alle Funktionalität da (es fehlen noch
> "Spezialtrennungen" ([a/b] und {a/b}) und
> * es ist sicherer zwei Implementierungen zu haben.
>
> Wenn die Zeit da ist, sollte extract-tex.pl durchaus weiterentwickelt
> werden...
OK.
>> Sprechsilben-Trennstellenauszeichnung, wenn wir nicht »ge-ri-...«
>> hinbekommen...
>
> Aber es klappt, auch ohne neues Trennzeichen:
>
> # >>> run_filters(['etymologisch'], u'ge-r<i-a-t-ri-sche')
> # u'ger<ia-tri-sche'
> # >>> run_filters(['modern'], u'ge-r<i-a-t-ri-sche')
> # u'ge-ri-at-ri-sche'
Sehr schön!
> Wir müssen uns noch überlegen, ob die unaussprechliche aber
> regelkonforme zusätzliche Trennung nach dem t in die "wortliste"
> soll.
Hm.
> Der Duden listet bei "abstrakt" zwar nur 2 Trennungen, aber je nach
> Kombination der Alternativen nach §112 und §113 gibt es drei
> Trennvarianten:
>
> # >>> run_filters(['etymologisch'], u'ab<s-t-rakt')
> # u'ab<strakt'
> # >>> run_filters(['modern'], u'ab<s-t-rakt')
> # u'abst-rakt'
Ehrlich gesagt schaut das saublöd aus.
> # >>> run_filters([syllabisch, fremdwortsilben], u'ab<s-t-rakt')
> # u'abs-trakt'
>
> Bei "Distrikt" hat übrigens auch der Duden alle 3 Varianten dabei:
>
> Von Duden empfohlene Trennung: Dis|trikt
> Alle Trennmöglichkeiten: Di|s|t|rikt
Mein Vorschlag: Wenn in Fremdwörtern bei »str« nach dem »s« getrennt
werden kann, gibt's keine Trennung nach dem »t«.
>> Anderes Beispiel ist »Fernabitur«.
>
> Das habe ich jetzt aufgenommen, aber auch da ist kein "doppelseitig
> ungünstiger" Flatterbuchstabe:
>
> Fernabitur;-2-;Fern=ab<.itur;Fern=ab<.i-tur
>
> mit den Varianten:
>
> # >>> run_filters(['etymologisch'], u'Fern=ab<.i-tur')
> # u'Fern=ab<.itur'
> # >>> run_filters(['modern'], u'Fern=ab<.i-tur')
> # u'Fern=abi-tur'
>
> Und nach entfernen der ungünstigen Stelle:
>
> # >>> run_filters(['etymologisch', 'standard'], u'Fern=ab<.i-tur')
> # u'Fern=abitur'
OK, überzeugt! Noch schöne Restfeiertage :-)
Werner
Mehr Informationen über die Mailingliste Trennmuster