[Trennmuster] Trennstellenunterdrückung

Werner LEMBERG wl at gnu.org
Sa Mai 19 09:13:18 CEST 2018


>> Hat jemand von Euch schon Trennmuster erzeugt und dort Fehler
>> gesucht?
> 
> Nein, das ist nicht mein Spezialgebiet. Aber ich habe Eingangsdaten
> für patgen erzeugt (mit sprachauszug.py) und werde das noch weiter
> ausbauen und testen.

Danke.  Ich denke, es wird wohl das beste sein, mein
»extract-tex.pl«-Skript in die Pension zu schicken und es durch
»sprachauszug.py« zu ersetzen, das doch deutlich flexibler ist.

>> Im Besonderen: funktioniert die Fremdwort-Automatik, sodaß das »t«
>> ans »r« angebunden wird, wenn man etymologisch trennen will?
> 
> Ja. Siehe fremdwortsilben() in wortliste.py.
> 
> fremdwortsilben(wort): 
>          ger<i-a-t-ri-sche -> ger<i-a-tri-sche
> fremdwortsilben(wort, 'modern'): 
>          ger<i-a-t-ri-sche -> ger<i-at-ri-sche
> 
> Komplett "wie früher" wird es durch Wahl des "etymologischen"
> Trennstils in sprachauszug.py:
> 
> # >>> etymologisch(u'ger<i-a-t-ri-sche')
> # u'ger<ia-tri-sche'

Das schaut alles sehr gut aus, danke!

> Aber wir können auch anders:
> 
> # >>> modern(u'ger<i-a-t-ri-sche')
> # u'geri-at-ri-sche'

Warum nicht »ge-ri-at-ri-sche«?  Was genau hindert uns daran, bei der
»modernen« Trennung nach »ge« nicht ebenfalls zu trennen?  Oder anders
gefragt (wie schon in meiner letzten E-Mail), warum fehlt diese
Trennstelle in »wortliste«?

> Wegen der verdunkelten Vorsilbe ändert sich die Auszeichnung in der
> "wortliste" für NR:
> 
>    ger<ia…  -->  ger<i-a…
>    
> Es gibt eine alternative Wahltrennstelle aber die Trennung an der
> Morphemgrenze ist weiterhin eine Trennung an der Morphemgrenze also
> mit "<" auszuzeichnen.

Vielleicht für die Sprechsilbentrennung in NR

  ge-r<.i-a...   ?

»duden.de« gibt übrigens »ge|r|i|a|t|risch« für alle möglichen
Trennstellen an.

Meiner Meinung nach fehlt irgendwas bei der
Sprechsilben-Trennstellenauszeichnung, wenn wir nicht »ge-ri-...«
hinbekommen...

> [...]
>
> Ich schlage eine "pragmatische" Auszeichnung vor:
> 
>     abstrakt;-2-;ab<strakt;ab<s-trakt # < lat. ab+ s + trahere
> 
>     Abszess;-2-;-3-;Ab<szess;Ab<s-zess # lat. ab + s + cēdere

Ja.

>> Falls der Fall »-.x-.« auftritt, soll meiner Meinung nach »·« den
>> »alternativen Flatterbuchstaben« darstellen, z.B. »-.x·«.
> 
> Dann kommt es also in An<woh-ner=in<.i-ti-a-ti-ve gar nicht vor. Wo
> wäre es denn hilfreich/nötig?

Statt »-« könnte auch »[<>=]« stehen.  Anderes Beispiel ist
»Fernabitur«.

> Ich werd an "sprachauszug.py" basteln und testen und sehen, wie weit
> wir ohne spezielle Marker kommen.  Dann haben wir auch ein besseres
> Gefühl, was wirklich hilfreich sein kann.

Danke!


   Werner




Mehr Informationen über die Mailingliste Trennmuster