[Trennmuster] Trennstellenunterdrückung
Werner LEMBERG
wl at gnu.org
Sa Mai 19 09:13:18 CEST 2018
>> Hat jemand von Euch schon Trennmuster erzeugt und dort Fehler
>> gesucht?
>
> Nein, das ist nicht mein Spezialgebiet. Aber ich habe Eingangsdaten
> für patgen erzeugt (mit sprachauszug.py) und werde das noch weiter
> ausbauen und testen.
Danke. Ich denke, es wird wohl das beste sein, mein
»extract-tex.pl«-Skript in die Pension zu schicken und es durch
»sprachauszug.py« zu ersetzen, das doch deutlich flexibler ist.
>> Im Besonderen: funktioniert die Fremdwort-Automatik, sodaß das »t«
>> ans »r« angebunden wird, wenn man etymologisch trennen will?
>
> Ja. Siehe fremdwortsilben() in wortliste.py.
>
> fremdwortsilben(wort):
> ger<i-a-t-ri-sche -> ger<i-a-tri-sche
> fremdwortsilben(wort, 'modern'):
> ger<i-a-t-ri-sche -> ger<i-at-ri-sche
>
> Komplett "wie früher" wird es durch Wahl des "etymologischen"
> Trennstils in sprachauszug.py:
>
> # >>> etymologisch(u'ger<i-a-t-ri-sche')
> # u'ger<ia-tri-sche'
Das schaut alles sehr gut aus, danke!
> Aber wir können auch anders:
>
> # >>> modern(u'ger<i-a-t-ri-sche')
> # u'geri-at-ri-sche'
Warum nicht »ge-ri-at-ri-sche«? Was genau hindert uns daran, bei der
»modernen« Trennung nach »ge« nicht ebenfalls zu trennen? Oder anders
gefragt (wie schon in meiner letzten E-Mail), warum fehlt diese
Trennstelle in »wortliste«?
> Wegen der verdunkelten Vorsilbe ändert sich die Auszeichnung in der
> "wortliste" für NR:
>
> ger<ia… --> ger<i-a…
>
> Es gibt eine alternative Wahltrennstelle aber die Trennung an der
> Morphemgrenze ist weiterhin eine Trennung an der Morphemgrenze also
> mit "<" auszuzeichnen.
Vielleicht für die Sprechsilbentrennung in NR
ge-r<.i-a... ?
»duden.de« gibt übrigens »ge|r|i|a|t|risch« für alle möglichen
Trennstellen an.
Meiner Meinung nach fehlt irgendwas bei der
Sprechsilben-Trennstellenauszeichnung, wenn wir nicht »ge-ri-...«
hinbekommen...
> [...]
>
> Ich schlage eine "pragmatische" Auszeichnung vor:
>
> abstrakt;-2-;ab<strakt;ab<s-trakt # < lat. ab+ s + trahere
>
> Abszess;-2-;-3-;Ab<szess;Ab<s-zess # lat. ab + s + cēdere
Ja.
>> Falls der Fall »-.x-.« auftritt, soll meiner Meinung nach »·« den
>> »alternativen Flatterbuchstaben« darstellen, z.B. »-.x·«.
>
> Dann kommt es also in An<woh-ner=in<.i-ti-a-ti-ve gar nicht vor. Wo
> wäre es denn hilfreich/nötig?
Statt »-« könnte auch »[<>=]« stehen. Anderes Beispiel ist
»Fernabitur«.
> Ich werd an "sprachauszug.py" basteln und testen und sehen, wie weit
> wir ohne spezielle Marker kommen. Dann haben wir auch ein besseres
> Gefühl, was wirklich hilfreich sein kann.
Danke!
Werner
Mehr Informationen über die Mailingliste Trennmuster