[Trennmuster] Fehlerchen in `sprachauszug.py` bei Gesangstrennungen?

Werner LEMBERG wl at gnu.org
Do Mär 16 13:44:13 CET 2023


Lieber Günter!


Wenn ich den Eintrag

```
Psychiater;-2-;Psych<i·a-ter;Psy-ch<i.a-ter
```

in eine Datei `zzz` gebe und dann

```
sprachauszug.py -l "de-1996,de-1996-x-versal" \
                -s "morphemisch,gesangstext,einfach" < zzz
```

aufrufe, bekomme ich `Psych-i-a-ter`.  Stimmt das?  Ich hätte
stattdessen `Psych-ia-ter` erwartet:

* Im morphemischen Stil löst sich »-ch<« zu »ch<« auf.

  → Psych<i.a-ter

* Entferne Schwankungsfälle.

  → Psych<ia-ter

* Konvertiere alles zu »-«.

  → Psych-ia-ter

Das vergleichbare Wort `Ha-wai-i.a-ner` wird von `sprachauszug.py`
dagegen zu `Ha-wai-ia-ner` aufgelöst...


    Werner




Mehr Informationen über die Mailingliste Trennmuster