[Trennmuster] Fragen zu »sprachauszug.py«
Guenter Milde
milde at users.sf.net
Mi Aug 22 00:56:32 CEST 2018
On 21.08.18, Werner LEMBERG wrote:
> * Option »--sprachtags« gibt u.a. »key« aus. Soll das so sein? Wenn
> ja, was ist das?
Nein. Das ist der Schlüssel, i.e. das ungetrennte Wort in Spalte 1.
> * Ich empfehle die Hilfeausgabe
> -l SPRACHE, --language SPRACHE
> in
> -l SPRACHE[,SPRACHE...], --language SPRACHE[,SPRACHE...]
> zu ändern.
> * Sprachtags werden mit »,« getrennt, während Stile mit »-« getrennt
> werden. Ich fände es gut, wenn letztere aus Konsistenzgründen
> ebenfalls mit »,« getrennt würden, wenn nichts dagegenspricht.
Erledigt. Danke für den Hinweis.
> * Es schaut so aus, als ob »sprachauszug.py« für »de-CH-1901« das
> falsche Feld nimmt (nämlich Feld 7 statt Feld 6):
de-CH-1901 bezeichnet Deutsch, wie in der Schweiz nach den Regeln
von 1901 geschrieben, also das Feld 8:
Falls Feld 5 leer und nicht identisch mit Feld 6, Trennung
nach (deutsch)schweizerischer, traditioneller Rechtschreibung
mit Trennung von „ss“, auch wenn es für „ß“ steht.
> echo "Strasse;-2-;-3-;-4-;-5-;Stra-sse;Stras-se;Stras-se" \
> | ./sprachauszug.py -l de-CH-1901
> => Stras-se
Haut doch hin, oder?
> * Für »de-x-versal« fehlt die Ausgabe komplett:
> echo "Strasse;-2-;-3-;-4-;-5-;Stra-sse;Stras-se;Stras-se" \
> | ./sprachauszug.py -l de-x-versal
> =>
In der Langform gibt es mehr Spalten und damit auch mehr Sprachtags: "de"
und "de-x-versal" bezeichnen in der Langform die "allgemeingültige" Form
(Felder 2 und 5). Bei Strasse gibt es die nicht. Für die aktuelle
Versalform muss im Langformat 'de-1996-x-versal' oder 'de-CH-1996'
gewählt werden.
Bei Fluss geht es:
echo "Fluss;-2-;-3-;Fluss;Fluss" | ./sprachauszug.py -l de-x-versal
Fluss
Viele Grüße
Günter
Mehr Informationen über die Mailingliste Trennmuster