[Trennmuster] Fragen zu »sprachauszug.py«

Guenter Milde milde at users.sf.net
Mi Aug 22 00:56:32 CEST 2018


On 21.08.18, Werner LEMBERG wrote:

> * Option »--sprachtags« gibt u.a. »key« aus.  Soll das so sein?  Wenn
>   ja, was ist das?

Nein. Das ist der Schlüssel, i.e. das ungetrennte Wort in Spalte 1.

> * Ich empfehle die Hilfeausgabe

>     -l SPRACHE, --language SPRACHE

>   in

>     -l SPRACHE[,SPRACHE...], --language SPRACHE[,SPRACHE...]

>   zu ändern.

> * Sprachtags werden mit »,« getrennt, während Stile mit »-« getrennt
>   werden.  Ich fände es gut, wenn letztere aus Konsistenzgründen
>   ebenfalls mit »,« getrennt würden, wenn nichts dagegenspricht.

Erledigt. Danke für den Hinweis.



> * Es schaut so aus, als ob »sprachauszug.py« für »de-CH-1901« das
>   falsche Feld nimmt (nämlich Feld 7 statt Feld 6):

de-CH-1901 bezeichnet Deutsch, wie in der Schweiz nach den Regeln 
von 1901 geschrieben, also das Feld 8: 

   Falls Feld 5 leer und nicht identisch mit Feld 6, Trennung
   nach (deutsch)schweizerischer, traditioneller Rechtschreibung
   mit Trennung von „ss“, auch wenn es für „ß“ steht.

>     echo "Strasse;-2-;-3-;-4-;-5-;Stra-sse;Stras-se;Stras-se" \
>     | ./sprachauszug.py -l de-CH-1901

>     => Stras-se

Haut doch hin, oder?

> * Für »de-x-versal« fehlt die Ausgabe komplett:

>     echo "Strasse;-2-;-3-;-4-;-5-;Stra-sse;Stras-se;Stras-se" \
>     | ./sprachauszug.py -l de-x-versal

>     =>

In der Langform gibt es mehr Spalten und damit auch mehr Sprachtags: "de"
und "de-x-versal" bezeichnen in der Langform die "allgemeingültige" Form
(Felder 2 und 5). Bei Strasse gibt es die nicht. Für die aktuelle
Versalform muss im Langformat 'de-1996-x-versal' oder 'de-CH-1996'
gewählt werden.

Bei Fluss geht es:

  echo "Fluss;-2-;-3-;Fluss;Fluss"  | ./sprachauszug.py -l de-x-versal
  Fluss
  
Viele Grüße

Günter  





Mehr Informationen über die Mailingliste Trennmuster