[Trennmuster] Neues Wortlistenformat

Guenter Milde milde at users.sf.net
So Mai 17 20:50:32 CEST 2020


On 16.05.20, Keno Wehr wrote:

> > Dieses Format finde ich unglücklich gewählt, da es durch die Verschiebung
> > der alten Felder 2 bis 5 für alle Werkzeuge, die mehr als ein Feld
> > auslesen inkompatibel ist (sort.py ist da nur die Spitze des Eisbergs).

...

> > * Volle Rückwärtskompatibilität wäre mit der Verlegung des Grammatikfeldes
> >    in den Kommentar erreichbar, z.B.
> >      Aa=dorf # U # geogr. Name
> >      -1-;an<ge<rauht # A

> Das gefällt mir nicht so. Das Wesen eines Kommentars ist, dass er von der
> Maschine ignoriert wird. Beim Umwandeln vom gramm. Kurzformat ins Kurzformat
> muss die Maschine aber gerade die Beugungsinformation auswerten.

Ja, dafür kann ich aber einfach sagen: im Grammatikformat ist "#" der
Trenner für das Grammatikfeld und, sagen wir, "!" das Kommentarzeichen:

     Aa=dorf # U! geogr. Name

Dann können andere Skripte ohne Zusatzaufwand das Grammatikformat verarbeiten.

> Vielleicht können wir uns auf eine der folgenden Varianten einigen:
> -1-;an<ge<rauht:A # Doppelpunkt als Trennzeichen
> -1-;an<ge<rauht A # Leerzeichen als Trennzeichen
> -1-;an<ge<rauht(A) # Grammatikfeld in Klammern
> -1-;an<ge<rauht (A) # Klammern und Leerzeichen

> > In jedem Fall wäre es gut, auf die vorhandenen Transformationsregeln und
> > Wandelungsprogramme der Rechtschreibprüfprogramme aufzubauen.

> Es wäre sicher lohnenswert, sich das anzusehen, aber ich halte es nicht für
> zwingend erforderlich, da das grammatische Kurzformat nur eine interne
> Arbeitshilfe sein soll.

> Auf jeden Fall muss sichergestellt sein, dass bei der Umwandlung Kurzformat
> -> grammatisches Kurzformat -> Kurzformat wieder exakt das gleiche
> herauskommt. Ob man das mit externen Algorithmen hinbekommt, muss man sehen.

Ja.

Günter



Mehr Informationen über die Mailingliste Trennmuster