[Trennmuster] Neues Wortlistenformat
Guenter Milde
milde at users.sf.net
So Mai 17 20:50:32 CEST 2020
On 16.05.20, Keno Wehr wrote:
> > Dieses Format finde ich unglücklich gewählt, da es durch die Verschiebung
> > der alten Felder 2 bis 5 für alle Werkzeuge, die mehr als ein Feld
> > auslesen inkompatibel ist (sort.py ist da nur die Spitze des Eisbergs).
...
> > * Volle Rückwärtskompatibilität wäre mit der Verlegung des Grammatikfeldes
> > in den Kommentar erreichbar, z.B.
> > Aa=dorf # U # geogr. Name
> > -1-;an<ge<rauht # A
> Das gefällt mir nicht so. Das Wesen eines Kommentars ist, dass er von der
> Maschine ignoriert wird. Beim Umwandeln vom gramm. Kurzformat ins Kurzformat
> muss die Maschine aber gerade die Beugungsinformation auswerten.
Ja, dafür kann ich aber einfach sagen: im Grammatikformat ist "#" der
Trenner für das Grammatikfeld und, sagen wir, "!" das Kommentarzeichen:
Aa=dorf # U! geogr. Name
Dann können andere Skripte ohne Zusatzaufwand das Grammatikformat verarbeiten.
> Vielleicht können wir uns auf eine der folgenden Varianten einigen:
> -1-;an<ge<rauht:A # Doppelpunkt als Trennzeichen
> -1-;an<ge<rauht A # Leerzeichen als Trennzeichen
> -1-;an<ge<rauht(A) # Grammatikfeld in Klammern
> -1-;an<ge<rauht (A) # Klammern und Leerzeichen
> > In jedem Fall wäre es gut, auf die vorhandenen Transformationsregeln und
> > Wandelungsprogramme der Rechtschreibprüfprogramme aufzubauen.
> Es wäre sicher lohnenswert, sich das anzusehen, aber ich halte es nicht für
> zwingend erforderlich, da das grammatische Kurzformat nur eine interne
> Arbeitshilfe sein soll.
> Auf jeden Fall muss sichergestellt sein, dass bei der Umwandlung Kurzformat
> -> grammatisches Kurzformat -> Kurzformat wieder exakt das gleiche
> herauskommt. Ob man das mit externen Algorithmen hinbekommt, muss man sehen.
Ja.
Günter
Mehr Informationen über die Mailingliste Trennmuster