[Trennmuster] neuer Arbeitsansatz

Mi Okt 26 09:20:45 CEST 2016

Lieber Werner, liebe Trennfreunde,

On 25.10.16, Werner LEMBERG wrote:

...

> > Bei meinem Lang-S Skripten sehe ich das Problem der Konvertierung
> > einfach (nur s) -> kompliziert (ſ und s).  Die Gegenrichtung ist
> > trivial.  Ebenso wäre de-1901->de-1996 einfacher als
> > de-1996->de-1901.  Andererseits ist die Verwendung einer veralteten
> > Rechtschreibung als "Urtext" auch problematisch.

> Nun ja, wir leben im Jahr 2016, und vielen Menschen ist die
> reformierte Rechtschreibung bereits in Fleisch und Blut übergegangen –
> oder sind nur mit ihr aufgewachsen.  Aus diesem Grund kann meiner
> Meinung die traditionelle Variante nicht als Grundlage genommen
> werden.

Eben. Es bleibt also nur die "fragile", komplexe Wandlung de-1996->de-1901,
welche erst nach ausgiebigem Testen als zuverlässig arbeitend angenommen
werden kann.

Ich sehe natürlich auch die Vorteile eines vereinfachten Datenformats.
Wenn nach einer Testphase klar ist, dass die "original wortliste" aus der
"Reformliste"+Ausnahmenliste zuverlässig fehlerfrei rekonstruiert werden
kann begrüße ich dem Umstieg auf die Reformliste als Quelldatei.

...

Anders sehe ich es mit der Aufteilung:

+1 git blame geht schneller

   z.Zt. liefert `git blame -L "2300,+1" wortliste`
   auf meinem etwas älterem Rechner bei gleichzeitigem patgen-Lauf nach ca.
   1 min
   bc77ba4b (Guenter Milde 2014-03-07 09:47:54 +0100 2300) Abfallentsorgungsgesellschaft;Ab<fall=ent<sor-gungs=ge<sell>schaft

-1 alle Editieraufgaben werden umständlicher (brauchen mehr Nachdenken,
   mehr Zeit, Spezialtools, ...)

   Das ist insbesondere bei kleineren Korrekturen die jetzt im Texteditor
   mit den Standardwerkzeugen (Suche, regexp-Replace) gehen ein deutlicher
   Nachteil.

Die Frage ist, was wird öfter gebraucht? 

Und, wie langsam wäre `blame`, wenn wir das schon mal angedachte "aspell
format" für die Ableitungen verwenden? Bei de_DE.dic gibt es damit eine
Reduktion von 350 000 auf 75 000 Einträge, also auf 20%.

...

> > Ich müsste wahrscheinlich die git Aufrufe "wrappen" um bei mir eine
> > Datei stehen zu haben. Alles in allem auf jeden Fall komplizierter
> > als einfach
> >  
> >    xjed wortliste

> Wie wär's mit einem Shell-Skript »xjedwl« folgenden Inhalts
> (ungetestet).
...

Immer noch deutlich komplizierter, ich müßte bei jedem Aufruf vorher dran
denken, ob ich evt. auch die Wortliste bearbeiten will.
Ein automatischer Abgleich der vollständigen Liste beim Laden und der
Einzellisten beim Speichern wäre eine mögliche Lösung. Immer noch
komplizierter aber evt. nicht mehr so sehr "arbeitsverhindernd".

Ich mags nicht aber könnte damit leben.
Könnte wenigstens die Ausnahmeliste zusammenhängend bleiben?

Viele Grüße

Günter