<html>
  <head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
  </head>
  <body>
    Am 06.10.21 um 10:42 schrieb Werner LEMBERG:
    <blockquote type="cite"
      cite="mid:20211006.104245.1510064646376207094.wl@gnu.org">
      <pre class="moz-quote-pre" wrap="">Wir könnten probeweise ein neues git-Repositorium aufsetzen, welches
auf dem Kurzformat basiert – aber bitte mit einer zusätzlichen
1. Spalte, welche das Wort ungetrennt enthält.  Ich könnte mir sogar
vorstellen, daß man ein Skript schreibt, um möglichst viele Commits
des jetztigen Repositoriums mitzunehmen, z.B. startend mit Einträgen
von vor einem Jahr.  Dann kann man sich die Repositorien anschauen und
vergleichen, was mit den Einträgen geschieht.</pre>
    </blockquote>
    <br>
    Ich weiß nicht so recht, was du dir davon versprichst. Die
    Konversionsskripte haben den Sinn, *denselben Wortbestand* in
    kompakterer Form darzustellen.<br>
    In zum Langformat expandierter Form sollten die Einträge also immer
    die gleichen sein, egal welches Format die Grundlage bildet.<br>
    <br>
    <br>
    <div class="moz-cite-prefix">Am 08.10.21 um 13:11 schrieb Guenter
      Milde:</div>
    <blockquote type="cite"
      cite="mid:20211008111119.GA6559@heinz.mythennetz">
      <blockquote type="cite">
        <pre class="moz-quote-pre" wrap="">Wir könnten probeweise ein neues git-Repositorium aufsetzen, welches
auf dem Kurzformat basiert – aber bitte mit einer zusätzlichen
1. Spalte, welche das Wort ungetrennt enthält.
</pre>
      </blockquote>
      <pre class="moz-quote-pre" wrap="">Dann brauchen wir allerdings auch verschiedene Zeilen bei verschiedener
Schreibung (daß/dass, Stofffetzen/Stoffetzen, ...).</pre>
    </blockquote>
    <br>
    Dafür sehe ich keine zwingende Notwendigkeit. Man könnte als
    Schlüssel stets das erste Feld nehmen, das nicht ausgekreuzt ist,
    also z. B.<br>
    <blockquote>Außenmaße;
      Au-ßen=ma-ße;Au-ßen=ma-ße;Aus-sen=mas-se;Au-ssen=ma[-s/s-]se<br>
Meßersatz;-1-;Meß=er<satz;-3-;Mes-ser=satz;Mes[-ser=/s=er<.]satz<br>
    </blockquote>
    Solche Fälle sind extrem selten.<br>
    Und natürlich dann auch:<br>
    <blockquote>dass;dass<br>
      Stofffetzen;Stoff=fet-zen<br>
    </blockquote>
    ohne separate Erwähnung von »daß« und »Stoffetzen«, da die AR-Formen
    automatisch generierbar sind.<br>
    Wenn wir noch nicht mal solche  Kürzungen nutzen, sehe ich in einem
    Kurzformat wenig Sinn.<br>
    <br>
    <blockquote type="cite">
      <pre class="moz-quote-pre" wrap="">Die Zusammenlegung der verschiedenen Schreibungen ist der aufwendigste
Teil der Konvertierung (was sowohl die Komplexität als auch die Laufzeit
des Skripts betrifft) aber spart nur 3,4% der Zeilen (502449 Zeilen in
wortliste werden 485 385).

Jedoch hilft sie beim Eintrag neuer Wörter, indem automatisch die
AR-Variante und die CH Variante dazukommen.
</pre>
    </blockquote>
    <br>
    Ja, für Neueinträge sollte das Kurzformat die erste Wahl sein. Die
    Frage ist nur, ob dieses dauerhaft ein Hilfsformat bleiben soll (als
    solches hat sich aus meiner Sicht schon sehr bewährt) oder ob wir es
    – in weiterentwickelter Form – gleich zur Grundlage machen.<br>
    <br>
    Gruß<br>
    Keno<br>
  </body>
</html>