[Trennmuster] Python-Skript wortzerlegung.py
Werner LEMBERG
wl at gnu.org
Fr Okt 23 08:43:28 CEST 2020
>> > und deutliche Schwierigkeiten mit `git diff`.
>
>> Wieso?
>
> Weil ich, wenn ich dann 3 bis 4 Formate habe (1 Datei Langformat,
> kleine Dateien Langformat, 1 Datei Kurzformat, kleine Dateien
> Kurzformat), an denen gearbeitet werden kann und wo zu entscheiden
> ist, welches das aktuellste ist aber nur "kleine Dateien Kurzformat"
> kann über git diff mit dem Repositorium verglichen werden.
Ich verstehe Deine Argumentation nicht. Derzeit kannst Du ja auch nur
ein Format mittels »git diff« vergleichen, oder? Durch die
Bereitstellung eines passenden Skripts würde sich das nicht ändern.
Oder übersehe ich da was?
>> Das haben wir doch schon besprochen: Sobald Nebenformen automatisch
>> erzeugt werden können, fällt dies weg.
>
> Und bis dahin ist es im Weg. Ich komme jedenfalls mit der
> Zweitkontrolle von neuen Eintragsschüben nicht mehr hinterher.
Entschuldige, aber ich glaube, Du übertreibst hier deutlich :-) Ich
behaupte jetzt mal, von den Einträgen, die ich beisteuere, sind nur
ein kleiner Teil (geschätzt 20%, wenn überhaupt) Nebenformen. Ich
hatte Zeit und war daher produktiv. Du klingst fast, als ob ich
weniger hätte tun sollen...
> Und mit automatischen Nebenformen bekommen wir 4 neue Varianten --
> die 4 obgenannten dann jeweils in "Nebenformen explizit" und
> "Nebenformen automatisch". Da den Überblick zu behalten, welche
> Änderungen von wo die aktuellen sind und andere überschreiben dürfen
> wird eine Herausforderung.
Ja, das müssen wir dann viribus unitis durchschauen. Ich sehe nichts
schlechtes dabei – garantiert finden wir Fehler zuhauf, und wir
entwickeln ein Gefühl dafür, was noch geändert und angepaßt werden
muß.
>> Ich denke, das ist deswegen so, weil ich mich mit meinen Commits
>> auf *einfache* Komposita beschränkt habe. Komposita mit mehr als
>> zwei Komponenten werden entsprechend besser getrennt.
>
> Ich denke allerdings, es ist vor allem deswegen so, weil ich gezielt
> nach falsch getrennten Wörtern gesucht habe und jeweils nur die
> Stammform oder noch eine Ableitung mit Umlaut eingetragen habe.
Pfft. Ich ergänze ja auch nur Wörter, die falsch getrennt werden (und
ab und zu Nebenformen). Wo ist der Unterschied?
Werner
Mehr Informationen über die Mailingliste Trennmuster