[Trennmuster] Neuorganisation des Skript-Verzeichnisses
Stephan Hennig
sh-list at posteo.net
Di Sep 29 19:03:14 CEST 2020
[FQ+CC]
Am 29.09.20 um 16:39 schrieb Guenter Milde:
> On 27.09.20, Stephan Hennig wrote:
>> Am 26.09.20 um 23:59 schrieb Keno Wehr:
>
>>> Hier noch mal eine leicht aktualisierte Vorschlagsliste für die Neuordnung:
>>>
>>> skripte/trennmuster/dokumentation/
>>> * diff-patgen-input.awk
>>> * diff-patgen-input.sh
>
>> Ich wollte darauf nochmal in der Diskussion zu formellen
>> Prüfmöglichkeiten eingehen, denn dieses Skript ermöglicht den Vergleich
>> der Patgeneingabe zweier unterschiedlicher Commits. Interessant ist
>> nicht nur die Eingabe der ersten Patgenstufe, sondern auch der Vergleich
>> der Eingaben der weiteren Stufen. Mitunter machen sich fehlerhafte
>> Wörter nämlich dadurch bemerkbar, dass Patgen mit ihnen länger zu tun
>> hat als zuvor.
>
>> Jetzt fällt mir auch auf, weshalb du als Ordner dokumentation/
>> vorschlägst. :-) Weil am Ende auch die Tabelle mit korrigierten,
>> hinzugefügten und entfernten Wörtern abfällt. Das ist aber nur eine
>> nette Dreingabe. Der Zweck des Skripts ist eigentlich der zuvor
>> genannte. Ein eigener Ordner dokumentation/ wäre daher nicht ideal.
>
> Ich habe jetzt probiert, damit den diff zur letzten Veröffentlichung zu
> erreichen, aber
>
> sh skripte/diff-patgen-input.sh "dehyph-exptl-v0.6"
>
> schlug mit
>
> skripte/diff-patgen-input.sh: 46: skripte/diff-patgen-input.sh: typeset: not found
> skripte/diff-patgen-input.sh: 47: skripte/diff-patgen-input.sh: Bad substitution
>
> fehl. Mit
>
> bash skripte/diff-patgen-input.sh "dehyph-exptl-v0.6"
>
> ging es dann.
Das Skript stammt noch aus der Zeit als ich die Shell aus Git for
Windows verwendet habe. Das scheint immer Bash gewesen zu sein. Ich
werde das bei Gelegenheit anpassen.
> Aber was it eine Translate-Datei für Patgen?
>
> # gawk -v ftr=<translate datei> ...
Diejenige, die patgen sagt, welche Groß- auf welche Kleinbuchstaben
abgebildet werden. Darum brauchst du dich aber nicht zu kümmern, das
Shellskrip ruft das AWK-Skript schon entsprechend auf:
> gawk -f skripte/diff-patgen-input.awk -v ftr=daten/german.tr ${OUTPUTDIR}/$dehyph/$difffile
Im Skript wird die Translate-Datei verwendet, um alle Wörter in
Kleinbuchstaben zu wandeln, um dann wiederum Wörter mit geänderter
Trennung von solchen nur mit geänderter Großschreibung zu unterscheiden.
Man könnte dafür auch tr oder iconv oder eine sonstige UTF-8-fähige
Funktion verwenden. Dass ich die Translate-Datei verwende, liegt
wiederum an Git for Windows, wo es immer wieder Probleme mit iconv und
tr gab. Vielleicht übersetzte ich das Skript auch mal nach texlua ...
Außerdem habe ich nun festgestellt, dass das Skript doch nur jeweils die
erste Eingabedatei für Patgen erstellt. Ich erinnere mich aber auch an
ein Skript, welches für die ausgecheckten Commits Patgen automatisch
ausführt, so dass man auch die Eingabelisten höherer Listen vergleichen
konnte.
Viele Grüße,
Stephan Hennig
PS: Der Verzeichnisname +++diff-patgen-input+++ dürfte der Sortierung im
Dateimanager unter Windows geschuldet sein, damit das Verzeichnis immer
oben landet. :-)
Mehr Informationen über die Mailingliste Trennmuster