[Trennmuster] Formale Qualitätssicherung?
Keno Wehr
wehr at abgol.de
Mo Sep 14 12:47:25 CEST 2020
Am 12.09.20 um 00:16 schrieb Selke, Gisbert W.:
>
> Liebe Mustler –
>
> Haben wir eigentlich eine Art „formaler Qualitätssicherung“ der
> Wortliste derart, dass sichergestellt wird, dass
> Änderungen/Hinzufügungen zur Liste bei der Trennmustererzeugung nicht
> zu Inkonsistenzen führen? („Inkonsistenz“ in dem Sinn, dass patgen im
> vorgegebenen Rahmen keine fehlerfreien Trennmuster mehr erzeugen kann.)
>
> Hintergrund meiner Frage ist, dass mir das beim Arbeiten an den
> Arzneiwirkstoffen mehrfach passiert ist. Ursache waren jeweils
> Tippfehler meinerseits.
>
> So ein QS-Prozess ließe sich ja skripten, er wird nur durch die
> diversen Freiheitsgrade bei der Mustererzeugung (AR/NR,
> Schweizerdeutsch, permissiv, …) erschwert, weil man streng genommen
> viele Varianten testen müsste.
>
>
Lieber Gisbert,
als Ergänzung zu Werners Antwort möchte ich auf die Skripte
„validate.lua“ und „umformatierung.py“ hinweisen.
„validate.lua“ (Aufruf: texlua skripte/validate.lua < dateiname) prüft
im Wesentlichen, ob alle Felder einer Zeile abgesehen von den
Trennzeichen gleich sind. Es ist derzeit nur bedingt brauchbar, da das
neue Trennzeichen „<·“ als Fehler eingeordnet wird. Trotzdem liefert die
Anwendung auf die momentane Arzneistoffliste im Repositorium einige
Hinweise auf echte Fehler.
Mit „umformatierung.py“ (Aufruf: ./skripte/umformatierung.py -k <
eingabedatei > ausgabedatei) kann man eine Wortliste ins Kurzformat
umwandeln (und zurück). Auch dies ist zur Fehlerkontrolle nützlich, da
das Kurzformat in der Regel mit einem einzigen Feld pro Zeile auskommt.
Wo es mehrere Felder gibt (also ein Semikolon in der Zeile auftaucht),
sollte man sich genau ansehen, ob in der Ausgangsdatei wirklich alles
stimmt. Auch dies liefert für die Arzneistoffliste mehrere Hinweise auf
Fehler, die uns beiden wohl bisher nicht aufgefallen sind.
Gruß
Keno
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <https://listi.jpberlin.de/pipermail/trennmuster/attachments/20200914/58323d21/attachment.htm>
Mehr Informationen über die Mailingliste Trennmuster