[Trennmuster] Formale Qualitätssicherung?

Keno Wehr wehr at abgol.de
Mo Sep 14 12:47:25 CEST 2020


Am 12.09.20 um 00:16 schrieb Selke, Gisbert W.:
>
> Liebe Mustler –
>
> Haben wir eigentlich eine Art „formaler Qualitätssicherung“ der 
> Wortliste derart, dass sichergestellt wird, dass 
> Änderungen/Hinzufügungen zur Liste bei der Trennmustererzeugung nicht 
> zu Inkonsistenzen führen? („Inkonsistenz“ in dem Sinn, dass patgen im 
> vorgegebenen Rahmen keine fehlerfreien Trennmuster mehr erzeugen kann.)
>
> Hintergrund meiner Frage ist, dass mir das beim Arbeiten an den 
> Arzneiwirkstoffen mehrfach passiert ist. Ursache waren jeweils 
> Tippfehler meinerseits.
>
> So ein QS-Prozess ließe sich ja skripten, er wird nur durch die 
> diversen Freiheitsgrade bei der Mustererzeugung (AR/NR, 
> Schweizerdeutsch, permissiv, …) erschwert, weil man streng genommen 
> viele Varianten testen müsste.
>
>

Lieber Gisbert,
als Ergänzung zu Werners Antwort möchte ich auf die Skripte 
„validate.lua“ und „umformatierung.py“ hinweisen.
„validate.lua“ (Aufruf: texlua skripte/validate.lua < dateiname) prüft 
im Wesentlichen, ob alle Felder einer Zeile abgesehen von den 
Trennzeichen gleich sind. Es ist derzeit nur bedingt brauchbar, da das 
neue Trennzeichen „<·“ als Fehler eingeordnet wird. Trotzdem liefert die 
Anwendung auf die momentane Arzneistoffliste im Repositorium einige 
Hinweise auf echte Fehler.
Mit „umformatierung.py“ (Aufruf: ./skripte/umformatierung.py -k < 
eingabedatei > ausgabedatei) kann man eine Wortliste ins Kurzformat 
umwandeln (und zurück). Auch dies ist zur Fehlerkontrolle nützlich, da 
das Kurzformat in der Regel mit einem einzigen Feld pro Zeile auskommt. 
Wo es mehrere Felder gibt (also ein Semikolon in der Zeile auftaucht), 
sollte man sich genau ansehen, ob in der Ausgangsdatei wirklich alles 
stimmt. Auch dies liefert für die Arzneistoffliste mehrere Hinweise auf 
Fehler, die uns beiden wohl bisher nicht aufgefallen sind.

Gruß
Keno
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <https://listi.jpberlin.de/pipermail/trennmuster/attachments/20200914/58323d21/attachment.htm>


Mehr Informationen über die Mailingliste Trennmuster