[Trennmuster] Arzneistoffnamen -- letzte Abgleiche mit der Wortliste
Keno Wehr
wehr at abgol.de
Mi Aug 19 21:31:34 CEST 2020
Am 18.08.20 um 00:15 schrieb Guenter Milde:
> On 17.08.20, Selke, Gisbert W. wrote:
>> Am 16 Aug 2020 um 17:50:32 +0200 schrieb Guenter Milde <milde at users.sf.net>:
>>>> -Ketamin;Ket=a·min # Kurzwort (ein chirales Arylcyclohexylamin)
>>>> +Ketamin;Ket<a·min # pharm. KETon + AMIN
>>> Ich finde die normale Schreibung
>>> +Ketamin;Ket<a·min # pharm., Kurzwort < Keton + Amin
>>> schöner und aussagekräftiger. (Das Kennwort "Kurzwort" im Kommentar ist
>>> wichtig damit ein Sammel-Algorithmus weiß, das "Ket" keine "richtige"
>>> Vorsilbe ist.)
>> Die (optisch zugegebenermaßen hässliche) Versalienschreibweise habe ich
>> bei den Arzneistoffnamen durchgängig gewählt, um die Bestandteile
>> leichter nachvollziehbar zu machen; Ketamin ist ein sehr einfaches
>> Beispiel, bei dem das sicherlich nicht nötig wäre, bei anderen
>> erleichtert es, glaube ich, das schnelle Verständnis, wie das Wort
>> entstanden ist. Das kann ich aber gerne rückgängig machen und normale
>> Graphie verwenden, wenn das Konsens ist.
>> Den Zusatz "Kurzwort" habe ich für die Arzneistoffnamen bisher nicht
>> verwendet, weil das (in meinem Arzneimitteltunnelblick) bei der großen
>> Mehrzahl der Arzneistoffnamen einzubauen wäre (schätzungsweise mehrere
>> tausend Einträge) -- das ist nun mal die Art, wie die meisten dieser
>> Namen standardmäßig legosteinartig zusammengesetzt werden. Wegen der
>> Ubiquität trägt dieser Zusatz *in diesem Bereich* praktisch keinen Sinn
>> bei -- für einen menschlichen Leser.
> Das ändert sich bei der Einsortierung in eine Liste von > 300000 Wörtern.
Die Arzneimittelnamen enthalten sehr oft Präfixe, die nur in dieser
Fachsprache vorkommen. Die Filterung wäre über den Kommentar „pharm.“
möglich, ohne dass jedes Mal „Kurzwort“ ergänzt werden müsste.
>> Dabei war mir allerdings nicht bewusst, dass die Kommentare auch
>> algorithmisch analysiert werden. Das ändert die Bewertung natürlich,
>> dann kann der Zusatz praktisch relevant werden.
>> Soll ich das für die ca. 8000 Arzneistoffnamen, die jetzt im
>> wesentlichen "inkorporationsreif" sind, in diesem Sinne ergänzen? Kann
>> ich gerne machen!
> Ich befürchte hier ist zunächst noch einmal ein genaueres/grundsätzliches
> Überdenken der Auszeichnung nötig.
Um hierfür eine Diskussionsgrundlage zu haben, sollte die
Arzneimittelliste mit dem jetzigen Stand zunächst einmal im Repositorium
veröffentlicht werden.
Generell gibt es zur Auszeichnung einer Morphemgrenze in vielen Fällen
keine Alternative, da die Trennung (mit gutem Grund) den Grundregeln
widerspricht.
>> (Ich kann allerdings nicht garantieren, dass ich in jedem Einzelfall
>> die "Kunst-Etymologien" in dieser Weise aufgedröselt habe, weil ich die
>> auch nicht immer nachvollziehen konnte.
> Der Zusatz ist nur nötig, wenn durch "Morphemtrennstellen" (also < = >)
> "exotische" Morpheme ausgewiesen sind, die es ansonsten nicht in der
> deutschen Sprache gibt.
Wie gesagt, das betrifft einen Großteil der Arzneimittelnamen. Die
Filterung über den Kommentar „pharm.“ sollte aber genügen.
Sinnvollerweise könnten wir die Präfixlisten auch um eine eigene Liste
mit rein pharmazeutischen Präfixen ergänzen.
>> Es gibt außerdem Standard-Wortstämme (im Sinne von
>> https://www.drugs.com/inn-stems.html), wo nur ein Teil des "Kurzworts"
>> ein nachvollziehbar sinntragendes Element ist, z.B. Ro-fe<co-xib:
>> "Coxib" hat eine Bedeutung (COX-2-Inhibitor), "Rofe" meines Wissens
>> nicht.)
> Da haben wir also ein Kurzwort (Coxib) mit einem Kunstwort als
> Bestimmungswort. Ich würde hier Ro-fe=co-xib oder Ro-fe>co-xib schreiben.
> Ggf. sollte muss "Kunstwort" neben "Abk." und "Kurzwort" als weiterer
> Marker für exotische Bestandteile in unsere Kommentarsyntax aufgenommen
> werden.
Über solche Alternativen können wir gerne diskutieren.
Zunächst sollte aber bitte die gesamte Liste der Allgemeinheit zur
Verfügung gestellt werden.
Keno
Mehr Informationen über die Mailingliste Trennmuster