[Trennmuster] neuer Arbeitsansatz
Stephan Hennig
sh-list at posteo.net
So Nov 6 12:45:35 CET 2016
Am 05.11.2016 um 22:27 schrieb Werner LEMBERG:
>
>>> * ob alle Felder eines Eintrags den gleichen "Schlüssel" haben
>>> sollen.
>>> * ob Einträge die sich aus Einträgen mit anderem Schlüssel
>>> generieren lassen (z.B. -1-;Faß=brau-se aus Fass=brau-se)
>>> weggelassen werden können/sollen.
>>
>> Von mir zweimal ja.
>
> Du meinst sicher nein/ja. Mit »Schlüssel« ist gemeint, daß alle
> Wörter in einer Zeile die exakt gleichen Buchstabenfolgen haben.
> Besser ist aber, wenn alle *zugehörigen* Wortformen (so sie manuell
> angegeben werden müssen) in einer Zeile stehen, so wie
>
> süß=sau-.er;süß=sau-.er;süss=sau-.er;süss=sau-.er;sü{ss/ss=s}au-er
Finde ich eigentlich gut, sofern es sich nur um ß-Ersatzschreibungen
handelt. Dagegen fände ich
Stän-gel;Sten-gel
schlecht. Falls das oben bereits klar war, habe ich es überlesen.
Zurück zu den ß-Ersatzschreibungen. Leider lässt die vorgeschlagene
Kodierung Raum für Kollisionen. Angenommen es existieren zwei Wörter
syyy und yyy wobei yyy mit einem Vokal beginnt. Des weiteren existieren
beide gültigen Zusammensetzungen mit einem Wort xxxß, also xxxß=syyy
sowie xxxß=yyy. Die Schweizer Form wäre in beiden Fällen xxxssyyy
abgeleitet aus zwei unterschiedlichen und auch nicht zusammengehörenden
Zeilen. In der Ableitung aus xxxß=yyy würde die Trennung xxxss-yyy
erlaubt, in der Ableitung aus xxxß=syyy dagegen nicht.
Ich weiß nicht, ob diese Kollision praktisch auftritt. Aber wie würden
wir damit umgehen:
* eine Ausnahmedatei
* die Ableitung aus xxxß=syyy ignorieren (Feld 5 explizit leer
notieren)
* Beide Wörter ignorieren?
Viele Grüße,
Stephan Hennig
Mehr Informationen über die Mailingliste Trennmuster