[Trennmuster] Entscheidungsmuster für Binnen- und Schluss-S in Frakturschriften
Werner LEMBERG
wl at gnu.org
Mo Jan 30 10:40:23 CET 2012
>> > Der größte Teil der noch offenen Fälle kann durch Wichtung der
>> > Trennstellen (z.B. mit dem SiSiSi-Algorithmus) gelöst werden.
>
>> Das geht nur manuell, denn...
>
>> > Gibt es schon Ansätze, SiSiSi über die Wortliste laufen zu
>> > lassen?
>
>> dies ist bereits geschehen und eingebaut.
>
> Eventuell kann die Kombination SiSiSi + Kenntnis der (ungewichteten)
> Trennstellen helfen weitere Wörter automatisch zu wichten.
Ich verstehe nicht wirklich, was Du damit meinst. Bitte gib ein
Beispiel.
>> > Wie ist mit Trennungen nach übliche Vorsilben (aus-, bis-,
>> > ...) zu verfahren: Haupt- oder Nebentrennstelle?
>
>> Ich betrachte diese Trennstellen als Haupttrennstellen.
>
> Sind dann die Nebentrennstellen nach "aus" von "aus-ba-lan-cier-tes"
> bis "Aus-rei-se|wil-li-gen" als Fehler anzusehen?
Ich ware zu salopp mit meiner Antwort: In der Wortliste gibt es
eigentlich keine Haupt- und Nebentrennstellen, sondern nur »gute« und
»schlechte« Trennstellen, also
aus=ba-lan-cier-tes
Aus=rei-se=wil-li-gen
Diese beiden Wörter sind in der Wortliste übrigens noch nicht
redigiert. Da fehlt noch viel an Feinarbeit...
Theoretisch könnte man noch eine dritte Ebene einführen, nämlich
»wirklich gute« Trennstellen:
Aus=rei-se|wil-li-gen
Es gibt aber viele Wörter, wo man streiten kann, wo »|« und wo »=« zu
plazieren ist.
> Leider sind die fehlenden Haupttrennstellen in zweisilbigen Wörtern
> für die automatische ſ-Umstellung problematisch: Auch in
> zweisilbigen Wörtern muß ein s=t st bleiben, aber ein s-t zu ſt
> werden.
Also mir wär's lieber, wenn man »s-t« und »s=t« speziell behandelt, wo
es notwendig ist – ich denke mal, die Anzahl der zweisilbigen Wörter
mit »s=t« ist überschaubar – und alles andere so beläßt wie es ist.
> Ich schlage vor, die "Ur-Liste" in "Rundschreibung" zu belassen, da
> ich denke, daß sie dann einfacher zu lesen und zu pflegen
> ist. (Anwender, die die Liste in Frakturschrift
> betrachten/bearbeiten dürften in der Unterzahl sein. ;-) Mitwirkende
> die neue Trennstellen beitragen müssen sich dann nicht auch noch um
> die korrekte S-Schreibung sorgen.
Das ist richtig, aber...
> Auch wenn die Konversion in s->ſ Richtung deutlich komplexer ist,
> läßt sie sich auf der Basis von gewichteten Trennstellen weitgehend
> automatisch erledigen. Unklare Fälle kann dann ein ſ-Experte über
> Ausnahmelisten und verbesserte Ersetzungsregeln lösen.
... da habe ich doch große Bedenken wegen des Arbeitsaufwandes.
> Aber es bleibt die Frage, ob untrennbare Abkürzungen und falsch
> geschriebene Maßeinheiten (nach SI ms und nicht msec) überhaupt in
> eine Trennmusterliste gehören.
Ich denke schon.
>> Bitte schick doch das Skript an die Liste!
>
> Gern.
Danke!
Werner
Mehr Informationen über die Mailingliste Trennmuster