[Trennmuster] Entscheidungsmuster für Binnen- und Schluss-S in Frakturschriften

Werner LEMBERG wl at gnu.org
Mo Jan 30 10:40:23 CET 2012


>> > Der größte Teil der noch offenen Fälle kann durch Wichtung der
>> > Trennstellen (z.B. mit dem SiSiSi-Algorithmus) gelöst werden.
>
>> Das geht nur manuell, denn...
>
>> > Gibt es schon Ansätze, SiSiSi über die Wortliste laufen zu
>> > lassen?
>
>> dies ist bereits geschehen und eingebaut.
>
> Eventuell kann die Kombination SiSiSi + Kenntnis der (ungewichteten)
> Trennstellen helfen weitere Wörter automatisch zu wichten.

Ich verstehe nicht wirklich, was Du damit meinst.  Bitte gib ein
Beispiel.

>> >     Wie ist mit Trennungen nach übliche Vorsilben (aus-, bis-,
>> >     ...) zu verfahren: Haupt- oder Nebentrennstelle?
>
>> Ich betrachte diese Trennstellen als Haupttrennstellen.
>
> Sind dann die Nebentrennstellen nach "aus" von "aus-ba-lan-cier-tes"
> bis "Aus-rei-se|wil-li-gen" als Fehler anzusehen?

Ich ware zu salopp mit meiner Antwort: In der Wortliste gibt es
eigentlich keine Haupt- und Nebentrennstellen, sondern nur »gute« und
»schlechte« Trennstellen, also

  aus=ba-lan-cier-tes
  Aus=rei-se=wil-li-gen

Diese beiden Wörter sind in der Wortliste übrigens noch nicht
redigiert.  Da fehlt noch viel an Feinarbeit...

Theoretisch könnte man noch eine dritte Ebene einführen, nämlich
»wirklich gute« Trennstellen:

  Aus=rei-se|wil-li-gen

Es gibt aber viele Wörter, wo man streiten kann, wo »|« und wo »=« zu
plazieren ist.

> Leider sind die fehlenden Haupttrennstellen in zweisilbigen Wörtern
> für die automatische ſ-Umstellung problematisch: Auch in
> zweisilbigen Wörtern muß ein s=t st bleiben, aber ein s-t zu ſt
> werden.

Also mir wär's lieber, wenn man »s-t« und »s=t« speziell behandelt, wo
es notwendig ist – ich denke mal, die Anzahl der zweisilbigen Wörter
mit »s=t« ist überschaubar – und alles andere so beläßt wie es ist.

> Ich schlage vor, die "Ur-Liste" in "Rundschreibung" zu belassen, da
> ich denke, daß sie dann einfacher zu lesen und zu pflegen
> ist. (Anwender, die die Liste in Frakturschrift
> betrachten/bearbeiten dürften in der Unterzahl sein. ;-) Mitwirkende
> die neue Trennstellen beitragen müssen sich dann nicht auch noch um
> die korrekte S-Schreibung sorgen.

Das ist richtig, aber...

> Auch wenn die Konversion in s->ſ Richtung deutlich komplexer ist,
> läßt sie sich auf der Basis von gewichteten Trennstellen weitgehend
> automatisch erledigen.  Unklare Fälle kann dann ein ſ-Experte über
> Ausnahmelisten und verbesserte Ersetzungsregeln lösen.

... da habe ich doch große Bedenken wegen des Arbeitsaufwandes.

> Aber es bleibt die Frage, ob untrennbare Abkürzungen und falsch
> geschriebene Maßeinheiten (nach SI ms und nicht msec) überhaupt in
> eine Trennmusterliste gehören.

Ich denke schon.

>> Bitte schick doch das Skript an die Liste!
>
> Gern.

Danke!


    Werner


Mehr Informationen über die Mailingliste Trennmuster