[Trennmuster] Ligaturaufbruchmuster

Guenter Milde milde at users.sf.net
Mo Sep 21 14:10:22 CEST 2020


Lieber Keno,

On 20.09.20, Keno Wehr wrote:
> Am 04.07.20 um 11:16 schrieb Guenter Milde:
...
> > Die aktuellen "major" Muster (alles mit '<', '=', '>' müssten bereits als
> > Grundlage für den Ligaturaufbruch taugen.

> gerade bin ich dabei, mich mit Stephans padrinoma-Projekt
> (https://github.com/sh2d/padrinoma) auseinanderzusetzen (dazu demnächst
> mehr).

> Die die Ligaturaufbruchmuster in seinem Repositorium veraltet sind, habe ich
> nach deinem Vorschlag neue erstellt:
> make major pattern-trad

Warum willst Du mit Mustern für die veraltete Rechtschreibung anfangen?

> Auf den ersten Blick sah es so aus, als erhielte man damit den Aufbruch an
> den erwarteten Stellen, aber es gab in Stephans Testdatei zwei
> Problemwörter, bei denen eine Ligatur fälschlich aufgebrochen wurde: die
> ff-Ligatur in „chauffierender“ und die Spezialligatur tz in „schmatzende“.

> Eine erste Analyse lässt vermuten, dass das Makefile alle Wortlisteneinträge
> aussortiert, die nur einfache Trennzeichen enthalten (darunter eben auch
> „chauffierender“ und „schmatzende“), sodass patgen gar nicht wissen kann,
> dass diese Wörter keine „Trennstelle“ (Ligaturaufbruchstelle) enthalten
> dürfen.

Scheint so. Ich habe jetzt ein neues Make-Ziel erstellt, dass eine passende
Eingabedatei für patgen erzeugen sollte. Nach

  make exzerpte/de-1996-x-morphemgrenzen

sollte exzerpte/de-1996-x-morphemgrenzen einen Startpunkt für Ligaturaufbruch 
bieten. Ein analoges Ziel für AR kannst Du bei Bedarf leicht erstellen
(de-1996 -> de-1901).

Ich hoffe das hilft weiter.

Günter



Mehr Informationen über die Mailingliste Trennmuster