[Trennmuster] Korrekturen zu »1300 Neueinträge«

Guenter Milde milde at users.sf.net
Sa Apr 14 19:34:03 CEST 2018


On 14.04.18, Werner LEMBERG wrote:

> Günter,


> bei der Durchsicht Deines letzten Commits sind mir ein paar
> systematische Fehler aufgefallen, die wahrscheinlich Deine Skripte
> erzeugt haben.

> * -Abschlussereignis;-2-;-3-;Ab<schluss=er<eig>nis;-5-;Ab<schluss=er<.eig>nis;Ab<schluss=er<eig>nis
>   +Abschlussereignis;-2-;-3-;Ab<schluss=er<.eig>nis;Ab<schluss=er<.eig>nis

>   Vermutlich wegen des ».« (bzw. dessen Fehlen) wird das nicht korrekt
>   erfaßt.

> *  Ausfallentgelten;Aus<fall=ent<gel-ten
>   -Ausfallerscheinung;Aus<fall=er<schei-nung
>   +Ausfallerscheinung;Aus<fall=er<.schei-nung
>    Ausfallerscheinungen;Aus<fall=er<.schei-nun-gen

>   Wie man sieht, fehlte bei »Ausfallerscheinung« ein ».«, obwohl der
>   nächste Eintrag »Ausfallerscheinungen« sehr wohl einen Punkt hat.
>   Kann Dein Skript vielleicht, sagen wir, ±20 Zeilen anschauen, ob es
>   Einträge gibt, die fast identisch sind und sich danach orientieren?


Die Ursache hier ist, dass die jetzt endlich durchgesehenen und
eingepflegten 1300 Wörter schon vor langer Zeit generiert wurden und in der
Zwischenzeit eine "Ungünstigkeitstellenmarkierungsaktion" stattgefunden hat.

Ich habe mich bei der Durchsicht an fehlenden =er<.-Punkten nicht
gestört, lasse mich aber auch gern korrigieren... (Meines Erachtens sind
ja alle Trennstellen mit nur 2 Buchstaben Abstand zu einer
Haupttrennstelle ungünstig und sollten bei der Extraktion zur
Vorbereitung des patgen-Laufs unterdrückt werden.)

Gruß und Dank,

Günter



Mehr Informationen über die Mailingliste Trennmuster