[Trennmuster] Titeltränen

Werner LEMBERG wl at gnu.org
Di Mai 24 21:15:36 CEST 2016


>> Allerdings gäbe es meiner Meinung nach wichtigere Projekte wie
>> z.B. den Abgleich mit der Wortliste aus dem Germandict-Projekt.
>>
>>   https://sourceforge.net/projects/germandict/
> 
> Ach "Fotografenkollegin" ist ein viel verwendetes Wort? ;)

Nun ja, auch diese Liste enthält Exoten, die wohl beim automatischen
Abernten des Internets hineingerutscht sind und wir eigentlich nicht
wirklich aufnehmen wollen...

Unabhängig davon gibt's massenhaft Einträge, die von unseren
Trennmustern komplett falsch getrennt werden, und *solche* Einträge
sollten in unsere Liste aufgenommen werden, so sie nicht wirklich
abartig sind!  Das ist im übrigen ein iterativer Prozeß, denn
verbesserte Trennmuster können durchaus dazu führen, daß vorher
korrekt getrennte Wörter, die nicht in unserer Liste sind, jetzt auf
einmal falsch getrennt werden...


    Werner




Mehr Informationen über die Mailingliste Trennmuster