[Trennmuster] Nichtwörter
Guenter Milde
milde at users.sf.net
Sa Apr 14 16:32:47 CEST 2018
On 12.04.18, Werner LEMBERG wrote:
> > in der Wortliste, in den Vorschlägen oder in externen Korpora finden
> > wir immer wieder auch Wörter, die nicht oder nur äußerst selten in
> > der deutschen Gegenwartssprache belegt sind.
> >
> > Manche dieser Fehlschreibungen oder Fehlbildungen tauchen immer
> > wieder auf,
> ... weil sie Teil der Korpora sind...
Genau, und die Chance, erkannte Nichtwörter aus allen relevanten Korpora und
Wörterbüchern zu löschen ist im Zeitalter des Datensammelns und
automatischen Abgleichs gering.
> > so dass es sinnvoll erscheint, sie in einer Datei im Repositorium zu
> > listen. Wäre eine Datei "nichtwörter" im Wurzelverzeichnis
> > angebracht, oder gibt es alternative Vorschläge für Name und Platz
> > einer solchen Liste?
> Bist Du sicher, daß wir soetwas erstellen sollen?
Sicher, nein. Aber ich halte es aus oben beschriebenen Gründen für eine
gute Idee wenn wir eine Liste der Wörter, die wir mühsam "per Hand" auf
Nichtsinnvollkeit geprüft haben, samt den Gründen der Ablehnung als
Kommentar, im Repositorium vorrätig halten.
> Ich schicke in der Regel Fehlerberichte an Jan Schreiber (der sich um
> das »germandic«-Projekt kümmert), damit er solche Fehleinträge wie
> »Apfelunglück« entfernt, was er auch tut.
Aber, wie gesagt hilft dass nicht für die vielfältigen im Internet
verteilten Wortlisten.
> > Ggf. sollte diese Liste dann auch zu Björn Hacke für sein
> > ispell98-Projekt.
> Link bitte! Ich find' da nix passendes im Internet...
OK, Merkfehler, es ist Björn Jacke mit der Seite
https://www.j3e.de/ispell/igerman98/
Günter
Mehr Informationen über die Mailingliste Trennmuster