<div dir="ltr">Liebe Liste<br><br>Ich habe Eure Wortliste mit einem Sprachkorpus abgeglichen, das mit einem kleinen Skript aus deutschsprachigen Online-Nachrichtentexten erzeugt wurde. (Ich hatte dieses Skript zum Erstellen von Korpora vor längerer Zeit einmal für einen früheren Arbeitgeber geschrieben, der den Quelltext unter einer freien Lizenz freigegeben hat; siehe <a href="https://github.com/google/corpuscrawler">hier</a>).<br><br>In der Beilage findet Ihr jene Wörter aus diesem Sprachkorpus, die in Eurer Liste zur Zeit noch fehlen. Die Liste ist nach absteigender Worthäufigkeit im Nachrichtenkorpus geordnet. Vieles sind Eigennamen (die man allerdings auch gerne korrekt trennen möchte), aber es hat auch ein paar ganz normale deutsche Wörter dabei. Zum Beispiel kommt das Wort „Hörverstehen“ 3322 Mal im Sprachkorpus vor (das insgesamt 46 Millionen Wörter umfasst), es fehlt aber aktuell noch in Eurer Wortliste.<br><br>Vielleicht hilft Euch die beiliegende Datei ja beim Vervollständigen Eurer Wortliste? Eigentlich hatte ich gedacht, dass ich diesen Abgleich schon einmal gemacht hatte, aber offenbar hatte ich das falsch im Kopf? Jedenfalls schienen diese Wörter noch zu fehlen.<br><br>Herzliche Grüsse<br><br>— Sascha<br></div>