<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
{font-family:"Cambria Math";
panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
{font-family:Calibri;
panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
{margin:0cm;
margin-bottom:.0001pt;
font-size:11.0pt;
font-family:"Calibri",sans-serif;
mso-fareast-language:EN-US;}
a:link, span.MsoHyperlink
{mso-style-priority:99;
color:#0563C1;
text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
{mso-style-priority:99;
color:#954F72;
text-decoration:underline;}
span.E-MailFormatvorlage17
{mso-style-type:personal-compose;
font-family:"Calibri",sans-serif;
color:windowtext;}
.MsoChpDefault
{mso-style-type:export-only;
font-family:"Calibri",sans-serif;
mso-fareast-language:EN-US;}
@page WordSection1
{size:612.0pt 792.0pt;
margin:70.85pt 70.85pt 2.0cm 70.85pt;}
div.WordSection1
{page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="DE" link="#0563C1" vlink="#954F72">
<div class="WordSection1">
<p class="MsoNormal">Liebe Trennende –<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Wie schon in einem früheren Posting angesprochen habe ich versucht, einen ersten Eindruck davon zu bekommen, wie sich die laufende Arbeit an den Trennmustern auf das Ergebnis bei nicht in der Wortliste stehenden Wörtern auswirkt.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Exemplarisch habe ich jetzt die Wortliste (nur diese; ausnahmsweise mal kein Arzneimittelkram von mir) vom 2020-08-17 genommen, Standard-Trennmuster (NR) erzeugt und damit die gesamte Wortliste von german.dic getrennt. Dann dasselbe nochmals,
aber mit der aktuellen Wortliste (Stand gestern abend). Und dann habe ich die Differenzen betrachtet. Von den rd. 2 Mio. Einträgen von german.dic werden rd. 6500 jetzt anders getrennt als vor einem Monat. Um zu bewerten, ob es in der Zwischenzeit besser oder
schlechter geworden ist, habe ich mir die rd. 190 Differenzeinträge angesehen, die mit „A“ oder „Ä“ beginnen.<o:p></o:p></p>
<p class="MsoNormal">In ca. 40% der Fälle liefern die aktuellen Trennmuster eine korrekte und vollständige Trennung, anders als die älteren Trennmuster.<o:p></o:p></p>
<p class="MsoNormal">Nach Beseitigung von eng verwandten (z.B. deklinierten) Formen verbleiben 105 Einträge, in denen die neue Trennung falsch oder unvollständig ist. In 33 Fällen wurde eine falsche oder unvollständige Trennung durch eine andere falsche oder
unvollständige Trennung ersetzt. In den verbleibenden rd. 70 Fällen wurden ehemals korrekte und vollständige Trennungen durch falsche oder unvollständige ersetzt, z.B. Ama-teur-chor -> Ama-teur-ch-or<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Es ergibt sich also nach dieser exemplarischen Betrachtung eine durchmischte Bilanz von Verbesserung und Regression.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Wäre die Trennmustererzeugung ein KI-Projekt, würde ich mich fragen, ob der Punkt des Overfitting erreicht ist: Auf dem Trainingsdatensatz werden die Ergebnisse immer besser, auf dem Testdatensatz geht es aber nicht mehr recht voran. Oder
ist das eine schiefe Perspektive?<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Anbei zum Nachvollziehen die Liste der A/Ä-Wörter mit (bona fide) inkorrekten Trennungen nach aktuellen Trennmustern (NR):<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<div style="mso-element:para-border-div;border-top:solid windowtext 1.0pt;border-left:none;border-bottom:solid windowtext 1.0pt;border-right:none;padding:1.0pt 0cm 1.0pt 0cm">
<p class="MsoNormal" style="border:none;padding:0cm">Wort;Bisherige Trennung;Aktuelle Trennung<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm"># Falsche oder unvollständige durch anders falsche oder unvollständige ersetzt:<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Abschrammens;Ab-schrammens;Ab-schramm-ens<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Ährenahorn;Äh-re-n-ahorn;Ähre-n-ahorn<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Akustikereignis;Akus-ti-kereig-nis;Akus-ti-k-ereig-nis<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Alibifrauen;Ali-bi-f-rau-en;Ali-bif-rau-en<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">allerderbste;al-lerd-erbs-te;al-ler-d-erbs-te<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Allgemeinerläuterung;All-ge-meiner-läu-te-rung;All-ge-mein-erläu-te-rung<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Alpakaställe;Al-pa-ka-st-äl-le;Al-pa-ka-s-täl-le<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Alteglofsheim;Al-te-gl-ofs-heim;Al-te-g-l-ofs-heim<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Alveolarabszess;Alveo-lar-abszess;Alveo-lar-abs-zess<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Amalgamallergie;Amal-g-a-mall-er-gie;Amal-ga-mall-er-gie<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Amarenacreme;Ama-ren-acreme;Ama-ren-a-creme<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Amigurumi;Ami-gu-rumi;Ami-gurumi<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">amtselitär;amtse-li-tär;amts-e-li-tär<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Amtsende;Amt-sen-de;Amt-s-en-de<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">angegrabschter;an-ge-grab-sch-ter;an-ge-grab-schter<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Angorakatze;Angora-kat-ze;An-gora-kat-ze<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Anruferkennung;An-ru-fer-ken-nung;An-ru-f-er-ken-nung<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">ansaufe;ansau-fe;ans-au-fe<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Ansaufens;Ansau-fens;Ans-au-fens<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Aortenisthmusstenose;Aor-tenisth-muss-teno-se;Aor-tenisth-mus-s-teno-se<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Apnoeleistung;Apn-oe-l-eis-tung;Apn-oel-eis-tung<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm"><span lang="EN-GB">Äquatorialguineer;Äqua-to-ri-al-guineer;Äqua-to-ri-al-gui-neer<o:p></o:p></span></p>
<p class="MsoNormal" style="border:none;padding:0cm">Arbeitnehmerentgelt;Ar-beit-neh-me-r-ent-gelt;Ar-beit-neh-me-rent-gelt<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Asbestes;Asbes-tes;Asbestes<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Assisis;As-sis-is;As-sisis<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Ätherwellengeigen;Äther-wel-lengei-gen;Äther-wel-leng-ei-gen<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Aufsetztank;Auf-setz-tank;Auf-setztank<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">ausblich;ausblich;ausb-lich<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Ausgleichsintensität;Aus-gleich-sin-ten-si-tät;Aus-gleich-s-in-ten-si-tät<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Auswandererland;Aus-wan-der-er-land;Aus-wan-der-erland<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Auswanderermuseen;Aus-wan-der-er-mu-se-en;Aus-wan-der-ermu-se-en<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Ausweichtrikot;Aus-weichtri-kot;Aus-weicht-ri-kot<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Ausweisersatzes;Aus-wei-ser-sat-zes;Aus-wei-sersat-zes<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm"># Richtige Trennung durch falsche oder unvollständige ersetzt<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Abikurs;Abi-kurs;Abikurs<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Absetztank;Ab-setz-tank;Ab-setztank<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">abzusaufen;ab-zu-sau-fen;ab-zu-s-au-fen<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Achatware;Achat-wa-re;Achat-ware<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Achtring;Acht-ring;Achtring<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Adelskorporation;Adels-kor-po-ra-ti-on;Adel-skor-po-ra-ti-on<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm"><span lang="EN-GB">AdWords;Ad-Words;Ad-Wor-ds<o:p></o:p></span></p>
<p class="MsoNormal" style="border:none;padding:0cm">Agentureintrag;Agen-tur-ein-trag;Agen-tu-r-ein-trag<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Aktionärsinitiative;Ak-tio-närs-in-itia-ti-ve;Ak-tio-närsin-itia-ti-ve<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Alibiartikel;Ali-bi-ar-ti-kel;Ali-biar-ti-kel<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Alleepflanzung;Al-lee-pflan-zung;Al-leepflan-zung<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Allersberg;Al-lers-berg;Al-ler-s-berg<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Alpakastoff;Al-pa-ka-stoff;Al-pa-ka-s-toff<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Alpakastute;Al-pa-ka-stu-te;Al-pa-ka-s-tu-te<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Alpenkreis;Al-pen-kreis;Al-pen-k-reis<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Alphateilchen;Al-pha-teil-chen;Al-pha-t-eil-chen<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Alpinskisport;Al-pin-ski-sport;Al-pin-s-ki-sport<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Altensteiner;Al-ten-stei-ner;Al-tenstei-ner<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Altmetallaufbereitung;Alt-me-tall-auf-be-rei-tung;Alt-me-tallauf-be-rei-tung<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Altrohstoff;Alt-roh-stoff;Altroh-stoff<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Altscherbitz;Alt-scher-bitz;Altscher-bitz<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Altstadtensemble;Alt-stadt-en-sem-ble;Alt-stadten-sem-ble<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Altwarmbüchen;Alt-warm-bü-chen;Alt-wa-rm-bü-chen<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Amateurchor;Ama-teur-chor;Ama-teur-ch-or<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Amerikafeind;Ame-ri-ka-feind;Ame-ri-kafeind<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Amperemessgerät;Am-pere-mess-ge-rät;Am-pere-mes-s-ge-rät<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Ämterfülle;Äm-ter-fül-le;Äm-t-er-fül-le<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Anbauerstelle;An-bau-er-stel-le;An-bau-erstel-le<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Anbauertrag;An-bau-er-trag;An-bau-ertrag<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Anbauerzeugnis;An-bau-er-zeug-nis;An-bau-erzeug-nis<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">angetüdelter;an-ge-tü-del-ter;an-ge-tü-delter<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Anhängerbaues;An-hän-ger-bau-es;An-hän-gerbau-es<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Ankerzahn;An-ker-zahn;Ank-er-zahn<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Ankerzentren;An-ker-zen-tren;Ank-er-zen-tren<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Ankerzugglied;An-ker-zug-glied;Ank-er-zug-glied<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Anlagentechnik;An-la-gen-tech-nik;An-lagen-tech-nik<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">anlagentechnisch;an-la-gen-tech-nisch;an-lagen-tech-nisch<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Anlagentechnologie;An-la-gen-tech-no-lo-gie;An-lagen-tech-no-lo-gie<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Anschlusswertemessmethode;An-schluss-wer-te-mess-me-tho-de;An-schluss-wer-te-mes-s-me-tho-de<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">anzusaufen;an-zu-sau-fen;an-zu-s-au-fen<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Apertureinstellungen;Aper-tur-ein-stel-lun-gen;Aper-tu-r-ein-stel-lun-gen<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Aquatintaradierung;Aqua-tin-ta-ra-die-rung;Aqua-tin-tara-die-rung<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Ariadnepfad;Ari-ad-ne-pfad;Ari-ad-nepfad<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Armeepferd;Ar-mee-pferd;Ar-meepferd<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Aronsstab;Arons-stab;Aronsstab<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Astansatz;Ast-an-satz;Astan-satz<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm"><span lang="EN-GB">Atahualpa;Ata-hu-al-pa;Ata-hual-pa<o:p></o:p></span></p>
<p class="MsoNormal" style="border:none;padding:0cm">Aufbruchgeist;Auf-bruch-geist;Auf-bruch-ge-ist<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">aufgehübschter;auf-ge-hübsch-ter;auf-ge-hübschter<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Aufwandsersatzes;Auf-wands-er-sat-zes;Auf-wands-ersat-zes<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Aufwendungsersatzes;Auf-wen-dungs-er-sat-zes;Auf-wen-dungs-ersat-zes<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Aufzugschacht;Auf-zug-schacht;Auf-zug-s-chacht<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Aufzugschächte;Auf-zug-schäch-te;Auf-zug-s-chäch-te<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Aufzugschlaufe;Auf-zug-schlau-fe;Auf-zug-s-chlau-fe<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Aufzugseil;Auf-zug-seil;Auf-zug-s-eil<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Aufzugspiegel;Auf-zug-spie-gel;Auf-zug-s-pie-gel<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Aufzugstärke;Auf-zug-stär-ke;Auf-zug-s-tär-ke<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Aufzugsteuerung;Auf-zug-steue-rung;Auf-zug-s-teue-rung<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Aufzugsystem;Auf-zug-sys-tem;Auf-zug-s-ys-tem<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">auseinanderzupfe;aus-ein-an-der-zup-fe;aus-ein-an-der-zupfe<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Auszugstisch;Aus-zugs-tisch;Aus-zug-s-tisch<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Autogrammjägerin;Au-to-gramm-jä-ge-rin;Au-to-gramm-jä-gerin<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Autorenabend;Au-to-ren-abend;Au-toren-abend<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Autorenakademie;Au-to-ren-aka-de-mie;Au-toren-aka-de-mie<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Autorenangabe;Au-to-ren-an-ga-be;Au-toren-an-ga-be<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Autorenansatz;Au-to-ren-an-satz;Au-toren-an-satz<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Autorenanteil;Au-to-ren-an-teil;Au-toren-an-teil<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Autorenarbeit;Au-to-ren-ar-beit;Au-toren-ar-beit<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Autorenargument;Au-to-ren-ar-gu-ment;Au-toren-ar-gu-ment<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Autorenartikel;Au-to-ren-ar-ti-kel;Au-toren-ar-ti-kel<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm">Autoverkehrsanteil;Au-to-ver-kehrs-an-teil;Au-to-ver-kehr-s-an-teil<o:p></o:p></p>
<p class="MsoNormal" style="border:none;padding:0cm"><span lang="FR">Avataren;Ava-ta-ren;Ava-taren<o:p></o:p></span></p>
</div>
<p class="MsoNormal"><span lang="FR"><o:p> </o:p></span></p>
<p class="MsoNormal"><span lang="FR"><o:p> </o:p></span></p>
<p class="MsoNormal">\Gisbert<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</body>
</html>