[Trennmuster] [abgleich_neueintraege.py] Wie weiter?
Guenter Milde
milde at users.sf.net
Di Okt 4 02:09:10 CEST 2016
On 1.10.16, Stephan Hennig wrote:
> Hi,
> ich möchte Neueinträge automatisch kategorisieren lassen. Der Datei
> skripte/python/MANIFEST entnehme ich, dass das Skript
> abgleich_neueintraege.py helfen könnte. Folgender Dialog beginnt:
> > $ python trennstellenkategorisierung/abgleich_neueintraege.py < torf-und-andere-stiche
> >
> > # identisch rekonstruiert:
> >
> > # eindeutig abgeleitet
> >
> > # eindeutig abgeleitet (andere Großschreibung)
> >
> > # mehrdeutig abgeleitet
> >
> > # Rest
> > Tongruben
> > Tonstich
> > Tonstiche
> > Tonstichen
> > Tonstichs
> > Torfstich
> > Torfstiche
> > Torfstichen
> > Torfstichs
> >
> > $
> Welche weiteren Schritte sind an dieser Stelle vorgesehen?
siehe unten.
In diesem Fall ist keines der gegebenen Wörter getrennt worden, weil im
skript "abgleich_neueintraege" einige Einstellungen suboptimal/falsch
waren.
Nach Korrekturen liefert es jetzt:
# identisch rekonstruiert:
# eindeutig abgeleitet
Tongruben;Ton=gru-ben
Tonstich;Ton=stich
Tonstiche;Ton=sti-che
Tonstichen;Ton=sti-chen
Tonstichs;Ton=stichs
Torfstich;Torf=stich
Torfstiche;Torf=sti-che
Torfstichen;Torf=sti-chen
Torfstichs;Torf=stichs
# eindeutig abgeleitet (andere Großschreibung)
# mehrdeutig abgeleitet
# Rest
und das kann schon eher so wie es im MANIFEST steht weiterverarbeitet werden:
Die Ausgabe kann nach ``neu.todo`` gespeichert und (nach Durchsicht) mit
``prepare_patch.py neu`` in die Wortliste eingepflegt werden, z.B. ::
python abgleich_neueintraege.py < neue-woerter.txt > todo.txt
Günter
Mehr Informationen über die Mailingliste Trennmuster