[Trennmuster] [abgleich_neueintraege.py] Wie weiter?

Guenter Milde milde at users.sf.net
Di Okt 4 02:09:10 CEST 2016


On  1.10.16, Stephan Hennig wrote:
> Hi,

> ich möchte Neueinträge automatisch kategorisieren lassen.  Der Datei
> skripte/python/MANIFEST entnehme ich, dass das Skript
> abgleich_neueintraege.py helfen könnte.  Folgender Dialog beginnt:

> > $ python trennstellenkategorisierung/abgleich_neueintraege.py < torf-und-andere-stiche
> > 
> > # identisch rekonstruiert:
> > 
> > # eindeutig abgeleitet
> > 
> > # eindeutig abgeleitet (andere Großschreibung)
> > 
> > # mehrdeutig abgeleitet
> > 
> > # Rest
> > Tongruben
> > Tonstich
> > Tonstiche
> > Tonstichen
> > Tonstichs
> > Torfstich
> > Torfstiche
> > Torfstichen
> > Torfstichs
> >
> > $

> Welche weiteren Schritte sind an dieser Stelle vorgesehen?

siehe unten.

In diesem Fall ist keines der gegebenen Wörter getrennt worden, weil im
skript "abgleich_neueintraege" einige Einstellungen suboptimal/falsch
waren.

Nach Korrekturen liefert es jetzt:

  # identisch rekonstruiert:
  
  # eindeutig abgeleitet
  Tongruben;Ton=gru-ben
  Tonstich;Ton=stich
  Tonstiche;Ton=sti-che
  Tonstichen;Ton=sti-chen
  Tonstichs;Ton=stichs
  Torfstich;Torf=stich
  Torfstiche;Torf=sti-che
  Torfstichen;Torf=sti-chen
  Torfstichs;Torf=stichs
  
  # eindeutig abgeleitet (andere Großschreibung)
  
  # mehrdeutig abgeleitet
  
  # Rest

und das kann schon eher so wie es im MANIFEST steht weiterverarbeitet werden:

  Die Ausgabe kann nach ``neu.todo`` gespeichert und (nach Durchsicht) mit
  ``prepare_patch.py neu`` in die Wortliste eingepflegt werden, z.B. ::

    python abgleich_neueintraege.py < neue-woerter.txt > todo.txt

Günter



Mehr Informationen über die Mailingliste Trennmuster