[Trennmuster] neuer Arbeitsansatz

Guenter Milde milde at users.sf.net
Fr Okt 28 08:56:48 CEST 2016


Lieber Werner,

On 27.10.16, Werner LEMBERG wrote:

> > Erster Versuch: Korrekturen einarbeiten: Da nichts Überschrieben und
> > bei Doppelein Einträgen keine Warnung kommt habe ich gleich mal in
> > einem Aufruf 20 fehlerhafte *.reformiert Dateien hergestellt.

> Hast Du

>   for i in wortlisten/*.reformiert; do
>     mv $i $i.old
>     perl skripte/dopplungen.pl < $i.old > $i
>     rm $i.old
>   done

> ausgeführt?  

Hab ich nicht, denn ...

> Das entfernt *echte* Dopplungen; 

aber ich habe ja vorhandene Einträge korrigiert!

> alles andere muß ja tatsächlich manuell bearbeitet werden.

Das ist die Krux, da fehlt noch was...

> > ... eigentlich wollte ich jetzt nicht alle alten Einträge manuell
> > löschen.


> > `git stash` und dann den Stash wegschmeißen hilft

...

> Vielleicht bessere Alternative:

>   cd wortlisten
>   rm *.reformiert  (oder was auch immer Du wiederherstellen willst)
>   git checkout .

> Oder auch:

>   git diff > git.diff
>   git reset --hard
>   ... »git.diff« bearbeiten ...
>   patch -p1 < git.diff

Danke für die Alternativen. 

Dennoch sind das alls nur Notlösungen, nicht für die normale Arbeit zu
empfehlen. Zumindest mir ist das Risiko, versehentlich auch eigene, noch
nicht eingepflegte Arbeit zu verlieren zu groß.


> > -> Wunsch: Frühwarnung bei Doppeleinträgen schon bei der
> >    a-z-Aufteilung und und eine -f bzw. --force Option zum
> >    Überschreiben (vgl. prepare_patch.py).

> OK.  Ich werde wahrscheinlich das Skript »a-z.sh« in ein Perl-Skript
> verwandeln; da kann ich dann das berücksichtigen (und wird
> »dopplungen.pl« wohl größtenteils überflüssig machen).  Das wird aber
> ein paar Tage dauern.

> Könntest Du eigentlich Deine Helferlein anpassen, sodaß ein Patch für
> »*.reformiert« erzeugt wird, bzw. direkt diese Dateien modifiziert
> werden?

Die Bausteine sind alle da und damit dürfte es kein Problem sein, einen
Ersatz für a-z.sh zu bauen. Der wäre dann auch effektiver, denn es muß nicht
26 Mal Python aufgerufen werden um zu sortieren.

Bevor ich damit loslege würd ich gern noch über das Zielformat
diskutieren - in einer anderen Mail.

Günter



Mehr Informationen über die Mailingliste Trennmuster