[Trennmuster] strippunct.sed

Werner LEMBERG wl at gnu.org
Fr Nov 8 07:22:32 CET 2013


> Die römischen Zahlen kriege ich mit:
> 
> s/[IVXLDMC\.]\{2,\}/ /g

Da es innerhalb von »[...]« keine speziellen Zeichen gibt, sollte das
eher

  s/[IVXLDMC.]\{2,\}/ /g

sein.

> Worte mit weniger als drei Buchstaben herausgefiltert

Was hältst Du von folgendem:

  1. Jedes Leerzeichen in `\n' konvertieren.

  2. Wörter kürzer als 3 Buchstaben können dann mit bequem entfernt
     werden, genauso die leeren Zeilen.

Somit hätten wir

====

sed 's/ /\
/g' \
| sed '/.../!d'

====

Beachte, daß ich kein »\n« im zweiten Teil von »s///« verwende, denn
das ist nicht portabel.

Mit Perl geht das natürlich alles viel eleganter...


    Werner


Mehr Informationen über die Mailingliste Trennmuster