[Trennmuster] strippunct.sed
Werner LEMBERG
wl at gnu.org
Fr Nov 8 07:22:32 CET 2013
> Die römischen Zahlen kriege ich mit:
>
> s/[IVXLDMC\.]\{2,\}/ /g
Da es innerhalb von »[...]« keine speziellen Zeichen gibt, sollte das
eher
s/[IVXLDMC.]\{2,\}/ /g
sein.
> Worte mit weniger als drei Buchstaben herausgefiltert
Was hältst Du von folgendem:
1. Jedes Leerzeichen in `\n' konvertieren.
2. Wörter kürzer als 3 Buchstaben können dann mit bequem entfernt
werden, genauso die leeren Zeilen.
Somit hätten wir
====
sed 's/ /\
/g' \
| sed '/.../!d'
====
Beachte, daß ich kein »\n« im zweiten Teil von »s///« verwende, denn
das ist nicht portabel.
Mit Perl geht das natürlich alles viel eleganter...
Werner
Mehr Informationen über die Mailingliste Trennmuster