[Trennmuster] strippunct.sed
Georg Pfeiffer
gp at praetor.de
Mo Nov 11 06:09:09 CET 2013
Am Fr 08 Nov 2013 07:22:32 schrieb Werner LEMBERG:
> sollte eher
>
> s/[IVXLDMC.]\{2,\}/ /g
>
> sein.
Warum nehmen wir die römischen Zahlen aus der Wortliste nicht ganz raus? Die
werden ohnehin nicht getrennt und nehmen nur unnötig Platz weg.
$ grep -c "^[IVXLCDM;]\{1,\}$" wortliste
2370
$
> Mit Perl geht das natürlich alles viel eleganter...
Na ja, eigentlich geht es nur um sehr simple Aufgaben: Alle „Unwörter“ und
nichtalphabetischen Zeichen raus, Worte nach Mindestlänge filtern, sortieren
und auflisten. Das geht ganz sicher auch ohne Perl und ist ja auch schon fast
erreicht. Nur in der Form, wie es jetzt ist, gefällt mir das Skript noch
nicht. Da bastle ich noch etwas besseres.
Georg
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <https://listi.jpberlin.de/pipermail/trennmuster/attachments/20131111/3677b43e/attachment.htm>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname : signature.asc
Dateityp : application/pgp-signature
Dateigröße : 198 bytes
Beschreibung: This is a digitally signed message part.
URL : <https://listi.jpberlin.de/pipermail/trennmuster/attachments/20131111/3677b43e/attachment.asc>
Mehr Informationen über die Mailingliste Trennmuster