[Trennmuster] Perl-Turbo
Georg Pfeiffer
gp at praetor.de
So Nov 3 03:13:02 CET 2013
Hallo,
ich habe mir ein kleines Perl-Skript gebastelt, das aus einer Datei neue, d.h.
noch in keiner Trennmusterliste erfaßte Worte auflisten bzw. in eine Datei
schreiben soll. Das Skript funktionert, aber es läuft unerträglich langsam.
Z.B. braucht es geschlagene zwei Stunden für einen vielleicht hundertseitigen
Text.
Ich vermute, daß das an der Speicherknappheit liegt. immerhin lädt es den zu
untersuchenden Text, erstellt daraus eine Wortliste, führt dann die allgemeine
allgemeine "wortliste" mit der pre-1901- und einer lokalen Trennmusterliste
zusammen und gleicht schließlich jedes Wort der aus der Datei generierten
Wortliste mit dieser Trennmustermaxiliste ab.
Vielleicht ist es einfach auch nur unzweckmäßig programmiert. Würde mal ein
Perl-Guru drüberschauen und sehen, ob man da noch einen kleinen Turbo einbauen
kann?
Vorab muß ich um Entschuldigung bitten: das Skript war eigentlich nicht zur
Veröffentlichung gedacht. So sind z.B. die Dateipfade noch „hart verdrahtet“.
Gruß
Georg
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <https://listi.jpberlin.de/pipermail/trennmuster/attachments/20131103/4213669b/attachment.htm>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname : signature.asc
Dateityp : application/pgp-signature
Dateigröße : 198 bytes
Beschreibung: This is a digitally signed message part.
URL : <https://listi.jpberlin.de/pipermail/trennmuster/attachments/20131103/4213669b/attachment.asc>
Mehr Informationen über die Mailingliste Trennmuster