[Trennmuster] Perl-Turbo

Georg Pfeiffer gp at praetor.de
So Nov 3 03:13:02 CET 2013


Hallo,

ich habe mir ein kleines Perl-Skript gebastelt, das aus einer Datei neue, d.h. 
noch in keiner Trennmusterliste erfaßte Worte auflisten bzw. in eine Datei 
schreiben soll. Das Skript funktionert, aber es läuft unerträglich langsam. 
Z.B. braucht es geschlagene zwei Stunden für einen vielleicht hundertseitigen 
Text. 

Ich vermute, daß das an der Speicherknappheit liegt. immerhin lädt es den zu 
untersuchenden Text, erstellt daraus eine Wortliste, führt dann die allgemeine 
allgemeine "wortliste" mit der pre-1901- und einer lokalen Trennmusterliste 
zusammen und gleicht schließlich jedes Wort der aus der Datei generierten 
Wortliste mit dieser Trennmustermaxiliste ab.

Vielleicht ist es einfach auch nur unzweckmäßig programmiert. Würde mal ein 
Perl-Guru drüberschauen und sehen, ob man da noch einen kleinen Turbo einbauen 
kann?

Vorab muß ich um Entschuldigung bitten: das Skript war eigentlich nicht zur 
Veröffentlichung gedacht. So sind z.B. die Dateipfade noch „hart verdrahtet“.

Gruß
Georg
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <https://listi.jpberlin.de/pipermail/trennmuster/attachments/20131103/4213669b/attachment.htm>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : signature.asc
Dateityp    : application/pgp-signature
Dateigröße  : 198 bytes
Beschreibung: This is a digitally signed message part.
URL         : <https://listi.jpberlin.de/pipermail/trennmuster/attachments/20131103/4213669b/attachment.asc>


Mehr Informationen über die Mailingliste Trennmuster