[Trennmuster] patgen-Kram

Stephan Hennig mailing_list at arcor.de
Fr Aug 2 00:54:24 CEST 2013


Am 01.08.2013 22:28, schrieb Georg Pfeiffer:
> Am Do 01 Aug 2013 20:43:53 schrieb Stephan Hennig:
>> Aber nein!  So viel ist doch gar nicht mehr zu tun.  Wenn Du einmal
>> erfolgreich damit durch bist, kann das doch alles automatisiert werden.
> 
> Na ja, make pattern-trad hatte ich schon mal aufgerufen. Das schrieb mir 
> endlos die Konsole voll, lastete meinen Prozessor zu 100% aus,

Ich habe augenblicklich kein Linux zum Ausprobieren, aber du könntest
versuchen, die Priorität von make mit nice herabzusetzen.  Dann dauert
die Musterberechnung zwar etwas länger, aber der Rechner bleibt
währenddessen benutzbar (wenn die patgen-Prozesse die Priorität erben).


> zeigte keinerlei Fortschritt an und wollte gar nicht mehr aufhören.

Bei mir benötigt das Erzeugen der Muster einer Varietät ca. eine
Viertelstunde, auf einem nicht ganz frischen Core2Duo T8100.

Das Eindampfen des 2009er Google-Books-Korpus liegt übrigens in
derselben Größenordnung, solange man (unter Windows) Lua 5.2 verwendet.
 Dort benötigen ältere Lua-Interpreter nämlich bis zu vier Mal länger,
unter Linux ist kein großer Unterschied spürbar.  LuaJIT wiederum bringt
in jedem Fall einige Minuten Ersparnis.


> Ich habs jetzt nochmal angestoßen. Unterdessen bringe ich meine Liste ins 
> wortliste-Format (<ungetrennt>;<getrennt>\n) hänge es dann an die wortliste an 
> und probiere es nochmal. Ich werde über das Ergebnis berichten, aber es kann 
> ein paar Tage dauern.

Das ist vielleicht am besten.  Für einen Test reicht dieses einfache
Format aus.

Viele Grüße,
Stephan Hennig




Mehr Informationen über die Mailingliste Trennmuster