[Trennmuster] Parser fuer Wortliste
Werner LEMBERG
wl at gnu.org
Sa Feb 11 16:17:29 CET 2012
> Ziel der Übung ist nicht die kleine Statistik, die aus validate.lua
> herausfällt, sondern alle Skripten auf Lua umzustellen.
Noch eine Programmiersprache zu lernen :-( Ist das wirklich notwendig?
> Was damit im Zusammenhang steht: Derzeit entspricht die Sortierung
> der Wortliste Werners Lokale-Einstellung.
Tut es nicht, denn ich arbeite normalerweise exklusiv mit UTF-8. Die
Einstellungen für die verschiedenen Wortlisten-Skripte, die ich intern
verwende, nämlich
LC_COLLATE=de_DE.ISO8859-1
LC_CTYPE=de_DE.ISO8859-1
müssen gesetzt werden, damit Textwerkzeuge wie »sort« oder »uniq«
korrekt funktionieren.
> Ich würde dies gern lokaleunabhängig gestalten.
Hmm.
> Unter Windows würde dies einiges erleichtern.
Wieso?
> Als Sortierung schlage ich daher Luas table.sort angewendet auf Feld
> 1 vor (also einfach nach 8-Bit-Kodepunkten). Man könnte auch eine
> DIN- oder Telefonbuchsortierung basteln, ich sehe darin jedoch
> keinen größeren Nutzen.
Die Sortierung ist mir im Prinzip egal, obwohl wir eine deutsche Liste
haben und ich daher eigentlich eine deutsche Sortierung mir wünsche,
als »ü« nach »u« beispielsweise und nicht nach »z«. Weitaus wichtiger
ist mir allerdings, daß die Unix-Werkzeuge funktionsfähig bleiben und
ich nicht jedesmal die Liste vorsortieren muß.
Werner
Mehr Informationen über die Mailingliste Trennmuster