[Trennmuster] Treuhandliegenschaftsgenossenschaft
Werner LEMBERG
wl at gnu.org
So Feb 24 20:09:54 CET 2013
>> Tja. Ich stimme Dir zu, aber der Liangsche Algorithmus braucht
>> alle möglichen Varianten, weil er rein musterorientiert ist und
>> sich nicht um Wörter oder Wortteile kümmert.
>
> Aber im Endeffekt ließe sich sowas doch recht einfach
> implementieren...
Nur zu! Für's Deutsche gibt's ja einen Ansatz, sogar als Patch für
(eine alte Version von) TeX verfügbar: SiSiSi. Aber eben nur für
Deutsch. Liangs Algorithmus hat zwar Schwächen, ist aber bei ziemlich
kleinen Speicherverbrauch erstaunlich flexibel und universal
einsetzbar. Und: er ist überall implementiert.
> Treuhandliegenschaftsgenossenschaft, zerlegt in Wörter und
> Wortteile: [...]
Und genau dieses Zerlegen ist die Crux. Soweit ich weiß, ist das ein
recht kniffliges Problem der Computerlinguistik.
Werner
Mehr Informationen über die Mailingliste Trennmuster