[Trennmuster] Treuhandliegenschaftsgenossenschaft

Werner LEMBERG wl at gnu.org
So Feb 24 20:09:54 CET 2013


>> Tja.  Ich stimme Dir zu, aber der Liangsche Algorithmus braucht
>> alle möglichen Varianten, weil er rein musterorientiert ist und
>> sich nicht um Wörter oder Wortteile kümmert.
> 
> Aber im Endeffekt ließe sich sowas doch recht einfach
> implementieren...

Nur zu!  Für's Deutsche gibt's ja einen Ansatz, sogar als Patch für
(eine alte Version von) TeX verfügbar: SiSiSi.  Aber eben nur für
Deutsch.  Liangs Algorithmus hat zwar Schwächen, ist aber bei ziemlich
kleinen Speicherverbrauch erstaunlich flexibel und universal
einsetzbar.  Und: er ist überall implementiert.

> Treuhandliegenschaftsgenossenschaft, zerlegt in Wörter und
> Wortteile: [...]

Und genau dieses Zerlegen ist die Crux.  Soweit ich weiß, ist das ein
recht kniffliges Problem der Computerlinguistik.


    Werner



Mehr Informationen über die Mailingliste Trennmuster