[Trennmuster] Datenstruktur

Stephan Hennig mailing_list at arcor.de
Fr Apr 11 18:22:36 CEST 2014


Am 11.04.2014 09:38, schrieb Guenter Milde:
> On  9.04.14, Stephan Hennig wrote:
> 
>> Patgen akzeptiert zwei Arten von Bewertungen in der Eingabeliste:
> 
>>   1. Wenn eine Ziffer vor einem Wort steht, gehen die folgenden Wörter
>>      mit jener Bewertung in Patgens Zählerei ein.  Wir könnten so zum
>>      Beispiel zusammengesetzte Wörter abwerten, in der Hoffnung, dass
>>      Patgen "normale" Wortstrukturen besser berücksichtigen kann.
> 
>>   2. Jede einzelne Trennstellen kann auch bewertet werden.  Wir könnten
>>      also auch ganz gezielt für jede Trennstellenkategorie
>>      unterschiedliche Bewertungen vergeben.
> 
> Ich dachte eher an zwei Durchgänge:

Das habe ich schon verstanden.  Ich wollte nur darauf hinweisen, dass es
möglicherweise auch ohne Extradurchgang geht, indem man Patgen mit
Gewichten in die entsprechende Richtung lenkt.  Was besser ist, lässt
sich nur durch Tests herausfinden.  Dazu benötigt man noch ein paar
aussagekräftige Kenngrößen für Mustersätze.  Die Dateigröße sagt nicht
so viel aus ...

Viele Grüße,
Stephan Hennig



Mehr Informationen über die Mailingliste Trennmuster