<!DOCTYPE html>

<html>

  <head>

    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

  </head>

  <body>

    <font face="monospace">Am 27.08.23 um 22:18 schrieb Werner LEMBERG:<span

      style="white-space: pre-wrap">

</span></font>

    <blockquote type="cite"

      cite="mid:20230827.221829.1226985640739615145.wl@gnu.org">

      <blockquote type="cite">

        <pre class="moz-quote-pre" wrap="">Mir ist jetzt noch eine Fallklasse aufgefallen, deren Behandlung

wahrscheinlich noch verbessert werden kann, nämlich Wörter der Form

a<b>c>d.

Aus „nach<denk>lich“ in der Wortliste werden die Primärtrennstellen

„nach-denk-lich“, dann sollte „Nach<denk>lich>keit“ logischerweise

„Nachdenklich-keit“ ergeben, mit extract-tex.pl erhält man aber

„Nach-denklich-keit“.  Für solche Fälle sind die Regeln zur

Bindungsstärke in README.wortliste wohl auch nicht klar genug.

</pre>

      </blockquote>

      <pre class="moz-quote-pre" wrap="">

Also wenn Du einen passenden Algorithmus findest, der zuverlässig das

produziert, was Dir vorschwebt, läßt sich das bestimmt implementieren!</pre>

    </blockquote>

    <font face="monospace"><br>

      Dazu hatte ich die Idee, die Trennzeichen „<“ und „>“ nicht

      von außen nach innen absteigend, sondern von innen nach außen

      aufsteigend zu wichten. Aus dem bisherigen<br>

      <br>

            #    0    1   2    3   4     5    6      7   8     9   10<br>

            #   ------------------------------------------------------<br>

            #   Nach  <  denk  >  lich   >  keit<br>

            #    0   39   0   38   0    39    0<br>

            #<br>

            #   Mit   <  ver   <  ant    -  wort     >  lich  

      >  keit<br>

            #    0   39   0   38   0    10    0     38   0    39    0<br>

            #<br>

            #   Ei    -  gen   =  wirt   >  schaft  =>  lich 

      =>  keit<br>

            #    0   10   0   50   0    39    0     68   0    69    0<br>

      <br>

      würde dann:<br>

      <br>

            #    0    1   2    3   4     5    6      7   8     9   10<br>

            #   ------------------------------------------------------<br>

            #   Nach  <  denk  >  lich   >  keit<br>

            #    0   31   0   31   0    32    0<br>

            #<br>

            #   Mit   <  ver   <  ant    -  wort     >  lich  

      >  keit<br>

            #    0   32   0   31   0    10    0     31   0    32    0<br>

            #<br>

            #   Ei    -  gen   =  wirt   >  schaft  =>  lich 

      =>  keit<br>

            #    0   10   0   50   0    31    0     61   0    62    0<br>

    </font><font face="monospace"><br>

      Damit würde sich die Primärtrennung von „Nachdenklichkeit“ von

      „Nach-denklich-keit“ in „Nachdenklich-keit“ verändern, während

      sich bei den beiden anderen Beispielen nichts ändern würde.

      Insgesamt hätte es Auswirkungen auf Primärtrennungen von 4282

      Wörtern der Wortliste.<br>

      <br>

      In einer Reihe von Fällen wäre die Primärtrennung damit

      verbessert:<br>

      <br>

      Nach-denklich-keit -> Nachdenklich-keit<br>

      außer-gewöhn-lich -> außer-gewöhnlich<br>

      be-dürfnis-los -> bedürfnis-los<br>

      dis-kontinuier-lich -> dis-kontinuierlich<br>

      Gegen-ereig-nis -> Gegen-ereignis<br>

      ge-sundheit-lich -> gesundheit-lich<br>

      ge-wohnheits-mäßig -> gewohnheits-mäßig<br>

      <br>

      In anderen Fällen ergibt der alternative Algorithmus schlechtere

      Ergebnisse:<br>

      <br>

      an-geborener-weise -> an-geborenerweise<br>

      be-anspruch-bar -> be-anspruchbar<br>

      im-provisier-bar -> im-provisierbar<br>

      kom-promiss-los -> kom-promisslos<br>

      nach-gewiesener-maßen -> nach-gewiesenermaßen<br>

      <br>

      Insgesamt scheint mir der aktuelle Stand des Skripts dann doch den

      besseren Kompromiss zu bieten. Eine Verbesserung wäre wohl nur

      durch eine Ausdifferenzierung der Auszeichnung erzielbar, die aber

      unverhältnismäßig aufwendig wäre.<br>

      <br>

      Schöne Grüße<br>

      Keno<br>

      <br>

      <br>

      <br>

    </font>

  </body>

</html>