<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
</head>
<body>
Am 01.10.20 um 02:45 schrieb Stephan Hennig:
<blockquote type="cite"
cite="mid:e92d1765-de33-d220-77d7-371abd95c836@posteo.net">
<pre class="moz-quote-pre" wrap="">Keno, welche Art der Koordination/Kuration der verschiedensten Muster
schwebt dir denn mittel- oder langfristig vor? Alles innerhalb von
Polyglossia?</pre>
</blockquote>
<br>
In Polyglossia werden keine Muster verwaltet; du meinst sicherlich
hyph-utf8 (gleicher Betreuer, aber anderes Paket).<br>
<br>
Ich meine, in hyph-utf8 sollten alle Mustersätze aufgenommen werden,
die sinnvollerweise mit dem gewöhnlichen Trennalgorithmus verwendet
werden können, ohne dass padrinoma beteiligt sein muss. Dazu gehören
Fugentrennmuster verschiedener Stufen und evtl. auch
Gesangstexttrennmuster.<br>
<br>
Andere Musterarten wie Ligaturaufbruchmuster gehören nicht in den
engeren Kompetenzbereich von hyph-utf8. Wenn ich es richtig sehe,
hat es für diese Muster auch keinen Sinn, in die
Konfigurationsdateien „language.dat“ etc. aufgenommen zu werden, da
padrinoma sie direkt liest.<br>
Wenn die hyph-utf8-Betreuer gerne alles Trennmusterartige aufnehmen
wollen, hätte ich nichts dagegen, ihnen auch diese Muster zu
übergeben, aber ich würde sie ihnen nicht aufdrängen.<br>
<br>
Die spezielleren Muster könnten entweder Teil der oder des
padrinoma-Pakets werden, oder aber über dehyph-exptl auf dem CTAN
lanciert werden. Noch ein neues Paket für deutsche
(Pseudo-)Trennmuster würde den bestehenden Wirrwarr vergrößern und
wäre daher nicht meine Wahl.<br>
<br>
Vielleicht können wir hier auch mal über die Administration der
herkömmlichen deutschen Trennmuster nachdenken.<br>
<br>
In der Datei „language.dat“ von TeXLive finden sich aktuell die
Einträge:<br>
<blockquote>% from dehyph-exptl:<br>
german-x-2019-04-04 dehypht-x-2019-04-04.tex<br>
=german-x-latest<br>
ngerman-x-2019-04-04 dehyphn-x-2019-04-04.tex<br>
=ngerman-x-latest<br>
% from hyphen-german:<br>
german loadhyph-de-1901.tex<br>
ngerman loadhyph-de-1996.tex<br>
swissgerman loadhyph-de-ch-1901.tex<br>
</blockquote>
Die Beziehung zwischen diesen Einträgen der Konfigurationsdatei und
den real geladenen Trennmustern ist alles andere als offenkundig.
Bei den in den einzelnen Einträgen angegebenen Dateien handelt es
sich nicht um die Trennmusterdateien selbst, sondern um
Manteldateien, die noch Fallunterscheidungen treffen.<br>
<br>
Es gibt zur Zeit 14 verschiedene deutsche Trennmustersätze in der
TeX-Live-Installation:<br>
<blockquote>(1) tex/generic/dehyph/dehyphn.tex<br>
(2) tex/generic/dehyph/dehypht.tex<br>
(3) tex/generic/dehyph-exptl/dehyphn-x-2019-04-04.pat<br>
(4) tex/generic/dehyph-exptl/dehypht-x-2019-04-04.pat<br>
(5) tex/generic/dehyph-exptl/dehyphts-x-2019-04-04.pat<br>
(6) tex/generic/hyph-utf8/patterns/tex/hyph-de-1901.tex<br>
(7) tex/generic/hyph-utf8/patterns/tex/hyph-de-1996.tex<br>
(8) tex/generic/hyph-utf8/patterns/tex/hyph-de-ch-1901.tex<br>
(9) tex/generic/hyph-utf8/patterns/ptex/hyph-de-1901.ec.tex<br>
(10) tex/generic/hyph-utf8/patterns/ptex/hyph-de-1996.ec.tex<br>
(11) tex/generic/hyph-utf8/patterns/ptex/hyph-de-ch-1901.ec.tex<br>
(12) tex/generic/hyph-utf8/patterns/txt/hyph-de-1901.pat.txt<br>
(13) tex/generic/hyph-utf8/patterns/txt/hyph-de-1996.pat.txt<br>
(14) tex/generic/hyph-utf8/patterns/txt/hyph-de-ch-1901.pat.txt</blockquote>
Zusätzlich existiert eine zu (2) gehörige Trennausnahmendatei:<br>
<blockquote>tex/generic/dehyph/dehyphtex.tex<br>
</blockquote>
Bei (1) und (2) handelt es sich um veraltete Muster, die aus Gründen
der Abwärtskompatibilität erhalten wurden und nur mit PDFTeX
verwendet werden.<br>
<br>
(3) bis (5) sind die Muster aus dem dehyph-exptl-Paket, die nur
außerordentlicherweise verwendet werden, wenn der Nutzer
beispielsweise das Paket hyphsubst einsetzt, um „german-x-latest“
oder „ngerman-x-latest“ anzufordern.<br>
(5) ist offenbar nur theoretisch verwendbar, da keine der in
„language.dat“ aufgeführten Manteldateien diese Muster lädt.<br>
<br>
Die Muster (6) bis (8) sind die Standardmuster des hyph-utf8-Pakets
für XeTeX, (8) auch für PDFTeX. Sie sind inhaltlich identisch mit
(3) bis (5).<br>
<br>
Die Muster (9) bis (11) sind von den hyph-utf8-Betreuern für die
Zwecke von pTeX auf ASCII umcodierte Varianten von (6) bis (8). (9)
und (10) werden außerdem geladen, falls die Sprachen
„german-x-latest“ und „ngerman-x-latest“ vom Benutzer mit PDFTeX
angefordert werden.<br>
<br>
Die Muster (12) bis (14) sind die Standardmuster des
hyph-utf8-Pakets für LuaTeX und inhaltlich identisch mit (6) bis
(8). Der Unterschied ist, dass es in diesen Dateien keine
TeX-Befehle gibt.<br>
<br>
Es wird wohl niemanden überraschen, wenn ich sage, dass ich Jahre
gebraucht habe, um diesen Musterdschungel zu durchschauen.<br>
<br>
Neben der verwirrenden Vielfalt der Musterdateien sehe ich noch ein
Problem mit dem Paketbezeichnungen. In den oben zitierten Auszügen
aus „language.dat“ heißt es: „from dehyph-exptl“, „from
hyphen-german“.<br>
<br>
„dehyph-exptl“ findet man tatsächlich als Paket auf dem CTAN,
„hyphen-german“ hingegen nicht, da es sich um eine hyph-utf8-interne
Paketbezeichnung handelt (?). Das Herkunftspaket wäre also
eigentlich „hyph-utf8“.<br>
Daneben kennt der CTAN noch ein Paket „dehyph“, das eine
Readme-Datei, die oben genannten Mustersätze (1) und (2) sowie die
ebenfalls genannte Trennausnahmendatei umfasst. Ein Hinweis darauf,
dass diese Paket als veraltet gelten kann, fehlt.<br>
<br>
Auch hier sind die Beziehungen zwischen den Paketen ohne langwierige
Einarbeitung für den Nutzer kaum zu verstehen.<br>
<br>
Um die Situation etwas übersichtlicher zu gestalten, schlage ich
Folgendes vor:<br>
<ol>
<li>
<p>Die CTAN-Pakete „dehyph-exptl“ und „dehyph“ werden zu
„dehyph“ zusammengelegt. Über den experimentellen Status sind
die neuen Muster längst hinaus, fortlaufende Verbesserungen
nehmen auch andere Sprachgruppen an ihren Muster vor, ohne
deshalb einen Zusatz wie „exptl“ zu führen. Der Status der
Muster „dehyphn.tex“ und „dehypht.tex“ wird dabei klar
beschrieben.</p>
</li>
<li>
<p>Die oben genannten Mustersätze (3) bis (5) werden nicht mehr
mit „dehyph-exptl“ bzw. „dehyph“ hochgeladen, sondern über
Pull-Requests in hyph-utf8 platziert. Auf diese Weise könnten
3 der 14 Mustersätze entfallen.</p>
</li>
<li>
<p>Für PDFTeX-Benutzer werden die in „language.dat“ aufgeführten
Manteldateien aus „dehyph-exptl“ weiterhin hochgeladen, welche
aber lediglich die passenden hyph-utf8-Muster referenzieren.</p>
</li>
<li>
<p>Die dehyph-(exptl-)Anleitung wird mit Anweisungen für den
Benutzer versehen, wie er aktuelle Muster aus dem
Trennmusterprojekt lokal installieren und verwenden kann.
Solche Anweisungen gibt es zwar bereits, doch funktionieren
sie nach meinen jüngsten Versuchen nicht mehr mit LuaLaTeX.</p>
</li>
<li>
<p>Das Paket dehyph nimmt neue (Pseudo-)Trennmuster auf, die
entweder von den hyph-utf8-Betreuern zurückgewiesen werden,
oder aber dort nicht hineingehören. Dabei ist zwischen
Mustern, die in „language.dat“ aufgeführt werden sollen, und
solchen für speziellere Zwecke zu unterscheiden. Für
angemessene Dokumentation ist zu sorgen.</p>
</li>
</ol>
Gruß<br>
Keno<br>
<blockquote>
</blockquote>
</body>
</html>