[Trennmuster] Kombinierende Zeichen in der TeX Eingabe
Werner LEMBERG
wl at gnu.org
Do Nov 2 22:05:54 CET 2023
>> Ja. Falls Nachbearbeitung nicht adäquat funktioniert, fügen wir
>> halt die Wörter mit Umlauten in allen NFC- und NFD-Kombinationen
>> ein. Wenn `patgen` ein paar Sekunden länger braucht, tut mir das
>> nicht weh.
>
> Ich denke, Mischformen ("Flötento(U+0308)ne", etc.) müssen wir nicht
> unbedingt berücksichtigen.
Ja, wahrscheinlich nicht.
>> Meiner Meinung nach sollte das vollständig äquivalent zu »Ä-ther«
>> behandelt werden, d.h., nach »Ae« kommt eine Gesangstrennstelle und
>> sonst nichts. So machen wir das ja auch bereits, oder?
>
> In der wortliste steht "Äther;Ä·ther". Die Ersatzschreibung wird
> automatisch erzeugt und vor der Mustererzeugung hinzugefügt.
> Gegenwärtig trennen die aktuellsten Muster bei mir "Aether" als
> "Ae-ther".
Das kann eigentlich nicht sein. Ich habe gerade nachgeschaut: in der
Eingabeliste für `patgen`, die während der Mustererstellung erzeugt
wird, befindet sich ganz korrekt »Aether« (ohne Trennung). Außerdem
bekomme ich folgendes:
```
skripte/lib/py_patuse> ./hyphenation.py --hyphen "-" -l de Aether
=> Aether
```
Bitte kontrolliere Dein Setup.
>> Warum ein langer Name? Das Laden der Trennmuster findet innerhalb
>> von `\begingroup ... \endgroup` statt; ich sehe daher keinerlei
>> Notwendigkeit, die Datei unnötig größer zu machen.
>
> Als self-documenting code. Aber vielleicht nicht ganz so lang...
Also das tut ein Kommentar auch vor der trivialen Definition von `\x`.
> Meine Idee wäre eine Funktion, die
>
> * mehrere Muster als Leerzeichen-getrennten String als Argument
> annimmt,
> * dieses in einzelne Muster zerlegt
> * für jedes Muster eine Übersetzung nach einer Code-Tabelle vornimmt
> und
> - wenn alle Zeichen übersetzt werden können das Resultat ausgibt
> - wenn ein Zeichen nicht übersetzt werden kann, dieses Muster
> überspringt.
>
> Bsp: \UtfAchtToTeEins{grün Škoda λογο groß}
> → gr"fdn gro"ff
>
> Die Funktion `\text_titlecase_all:n(n)` schreibt alle Wörter des
> Arguments mit großem Anfangsbuchstaben. D.h. es gibt eine Funktion,
> die ähnliche Aufgaben wie meine Zielfunktion ausführt:
> - Zerlegen der Eingabe an Leerzeichen
> - Ersetzen von Zeichen
> Ihre Definition könnte ggf. bei der Implementierung meiner
> Zielfunktion als Vorbild oder Ausgangspunkt dienen. Ein
> LaTeX3-Experte möglicherweise helfen...
Die Idee klingt nett, ist aber meiner Meinung nach völlig fehl am
Platze im Rahmen von Trennmustern. Wir können einfach nicht
voraussetzen, daß beim Laden von Trennmustern stets die
LaTeX3-Maschinerie zur Verfügung steht!
Aber vielleicht verstehe ich Dich falsch?
Werner
Mehr Informationen über die Mailingliste Trennmuster