[Trennmuster] Trennstellenunterdrückung
Werner LEMBERG
wl at gnu.org
Do Mai 17 07:42:23 CEST 2018
>> Das ist nicht notwendig. Was ich haben will, ist einfach die
>> Aktivierung der »anderen« einbuchstabigen Trennstelle.
>
> Für "Flatterbuchstaben" oder für alle vier Fälle von Trennstellen
> mit Abstand eins? (vgl. Trennstile.txt)
Flatterbuchstaben – und vielleicht ähnlich gelagertes, das kann ich
nicht genauer sagen.
> Wenn "für alle", was ist dann die "andere" Stelle bei z.B.
> ger<i-a-t-ri-sche, Bi-n<o-kel, o·pi-o-i-.de oder Di-a<g-no-se?
Ja, das Aufdröseln von »gn« und Freunden macht's recht unübersichtlich
– und fehleranfällig meiner Meinung nach. Seufz. Das sind die
Schattenseiten der derzeitigen Kampagne. Hat jemand von Euch schon
Trennmuster erzeugt und dort Fehler gesucht? Wie kann man z.B. das
Wort »ger<i-a-t-ri-sche« zähmen? Im Besonderen: funktioniert die
Fremdwort-Automatik, sodaß das »t« ans »r« angebunden wird, wenn man
etymologisch trennen will? Und ist nicht eigentlich »ger« als
verblaßte Vorsilbe zu betrachten? Dann hätten wir
»ge-r-i-a-t-ri-sche«! Das müßte dann reduziert werden nach
. Sprechsilben, mit »tr« zusammen: ge-ri-a-tri-sche
. nur Sprechsilben: ge-ri-at-ri-sche
. etymologisch: ger-ia-tri-sche
Geht das alles *zuverlässig* mittels Filter? Reicht die derzeitige
Auszeichnung dafür aus?
Leider komme ich derzeit nur zum Antworten von E-Mails (und das auch
mit Verzögerung) und nicht zu herumprobieren – im Mai und Juni ist
immer sehr viel los in meinen Jobs...
> Wenn wir ein neues Trennstellensymbol einführen, ist es sehr
> erheblich, zu definieren wo es stehen darf, was es bedeuten soll und
> wie es in den verschiedenen Anwendungsfällen zu verarbeiten ist.
>
> Welchen Unterschied zu An<woh-ner=in<.i-ti-a-ti-ve soll denn das «·»
> kennzeichnen?
Falls der Fall »-.x-.« auftritt, soll meiner Meinung nach »·« den
»alternativen Flatterbuchstaben« darstellen, z.B. »-.x·«.
>> Schalter 1: Semantische Trennungen ein/aus.
>
> Ich vermute, Du meinst "semantisch irreführende" Trennstellen:
Ja.
>> An<woh-ner=in-i-ti-a-ti-ve <--> An<woh-ner=ini-ti-a-ti-ve
>> Ur<in<stinkt <--> Ur<instinkt
>
> Schalter 1 gilt also auch für Trennstellen *ohne* Nachbar im Abstand 1,
> richtig?
Ja.
> Soll/darf Schalter 1 auch "phonetisch irreführende" Trennstellen schalten?
>
> Ab<fra-ge=in-.ter<vall: Ab<fra-ge=in-ter<vall / Ab<fra-ge=inter<vall
> Ju-da-i-.stik: Ju-da>i-stik / Ju-da>istik
Nein, sollte er nicht, deswegen die von mir vorgeschlagene andere
Auszeichnung.
> Soll/darf Schalter 1 "Nottrennstellen" schalten?
>
> Tel-tow-.er: Tel-tow-er / Tel-tower
> Ko-.a-la: Ko-a-la / Koa-la
Dazu hab' ich keine Meinung. Nottrennungen sind mir bei der
Mustererzeugung nie negativ aufgefallen; sie könnten, wenn's nach mir
geht, so behandelt werden wie bisher.
>> Schalter 2: Keine einbuchstabigen Trennungen mit
>> bevorzugter/alternativer Unterdrückung.
>
> Was bedeutet hier bevorzugt/alternativ?
Von *uns* bevorzugt :-)
> Mit Stand 2018-05-09 gibt es vier Anlässe für die Auszeichnung von
> Trennstellen mit Abstand eins mit unterschiedlichen
> "Vorzugsregelungen" und damit die zusätzlichen Trenn-Varianten:
>
> An<woh-ner=ini-ti-ati-ve # modern + Flatterbuchstabe nach hinten
>
> An<woh-ner=in<itia-ti-ve # etymologisch + Flatterbuchstabe nach vorn
Das kann ich jetzt nicht beantworten – im Prinzip ist es allerdings
egal: Hauptsache, die Trennstellen werden systematisch kategorisiert
(durch Filter, eigene Marker, was auch immer), sodaß ich verschiedene
Muster zum Testen konstruieren kann, die weder einbuchstabige
Trennungen noch sementisch irreführende Trennungen enthalten.
> Die "An<woh-ner=in<.i-ti-a-ti-ve" ist ein komplexer Fall, [...]
Ja. Mir ist dieses Wort beim Anwenden des super-einfachen Filters in
»extract-tex.pl« als erstes aufgefallen. Wenn ich das verfeinere
(sobald ich mal wieder Zeit hab'), kommt bestimmt noch mehr :-)
>> Also ich denke, wir können uns ein neues Zeichen leisten :-)
>
> Ein extra Zeichen für seltene Ausnahmen ist eine schlechte Idee --
> die Bedeutung wird schnell vergessen und verwirrt dann nur. Für
> Einzelfälle fände ich z.B. einen "formalisierten Kommentar" deutlich
> günstiger.
Hmm. Wie sollte das ausschauen, Deiner Meinung nach, damit das
maschinell erfaßt werden kann?
> Das Problem ist, dass in bei normalem Text im "modernem" Trennstil
> die Trennung "Anwohnerini-tiative" zulässig ist, die Trennung
> "gea-delt" aber nicht. Wie soll das bei einer Auszeichnung mit
>
> An<woh-ner=in<.i·ti-a-ti-ve und ge<a·delt
»<« ist stärker als ».« oder »·«, falls nicht als ungünstig markiert.
Werner
Mehr Informationen über die Mailingliste Trennmuster