[Trennmuster] Trennstellkategorien

Guenter Milde milde at users.sf.net
Do Mär 15 13:57:46 CET 2012


On 14.03.12, Werner LEMBERG wrote:

> > I propose '|' for suffixes (Vorsilben), z.B.

> ... ah, another category :-)

Genau.

Für Ligaturunterdrückung (L) Lang-S-Schreibung (S) und Silbentrennung (T)
ist insbesondere die Unterscheidung zwischen normaler Trennung und
Trennung nach Wortteilen wichtig:

* normal     L: höf-lich -> höflich
             S: es-sen  -> eſſen
             T: es-sen  -> es-sen

* Präfix     L: Auf|la-ge -> Auf\/lage
             S: Aus|sa-ge -> Ausſage
             T: An|den-ken -> An--den-ken

* Wortfuge   L: Chef=ideo-lo-ge         -> Chef\/ideologe
             S: Eis=schicht             -> Eisſchicht
             T: Be|gleit=er|schei-nung  -> Be-gleit--erschei-nung

Für die anvisierten Anwendungsfälle kann die Unterscheidung Präfix vs.
Wortfuge auch über eine Wichtung der Haupttrennstellen erfolgen:

  Be=gleit==er=schei-nung  -> Be-gleit--erschei-nung

Dabei geht allerdings die Unterscheidung verloren, ob es sich bei dem
Wort um ein Kompositum oder ein Derivat handelt.

Mir scheint eine separate Kategorie in der "master" Wortliste einfacher
zu lesen und zu pflegen und "einfach richtig". Aber ich bin kein Germanist
und lasse mich auch anderweitig überzeugen.


> > [about `.' vs. `_']
> >
> > I am not sure, whether we need (or can do) this conceptual
> > distinction: Both, low line '_' and full stop '.' indicate an
> > "undesired" hyphenation point (i.e. a hyphenation that point that
> > should not be used but nevertheless marked as existent to make clear
> > we know it exists).

> This should be discussed, indeed.

> > The full stop '.' is the "legacy" character, used in words that have
> > non-categorized marks '·'.

> AFAIK, this is not correct; `.' is not restricted to non-categorized
> words.  For example, we have

>   An-den.ken

Das hat mein Skript kürzlich aus "An·den.ken" generiert. Der Punkt ist
hier immer noch ein Platzhalter für nicht bearbeitete Fälle. (Damit sind
nun die ersten teilkategorisierten Wörter in der "master" Wortliste.)

Das Andenken sollte (genau wie die anderen Be-gleit=er.schei-nun-gen)
baldmöglichst kategorisiert werden. Dazu ist allerdings zunächst eine
Einigung auf die gewünschte Markierung dieser Fälle nötig:


* Gibt es unerwünschte Wortfugen? (Dann bräuchten wir '-.' vs. '=.'.)

* Möchten wir die "Unerwünschtheit" wichten ('-.', '-..', '-...' …)
  oder kategorisieren?

  Gibt es eine scharfe, allgemein anerkannte Unterscheidung von
  "unerwünscht", "sinnverwirrend" und "sinnentstellend" oder sind die
  Übergänge fließend?

  Ist eine "Nottrennstelle" (Tel-tow_er) genau definiert? Sollten wir
  sie anders als andere zu unterdrückende Trennstellen markieren
  (z.B. mit '_')?

* Bis zu welchem Abstand von einer Haupttrennstelle wird die Trennung
  automatisch unterdrückt?

> [For non-wortliste users: a hyphenation point is `near' if the
>  distance is smaller than three characters.]

  Ist dieser Abstand (z.B. beim Erzeugen der Trennmusterdateien)
  konfigurierbar?

  -> Ab welchem Abstand sollte eine zusätzliche Markierung zu
  unterdrückender Trennstellen erfolgen? (Abwägen: Rauschen vs.
  Informationsverlust)

> As you correctly write, some of the full stops could be avoided.
> However, in some cases `=.' could be helpful for clarity.


> > The to-be-suppressed hyphenation point in An·den.ken or the famous
> > Ur·in.stink, on the other hand, might still need a special mark.
> >
> > Proposals are Ur|in_stinkt or Ur=in-.stinkt.

> As mentioned in other mails `.' is essentially a shorthand for `-.'.

Diese Deutung ist allerdings bisher weder "formal" angenommen noch in den
Regeln oder in "dateikopf" dokumentiert. Auch kommt die "Langform" bisher
nicht vor.
  

Günter



Mehr Informationen über die Mailingliste Trennmuster