[Trennmuster] Buße/Busse

Werner LEMBERG wl at gnu.org
Mo Nov 14 12:31:29 CET 2016


[versehentlich privat geantwortet]

>> > Ich fände es allerdings schöner, wenn die Wortliste das richtig
>> > hätte und nur bei "Mischmustern für de-1901 und de-1901-versal
>> > die Vorrangregelung greift.
>
>> Das geht bei den schweizer Mustern derzeit nicht, denn...
>
>> > die vereinfachte Form wäre
>> >
>> >   Bussystem;-2-;Bus=sy-stem;Bus=sys-tem
>> >
>> > ich bin (siehe oben) für
>> >
>> >   Bussystem;-2-;Bus=sy-stem;Bus=sys-tem;-5-;Bus=sy-stem;Bus=sys-tem;Bu[ss=/{ss/ss=s}]y-stem
>> >
>> > aber auf jeden fall nicht:
>> >
>> >   Bussystem;-2-;Bus=sy-stem;Bus=sys-tem;-5-;Bus=sy-stem;Bus=sys-tem;-8-
>> >
>> > denn das würde ja bedeuten es gäbe kein Bussystem in alter
>> > Schweizer Schreibung - aber es gibt ja gleich 2: Bus-System und
>> > Buss=System.
>>
>> ... es gibt ein grundlegendes Problem, das schon vor ein paar
>> Wochen auf der Liste diskutiert wurde: Es hat sich herausgestellt,
>> daß das »offizielle« Format der Wortliste aus Gründen der Les- und
>> Wartbarkeit für schweizer Einträge *nur additiv* ist und keine
>> Möglichkeit für Alternativformen bietet.
>
> Das »offizielle« Format (d.h. die Definition in README.wortliste)
> ist da nicht eindeutig:

Ja, das war ein Lapsus damals.

>   Leere Felder sind mit „-x-“ markiert („x“ ist die Feldnummer);
>   Felder 3 und 4 als auch Felder 6, 7 und 8 treten immer simultan
>   auf, um die Lesbarkeit zu erhöhen
>
> aber was ist "leer"?
>
>   * für Felder 2 bis 7 heißt leer: gibts nicht
>
>   * für Feld 8 gilt die inoffizielle (nicht in README.wortliste
>     dokumentierte) Deutung:
>
>> Mit anderen Worten, der Eintrag
>
>>   Bussystem;-2-;Bus=sy-stem;Bus=sys-tem;-5-;Bus=sy-stem;Bus=sys-tem;-8-
>
>> bedeutet nicht, daß es »Bussystem« nicht in schweizAR gibt, sondern
>> daß es keine *zusätzliche* schweizer AR-Form gibt und stattdessen
>> der ARversal-Eintrag verwendet wird.
>
> Das ist problematisch, denn damit können wir nicht mehr zwischen
> vorhandenen und nicht vorhandenen Wörtern in de-CH-1901
> unterscheiden:

Ganz genau.  Ich habe das inkauf genommen, um uns Arbeit zu ersparen
und die Lesbarkeit bei der Bearbeitung zu erhöhen.

> Wie soll ein Algorithmus denn für
>
>   Bussystem;-2-;Bus=sy-stem;Bus=sys-tem;-5-;Bus=sy-stem;Bus=sys-tem;-8-
>
>   Passsystem;-2-;-3-;Pass=sys-tem;-5-;Pass=sy-stem;Pass=sys-tem;-8-
>
> und
>
>   Passstücke;-2-;-3-;Pass=stü-cke;-5-;Pass=stü{ck/k-k}e;Pass=stü-cke;-8-
>
> das Vorhandensein in de-CH-1901 bestimmen?

So ist es.  Aber wir haben jetzt die Gelegenheit, diesen Schnitzer zu
korrigieren.

>> Da wir jetzt auf ein neues internes Format umsteigen und das
>> offizielle Format komplett daraus erzeugt wird, können wir diese
>> Beschränkung aufheben und tatsächlich Alternativformen anbieten:
>> Wenn wir ein »-x-«-Feld haben, dann gibt's diese Form nicht für die
>> entsprechende Rechtschreibung.  Das bedeutet natürlich, daß im
>> offiziellen Format fast alle »-8-«-Einträge durch Dopplungen von
>> Feld 7 ersetzt werden müssen – da das aber ein Skript macht, sehe
>> ich keinerlei Probleme.
>
> Wir haben 2 Möglichkeiten:
>
> a) Doppelungen in Feld 8
>
> b) Verzicht auf die Regelung:
>
>      Felder 6, 7 und 8 treten immer simultan auf, um die Lesbarkeit zu
>      erhöhen
>
>    und Festschreiben der Regel: ein "ausgekreuztes" Feld (-x-)
>    bedeutet, dass die Schreibweise in Feld 1 in der entsprechenden
>    Orthographie nicht gültig ist.
>
> Ich halte b) für lesbarer.

Mir ist alles recht, ich hab' da keine Präferenz.  Da wir wohl primär
mit dem internen Format arbeiten werden, bin ich für jede Verbesserung
zu haben.

Gibt's weitere Meinungen dazu?


    Werner




Mehr Informationen über die Mailingliste Trennmuster