Sechs Fragen zur Terminologieprüfung

Blog-Beitrag vom 22.01.2019

Zum Thema Terminologiearbeit gibt es erfahrungsgemäß zwei vorherrschende Meinungen. Erstens: Terminologiearbeit ist wichtig und bringt viele Vorteile. Zweitens: Terminologiearbeit ist aufwändig, die Recherche kostet den Autor viel Zeit.

Wir sagen dazu: Wichtig und vorteilhaft ist Terminologiearbeit immer. Damit sie nicht aufwändig ist, kann eine Terminologieprüfung eingesetzt werden, die dem Autor zur Hand geht. Die Schwierigkeit bei der Auswahl einer Terminologieprüfung ist aber, dass es verschiedene Verfahren gibt. Hier müssen Sie sich die Frage stellen, welches Verfahren das richtige für Ihr Unternehmen ist.

Als Impuls für Ihre Entscheidungsfindung können die folgenden Fragen dienen.

1 Welche Verfahren zur Terminologieprüfung gibt es eigentlich?

Es gibt verschiedene Ansätze zur Terminologieprüfung. Die bekanntesten Ansätze sind:

  • Fuzzy-Matching: Die grundlegende Funktionsweise des Fuzzy-Matchings besteht darin, dass die Ähnlichkeit von zwei Strings auf Zeichenbasis bestimmt wird. Für die Ähnlichkeit wird ein bestimmter Schwellenwert festgelegt. Mit einem niedrigen Schwellenwert erhält man viele Treffer, dafür auch viele Falschmeldungen. Mit einem hohen Schwellenwert reduziert man die Falschmeldungen, bekommt aber auch weniger Treffer.
  • Stemming: Die Grundidee hinter Stemming ist, dass Wörter auf einen Wortstamm zurückgeführt und die Wortstämme miteinander verglichen werden. Ein Stemming-Verfahren muss für jede Sprache entwickelt werden. Dabei ist zu beachten, dass Stemming bei manchen Sprachen besser, bei anderen schlechter bzw. gar nicht funktioniert.
  • Linguistische Terminologieprüfung: Im Zuge dieses Verfahrens wird Sprache in Morpheme (kleinste bedeutungstragende Einheiten) zerlegt und dann einer linguistischen Analyse unter Beachtung der Wortbildungsregeln unterzogen.

2 Gibt es Unterschiede für bestimmte Sprachen?

Beim Fuzzy-Matching kommen keine Kenntnisse über Sprache zum Tragen. Dies hat den Vorteil, dass die Methode für alle Sprachen funktioniert.

Stemming funktioniert bei manchen Sprachen besser, bei anderen schlechter bzw. gar nicht. Für viele Sprachen sind bereits Software-Bibliotheken vorhanden.

Linguistische Verfahren zur Terminologieprüfung decken weniger Sprachen ab, da sehr aufwändig. Deutsch, Englisch und Französisch werden aber von den meisten Lösungen abgedeckt.

3 Gibt es besonders robuste Verfahren?

Fuzzy-Matching ist robust gegen Tippfehler. Der Grund ist, dass Strings mit Rechtschreibfehlern normalerweise den entsprechenden fehlerfreien Strings noch sehr ähnlich sind. Letztlich hängt die Robustheit gegenüber Rechtschreibfehlern von der Länge des Worts ab. Bei kurzen Wörtern kann ein falscher Buchstabe schnell zu einer geringen Ähnlichkeit führen.

Für Stemming und linguistische Terminologieprüfung gilt hingegen: Terme mit Rechtschreibfehlern werden meist nicht erkannt. Dies wird aber in der Regel durch eine Rechtschreibprüfung mit Benutzerwörterbuch abgefangen.

4 Was bringt eine gute Variantenerkennung?

Um von Fuzzy-Matching- oder Stemming-Verfahren erkannt zu werden, müssen alle Varianten einer Negativbenennung der Software explizit bekanntgemacht werden. Das ist immens aufwändig. Eine linguistische Terminologieprüfung erkennt automatisch auch linguistische Varianten hinterlegter Negativbenennungen, darunter:

  • Flexionen
  • Bindestrichvarianten
  • Fugenvarianten
  • Ableitungsvarianten
  • Syntaktische Varianten
  • Synonyme

So spart die Variantenerkennung einer linguistischen Terminologieprüfung viel Zeit bei der Terminologiehinterlegung und erfasst auch komplexe Varianten. 

5 Gibt es auch kostenfreie Verfahren?

Fuzzy-Matching- und Stemming-Verfahren sind mitunter kostenfrei erhältlich. Die Entwicklung einer linguistischen Terminologieprüfung erfordert einen nicht zu vernachlässigenden Forschungs- und Entwicklungsaufwand. Daraus resultiert, dass entsprechende Produkte ihren Preis haben.

6 Wie gut integrieren sich die Verfahren in meine Arbeitsumgebung?

Um eine Terminologieprüfung produktiv zu nutzen, ist es wichtig, zu klären, dass die Verfahren in die eigene Arbeitsumgebung integrierbar sind. Idealerweise stehen sie als Plug-In für den Editor oder das Redaktionssystem zur Verfügung. Durch eine möglichst breite Abdeckung aller gängigen Programme können Sie zudem an möglichst vielen Stellen des Unternehmens Konsistenz sicherstellen.

tl;dr

Die Nutzung einer maschinellen Terminologieprüfung bringt viele Vorteile, aber die Auswahl eines geeigneten Verfahrens kann kompliziert sein. Bei der Entscheidung sollten Sie neben dem Preis auch besonders Kriterien wie Sprachverfügbarkeit, Robustheit, Integrierbarkeit in die Arbeitsumgebung und das Vorhandensein einer guten Variantenerkennung einbeziehen.