Unsere automatische Termextraktion bietet Ihnen die ideale Unterstützung für grundlegende Arbeitsschritte beim Terminologieaufbau. Vergleichen Sie auch die Ergebnisse Ihrer bisherigen Termextraktionsmethoden mit den Ergebnissen unserer linguistisch fundierten Methoden und überzeugen Sie sich von den Vorzügen.
Sie haben noch keine unternehmenseigene Terminologie?
Oder wollen Sie Ihre Terminologie auf der Grundlage Ihres Dokumentbestands erweitern?
Sie haben Terminologie bisher manuell extrahiert?
Oder setzen Sie bereits Tools für die Termextraktion ein?
Linguistische Analyse
Bei der Analyse Ihrer Textdaten setzen wir linguistische Analyseverfahren ein. Dabei ermittelt die morphologische Analyse für jedes einzelne Wort die Grundform, die Wortart und zugehörige grammatische Information wie z. B. das Genus von Substantiven.
Durch die automatische Grundformenberechnung werden unterschiedlich gebeugte Formen zusammengefasst (z. B. Dieselmotor, Dieselmotoren, Dieselmotors).
Die grammatische Analyse erkennt Wortgruppen und Satzbaumuster. Auf dieser Basis werden Termkandidaten unterschiedlicher Bildungsmuster ermittelt:
- Nominalphrasen bestehend aus einem Adjektiv und einem Substantiv wie z. B. dieselhydraulischer Antrieb
- zusammengesetzte Substantive wie z. B. Dieselmotor
- einfache Substantive wie z. B. Differenzial
Auszug Beispielanalyse
Grundform | Originalwort | Wortart | Genus | Kriterium | # Belegstellen | # Belegdokumente | Belege |
---|---|---|---|---|---|---|---|
dieselhydraulischer Antrieb | Dieselhydraulischer Antrieb dieselhydraulischen Antriebs | adj noun | m | np | 2 | 1 | home.html |
Dieselkraftstoff | Dieselkraftstoff | noun | m | compound | 2 | 1 | home.html |
Diesellokomotive | Diesellokomotiven | noun | f | compound | 1 | 1 | dlok.html |
dieselmechanischer Antrieb | Dieselmechanischer Antrieb | adj noun | m | np | 1 | 1 | home.html |
Dieselmotor | Dieselmotor Dieselmotoren Dieselmotors | noun | m | compound | 9 | 2 | home.html dmotor.html |
Differenzial | Differenzial | noun | n | simplex | 1 | 1 | diff.html |
Statistische Auswertung
Statistische Auswertungsverfahren ermitteln die Vorkommenshäufigkeit der Termkandidaten und die Anzahl der Belegdokumente pro Term. Diese Zahlen unterstützen Sie im Entscheidungsprozess für die Festlegung Ihrer Terminologie.
Features
- lexikografische Grundform
- grammatisches Geschlecht
- unterschiedliche Bildungsmuster
- Vorkommenshäufigkeit
- Anzahl der Belegdokumente
- Liste der Belegdokumente
- Vorkommenskontexte
- Aufbereitung als Excel-Tabelle
Kontextermittlung
Die Ermittlung der Vorkommenskontexte von Termkandidaten basiert auf der Kombination von statistischen und linguistischen Verfahren. Hierbei werden die Kontexte, in denen ein Termkandidat verwendet wird, auf linguistische Plausibilität überprüft.
So können Sie sich bei der Sichtung der Kontexte schnell und umfassend ein Bild von der sprachlichen und fachlichen Verwendung eines Termkandidaten machen.
Zuordnung von Metadaten
Durch die Zuordnung von Dokument-Metadaten gemäß Ihren speziellen Anforderungen (z. B. Dokumentart, Baugruppe, Abteilung) können wir Ihnen spezifische Sichten auf die Extraktionsergebnisse ermöglichen.
So erfahren Sie beispielsweise, welche Terme abteilungsübergreifend verwendet werden oder welche Terme für bestimmte Dokumentarten oder Baugruppen spezifisch sind.
Berücksichtigung der Bestandsterminologie
Bei Durchführung einer Termextraktion können wir auch Ihre Bestandsterminologie berücksichtigen. Terme, die schon in Ihrer Terminologie erfasst sind, werden gesondert ausgezeichnet. So können Sie sich ein umfassendes Bild davon machen, wie häufig und in welchen Dokumenten Bestandsterme überhaupt vorkommen.
Sie wissen abschließend, welche Terme dringend in Ihrer Terminologie zu ergänzen sind. Außerdem wird offensichtlich, welche Bestandsterme irrelevant sind, da Sie in keinem oder kaum einem Dokument verwendet werden.
Evaluierung der extrahierten Terme
Kombinieren Sie die Termextraktion mit einer Terminologieevaluierung. So erfahren Sie beispielsweise, welche Termkandidaten nur in falscher Schreibung belegt oder unter Gesichtspunkten der Termbildung problematisch sind, wie in den folgenden Beispielen:
Umleitdampfeinführungsversteifungsrohr
Hierbei handelt es sich um eine sehr komplexe Wortzusammensetzung, die durch einen Bindestrich strukturiert werden sollte.
Abdichtband / Dichtband / Dichtungsband
Die drei Termkandidaten sind bedeutungsgleiche Varianten voneinander.
Wir bauen effizient Terminologie auf
Kontaktieren Sie uns mit Ihrem Anliegen zur Extraktion von Terminologie aus Ihren Dokumentbeständen.
Auch spezielle Anforderungen an die Termextraktion erfüllen wir gerne für Sie.
Ihr Ansprechpartner
Unsere Spezialisten für den Terminologieaufbau helfen bei allen Fragen zu Ihrer Unternehmensterminologie.
E-Mail+49 (0) 721 6677570