Datenbereinigung

Wir bringen Ihre sprachlichen Altdaten auf Vordermann!

Mit unseren linguistischen Analyseverfahren wandeln wir Ihre Altdaten Schritt für Schritt in Texte um, die nicht nur den allgemeinen sprachlichen Qualitätsstandards genügen, sondern auch Ihre terminologischen und redaktionellen Vorgaben berücksichtigen. Ihre Texte sind damit fit für den Einsatz moderner Sprach- und Informationstechnologien wie etwa einem Translation Memory oder einem Authoring Memory.

Sie haben es bisher nicht gewagt, Ihre sprachlichen Altdaten auf den heutigen Stand sprachlicher Qualitätsstandards zu heben?

Ihre Produktstammdaten und die dazugehörigen Texte sind durchgängig in Großbuchstaben verfasst, kennen weder Umlaute noch ß oder folgen der alten Rechtschreibung?

Leerzeichen sind wahllos gesetzt, Wörter teils abgeschnitten oder willkürlich abgekürzt?

Standards für spezielle Datentypen wie Maßangaben, Schraubenbezeichnungen oder Teilenummern werden nicht konsequent eingehalten – ganz zu schweigen von terminologischen oder redaktionellen Vorgaben?

Dann ist es höchste Zeit, Ihre sprachlichen Altdaten einer Verjüngungskur zu unterziehen!

Datenbereinigung in fünf Schritten

  1. Leerzeichen normalisieren
  2. Datentypen standardisieren
  3. Strings regelbasiert ersetzen
  4. Rechtschreibung korrigieren
  5. Terminologie vereinheitlichen
  • Maßangaben
  • Schraubenbezeichnungen
  • Teilenummern u. a.
  • Schreibvarianten
  • Abkürzungen u. a.
  • Versalschreibung
  • alte Rechtschreibung
  • Falschschreibungen u. a.
  • Negativbenennungen
  • Termvarianten

Von der Dublettenreduktion zur Variantenermittlung

Nach der Bereinigung Ihrer Altdaten werden sich bereits viele Texte als Dubletten erweisen. Darüber hinaus können Gruppen ähnlicher Texte ermittelt werden. Die Ähnlichkeitsberechnung orientiert sich dabei zunächst strikt an den Zeichenfolgen der Texte.

Ein erweitertes Verfahren der Ähnlichkeitsberechnung berücksichtigt die linguistischen Wortanalysen und lässt die Wortstellung außer Acht. Terminologische Konzepte können in die Ähnlichkeitsberechnung einbezogen und dabei stärker gewichtet werden als andere Inhaltswörter.

Indem Sie Textähnlichkeiten bereinigen, reduzieren Sie Schritt für Schritt das Volumen der übersetzungsrelevanten Texte. Sie sind damit bestens aufgestellt für den Einsatz eines Translation Memory Systems. Und Ihr konsolidierter Textbestand eignet sich hervorragend für die Erstbefüllung eines Authoring Memorys.

Wir bereinigen Ihre Daten mit System

Kontaktieren Sie uns mit Ihrem Anliegen zur Bereinigung und Konsolidierung Ihrer sprachlichen Altdaten wie Produktstammdaten, Stücklisten, Teilekataloge und viele andere.

Auch spezielle Anforderungen an die Sprachdatenbereinigung erfüllen wir gerne für Sie.

Ihr Ansprechpartner

Unsere Spezialisten für die Datenaufbereitung helfen bei allen Fragen zur Sprachdatenbereinigung.

E-Mail+49 (0) 721 6677570

Axel Theofilidis
Language Technology Developer

Mit Absendung Ihrer Daten erklären Sie Ihre Einwilligung darin, dass wir diese in dem in unseren Datenschutzhinweisen genannten Umfang zum Zweck der Bearbeitung Ihrer Anfrage verarbeiten und Sie auf demselben Kommunikationsweg kontaktieren dürfen. Überdies verarbeiten wir die Daten aufgrund berechtigten Interesses. Wir löschen die Daten dann, wenn Ihre Anfrage erkennbar endgültig erledigt ist, die Einwilligung widerrufen wird bzw. Sie wirksam der weiteren Verarbeitung Ihrer Daten durch uns widersprechen. Weitere Informationen dazu erhalten Sie in unseren Datenschutzhinweisen.