Mit unseren linguistischen Analyseverfahren wandeln wir Ihre Altdaten Schritt für Schritt in Texte um, die nicht nur den allgemeinen sprachlichen Qualitätsstandards genügen, sondern auch Ihre terminologischen und redaktionellen Vorgaben berücksichtigen. Ihre Texte sind damit fit für den Einsatz moderner Sprach- und Informationstechnologien wie etwa einem Translation Memory oder einem Authoring Memory.
Sie haben es bisher nicht gewagt, Ihre sprachlichen Altdaten auf den heutigen Stand sprachlicher Qualitätsstandards zu heben?
Ihre Produktstammdaten und die dazugehörigen Texte sind durchgängig in Großbuchstaben verfasst, kennen weder Umlaute noch ß oder folgen der alten Rechtschreibung?
Leerzeichen sind wahllos gesetzt, Wörter teils abgeschnitten oder willkürlich abgekürzt?
Standards für spezielle Datentypen wie Maßangaben, Schraubenbezeichnungen oder Teilenummern werden nicht konsequent eingehalten – ganz zu schweigen von terminologischen oder redaktionellen Vorgaben?
Dann ist es höchste Zeit, Ihre sprachlichen Altdaten einer Verjüngungskur zu unterziehen!
Datenbereinigung in fünf Schritten
- Leerzeichen normalisieren
- Datentypen standardisieren
- Strings regelbasiert ersetzen
- Rechtschreibung korrigieren
- Terminologie vereinheitlichen
- Maßangaben
- Schraubenbezeichnungen
- Teilenummern u. a.
- Schreibvarianten
- Abkürzungen u. a.
- Versalschreibung
- alte Rechtschreibung
- Falschschreibungen u. a.
- Negativbenennungen
- Termvarianten
Von der Dublettenreduktion zur Variantenermittlung
Nach der Bereinigung Ihrer Altdaten werden sich bereits viele Texte als Dubletten erweisen. Darüber hinaus können Gruppen ähnlicher Texte ermittelt werden. Die Ähnlichkeitsberechnung orientiert sich dabei zunächst strikt an den Zeichenfolgen der Texte.
Ein erweitertes Verfahren der Ähnlichkeitsberechnung berücksichtigt die linguistischen Wortanalysen und lässt die Wortstellung außer Acht. Terminologische Konzepte können in die Ähnlichkeitsberechnung einbezogen und dabei stärker gewichtet werden als andere Inhaltswörter.
Indem Sie Textähnlichkeiten bereinigen, reduzieren Sie Schritt für Schritt das Volumen der übersetzungsrelevanten Texte. Sie sind damit bestens aufgestellt für den Einsatz eines Translation Memory Systems. Und Ihr konsolidierter Textbestand eignet sich hervorragend für die Erstbefüllung eines Authoring Memorys.
Wir bereinigen Ihre Daten mit System
Kontaktieren Sie uns mit Ihrem Anliegen zur Bereinigung und Konsolidierung Ihrer sprachlichen Altdaten wie Produktstammdaten, Stücklisten, Teilekataloge und viele andere.
Auch spezielle Anforderungen an die Sprachdatenbereinigung erfüllen wir gerne für Sie.
Ihr Ansprechpartner
Unsere Spezialisten für die Datenaufbereitung helfen bei allen Fragen zur Sprachdatenbereinigung.
E-Mail+49 (0) 721 6677570