In Ihrem Unternehmen werden laufend Texte produziert, der Textbestand wächst und wächst? Dann haben Sie vielleicht schon die Erfahrung gemacht, dass das Auffinden der wirklich wichtigen Informationen eine Herausforderung sein kann.
Wie lässt sich eine Suchfunktion für Ihre Textbestände so nutzen, dass Sie nicht nur 1:1-Entsprechungen finden können, sondern genau das, was Sie gesucht haben?
Linguistisches Phänomen:
Hier kommt Congree Search ins Spiel. Congree Search basiert auf linguistischen Technologien und kombiniert diese mit statistischen Verfahren. Aufgrund der ermittelten morphosyntaktischen Informationen über die Wörter Ihrer Texte kann Congree Search wichtige von unwichtigen Wörtern unterscheiden und garantieren, dass Textpassagen auch dann gefunden werden, wenn sie nicht nur 1:1-Entsprechungen der Suchbegriffe enthalten, sondern beispielsweise auch flektierte Formen und Schreibvarianten.
Fast 20% der Arbeitszeit werden mit Suche nach Informationen verschwendet.
Das liegt vor allem an der Schwäche der eingesetzten Suchtechnologie. Normale Search Engines arbeiten mit Fuzzy- und Stemming-Mechanismen und berücksichtigen linguistische Informationen nur oberflächlich.
Mit Congree Search erhalten Sie mehr Ergebnisse und bessere Relevanz dank linguistischer Intelligenz.
Wie funktioniert linguistische Suche
Linguistisch charakteristische Einheiten wie Komposita oder Nominalphrasen aus Adjektiv und Substantiv werden zunächst als potenzielle Schlagwörter ermittelt. Da linguistische Faktoren allein nicht ausreichen, um allgemeinsprachliche von fachgebietsspezifischen Wörtern zu unterscheiden, werden die ermittelten potenziellen Schlagwörter anschließend mithilfe ausgereifter statistischer Verfahren gewichtet.
Intelligente Ergebnisgewichtung
nach dem Tf-idf-Maß
Allgemein anerkannt sind die Annahmen, dass Schlagwörter, die in einem Dokument häufig vorkommen, wichtiger sind als weniger häufige Schlagwörter (Termfrequenz) und dass Schlagwörter, die in vielen Dokumenten des Dokumentbestands vorkommen, weniger wichtig sind als die, die nur in wenigen Dokumenten vorkommen (inverse Dokumenthäufigkeit).
Semantische Suche
Ein zusätzlicher Faktor, der in die Gewichtung einfließt, ist die Häufigkeit semantischer Merkmale, die in einem Text vorkommen.
Dazu ordnet Congree Search den ermittelten potenziellen Schlagwörtern jeweils eine Semantikklasse zu: Agent, Ding, Instrument, Material, Prozess und viele weitere. Auf Basis der Semantikklassen wird statistisch die Relevanz der Schlagwörter ermittelt: Je mehr Schlagwörter pro Klasse auftauchen, desto höher werden sie gewichtet.
Congree Search basiert auf der Indexierung Ihrer Texte.
Erweiterte Match-Erkennung
Linguistische Operationen und intelligente Matchingstrategien ermöglichen erweiterte Suchräume für Schlagwörter, die auf Basis einer Terminologie vergeben werden:
Transformation
- Stabilität des Netzes vs. Netzstabilität
- Reduktion von Emissionen vs. Emissionsreduktion
Diskontinuität
- indizierter und mechanischer Wirkungsgrad vs. indizierter Wirkungsgrad
Partielles Matching
- Servoantriebsregelung vs. Antriebsregelung
Synonymisierung
- Emissionsminderung vs. Emissionsreduktion
Berücksichtigung Ihrer Terminologie
Bei Durchführung der Indexierung können wir Ihre bereits vorhandene Unternehmensterminologie berücksichtigen. Die Einbindung der Terminologie garantiert die Erkennung relevanter Schlagwörter und führt dazu, dass Ihrem definierten Fachwortschatz bei einer Suche eine hohe Gewichtung zukommt.
Darüber hinaus kann das in der Terminologie hinterlegte Wissen über Begriffsrelationen – wie Ober- und Unterbegriff – genutzt werden, um beispielsweise von einem Heckantrieb auf einen Fahrzeugantrieb zu schließen.
Wir machen Suche erfolgreich
Kontaktieren Sie uns mit Ihrem Anliegen zu Congree Search. Wir beraten Sie gern zu den verschiedenen Integrationsmöglichkeiten und machen aus einem Suchen ein Finden.
Auch spezielle Anforderungen an Suchlösungen erfüllen wir gerne für Sie.
Ihre Ansprechpartner
Unsere Spezialisten für intelligente Suchlösungen helfen bei allen Fragen zu Congree Search.
E-Mail+49 (0) 721 6677570