Cebit 2016: Wenn die Suchmaschine mitdenkt und riesige Textbestände automatisch analysiert
Auch im Zeitalter von Diensthandys und firmeninternen Chatrooms werden die meisten Informationen in Unternehmen nicht über das gesprochene Wort, sondern über Mails, Datenbanken und interne Newsportale ausgetauscht. „Laut einer Marktanalyse des Medienunternehmens Gartner nutzen derzeit jedoch nur ein Viertel der Unternehmen weltweit automatisierte Methoden, um ihre Textbestände zu analysieren und besser zu verstehen. In fünf Jahren werden es nach Gartners Schätzungen mehr als die Hälfte sein, da die Datenmengen in Firmen kontinuierlich wachsen und es immer aufwändiger wird, diese sinnvoll zu strukturieren und mit Erfolg zu durchsuchen“, sagt Johannes Hoffart, Forscher am Max-Planck-Institut für Informatik und Gründer der Firma Ambiverse. Sein Team hat daher eine Technologie für die Analyse von großen Textbeständen entwickelt, bei der viel Rechenpower und Künstliche Intelligenz im Hintergrund buchstäblich „mitdenkt“.
„Wir greifen bei unseren Textanalysen auf frei verfügbares Wissen zurück, zum Beispiel auf Wikipedia oder große Nachrichtenportale im Internet. Dieses können wir mit unternehmensspezifischem Wissen anreichern, etwa aus Produktkatalogen oder dem Schriftverkehr mit Kunden“, erläutert Hoffart. Über komplexe Rechenverfahren werden die Texte dann genauer durchleuchtet und mit Hilfe von linguistischen Werkzeugen analysiert. „Wir können dann Firmen und Branchen einzelnen Kategorien zuordnen und zum Beispiel untersuchen, wie sich die eigene Produkte im Vergleich mit den Angeboten der Konkurrenz im Markt positionieren konnten“, sagt Hoffart. Die Herausforderung sei dabei, dass die Namen von Unternehmen oder Produkten meist nicht nur einmal auf der Welt vergeben werden, sondern in verschiedenen Bedeutungen und in vielfältigen Zusammenhängen erscheinen.
„Unsere Technologie hilft dabei, automatisiert die richtigen Bezüge herzustellen“, erklärt der Informatiker. Der Name Paris steht zum Beispiel nicht nur für die Stadt des Lichts und die Hauptstadt Frankreichs, sondern bezieht sich auch auf die griechische Mythologie und ein prominentes Partygirl mit deutschen Vorfahren, das millionenfach im Internet auftaucht. „Nur wenn es gelingt, diese verschiedenen Bedeutungen eines Namens oder eines Sachverhalts richtig zuzuordnen, kann man riesige Textbestände sinnvoll durchsuchen“, so Hoffart. Die von seinem Team entwickelte intelligente Suchmaschine lernt dabei laufend dazu und ordnet automatisch neue Textinhalte den passenden Kategorien zu. „Die Rechenverfahren sind daher auch für Firmen interessant, die Onlinemedien und soziale Netzwerke auswerten, um etwa den Bekanntheitsgrad eines Produktes oder den Erfolg einer Marketingkampagne zu messen“, nennt Hoffart als weiteres Beispiel.
Das Spin-Off-Unternehmen Ambiverse wird auf der Computermesse Cebit außerdem einen intelligenten Editor vorstellen, der Autoren bei der Recherche und dem Schreiben von Texten unterstützt. Wer dort die Eingabemaske mit neuem Text füttert, bekommt zum Beispiel Hintergrundinformationen aus firmeninternen Leitfäden oder auch aus Internetquellen zur Verfügung gestellt. „Im Text werden zudem wichtige Begriffe automatisch verlinkt und weitere Recherchemöglichkeiten eingeblendet“, so der Informatiker.
Am saarländischen Forschungsstand auf der Cebit (Halle 6, Stand D 28) werden Besucher die Möglichkeit haben, in einem Frage-und-Antwort-Spiel gegen die Künstliche Intelligenz von Ambiverse anzutreten. Ambiverse wird durch das Programm EXIST-Forschungstransfer des Bundesministeriums für Wirtschaft und Energie unterstützt.
Weitere Informationen: www.ambiverse.com
Pressefoto unter: www.uni-saarland.de/pressefotos
Presse-Kontakt:
Dr. Johannes Hoffart
Ambiverse
Max-Planck-Institut für Informatik
Tel +49 681 9325-5024
Fax +49 681 9325-5099
E-Mail: johannes@ambiverse.com