WELTNEUHEIT: «Es wird gar nichts gespeichert»

Die Softwareschmiede Hulbee AG in Egnach hat ein Programm entwickelt, das selbst Google hinten anstehen lässt. Getdigest fasst mit Hilfe künstlicher Intelligenz (KI) innert Sekunden Texte zusammen. Online kann das Programm gratis genutzt werden.

Stefan Borkert
Drucken

Interview: Stefan Borkert

In Luzern sitzt der kommerzielle Schweizer Referatedienst Get­abstract. Er ist seit 1999 spezialisiert auf die Zusammenfassung von Welt- und Wirtschaftsliteratur. Was bei Getabstract Menschen leisten, leistet bei Getdigest künstliche Intelligenz (KI), und zwar für alle Texte. Treibende Kraft dahinter ist Hulbee-Chef Andreas Wiebe.

Andreas Wiebe, wie lange hat die Entwicklung von Getdigest gedauert?

Mit der Entwicklung haben wir bereits im Jahr 2002 angefangen und bauten im ersten Anlauf den Algorithmus und den ersten Thesaurus, also eine Wortschatzdatenbank. Wir sind ein inter­nationales Unternehmen und entwickeln jeweils in mehreren Ländern. Bei Getdigest waren drei Länder beteiligt: Schweiz, Deutschland und Ukraine.

Woher weiss die Software, was wichtig ist und was nicht?

Es ist eine komplexe Softwaretechnologie aus dem Bereich der KI. Unkompliziert dargestellt, besteht die Technologie aus einer Wissensdatenbank einer Thesaurus-Datenbank, Semantik, einer Sprachenbibliothek und jeder Menge Algorithmen.

Die darin enthalten sind?

Wir füllen die Wissensdatenbank erst einmal mit vielen Informationen zu verschiedenen Themen. Die Software beginnt zu lernen. Dabei soll unter anderem ein bestehender Thesaurus erweitert werden. Somit kann die Software beispielsweise erkennen, ob beim Wort Maus über die Tierwelt oder Computertechnik gesprochen wird. Ebenso wird jede unwichtige Information wie etwa Artikel aussortiert, da sie kein Wissen mit sich trägt.

Analyse ist also ein zentrales Merkmal?

Ja. Jedes Wort wird analysiert und mit Hilfe von KI und Statistik verglichen und erst dann die Zusammenfassung erstellt. Die Technologie erkennt quasi, was die wichtigste Information in einem jeweiligen Zusammenhang ist. Um die Ergebnisse auf den heutigen Stand zu bringen, musste die Software erst einmal mit Unmengen an Daten gefüllt werden.

Was ist der Vorteil der Softwa­re gegenüber dem Menschen?

Wenn wir sie mit dem Menschen vergleichen, so ist es wie bei einem Kind, das mit dem Wachstum klüger wird. Jedoch kann die Software in all diesen Bereichen schneller wachsen als ein Mensch. Es bedarf hier natürlich ausser der Software leistungsstarke Computer, um die Rechenprozesse schnell verarbeiten zu können. Dazu nutzen wir Dutzende Server in unserem Datenzentrum in der Schweiz. Übrigens ist der sprachliche Aspekt auch sehr wichtig. Die Technologie kann Informationen in mehr als 30 Sprachen verstehen.

Warum ist nichts Vergleichbares etwa von Google bereits auf dem Markt, so dass Hulbee nun eine Weltneuheit präsentieren kann?

Wir begannen mit der Forschung zu einer Zeit, als sich viele in die übliche Softwareentwicklung stürzten. KI war zu dieser Zeit eher Fluch als Segen. Die Forschung ist sehr aufwendig und benötigt viel Zeit. Unternehmen haben das erst vor etwa zwei Jahren entdeckt und mit den Entwicklungen begonnen. Doch das wird jetzt seine Zeit brauchen.

Yahoo hatte schon mal was Ähnliches in der Pipeline.

Die Expertin auf dem Gebiet von KI, die frühere Google-Mitarbeiterin Marissa Mayer, hat als Chefin von Yahoo 2014 ein Start-up mit dem ersten Ansatz im Bereich der Summary Software für 30 Millionen Dollar gekauft. Meine Meinung ist, dass die Zeit für die automatisierte Analyse von Texten und Informationen erst noch folgen wird. Denn erst jetzt begreifen die Unternehmen, dass die Flut von Informationen drastisch steigt.

Werden die eingegebenen Tex­te und Zusammenfassungen in einer Datenbank gesammelt?

Es wird nichts, gar nichts gespeichert oder gesammelt! Nicht ein Buchstabe, das garantiere ich! Es gibt auch keine Datenbank!

Haben Sie die Urheberrechtsfragen vorher geklärt?

Weil wir nichts behalten und nichts speichern, liegt es nicht an uns, die Urheberrechte der Nutzer anzuzweifeln. Das müssen die Nutzer selbst verantworten.