Watson (Künstliche Intelligenz)

Watson ist ein Computerprogramm aus dem Bereich der künstlichen Intelligenz. Es wurde von IBM entwickelt, um Antworten auf Fragen zu geben, die in digitaler Form in natürlicher Sprache eingegeben werden. Das nach Thomas J. Watson, einem der ersten Präsidenten von IBM, benannte Programm wurde als Teil des DeepQA-Forschungsprojektes entwickelt.[1]

Zur Demonstration seiner Leistungsfähigkeit konkurrierte das Programm in drei vom 14. bis 16. Februar 2011 ausgestrahlten Folgen der Quizsendung Jeopardy! mit zwei menschlichen Gegnern, die in der Show zuvor Rekordsummen gewonnen hatten. Die Partie, für die ein Preisgeld von einer Million Dollar ausgelobt war, wurde in den Medien daher mit dem Duell des Schachweltmeisters Garri Kasparow gegen den Computer Deep Blue verglichen.[2] Das System gewann das Spiel mit einem Endstand von $77.147 gegenüber den $24.000 bzw. $21.600 seiner menschlichen Konkurrenten.[3][4] Im Januar 2017 ersetzte eine japanische Versicherung mehr als 30 Mitarbeiter durch die Watson-Plattform.[5] Die KI soll Namen und Daten der Versicherten sowie deren medizinische Vorgeschichte prüfen und Verletzungen bewerten.

Inzwischen wird der Begriff Watson von IBM für unterschiedliche Lösungen verwendet, die künstliche Intelligenz in Data-, AI- und Businessanwendungen integrieren.[6]

Hintergrund und Zielsetzung

Ziel des Projekts ist es letztlich, eine hochwertige Semantische Suchmaschine zu schaffen. Diese soll den Sinn einer in natürlicher Sprache gestellten Frage erfassen und in einer großen Datenbank, die ebenfalls Texte in natürlicher Sprache umfasst, innerhalb kurzer Zeit die relevanten Passagen und Fakten auffinden. Eine derartige Software könnte in vielen Bereichen, etwa der medizinischen Diagnostik, komplexe Entscheidungen unterstützen, insbesondere wenn diese unter Zeitdruck getroffen werden müssen.

Watson implementiert Algorithmen der Natürlichen Sprachverarbeitung und des Information Retrieval, aufbauend auf Methoden des Maschinellen Lernens, der Wissensrepräsentation und der automatischen Inferenz.[7] Das System enthält Softwaremodule zur Erstellung von Hypothesen, ihrer Analyse und Bewertung. Es greift dabei auf eine Aussagensammlung und umfangreiche Textbestände zurück, ist jedoch nicht mit dem Internet verbunden. Anfragen an Watson werden bislang in Textform gestellt. Anders als aktuelle Systeme wie z. B. Wolfram Alpha benötigt es jedoch keine formale Abfragesprache. Seit Februar 2011 arbeitet IBM mit der Firma Nuance zusammen, einem führenden Hersteller von Software zur Spracherkennung. Die geplante Fähigkeit, auch gesprochene Fragen zu bearbeiten, soll den Einsatz einer spezialisierten Version Watsons im Gesundheitswesen erleichtern.[8]

IBM plant, auf Watson basierende Systeme im Laufe der nächsten Jahre kommerziell zu vermarkten. Der Leiter des zuständigen Forschungslabors geht davon aus, dass die Kosten des Gesamtsystems zunächst mehrere Millionen US-Dollar betragen könnten, da bereits die notwendige Hardware mindestens eine Million Dollar kostet.[9] Im Rahmen von Pilotstudien wurde das System bislang unter anderem dazu verwendet, Vorhersagen zu treffen, welche Arzneistoffe gegen bestimmte Krankheiten wirksam sein könnten; durch Integration zahlreicher Sensordaten und Informationen zu Umwelteinflüssen vorherzusagen, welche Bauteile komplexer Industriemaschinen Gefahr laufen vorzeitig auszufallen und daher gewartet werden sollten; aber auch dazu, innovative Kombinationen von Zutaten für schmackhafte Kochrezepte vorzuschlagen.[10] Zudem ist geplant zukünftig neuromorphe Chips, wie z. B. TrueNorth, zu integrieren um Eingaben in Form von natürlicher Sprache, Bildern und Videos, sowie beliebigen Sensoren zu ermöglichen.[11] Darüber hinaus soll Watson in Zukunft Rechtsanwälte bei der rechtlichen Recherche in juristischen Datenbanken entlasten.[12]

Auftritt bei Jeopardy!

Ken Jennings, ein 74-maliger Sieger bei Jeopardy!, unterlag im Februar 2011 dem Computerprogramm Watson

Die Quizshow Jeopardy! stellt Systeme zur automatischen Beantwortung natürlichsprachiger Fragen vor eine interessante Herausforderung, da die als Antworten gestellten Aufgaben meist bewusst mehrdeutig formuliert sind, häufig die Verknüpfung mehrerer Fakten erforderlich machen und die passende Frage innerhalb eines Zeitlimits von fünf Sekunden gefunden werden muss. Die Entwickler des System Watson setzten sich daher das Ziel, in diesem Spiel menschliche Kandidaten zu schlagen.

Bei ersten Testläufen im Jahr 2006 fand Watson nur für etwa 15 % von 500 Umschreibungen vorangegangener Jeopardy!-Sendungen die korrekte Frage. Die besten Kandidaten von Jeopardy! erreichen im Vergleich dazu etwa 95 % Genauigkeit. Im Laufe der nächsten Jahre wurde Watson mit einer Datenbank von ungefähr 100 Gigabyte an Texten ausgestattet, darunter Wörterbücher, Enzyklopädien, wie z. B. die gesamte Wikipedia, und anderes Referenzmaterial. Watson hat jedoch keine Verbindung zum Internet, ist also, wie seine menschlichen Gegenspieler, auf sich allein gestellt. Die Informationen werden unter anderem statistisch ausgewertet, um Sinnbezüge herzuleiten. Anstatt sich auf einen einzelnen Algorithmus zu stützen, nutzt Watson hunderte davon gleichzeitig, um über einen Pfad eine potentiell richtige Antwort zu finden. Je mehr Algorithmen unabhängig voneinander die gleiche Antwort erreichen, als desto wahrscheinlicher wird es angesehen, dass Watson die korrekte Lösung gefunden hat. Wenn das System für eine Aufgabe eine kleine Anzahl potentieller Lösungen erarbeitet hat, werden diese anhand einer Datenbank überprüft, um zu bewerten, welche davon als potentiell sinnvoll gelten können. Dazu werden z. B. Zeitangaben überprüft.

In einer Sequenz von 20 Übungsspielen nutzten die menschlichen Kandidaten die 6 bis 8 Sekunden Dauer während des Lesens des Ratebegriffes dazu, den Buzzer zu betätigen und die korrekte Antwort zu geben. Das auf diese Zeitspanne optimierte System Watson evaluiert eine Antwort und entscheidet, ob es genügend Sicherheit bezüglich des Ergebnisses gibt, um den Buzzer auszulösen.[9][13]

Seit Februar 2010 ist Watson in der Lage, im Rahmen regelgerechter Partien menschliche Jeopardy!-Kandidaten zu schlagen.[14] IBM stellte zunächst eine Übungssituation in einem Konferenzraum im Thomas J. Watson Research Center in Yorktown Heights, New York, nach, die die Situation bei Jeopardy nachahmt, und ließ Einzelpersonen, einschließlich früherer Jeopardy-Kandidaten, in Probespielen gegen Watson teilnehmen, mit Todd Alan Crain von The Onion als Quizmaster. Dem Computersystem, auf dem Watson ausgeführt wurde, wurden die Ratebegriffe (als Antwort auf eine Frage) elektronisch übermittelt und es war in der Lage, den Buzzer zu betätigen und mit einer elektronischen Stimme die Antworten im Jeopardy-eigenen Frageformat zu geben.[9][13]

Schließlich trat Watson bei Jeopardy in drei Sendungen, die zwischen dem 14. und 16. Februar 2011 ausgestrahlt wurden, gegen die früheren Champions Ken Jennings und Brad Rutter an, welche in der Show zuvor Rekordsummen gewonnen hatten. Nachdem das System Watson und der Kandidat Rutter nach der ersten Runde noch gleichauf lagen, ging Watson aus den beiden anderen als klarer Sieger hervor. Das Preisgeld von einer Million US-Dollar stellte IBM gemeinnützigen Zwecken zur Verfügung. Jennings und Rutter kündigten an, jeweils die Hälfte ihrer Preise von $300.000 bzw. $200.000 zu spenden.[3]

Aufbau

Die Softwareengine von Watson ist DeepQA. Diese läuft bei Watson auf dem Betriebssystem SUSE Linux Enterprise Server.[15]

Der Rechnerverbund besteht aus 90 Power 750 Servern mit 16 TB RAM. Jeder Server besitzt einen mit 3,5 GHz getakteten Power7 8-Kern Prozessor, wobei jeder Kern bis zu 4 Threads gleichzeitig ausführt.[16][17]

Geschrieben wurde DeepQA in verschiedenen Programmiersprachen; darunter Java, C++ und Prolog. DeepQA ist hierbei in Form von Annotatoren einer UIMA-Pipeline implementiert.[18][19]

Durch den Einsatz von UIMA Asynchronous Scaleout und Hadoop wird eine massive Parallelisierung ermöglicht. Spezielle UIMA Annotatoren ermöglichen dabei eine Abbildung auf Hadoop MapReduce-Schema um eine große Anzahl von Textdokumenten parallel durchsuchen zu können.

Funktionsweise

Funktionsweise von IBM Watson

Watson übernimmt eine Jeopardy!-Antwort (die Frage) des Moderators in elektronischer Form über eine Tastatur. Eine solche Jeopardy!-Antwort kann dabei sehr komplex sein und aus mehreren Sätzen, Rätseln und Wortwitzen bestehen.

Linguistischer Präprozessor

Die Jeopardy!-Antwort wird von der DeepQA-Engine mit Hilfe eines Linguistischen-Präprozessors analysiert. Dabei wird die logische Struktur mit Hilfe eines Parsers des Satzes als Baum in Prolog abgebildet.

Ein Tokenizer, bestehend aus UIMA-Annotatoren für Pattern Matching, kümmert sich um die Abbildung auf Lexikalische Antworttypen (LAT). Dabei wird die Beziehung der Satzteile zueinander (die Grammatik) analysiert. Das betrifft insbesondere das Pronomen (auf das Watson sich mit der von ihm zu generierenden Frage beziehen muss), sowie Wörter, die angeben, welche Klasse von Antwort (z. B. Poet, Land, Epoche etc.) gesucht wird.[20]

Das Pronomen wird – sofern dieses nicht als solches erkennbar ist – dadurch gefunden, dass durch dessen Entfernung aus der Frage eine Aussage wird. Auf diesen Teil des Satzes legt DeepQA den Fokus bei der Kandidatenbewertung.[21]

Kandidatengenerierung

Die Kandidatengenerierung nimmt den Prolog-Code des Linguistischen Präprozessors entgegen und leitet diese an verschiedene Suchmaschinen weiter. Hierbei wird etwa INDRI und Lucene für die Durchsuchung von unstrukturierten Dokumenten eingesetzt, welche in einem HDFS gespeichert sind. Zudem gibt es spezielle Engines die den LAT-Prolog-Code entgegennehmen und SPARQL-Abfragen auf semantischen Datenbanken (Triplestores) bzw. SQL-Abfragen auf relationalen Datenbanken durchführen, welche auf DB2 basieren.[22] Die Dokumente decken hierbei ein breiteres Wissensgebiet ab und sind schneller durchsuchbar, während die strukturierten und insbesondere semantischen Datenquellen eine höhere Genauigkeit bieten.[21]

Die Daten stammen aus verschiedenen Quellen, wie etwa DBpedia, Wordnet, Yago, Cyc, Freebase, Wikipedia, IMDB, World Book Encyclopedia, der Bibel sowie verschiedenen Taxonomien und Ontologien, Literarischen Werken und Artikeln von PR Newswire und New York Times. Zudem werden Webseiten analysiert und in Form von Textschnipseln in den Datenbanken von Watson gespeichert.[21]

DeepQA generiert dabei zwischen 100 und 250 Suchergebnisse. Diese Ergebnisse (Kandidaten) stellen Hypothesen für die mögliche Antwort dar.[21]

In Jeopardy! hat Watson keinen Zugriff auf das Internet, sondern nur auf die Daten in den internen Datenbanken. Prinzipiell hat DeepQA für zukünftige Anwendungen jedoch auch die Möglichkeit, weitere Informationen aus dem Internet zu beziehen und mit Hilfe von Webservices auch Echtzeitdaten zu berücksichtigen.

Kandidatenbewertung

Die wahrscheinlichsten Ergebnisse der Suche werden genauer analysiert. Hierzu besitzt DeepQA mehrere tausend Softwareagenten die jeweils eine ganz spezielle Analyse parallel durchführen. Hierzu gehören vor allem Agenten für die Analyse von zeitlichen (temporalen) und räumlichen (spatiellen) Zusammenhängen, Taxonomien, einfachen Berechnungen für Rechenrätsel, Bewertung der Akustik für Wörter die ähnlich klingen, Scrabble-Bewertung für Wörter deren Buchstaben vertauscht wurden, Agenten, die Suchergebnisse einer genaueren semantischen Analyse durchführen, sowie viele andere mehr.

Diese Analyse umfasst oft ein sehr breites Wissensspektrum, wobei verschiedene Kandidaten und Wissensdomänen von den jeweiligen Agenten voneinander unabhängig und massiv parallel analysiert werden. Da jedes Suchergebnis von bis zu tausend Agenten analysiert wird, multipliziert sich die Anzahl der gleichzeitig analysierten Evidenzfragmente. Aus den 100 bis 250 Hypothesen werden somit bis zu 100.000 Evidenzfragmente die in unabhängigen Threads analysiert werden. Ein Softwarefilter eliminiert alle Ergebnisse von Agenten, die keinen Beweis für die Richtigkeit eines Suchergebnisses erbracht haben.

Einsatzbeispiele

„Olli“ auf der CeBIT 2017

Ende August 2016 veröffentlichte 20th Century Fox einen Trailer zum Film Das Morgan Projekt, der von Watson gefertigt wurde. Es handelt sich dabei um den ersten Trailer der Filmgeschichte, der durch einen Algorithmus entstanden ist.[23] Der IBM-Manager John R. Smith erklärte in einem Blogeintrag, Watson habe insgesamt 100 Trailer von Horrorfilmen analysiert, um den rund 60 Sekunden langen Trailer zu fertigen. Watson unterteilte diese in Segmente, und nach einer visuellen Analyse, einer Audio-Analyse und einer Analyse der Szenen-Zusammensetzung, analysierte die künstliche Intelligenz den Film Morgan und filterte die passenden Stellen heraus. Letztlich entschied sich das System für zehn Sequenzen, aus denen dann ein Filmteam den Trailer zusammensetzte.[24]

Auf der CeBIT 2017 präsentierte IBM einen autonomen Bus namens Olli, der durch Watson gesteuert wird. Watson und Olli sind vernetzt, die Rechenleistung kommt aus IBMs Datenzentrum in Frankfurt.[25][26][27]

In Form von unterschiedlichen Anwendungen steht Watson mittlerweile auch Endnutzern zur Verfügung. Ein Beispiel hierfür ist Cognos Analytics, eine Software für intelligente Datenanalyse und Visualisierung, oder Watson Assistant, mit dem intelligente Chatbots und digitale Assistenten erstellt werden können.[28] Zahlreiche weitere Watson Services können teilweise sogar kostenlos über die IBM Cloud in Anspruch genommen werden und reichen von Bild- und Spracherkennung bis hin zu Machine Learning Modellen.[29]

Im Bereich der Onkologie berät Watson for Oncology Krebsärzte in 230 Krankenhäusern weltweit bei der Suche nach der jeweils besten Therapie (Stand Mitte 2018). Allerdings kritisierte 2017 der Leiter der Krebsabteilung von Kopenhagens Reichskrankenhaus das System scharf und stoppte an seiner Klinik das Experiment.[30] Aus internen IBM-Dokumenten ging hervor, dass Watson oftmals falsche Behandlungstipps gegeben hatte und dass IBM-Medizinspezialisten und Kunden zahlreiche Beispiele für unsichere und falsche Behandlungsempfehlungen festgestellt hatten. Ursache sei eine nur geringe Anzahl künstlicher Krebsfälle statt echter Patientendaten gewesen; außerdem basierten die Empfehlungen auf der Expertise einiger weniger Spezialisten für jede Krebsart statt auf Richtlinien oder Nachweisen. IBM-intern war bekannt, dass Watson ungenaue Empfehlungen gab, die im Widerspruch zu nationalen Behandlungsrichtlinien standen; außerdem stellte sich heraus, dass Studien, die IBM mit der Software durchgeführt hatte und deren Ergebnisse als Beweis für die Nützlichkeit des Systems angepriesen wurden, so angelegt waren, dass sie günstige Ergebnisse erbrachten.[31]

IBM Watson wurde beim Grand Slam Turnier in Wimbledon eingesetzt, um Spieldaten von Tennisspielern zu analysieren und Spielergebnisse vorherzusagen. Dieses System verwendet historische Daten und aktuelle Turnierdaten, um Prognosen zu erstellen. Es analysiert den möglichen Spielverlauf basierend auf Variablen wie Oberflächentyp, Wetterbedingungen und jüngsten Spielerleistungen. Solche Erkenntnisse können Spielern und Trainern helfen, effektivere Spielstrategien gegen Gegner zu planen, indem sie wahrscheinliche Muster und Ergebnisse verstehen und so möglicherweise die Gewinnchancen in hart umkämpften Spielen erhöhen.[32]

Filmische Dokumentationen

Videos

Einzelnachweise

  1. The DeepQA Project. IBM, abgerufen am 14. Oktober 2012 (englisch).
  2. Dylan Loeb McClain: First Came the Machine That Defeated a Chess Champion. In: New York Times. 16. Februar 2011, abgerufen am 10. September 2011 (englisch).
  3. a b John Markoff: On ‘Jeopardy,’ Watson’s a Natural. In: New York Times. 16. Februar 2011, abgerufen am 16. Februar 2011.
  4. Watson lässt Quizkönige alt aussehen. In: Spiegel Online netzwelt. Abgerufen am 16. Februar 2011.
  5. Till Haase: IBM-Software in japanischem Unternehmen: Versicherung ersetzt 34 Mitarbeiter durch künstliche Intelligenz. In: DRadio Wissen. 4. Januar 2017, abgerufen am 4. Januar 2017.
  6. IBM Watson. Abgerufen am 3. Februar 2022 (amerikanisches Englisch).
  7. DeepQA FAQs. IBM, abgerufen am 14. Oktober 2012.
  8. Pressemitteilung der Firma Nuance (Memento vom 20. Februar 2011 im Internet Archive) (englisch) vom 17. Februar 2011, abgerufen am 24. Februar 2011.
  9. a b c Clive Thompson: What Is I.B.M.’s Watson? In: New York Times. 14. Juni 2010, abgerufen am 2. Juli 2010 (englisch).
  10. Steve Lohr: And Now, From I.B.M., Chef Watson. In: New York Times. 27. Februar 2013, abgerufen am 4. März 2013 (englisch).
  11. Dharmendra S. Modha: Introducing a Brain-inspired Computer: TrueNorth’s neurons to revolutionize system architecture. IBM Research, abgerufen am 7. August 2014 (englisch).
  12. Künstliche Intelligenz revolutioniert Rechtsberatung. In: Strafjournal. Archiviert vom Original (nicht mehr online verfügbar) am 13. April 2016; abgerufen am 13. April 2016.
  13. a b Computer: Watson und die Pet Shop Boys. In: Spiegel Online. 12. Juli 2010, abgerufen am 14. Oktober 2012.
  14. Jon Brodkin: IBM's Jeopardy-playing machine can now beat human contestants. Network World, 10. Februar 2010, archiviert vom Original (nicht mehr online verfügbar) am 3. Juni 2013; abgerufen am 14. Oktober 2012 (englisch).
  15. IBM Watson runs SUSE Linux Enterprise Server. Novell, abgerufen am 10. September 2011 (englisch).
  16. Amara D. Angelicas: How Watson works: a conversation with Eric Brown, IBM Research Manager. 31. Januar 2011, abgerufen am 16. Februar 2011 (englisch).
  17. Is Watson the smartest machine on earth? 10. Februar 2011, abgerufen am 14. Oktober 2012.
  18. Dean Takahashi: IBM researcher explains what Watson gets right and wrong. VentureBeat, 17. Februar 2011, abgerufen am 18. Februar 2011 (englisch).
  19. Adam Lally, Paul Fodor: Natural Language Processing With Prolog in the IBM Watson System. The Association for Logic Programming, 31. März 2011, abgerufen am 18. Oktober 2001 (englisch).
  20. Adam Lally, Paul Fodor: Natural Language Processing With Prolog in the IBM Watson System. (PDF; 67 kB) 24. Mai 2011, abgerufen am 14. Oktober 2012 (englisch).
  21. a b c d David Ferrucci, Eric Brown, Jennifer Chu-Carroll, James Fan, David Gondek, Aditya A. Kalyanpur, Adam Lally, J. William Murdock, Eric Nyberg, John Prager, Nico Schlaefer, Chris Welty: The AI behind Watson – The Technical Article. In: AI Magazine. AAAI, 2010, abgerufen am 14. Oktober 2012.
  22. Howard Baldwin: Smarter is: Making Watson smarter…faster. IBM Data Management magazine, 15. April 2011, archiviert vom Original (nicht mehr online verfügbar) am 28. Januar 2015; abgerufen am 28. Oktober 2012.
  23. Julia Alexander: Watch the first ever movie trailer made by artificial intelligence In: polygon.com, 1. September 2016.
  24. Giuseppe Rondinella: KI 'Watson' entwickelt für 'Morgan' den perfekten Filmtrailer In: horizont.net, 2. September 2016.
  25. Ein Bus, der keinen Fahrer braucht In: Süddeutsche Zeitung, 13. Dezember 2016.
  26. Der Bus Olli braucht keinen Fahrer In: golem.de, 22. März 2017
  27. Olli: Local Motors baut autonome Busse für die Bahn In: cebit.de, 2. Januar 2017
  28. Was ist ein Chatbot. IBM, abgerufen am 7. Mai 2019.
  29. Watson Services in der IBM Cloud. IBM, abgerufen am 7. Mai 2019.
  30. Christian J. Meier: IBMs virtueller Arzt macht Fehler. In: www.nzz.ch. 9. August 2018, abgerufen am 9. August 2018.
  31. Casey Ross und Ike Swetlitz: IBM’s Watson supercomputer recommended ‘unsafe and incorrect’ cancer treatments, internal documents show. In: www.STATNews.com. 25. Juli 2018, abgerufen am 15. August 2022 (englisch).
  32. 10 ways AI is being used in Tennis, 2024, DigitalDefynd. Abgerufen am 7. November 2024.