Im Wettlauf bei Künstlicher Intelligenz will sich Google mit dem neuen Sprachmodell Gemini an die Spitze setzen. Das KI-System soll nicht nur mit dem Sprachmodell GPT4 des Konkurrenten OpenAI mithalten, sondern es auch übertreffen.
Google-Chef Sundar Pichai nahm am Mittwoch zur Ankündigung von Gemini den Mund ziemlich voll: Der Wandel, den man gerade mit der KI erlebe, sei der «tiefgreifendste in unserem Leben», er sei «weitaus grösser als die Umstellung auf das Mobiltelefon oder auf das Internet davor».
Als multimodales KI-Modell sei Gemini in der Lage, Informationen aus einer Vielzahl verschiedener Quellen zu interpretieren und zu generalisieren. Hierzu zählten etwa Texte, Bilder, Audio-Aufnahmen, Videos und Programmiersprachen.
We believe in making AI helpful for everyone. That’s why we’re launching Gemini, our most capable model that’s inspired by the way people understand and interact with the world. #GeminiAI pic.twitter.com/gNG9ha9xMO
— Google (@Google) December 6, 2023
Gemini kann nicht nur in einem Chatbot Texte generieren, sondern auch bestimmte Probleme lösen und situationsabhängige Entscheidungen treffen. Es kann auch Informationen aus Fotos und Videos aufnehmen.
Google demonstrierte das System mit einem Videochat, bei dem Gemini Zeichnungen und Handgesten des menschlichen Gegenübers sofort erkannte und richtig einordnete.
Bard werde ab sofort in über 170 Ländern auf Englisch verfügbar sein. Google plane aber, in naher Zukunft neue Sprachen und Standorte zu unterstützen.
«Wir bringen Gemini über die Google-Produkte zu Milliarden von Menschen», kündigte der Chef von Google DeepMind, Demis Hassabis, an.
Die Google-Tochter DeepMind war im April 2023 aus dem 2014 zugekauften, gleichnamigen britischen Start-up und der Google-internen KI-Abteilung hervorgegangen.
Mit der Integration des bis zu diesem Zeitpunkt weitgehend unabhängig agierenden Start-ups wollte Pichai die KI-Anstrengungen im Google-Konzern bündeln, um entschiedener gegen OpenAI antreten zu können.
Google wird das neue System in drei unterschiedlichen Versionen für verschiedene Produkte und Dienste einführen: Gemini Ultra, Gemini Pro und Gemini Nano.
Gemini Ultra ist das grösste und leistungsfähigste Modell für hochkomplexe Aufgaben. Diese Variante richtet sich vor allem an Unternehmenskunden.
Gemini Pro wird sich an ein breites Publikum wenden und beispielsweise dem Chatbot Google Bard «fortgeschrittenes Denken, Planen, Verstehen und mehr» beibringen. «Dies ist das grösste Upgrade für Bard seit seiner Einführung», sagte Hassabis.
Gemini Nano bringt das KI-System auf das Topmodell der Google-Smartphones Pixel.
In den kommenden Monaten werde Gemini in weiteren Google-Produkten und Diensten wie Suche, Werbeanzeigen oder dem Chrome-Browser verfügbar sein.
«Das Pixel 8 Pro ist das erste Smartphone, auf dem Gemini Nano läuft», kündigte Hassabis an. Damit lässt sich beispielsweise mit der Recorder App nicht nur gesprochene Sprache aus einem längeren Meeting, einer Vorlesung oder einem Interview aufzeichnen und in Echtzeit in schriftliche Sprache umwandeln.
Mit Hilfe von Gemini Nano könne das Pixel dann ausserdem ohne Zeitverzögerung eine kompakte Zusammenfassung erstellen.
Google arbeitet schon seit Jahren an Anwendungen auf Basis Künstlicher Intelligenz, steht aktuell aber unter Zugzwang, mehr davon preiszugeben.
Vor einem Jahr löste das Start-up OpenAI einen neuen Wettstreit bei Künstlicher Intelligenz aus, als es seinen Chat-Bot ChatGPT öffentlich machte.
Die Software sorgte für viel Aufsehen, weil sie Sätze wie ein Mensch bilden kann. Sie wird mit gewaltigen Datenmengen trainiert und schätzt Wort für Wort ab, wie ein Satz weitergehen könnte. Das bringt das Risiko mit sich, dass sie völlig falsche Informationen ausgeben kann.
(dsc/sda/awp/dpa)