An seiner Entwicklerkonferenz I/O hat Google am Mittwochabend verraten, wie es ChatGPT in den Schatten stellen will, ohne die gleichen Fehler zu machen. Dieser Beitrag dreht sich um die wichtigsten Software-Ankündigungen und geht der Frage nach, was hierzulande verfügbar ist.
Googles neuestes Fotos-Feature ist eine Funktion namens Magic Editor. Generative KI ermöglicht es, ganz einfach grössere Änderungen in einer Aufnahme vorzunehmen.
Die KI-Funktion für Google Fotos soll laut Ankündigung später in diesem Jahr verfügbar sein – zunächst allerdings nur auf «ausgewählten» neuen Pixel-Smartphones.
Die neue KI-Funktion «Magic Compose» soll in Nachrichten und Konversationen verwendet werden können, um Texte in verschiedenen Stilen umzuschreiben.
So gehts: Um mit Magic Compose zu starten, muss man gemäss Ankündigung die Google-App «Messages» verwenden und zunächst wie gewohnt den Text eingeben. Anschliessend wählt man aus, wie die Nachricht klingen soll, und die generative KI könne den Text entsprechend anpassen.
Laut Google soll «Magic Compose» noch in diesem Sommer als Betaversion für Android-User lanciert werden.
Google-Chef Pichai demonstrierte unter anderem, wie Software einen Brief für die User formulieren kann. Und wenn man eine Geschichte schreibt, soll die Software Vorschläge für weitere Wendungen der Story und automatisch generierte Illustrationen liefern können.
Die ChatGPT-Herausforderer aus dem Hause Google soll schon bald in 180 Ländern verfügbar sein, wenn auch nur auf Englisch. Das Eintragen in eine Warteliste entfalle für alle Interessierten, die den KI-Chatbot testen möchten.
Als sich der watson-Redaktor auf bard.google.com (mit dem eigenen Google-Account) anmeldete, gab es allerdings eine herbe Enttäuschung: «Derzeit nicht verfügbar», wurde auf dem Bildschirm angezeigt. 💩
Neu würden auch Japanisch und Koreanisch unterstützt, Deutsch und Schweizerdeutsch hingegen nicht. Weitere 40 Sprachen, darunter Deutsch, sollen «bald» folgen. Aber auch in den Ländern der Europäischen Union (EU) wird Bard zumindest vorerst nicht verfügbar sein.
Laut Ankündigung erhält Google Bard eine Reihe neuer Funktionen, darunter einfachere Möglichkeiten zum Exportieren von Text in Google Docs und Gmail, eine visuelle Suche und einen «Dark Mode» (Dunkelmodus).
Der neue KI-Chatbot kann nicht nur Sprache in Textform verarbeiten, er «versteht» bis zu einem gewissen Grad auch Bildinhalte. Dies wird als multimodal bezeichnet.
Auch die Google-Workspace-Apps, also die Bürosoftware, wird mit KI-Funktionen ergänzt, um sie leistungsfähiger zu machen: Dies soll etwa mit der Hinzufügung einer automatischen Tabellengenerierung (nicht von Formeln) geschehen und mit automatisierter Bilderstellung in Slides und Meet.
An der Entwicklerkonferenz hat Google die Einführung von PaLM 2 bekannt gegeben, seinem neuesten Large Language Model (LLM). Auf dieser Technologie basieren auch der neue KI-Chatbot Bard und weitere KI-Funktionen.
So wie es der Konkurrent OpenAI mit ChatGPT tut, gibt auch Google nicht viele technische Details darüber preis, wie es die nächste Generation der generativen KI trainiert.
Google sagt, das neue Modell sei besser in den Bereichen gesunder Menschenverstand, Mathematik und Logik. Und es komme nicht nur auf die Grösse an.
PaLM 2 bietet laut Ankündigung auch eine verbesserte Unterstützung für das Programmieren und Debuggen von Code. Das Modell wurde in 20 Programmiersprachen trainiert, darunter beliebte Sprachen wie JavaScript und Python.
Google spricht von PaLM als Familie von Modellen, zu denen auch Med-PaLM 2 gehört, das Modell des Unternehmens, das sich auf medizinisches Wissen konzentriert.
Es gebe auch noch Sec-PaLM, eine Version, die sich auf Sicherheitsanwendungen konzentriert, und ein kleineres PaLM-2-Modell, das auf Smartphones laufen könne.
Google will in Zukunft alle KI-generierten Inhalte mit einem digitalen Wasserzeichen versehen. Und diese Kennzeichnung, die gegen die Verbreitung von Fake News helfen kann, bleibe erhalten, auch wenn der Inhalt bearbeitet wird.
Googles Erzrivale Microsoft ist bekanntlich einen milliardenschweren Pakt mit der ChatGPT-Entwicklerfirma OpenAI eingegangen und baut generative KI auf breiter Front in seine Anwendungen ein. Google hielt sich bisher damit zurück, unter Verweis auf einen verantwortungsvollen Einsatz der Technologie und regulatorische Notwendigkeiten.
Auf der Google I/O bekräftigte der Konzern diesen Kurs. «Der einzige Weg, auf lange Sicht mutig zu sein, ist, von Anfang an verantwortungsvoll zu agieren», betonte am Mittwoch James Manyika, der bei Google für gesellschaftliche Verantwortung beim Einsatz Künstlicher Intelligenz zuständig ist.
Der Konzern sehe die Gefahr, dass die Software Vorurteile stärken oder für Produktion und Verbreitung von Falschinformationen verwendet werden könne. Zum Schutz davor sollen zum Beispiel mit Hilfe Künstlicher Intelligenz erzeugte Dateien mit Metadaten versehen werden, damit sie sofort erkannt werden können.
Auch werde Google eine Software, die automatisch Synchronfassungen von Videos anfertigen kann, nur überprüften Entwicklern zur Verfügung stellen, sagte Manyika. Damit sollen sogenannte Deepfakes mit angeblichen Handlungen realer Personen verhindert werden.
Manyika betonte zugleich, dass Google sich schon vor Jahren dagegen entschieden habe, Schnittstellen für Anwendungen mit Gesichtserkennung öffentlich verfügbar zu machen. Beim verantwortungsvollen Einsatz Künstlicher Intelligenz müssten alle Beteiligten zusammenarbeiten.
Generative KI wird auch in die Google-Suche integriert:
Die neuen KI-Such-Funktionen sollen zunächst nur für interessierte Tester verfügbar sein. Wer es ausprobieren möchte, soll sich bei labs.google.com/search anmelden können. Allerdings ist dies mit dem Standort Schweiz nicht möglich. 💩
Mithilfe der integrativen KI soll die Suchmaschine etwa die Frage beantworten können, welcher von zwei Naturparks für eine Familie mit Kindern und Hund besser geeignet sei. Die Antworten werden in ganzen Sätzen formuliert, als Zusatz gibt es die gewohnten Internet-Links.
Bei Produktsuchen gebe es neben den bisherigen Shopping-Vorschlägen KI-generierte Hinweise und Tipps – etwa, worauf bei einem Velokauf zu achten sei. Die Shopping-Anzeigen würden ebenfalls mit KI-Erklärungen ergänzt, heisst es.
Bei der Suche nach einem Gefährt werden zusätzlich zu Ratschlägen, etwa auf die Radaufhängung zu achten, auch passende Angebote von Händlern angezeigt. Zusätzlich könnte man sich zum Beispiel zu Regeln für Handzeichen beim Radfahren in Kalifornien befragen lassen, sagte Google-Managerin Cathy Edwards. «Das sind Dinge, nach denen man früher nie in der Suche gefragt hätte.»
Aber: Google betont, dass «Bard» ein Experiment sei und kein ernsthafter Ersatz für seine Suchmaschine.
Ausserdem lanciert Googles ein experimentelles KI-Tool, das Text in Musik umwandeln kann. Das im Januar angekündigte «Music LM» soll man nun ausprobieren können.
Googles Karten-App soll in einigen Städten «Immersive View» für Routen bekommen. Dabei wird eine virtuelle Vorschau der vom User gewählten Strecke angezeigt, die unter anderem den aktuellen Verkehr als kleine, animierte Fahrzeuge visualisiert. Auch das Wetter wird angezeigt. Egal, ob man die Strecke per Auto, Velo oder zu Fuss absolvieren will.
Zu den auserwählten Metropolen, die Immersive View als Erste erhalten, gehören Amsterdam, Berlin, Dublin, Florenz, Las Vegas, London, Los Angeles, Miami, New York, Paris, San Francisco, San Jose, Seattle, Tokio und Venedig.
Eine Schweizer Stadt ist nicht darunter. 💩
Seitdem ChatGPT im vergangenen November für die Öffentlichkeit zugänglich gemacht wurde, hat in der IT-Branche ein wilder Wettlauf um generative KI-Systeme begonnen, die auf Nutzeranfragen in natürlicher Sprache in Sekundenschnelle Inhalte generieren können.
Der Hype rund um die Möglichkeiten der neuen KI-Systeme schwankt in der Öffentlichkeit dabei zwischen überschwänglicher Begeisterung und apokalyptischen Befürchtungen.
Auch Google zog nach und machte sein Konkurrenzprodukt Bard Ende März eingeschränkt der Öffentlichkeit zugänglich.
Die Verantwortlichen beim US-Techkonzern werden nicht müde zu betonen, dass Google kein Neueinsteiger ist.
«Seit sieben Jahren sind wir in erster Linie ein Unternehmen für künstliche Intelligenz, und wir stehen an einem Wendepunkt», sagte der Chef des kalifornischen Konzerns, Sundar Pichai, am Mittwochabend zur Eröffnung der I/O im Google-Amphitheater im kalifornischen Mountain View.
Microsoft hat kürzlich ähnliche Ankündigungen gemacht. Der IT-Riese, der zweistellige Milliardenbeträge in den kalifornischen ChatGPT-Entwickler OpenAI investiert hat, hatte ChatGPT bereits in die eigene Suchmaschine Bing integriert und öffnete die KI-Suche vergangene Woche vollständig für die Öffentlichkeit - wodurch das im Vergleich zu Google unbedeutende Suchportal wiederbelebt wurde.
Mit Material der Nachrichtenagenturen Keystone-SDA und DPA
Es darf nicht sein, dass man Deep Fake Bilder und Videos von anderen Menschen oder Ereignissen erstellen kann, ohne dass dies klar für Menschen erkennbar ist, ohne dass es dafür strafrchtliche Folgen gibt. Ohne solche Gesetze gibt es ein grosses Missbrauchpotential für Fake News.