Der Chatbot ChatGPT kann jetzt eine Unterhaltung mit Menschen führen. Die US-Entwicklerfirma OpenAI demonstrierte am Montag das Modell Künstlicher Intelligenz (KI) GPT-4o, das sich mit seiner menschlichen Stimme mit den Usern austauscht.
Das Modell übersetzt ausserdem zwischen verschiedenen Sprachen und kann gleichzeitig mit gesprochenen Befehlen auch Informationen von einer Smartphone-Kamera verarbeiten.
ChatGPT wird damit zu einem mächtigen Konkurrenten für die Sprachassistenten der Tech-Schwergewichte wie Amazons Alexa und Apples Siri.
This is wild.
— Min Choi (@minchoi) May 13, 2024
OpenAI just dropped ChatGPT-4o and it will completely change the AI assistant game.
10 wild examples:
1. Visual assistant in real-timepic.twitter.com/D3qWzHGzaD
Apple, das am 10. Juni zum Auftakt seiner Entwicklerkonferenz WWDC neue Software vorstellen wird, setzt laut Gerüchteküche auf einen Deal mit OpenAI. Wie der Techjournalist Mark Gurman am Wochenende für Bloomberg berichtete, integriert der iPhone-Hersteller ChatGPT in das nächsten iPhone-Betriebssystem.
Gurman hatte zuvor berichtet, Apple arbeite auch an einem eigenen Chatbot-Tool, «Apple GPT» genannt, um mit ChatGPT von OpenAI mithalten zu können.
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
— OpenAI (@OpenAI) May 13, 2024
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
In einem Livestream demonstrierte OpenAI am Montagabend unter anderem, wie das neue Modell helfen kann, eine Mathematik-Gleichung zu lösen. Dabei gab die Software per Stimme Ratschläge für den Rechenweg, statt das Ergebnis zu verraten.
Ein OpenAI-Mitarbeiter (AI für: Artificial Intelligence/Künstliche Intelligenz) schrieb dafür die Gleichung auf einem Blatt Papier und richtete die Smartphone-Kamera darauf. Seine Fragen an ChatGPT stellte er mündlich. Einziger Patzer: Die Software behauptete erst, sie sehe die Aufgabe, noch bevor er die Gleichung aufschrieb.
In einer weiteren Demonstration erfand ChatGPT ein Gute-Nacht-Lied und sang es vor. Dabei konnte man die Software unterbrechen und bitten, mehr Dramatik in die Stimme zu bringen oder wie ein Roboter zu sprechen. ChatGPT sprach dabei fliessend und lebendig wie ein Mensch.
Lullabies and whispers with GPT-4o pic.twitter.com/5T7ob0ItuM
— OpenAI (@OpenAI) May 13, 2024
Reibungslos funktionierte auch ein Live-Test, bei dem ChatGPT einige Sätze zwischen Italienisch und Englisch übersetzte. Alle Interaktionen wurden mit dem Weck-Satz «Hey, ChatGPT» eingeleitet.
2. Helping students learn in real-timepic.twitter.com/8v4YHZiPi4
— Min Choi (@minchoi) May 13, 2024
3. Real-time translationpic.twitter.com/7CGN7RB7Ai
— Min Choi (@minchoi) May 13, 2024
OpenAI-Technologiechefin Mira Murati betonte, dass das neue Modell GPT-4o auch für Gratis-Nutzerinnen und -Nutzer verfügbar sein werde. Bisher packte das KI-Start-up erweiterte Funktionen eher in die kostenpflichtige Abo-Version.
Ab sofort.
Ausprobieren können es alle registrierten Nutzerinnen und Nutzer hier auf chatgpt.com.
ChatGPT löste vor über einem Jahr den Hype um Künstliche Intelligenz aus. Solche KI-Chatbots werden mit gewaltigen Mengen an Informationen trainiert und können Texte auf dem sprachlichen Niveau eines Menschen formulieren, Software-Code schreiben und Informationen zusammenfassen. Das Prinzip dahinter ist, dass sie Wort für Wort abschätzen, wie ein Satz weitergehen sollte.
Solche KI-Chatbots sind aber auch fehleranfällig und können täuschend echt wirkende Falschinformationen ausgeben, was in der Fachwelt als Halluzinieren bezeichnet wird. Schliesslich gibt es auch massive gesellschaftlichen Risiken durch generative KI: Die leistungsfähige Technologie kann für die Verbreitung von Desinformation und andere Zwecke missbraucht werden.
Mit Material der Nachrichtenagentur Keystone-SDA
(dsc/dab)