OpenAI hat seine Text-KI ChatGPT mit Stimmen ausgestattet. Das Unternehmen teilte mit, dass zahlende Nutzer des Dienstes künftig mit dem Chatbot per Sprache interagieren könnten.
Der Nutzer kann aus fünf Stimmen – Juniper, Sky, Cove, Ember und Breeze – wählen und erhält in einem Voice-Chat Antworten auf Fragen in Echtzeit. Die Stimmen seien in Zusammenarbeit mit Synchronsprechern erstellt worden, schreibt OpenAI.
Im Gegensatz zu Sprachassistenten wie Amazons Alexa oder Siri von Apple klingen die Stimmen tatsächlich weniger künstlich. OpenAI hat auf seinem Blog ein paar Textbeispiele veröffentlicht, die von den ChatGPT-Stimmen vorgelesen werden.
Show ChatGPT one or more images. Troubleshoot why your grill won’t start, explore the contents of your fridge to plan a meal, or analyze a complex graph for work-related data.
— OpenAI (@OpenAI) September 25, 2023
Im Blog-Post warnt OpenAI vor einem Missbrauch der Technologie. Zwar biete die Funktion die Möglichkeit, barrierefreie und kreative Anwendungen zu schaffen. Allerdings berge sie auch Risiken, wenn Kriminelle sie für betrügerische Handlungen nutzten – etwa um sich als andere Personen auszugeben. Deshalb habe man die Technologie nur für diesen einen bestimmten Anwendungsfall, den Voice-Chat, konzipiert.
Mit dem neuen Software-Update bringt OpenAI auch eine Funktion, die der KI das Erkennen von Bildinhalten ermöglicht. ChatGPT lerne sozusagen das Sehen, schreibt OpenAI.
Wie funktioniert das? Hier ein Beispiel: Der Nutzer macht ein Foto von einer Sehenswürdigkeit während einer Reise. Anschliessend lädt er das Bild über die ChatGPT-App hoch. Die KI erkennt das Motiv und kann etwas zur Entstehungsgeschichte erzählen.
Eine andere Anwendungsmöglichkeit sieht OpenAI beim Lösen von Problemen. Man könne zum Beispiel ein Bild eines Grills machen und den Chatbot fragen, warum dieser nicht funktioniert. Die KI könne dabei helfen, den Fehler ausfindig zu machen.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
Die neuen Funktionen will OpenAI in den kommenden zwei Wochen für alle bezahlenden Mitglieder seines Dienstes zur Verfügung stellen. Die Sprachfunktion komme nur für die App unter iOS und Android, heisst es. Bilderkennung werde hingegen auf allen Plattformen verfügbar sein.
Verwendete Quellen: