IA: ChatGPT va parler et interpréter des images

Chat GPT

Image réalisée avec l'AI Midejourney

OpenAI a indiqué le 25 septembre qu'elle avait doté son programme d'intelligence artificielle (IA) ChatGPT de la parole et de la vision pour le rendre "plus intuitif".

Ces nouveaux outils seront déployés dans les deux prochaines semaines pour les abonnés à ChatGPT Plus, la version payante du chatbot, ou les organisations clientes du service. Ils pourront, par exemple, prendre une photo d'un monument et "avoir une conversation avec ChatGPT" sur l'histoire du bâtiment, ou encore montrer au logiciel ce qu'il y a dans leur frigo pour qu'il leur propose une recette, suggère OpenAI dans un communiqué.

La start-up a limité les capacités de ChatGPT à "analyser les personnes", car l'interface "n'est pas toujours précise et ces systèmes doivent respecter la confidentialité des individus". Le succès de ChatGPT depuis la fin 2022 a entraîné une course majeure à l'IA générative, mais le déploiement à toute vitesse de ces programmes encore très peu régulés et suscite beaucoup d'inquiétudes. Parmi elles, le problème des IA qui ont des "hallucinations", soit d'inventer des réponses.

Un partenariat avec Spotify

La plateforme de streaming Spotify a par ailleurs annoncé le 25 septembre un partenariat avec OpenAI pour traduire les podcasts directement avec de l'IA. Des émissions enregistrées en anglais seront désormais disponibles dans d'autres langues. L'entreprise suédoise assure que la nouvelle technologie de génération de voix d'OpenAI "reproduit le style de l'orateur d'origine, ce qui permet une expérience d'écoute plus authentique, plus personnelle et plus naturelle que le doublage traditionnel".

À lire aussi

Filtrer par