ChatGPT continue d’évoluer : il peut désormais voir, entendre et parler
OpenAI est en train de déployer deux nouveautés importantes pour ChatGPT : il bénéficie de plusieurs voix de synthèse et il peut aussi analyser des images. Oui, désormais, ChatGPT peut entendre, parler et voir.
ChatGPT est avant tout un chatbot conversationnel avec de l'intelligence artificielle, mais avec les deux nouveautés en cours de déploiement, il va prendre de l'ampleur et pourrait devenir un véritable assistant virtuel. OpenAI a dévoilé ces nouveautés dans un article au nom évocateur "ChatGPT peut désormais voir, entendre et parler".
ChatGPT peut entendre et parler
Ceci signifie que vous pouvez désormais utiliser la voix pour communiquer avec ChatGPT et engager une conversation. Cette fonctionnalité est accessible dans les paramètres de l'application mobile.
En collaboration avec des comédiens de doublage professionnels pour mettre au point 5 voix de synthèse pour ChatGPT ! En effet, il va bénéficier de deux voix féminines, deux voix masculines, une voix plus enfantine, qui seront utilisées par le nouveau modèle text-to-speech d'OpenAI. Pour le moment, ce sont uniquement des voix pour une seule langue : l'anglais, sans surprise. En complément, l'outil open source Whisper est utilisé pour pour retranscrire vos paroles en texte.
Cette technologie est réservée aux discussions vocales, car OpenAI a bien conscience qu'il pourrait y avoir des débordements, notamment l'usurpation de la voix de personnalités publiques.
ChatGPT peut voir
Par ailleurs, ChatGPT est désormais capable d'analyser une image ou une photo afin d'identifier les objets qu'elle contient. Cette nouveauté s'appuie sur les modèles de langage GPT-3.5 et GPT-4. Si vous prenez une photo à partir de l'application mobile ChatGPT, vous pouvez entourer la zone de l'image à laquelle doit s'intéresser le chatbot IA.
D'après OpenAI, ceci laisse la porte ouverte à plein de sollicitations diverses et variées : "Trouvez la raison pour laquelle votre gril ne démarre pas, explorez le contenu de votre réfrigérateur pour planifier un repas ou analysez un graphique complexe pour des données liées au travail."
Comment en profiter ?
Une fois de plus, il sera nécessaire d'avoir un abonnement ChatGPT Plus ou Enterprise pour profiter de ces nouveautés qui seront déployées au cours des deux prochaines semaines.
Les fonctions liées à la voix seront disponibles sur les applications Android et iOS dans un premier temps. Quant à la fonction d'analyse d'images, elle sera disponible sur toutes les plateformes.