OpenAI confirme sa longueur d’avance sur la concurrence : ChatGPT peut désormais voir, entendre et parler

La société à l’origine de ChatGPT, OpenAI, a annoncé le déploiement d’une mise à jour qui propulse encore un peu plus son chatbot loin devant la concurrence.

L’actualité : ChatGPT pourra désormais voir, entendre et parler. Une véritable révolution.

  • Jusqu’à présent, il n’était possible d’interagir avec l’IA conversationnelle que par commandes écrites.
  • Avec la mise à jour, les utilisateurs pourront interagir avec elle par commandes vocales, mais aussi à l’aide d’images.

Le détail : ces nouveaux moyens d’interactions seront bien évidemment réservés à celles et ceux qui ont souscrit aux formules payantes ChatGPT Plus et Entreprise.

  • Ils seront déployés au cours des deux prochaines semaines, a précisé OpenAI.
  • La fonction Voice sera réservée à la version mobile du chatbot, sur iOS et Android. La fonction images sera disponible sur toutes les plateformes.  

ChatGPT s’attaque à Siri et Alexa

La fonctionnalité vocale « ouvre les portes à de nombreuses applications créatives et axées sur l’accessibilité », a indiqué OpenAI dans un article de blog.

  • Mais cette nouveauté fait surtout de ChatGPT un concurrent direct des assistants virtuels tels que Siri d’Apple ou Alexa d’Amazon.
  • On peut ainsi imaginer que ChatGPT soit prochainement intégré dans des appareils connectés et que l’on puisse l’utiliser pour programmer des alarmes et des rappels par simples commandes vocales.
  • Sur le court terme, il sera possible d’interagir vocalement avec ChatGPT par la voix directement depuis son smartphone, via l’application mobile.

« La nouvelle capacité vocale est alimentée par un nouveau modèle de synthèse vocale, capable de générer un son de type humain à partir de seulement du texte et de quelques secondes d’échantillons de parole. Nous avons collaboré avec des comédiens professionnels pour créer chacune des voix. Nous utilisons également Whisper, notre système de reconnaissance vocale open source, pour transcrire vos paroles en texte. »

indique OpenAI sur son site

Quant aux images : il sera possible de faire directement une photo ou d’en importer une ou plusieurs pour lui demander, par exemple, de nous concocter une recette à partir d’un cliché de notre frigo, mais aussi lui demander d’analyser un graphique.

Bouleversement : le déploiement public de ChatGPT en décembre dernier a déjà provoqué une révolution dans l’industrie technologique, obligeant les géants du secteur à mettre la deuxième pour dévoiler – parfois dans l’urgence, avec les soucis que cela implique – leur propre IA conversationnelle. Et si certains se sont laissé aller à proposer des expériences alternatives, permettant d’interagir avec des images, la sauce n’a pour l’instant pas réellement pris auprès des utilisateurs.

  • Il faut dire que la concurrence n’arrive pas à la cheville de ChatGPT, tant en termes d’expérience que de popularité.
  • Et l’arrivée de ces deux nouvelles fonctionnalités – la possibilité d’interagir avec la voix et avec des images – va très certainement contribuer à confirmer la longueur d’avance du chatbot d’OpenAI.
  • Nul doute que son annonce a été accueillie avec angoisse par les géants technologiques impliqués dans la course à l’IA.  
Plus