Voici Gemini, l’arme de Google pour contrer ChatGPT

La course à l’IA prend une tournure intéressante avec l’arrivée de Gemini, le nouveau modèle de langage (LLM) de Google. Ce dernier vient directement concurrencer GPT-4 d’OpenAI et améliore par la même occasion Bard, l’IA générative du géant américain. De quoi véritablement faire de l’ombre à la star ChatGPT ?

L’actualité : Google a présenté son nouveau modèle de langage, Gemini.

  • Le géant américain assure qu’il est beaucoup plus performant que LaMDA, son modèle de langage qui faisait tourner jusqu’alors Bard.
  • Et pour cause, il a été développé dès le départ pour être multimodal, ce qui signifie qu’il peut gérer  » différents types d’informations, notamment le texte, le code, l’audio, l’image et la vidéo ».
  • Mais surtout, il peut « généraliser et comprendre, fonctionner et combiner de manière transparente » tous ces types d’informations.
  • De quoi lui permettre une parfaite compréhension de son environnement et du contexte.
  • Plus encore, le système d’IA peut justifier ses raisonnements.
  • Il est ainsi efficace pour résoudre des problèmes mathématiques et de physique, mais aussi pour répondre à des questions de compréhension plus simple et moins logique.

« Les capacités sophistiquées de raisonnement de Gemini 1.0 lui permettent d’interpréter des informations écrites et visuelles complexes, ce qui le rend singulièrement apte à isoler des connaissances difficiles à discerner dans des volumes considérables de données »

explique Google sur son blog.

Le détail : déjà disponible, le déploiement de Gemini ne fait que commencer.

  • Le modèle de langage débarque sur les smartphones Pixel de Google avec la possibilité pour les utilisateurs de lui demander de résumer un enregistrement audio, par exemple.
  • Dans les applications de chats, il génère différentes réponses adaptées, notamment dans WhatsApp.
  • La partie photo des Pixel, fortement soutenue par l’IA, en profitera également.
  • Mais Gemini profite également à Bard, l’IA générative de Google. De quoi largement améliorer ses performances et en faire un concurrent sérieux à ChatGPT.
    • Cette version améliorée du chatbot n’est pour l’instant disponible qu’en anglais, mais le géant américain assure que d’autres langues seront bientôt disponibles.

Une vraie menace pour GPT-4 ?

C’est en tout cas ce que laisse penser Google. Et à vrai dire, cela parait assez logique. Rappelons que Google est active dans l’intelligence artificielle depuis bien longtemps et qu’elle s’est fait coiffer au poteau par une « petite » startup, OpenAI avec ChatGPT. Et sa réponse, Bard, n’a pas vraiment convaincu. Avec Gemini, Google tente de redorer son image et vante les mérites de son modèle d’IA.

  • Le géant américain assure ainsi que Gemini surpasse GPT-4 sur 30 des 32 référentiels académiques.
  • « Avec un score de 90,0 %, Gemini Ultra est le premier modèle à surpasser les experts humains en matière de MMLU (compréhension massive du langage multitâche) », précise également la firme américaine.
  • Si le modèle d’OpenAI se montre assez costaud en matière de texte, Gemini s’impose dès qu’il est question d’une gestion multimodale, d’après les démonstrations de Google.
  • Reste à voir dans la pratique.

Mais l’intégration de Gemini dans les produits de Google – ce vers quoi semble vouloir aller l’entreprise américaine – sera sans doute la plus grosse menace pour ChatGPT et GPT-4. Un excellent moyen pour Google de déployer son modèle d’IA entre les mains de tous.

Un modèle ultra sérieux

Autre preuve – s’il en fallait – que Google cherchée à retrouver son prestige en matière d’IA, le géant américain a dévoilé plusieurs versions de son modèle de langage. L’idée étant de pouvoir le mettre dans toutes les mains. On se retrouve ainsi avec :

  • Gemini Ultra : modèle le plus grand et le plus performant pour les tâches très complexes. Cette version intègrera une version « Advanced » de Bard début 2024.
  • Gemini Pro : un modèle polyvalent adapté à de nombreuses tâches.
  • Gemini Nano : une version capable de tourner sur des appareils, notamment sur les Pixel.

La firme de Mountain View prévoit de donner un aperçu à ses clients dans le Cloud plus tard ce mois-ci, histoire de démontrer tout son savoir-faire. On peut évidemment s’attendre à qu’une offre (payante) pour les entreprises soit mises en place, à l’image de ChatGPT.

Plus