La course à l’IA prend une tournure intéressante avec l’arrivée de Gemini, le nouveau modèle de langage (LLM) de Google. Ce dernier vient directement concurrencer GPT-4 d’OpenAI et améliore par la même occasion Bard, l’IA générative du géant américain. De quoi véritablement faire de l’ombre à la star ChatGPT ?
L’actualité : Google a présenté son nouveau modèle de langage, Gemini.
- Le géant américain assure qu’il est beaucoup plus performant que LaMDA, son modèle de langage qui faisait tourner jusqu’alors Bard.
- Et pour cause, il a été développé dès le départ pour être multimodal, ce qui signifie qu’il peut gérer » différents types d’informations, notamment le texte, le code, l’audio, l’image et la vidéo ».
- Mais surtout, il peut « généraliser et comprendre, fonctionner et combiner de manière transparente » tous ces types d’informations.
- De quoi lui permettre une parfaite compréhension de son environnement et du contexte.
- Plus encore, le système d’IA peut justifier ses raisonnements.
- Il est ainsi efficace pour résoudre des problèmes mathématiques et de physique, mais aussi pour répondre à des questions de compréhension plus simple et moins logique.
« Les capacités sophistiquées de raisonnement de Gemini 1.0 lui permettent d’interpréter des informations écrites et visuelles complexes, ce qui le rend singulièrement apte à isoler des connaissances difficiles à discerner dans des volumes considérables de données »
explique Google sur son blog.
Le détail : déjà disponible, le déploiement de Gemini ne fait que commencer.
- Le modèle de langage débarque sur les smartphones Pixel de Google avec la possibilité pour les utilisateurs de lui demander de résumer un enregistrement audio, par exemple.
- Dans les applications de chats, il génère différentes réponses adaptées, notamment dans WhatsApp.
- La partie photo des Pixel, fortement soutenue par l’IA, en profitera également.
- Mais Gemini profite également à Bard, l’IA générative de Google. De quoi largement améliorer ses performances et en faire un concurrent sérieux à ChatGPT.
- Cette version améliorée du chatbot n’est pour l’instant disponible qu’en anglais, mais le géant américain assure que d’autres langues seront bientôt disponibles.
Une vraie menace pour GPT-4 ?
C’est en tout cas ce que laisse penser Google. Et à vrai dire, cela parait assez logique. Rappelons que Google est active dans l’intelligence artificielle depuis bien longtemps et qu’elle s’est fait coiffer au poteau par une « petite » startup, OpenAI avec ChatGPT. Et sa réponse, Bard, n’a pas vraiment convaincu. Avec Gemini, Google tente de redorer son image et vante les mérites de son modèle d’IA.
- Le géant américain assure ainsi que Gemini surpasse GPT-4 sur 30 des 32 référentiels académiques.
- « Avec un score de 90,0 %, Gemini Ultra est le premier modèle à surpasser les experts humains en matière de MMLU (compréhension massive du langage multitâche) », précise également la firme américaine.
- Si le modèle d’OpenAI se montre assez costaud en matière de texte, Gemini s’impose dès qu’il est question d’une gestion multimodale, d’après les démonstrations de Google.
- Reste à voir dans la pratique.
Mais l’intégration de Gemini dans les produits de Google – ce vers quoi semble vouloir aller l’entreprise américaine – sera sans doute la plus grosse menace pour ChatGPT et GPT-4. Un excellent moyen pour Google de déployer son modèle d’IA entre les mains de tous.
Un modèle ultra sérieux
Autre preuve – s’il en fallait – que Google cherchée à retrouver son prestige en matière d’IA, le géant américain a dévoilé plusieurs versions de son modèle de langage. L’idée étant de pouvoir le mettre dans toutes les mains. On se retrouve ainsi avec :
- Gemini Ultra : modèle le plus grand et le plus performant pour les tâches très complexes. Cette version intègrera une version « Advanced » de Bard début 2024.
- Gemini Pro : un modèle polyvalent adapté à de nombreuses tâches.
- Gemini Nano : une version capable de tourner sur des appareils, notamment sur les Pixel.
La firme de Mountain View prévoit de donner un aperçu à ses clients dans le Cloud plus tard ce mois-ci, histoire de démontrer tout son savoir-faire. On peut évidemment s’attendre à qu’une offre (payante) pour les entreprises soit mises en place, à l’image de ChatGPT.