Google riposte à OpenAI avec son dernier modèle d'intelligence artificielle, Gemini, qui, selon l'entreprise, surpasse GPT-4 dans de nombreux domaines. Cette avancée majeure suscite des attentes, d'autant plus que Google a intégré une version allégée de Gemini à son assistant Bard et à son smartphone Pixel 8 Pro.
Gemini : Un monde multimodal
Gemini est un "large language model" (LLM) qualifié de "multimodal", signifiant qu'il peut comprendre du texte, des images et des vidéos, tout en répondant à l'écrit ou à l'oral. Google affirme que la version ultra a surpassé l'humain dans un test MMLU, mesurant la compréhension et les capacités de raisonnement dans plusieurs domaines, tels que le langage, les mathématiques, l'histoire, la physique, la médecine, le droit et l'éthique. Toutefois, l'impact réel de Gemini Ultra, la version la plus puissante, surpasse OpenAI sera confirmé début 2025, marquant un tournant dans la course à l'intelligence artificielle.
Lire également : GPT-4 Turbo et les assistants représentent-ils une menace pour les solutions en open source ?
Démonstration éloquente
Une vidéo de démonstration de 5 minutes met en avant les capacités impressionnantes de Gemini. L'IA analyse des objets, des dessins et des vidéos, commentant à l'oral ses observations, identifiant les objets, jouant de la musique et répondant à des questions nécessitant une analyse approfondie. La déduction devient un jeu pour Gemini, qui identifie un croquis de canard comme un jouet en plastique, propose des devinettes basées sur des emojis pour reconnaître des pays, et excelle même dans des tâches créatives telles que le bonneteau et la suggestion d'objets à tricoter à partir de pelotes de laine.
Objectif : Intelligence artificielle générale (AGI)
Google, tout comme OpenAI, vise l'objectif ultime de l'intelligence artificielle générale (AGI), capable de raisonner aussi bien, voire mieux, que les humains. Si certains experts considèrent la puissance de calcul comme la clé, d'autres restent sceptiques, soulignant que la compréhension limitée de la machine par le monde réel freine son intelligence. Google envisage de résoudre ce défi en intégrant son IA à des robots dotés de capacités sensorielles avancées, y compris le sens du toucher.
Gemini, la nouvelle frontière de l'IA
Gemini, avec ses prouesses démontrées, représente une avancée significative dans la quête de l'IA générale. Son intégration potentielle à des applications réelles et son impact sur la compétition avec OpenAI soulignent la dynamique passionnante qui façonne l'avenir de l'intelligence artificielle. Les mois à venir promettent des développements fascinants dans cette course effrénée vers la prochaine génération d'IA.