L’ordinateur le plus intelligent du monde ne fait pas le poids face à…. Homer Simpson

DeepMind, l’ordinateur à l’intelligence artificielle de Google, rencontre des difficultés lorsqu’il s’agit d’identifier certains des comportements préférés d’Homer Simpson tels que la consommation de bière, de chips, de beignets ainsi que ses bâillements ou encore ses chutes face contre terre. Cette constatation ressort de tests effectués par DeepMind sur son ensemble de données Kinetics composées de 300.000 séquences vidéo et de 400 actions humaines.Récemment, DeepMind a réussi à vaindre Ke Jie, Chinois champion du monde du jeu de Go. Toutefois, la machine rencontre des problèmes lorsqu’il s’agit d’analyser certaines activités quotidiennes. Lors des tests sur l’ensemble des données Kinetics, certains résultats se sont révélés intrigants. Par exemple, les algorithmes d’apprentissage en profondeur ont eu une précision de 80% lorsqu’il s’agissait de classer des actions telles jouer au tennis, établir des prévisions météorologiques, couper une pastèque ou encore jouer au bowling. Par contre, l’exactitude de la classification de Deepmind a chuté à 20% ou moins lors de l’analyse d’actions d’Homer Simpson.

Opportunités

« Les systèmes d’intelligence artificielle sont actuellement très bons pour reconnaître des objets au sein d’une image, mais ont toujours du mal à comprendre les vidéos. « L’une des raisons principales est que la communauté scientifique a jusqu’à présent manqué d’un grand ensemble de données vidéo de haute qualité. »L’intelligence artificielle fait face à des obstacles pour classer des actions telles que manger car elle n’est pas en mesure d’identifier avec précision les aliments spécifiques consommés, principalement si le hamburger ou le hot-dog est déjà partiellement entamé ou très petits au sein de la séquence. La danse et les actions axées sur une partie spécifique du corps telles qu’éternuer, renifler, bâiller, boire de la bière ou manger des chips  peuvent également s’avérer difficile à identifier pour DeepMind.« La compréhension vidéo représente un défi important pour la communauté scientifique », a déclaré un porte-parole de DeepMind. « Les applications de l’intelligence artificielle dans le monde réel dans des domaines tels que la médecine offrent de grands opportunités. »