π0 - L'IA qui apprend aux robots à plier le linge
Vous vous êtes déjà demandé pourquoi les robots excellent aux échecs mais peinent encore à plier une simple paire de chaussettes ? Cette question, visiblement anodine, illustre en fait parfaitement le paradoxe de Moravec. Je pourrais le résumer rapidement comme ceci : Ce qui nous semble facile est souvent le plus compliqué pour les machines. Mais visiblement la donne pourrait bien changer grâce aux travaux de Physical Intelligence et de leur nouveau modèle IA baptisé π0 (pi-zero).
Les chercheurs de Physical Intelligence ont en effet développé un système d’intelligence artificielle généraliste qui permet aux robots d’acquérir une véritable intelligence physique. Contrairement aux robots industriels traditionnels, programmés pour répéter inlassablement les mêmes mouvements dans un environnement ultra-contrôlé (un peu comme votre collègue Bernard qui fait toujours la même présentation PowerPoint depuis 2007), π0 est capable de s’adapter à son environnement et d’accomplir des tâches variées. Et quand on dit variées, c’est du lourd : plier des vêtements, débarrasser une table, assembler des cartons… Des tâches qui nous paraissent triviales mais qui représentent en réalité des défis techniques considérables.
Le secret de cette prouesse, c’est une approche nouvelle combinant apprentissage par démonstration et modèles de langage visuel. Comme si on donnait à un robot un immense catalogue d’expériences physiques, enrichi par des millions d’images et de textes provenant d’Internet. Résultat des courses : une compréhension approfondie du monde physique qui lui permet alors de généraliser ses apprentissages à de nouvelles situations.
Et ce n’est pas tout puisque ce système est capable de gérer les imprévus. Si quelqu’un vient perturber son travail (oui, il y a toujours un petit malin pour tester les limites), π0 s’adapte et trouve une solution alternative. On est donc trèèèès loin du robot qui bugue dès qu’on déplace sa cible de 2 millimètres !
L’une des innovations majeures de π0 réside également dans sa capacité à contrôler différents types de robots. Un peu comme un système d’exploitation universel pour robots, capable de faire fonctionner aussi bien un bras articulé qu’un robot mobile complet. Les chercheurs ont réussi cet exploit en développant une architecture réseau particulière qui traduit les instructions en commandes motrices adaptées à chaque plateforme.
Le système s’appuie sur un modèle de 3 milliards de paramètres, pré-entraîné sur des données internet à grande échelle et ce modèle est ensuite augmenté pour produire des commandes motrices continues grâce à une technique appelée “flow matching”, permettant jusqu’à 50 commandes par seconde pour des mouvements ultra-précis.
Les performances sont franchement impressionnantes. Dans les tests comparatifs, π0 surpasse largement les autres modèles généraliste robotique comme OpenVLA ou Octo. Pour vous donner une idée, sur des tâches complexes comme le pliage de linge ou le rangement de table, π0 obtient des scores plus de deux fois supérieurs à ses concurrents. Et les applications potentielles sont nombreuses car au-delà des tâches domestiques, on peut imaginer des robots capables d’assister les personnes âgées ou à mobilité réduite, d’aider dans les entrepôts logistiques, ou même de participer à des opérations de secours en milieu hostile. La seule limite semble être notre imagination (et peut-être quelques lois de la physique, soyons honnêtes…).
Alors, sommes-nous à l’aube d’une nouvelle ère où les robots deviendront nos assistants du quotidien ? L’avenir nous le dira, mais une chose est sûre : avec π0, les chercheurs de Physical Intelligence ont fait un pas de géant vers des robots véritablement intelligents et adaptables. Et qui sait, peut-être que bientôt, la corvée de pliage du linge ne sera plus qu’un mauvais souvenir !
Merci à Guillaume pour cette découverte ! N’hésitez pas à le suivre sur Twitter: @gchampeau.