Quand l'IA dépasse les experts en neurosciences
Vous pensiez que l’IA n’était bonne qu’à générer des images de chats et à discuter avec vous les jours de pluie ? Eh bien, allumez votre cortex préfrontal, car ce qui arrive est plutôt bluffant !
Une équipe de chercheurs vient de démontrer que les modèles de langage sont désormais capables de prédire les résultats d’expériences en neurosciences avec une précision supérieure à celle des experts humains.
Cette découverte, qui fait trembler les murs du monde académique, n’est pas sortie de nulle part. Les scientifiques ont créé BrainBench, un benchmark spécialement conçu pour tester la capacité des modèles de langage à prédire les résultats d’expériences en neurosciences. Et surprise (ou pas) : les IA ont surpassé les experts humains avec une marge qui ferait pâlir Einstein lui-même.
Pour cette étude, les chercheurs on présenté aux modèles de langage et aux experts deux versions d’un même abstract scientifique. L’une contient les vrais résultats, l’autre des résultats modifiés mais plausibles.
Le défi ? Identifier la version correcte.
Et là, c’est le drame pour l’ego des chercheurs : les modèles de langage atteignent une précision moyenne de 81,4%, tandis que les experts humains plafonnent à 63,4%. Même les plus expérimentés d’entre eux ne dépassent pas 66,2%.
Le plus fascinant, c’est que ces performances ne reposent pas sur une simple mémorisation des articles scientifiques. Non, les modèles ont réellement appris à comprendre les patterns sous-jacents de la recherche en neurosciences. Par exemple, ils peuvent déduire qu’une stimulation de l’hippocampe aura probablement un effet positif sur la mémoire, ou qu’une lésion du cortex moteur affectera la coordination des mouvements. C’est comme s’ils avaient développé une sorte d’intuition scientifique, mais version silicium.
Et ce n’est pas tout, les chercheurs ont poussé l’expérience plus loin en créant BrainGPT, une version spécialisée en neurosciences qui fait encore mieux que ses cousins généralistes. Comment ? En lui faisant ingurgiter plus de 1,3 milliard de tokens issus de publications scientifiques. Et le résultat, c’est une amélioration de 3% des performances, ce qui peut sembler modeste mais représente une avancée significative dans le domaine.
Les implications sont vertigineuses. Je vous donne un exemple : une équipe de chercheurs étudie l’impact d’un nouveau médicament sur la plasticité synaptique. Au lieu de se fier uniquement à leur intuition, ils peuvent maintenant consulter BrainGPT qui, ayant analysé des milliers d’études similaires, peut prédire avec une grande précision les effets probables du traitement sur différentes régions cérébrales. Cela permet non seulement d’optimiser la conception des expériences mais aussi d’identifier rapidement les pistes les plus prometteuses.
Mais attention, ce n’est pas pour autant la fin des chercheurs humains. Au contraire ! Cette technologie devrait plutôt être vue comme un outil pour accélérer les découvertes. Par exemple, si l’IA prédit qu’une expérience aura des résultats contraires à ce qu’on attendait, cela pourrait soit éviter de perdre du temps sur une piste infructueuse, soit au contraire motiver à creuser davantage pour potentiellement faire une découverte inattendue.
Le plus remarquable, c’est que cette approche n’est pas limitée aux neurosciences. On pourrait imaginer des versions spécialisées pour la physique, la chimie, la biologie… Un physicien pourrait par exemple utiliser un “PhysicsGPT” pour prédire les résultats d’une expérience sur les particules quantiques, tandis qu’un chimiste consulterait “ChemGPT” pour anticiper les produits d’une nouvelle réaction.
D’ailleurs, petit détail croustillant : les modèles plus petits (7 milliards de paramètres) se sont montrés aussi performants que leurs grands frères, prouvant qu’on n’a pas forcément besoin d’une machine de guerre pour obtenir des résultats impressionnants. Et pour les sceptiques qui se demandent si ces IA ne font pas que deviner au hasard, sachez qu’elles sont plutôt bien calibrées. Quand elles sont sûres de leurs prédictions, elles ont effectivement plus de chances d’avoir raison. C’est comparable à un chercheur expérimenté qui sait reconnaître quand une hypothèse est particulièrement solide.
Bien sûr, comme je vous le disais, l’objectif n’est pas de mettre les neuroscientifiques au chômage, mais plutôt de leur donner un super assistant capable d’analyser des masses de données qu’aucun humain ne pourrait traiter seul. C’est comme un GPS pour naviguer dans l’océan de la connaissance scientifique : ça ne remplace pas le capitaine, mais ça aide sacrément à trouver son chemin !