DolphinGemma - L'IA de Google qui veut parler avec les dauphins

par Korben ✨ -

Y’a des gens, j’vous jure, je ne comprends jamais rien quand ils s’expriment. Pas de logique dans leurs arguments, un vocabulaire réduit, des fautes d’orthographe… Et il faut vraiment apprendre à décoder leur diarrhée verbale pour leur répondre, sinon ils s’empressent d’aller porter plainte.

Alors, je me plains, mais peut-être que ma vie va s’améliorer bientôt car je viens d’apprendre l’existence d’un nouvel modèle IA nommée DolphinGemma, qui ambitionne de nous faire comprendre ce que les dauphins se racontent depuis des millénaires.

Basé sur Gemma et issu d’une collab entre Google, Georgia Tech et Wild Dolphin Project, ce modèle aux 400 millions de paramètres a pour objectif de décoder les communications des Dauphins tachetés de l’Atlantique. Pour cela, le Wild Dolphin Project mène depuis 1985 (!) la plus longue étude sous-marine de dauphins au monde, enregistrant méthodiquement les sons, comportements et interactions sociales de ces mammifères marins dans leur habitat naturel aux Bahamas.

Et ce n’est pas juste un délire de chercheurs en mal de financement car ces dauphins ont un vrai système de communication complexe, avec des “sifflements signatures” uniques (sorte de noms personnels), des “squawks” (impulsions rapides) émis pendant les bagarres, et des “buzzes” (cliquetis) utilisés pendant la parade amoureuse ou la chasse aux requins. Un peu comme les ados sur TikTok, mais avec plus de consistance.

Soutenir Korben

Et contrairement à ChatGPT qui s’est gavé de tout Internet, DolphinGemma a été nourri exclusivement aux vocalises de dauphins. Il utilise une architecture audio-in/audio-out, ce qui signifie qu’il prend des sons de dauphins en entrée et produit des sons de dauphins en sortie. On est donc en présence d’un modèle d’IA qui n’apprend pas à parler comme un humain, mais à “siffler” comme un dauphin.

Techniquement, DolphinGemma utilise le tokenizer SoundStream pour transformer les sons en représentations plus facilables à traiter, puis analyse ces séquences pour identifier des patterns et, comme ChatGPT prédit le prochain mot, ce modèle prédit le prochain son dans une séquence de vocalisations. C’est de l’autocomplete pour dauphins, en gros. Et ça pourrait accélérer considérablement la recherche en automatisant l’analyse de milliers d’heures d’enregistrements qui prendraient des décennies à traiter manuellement.

Soutenir Korben


Le plus dingue c’est que modèle d’IA est suffisamment léger pour tourner directement sur un smartphone Pixel en pleine mer. Ainsi, pour la prochaine saison de recherche (été 2025), l’équipe va passer du Pixel 6 au Pixel 9, intégrant ce dernier dans un système appelé CHAT (Cetacean Hearing Augmentation Telemetry). TELLEMENT ORIGINAL, WAHOU !

Soutenir Korben

D’ailleurs, ce système CHAT ne cherche pas seulement à comprendre le langage naturel des dauphins, mais tente aussi d’établir un “vocabulaire partagé”. Les chercheurs associent des sifflements artificiels à des objets que les dauphins apprécient (comme des algues sargasse ou autres herbes marines), dans l’espoir que les dauphins, curieux de nature, imitent ces sons pour “demander” ces objets. Bref, c’est comme apprendre les bases d’une langue étrangère avant de maîtriser toutes les subtilités.

Pour que ça fonctionne, le système doit capturer l’imitation du dauphin malgré le bruit océanique, identifier quel sifflement a été imité en temps réel, informer le chercheur via des écouteurs à conduction osseuse sous-marins, et lui permettre de répondre rapidement en offrant l’objet correspondant. Un vrai challenge technique en milieu hostile. Alors c’est là que le Pixel entre en jeu, permettant l’analyse en temps réel et faisant tourner à la fois les modèles d’apprentissage profond et les algorithmes de correspondance. Plus besoin de matériel sur mesure, juste un smartphone dans un boîtier étanche. Un gain considérable en termes de coût, de taille et de maintenance pour de la recherche en plein océan.


Google prévoit également de partager DolphinGemma en tant que modèle open source cet été. Bien qu’entraîné sur les dauphins tachetés de l’Atlantique, il pourrait alors être fine-tuné pour d’autres espèces comme les dauphins à gros nez (tursiops) ou les dauphins à long bec. Bref, ils semblent vraiment vouloir que cette technologie bénéficie à l’ensemble de la communauté scientifique.

Soutenir Korben

Bref, si on arrive à le faire pour les dauphins, on pourra bientôt le faire pour certains humains, ou pour mon chat qui me casse les couilles toute la journée en miaulant pour je ne sais quoi.

Quoiqu’il en soit, je suis sûr que les dauphins auront beaucoup de choses à nous apprendre. Peut-être même qu’on deviendra amis et qu’ils pourront aller nous chercher des trésors enfouis en échange d’un burrito sauce blanche ?

Allez savoir…

Source