Aller au contenu
Korben, roi d’internet, logo bébé avec des lunettes en mode thug life

Comment numériser une voix et lui faire lire un texte ?

On arrive a faire des choses de dingue avec du deeplearning, notamment, tout ce qui est deepfake pour générer des vidéo avec le visage d’autres personnes. Mais si votre truc, c’est de devenir le Gérald Dahan numérique pour faire des canulars au téléphone en vous faisant passer pour quelqu’un d’autre, le mieux c’est encore de jeter un œil à ce projet.

Développé par Simone Sasso, Voice Cloner permet à partir de 200 extraits audio (environ 15 / 20 minutes d’audio), d’obtenir un modèle qui lui permet ensuite de lire avec n’importe quelle voix, n’importe quel texte. Et cela peut fonctionner dans toutes les langues. Il suffit de trouver le bon moteur de Text-To-Speech qui va bien avec le français par exemple.

Pour fonctionner, ce projet a besoin de Python, de Tensorflow, de la lib rosa…etc et surtout d’un smartphone Android si vous voulez faire comme lui et avoir carrément une application sur votre mobile.

Capture d'écran d'un logiciel de reconnaissance vocale

Avoir sa propre voix numérisée de cette façon, ça peut permettre aussi d’envoyer des messages audios en les textant, ou de proposer une fonctionnalité de lecture sur un site avec la voix de l’auteur. En tout cas, c’est fun ;).


Les articles du moment