Whisper-ui - Transcrire vos audios / vidéos bien au chaud dans une interface graphique

par Korben -

Vous vous souvenez de Whisper, ce projet d’OpenAI qui permet de convertir au format texte, n’importe quel audio, ce qui permet par exemple de faire des transcriptions d’interview ou des sous-titres pour une vidéo ?

J’avais même fait un tuto sur le sujet.

Et bien bonne nouvelle, le codeur Abhay Kashyap a mis au point une interface graphique pour Whisper simplement nommée Whisper-ui. Cela fonctionne avec Streamlit et ça permet de se constituer une liste de média à traduire ou retranscrire très facilement.

Vous pourrez ensuite naviguer dans vos fichiers et les filtrer comme bon vous semble avec le moteur sur la gauche et évidemment récupérer la retranscription.

Pour installer Whisper-ui, le plus simple c’est de passer par Docker puisqu’il y a un Docker-Compose fourni.

git clone https://github.com/hayabhay/whisper-ui.git cd whisper-ui docker-compose up -d

Puis vous rendre sur l’URL suivante : http://localhost:8501/

Sinon, vous pouvez aussi l’installer directement :

sudo apt install ffmpeg pip install -r requirements.txt

Et lancer le script Python avec Streamlit :

streamlit run app/01_🏠_Home.py

Bref, c’est pratique, ça fait gagner du temps et ça permet d’éviter de se farcir tout en ligne de commande. Et si vous cherchez d’autres projets qui utilisent Whisper, y’a toute une liste merveilleuse ici ! Merci à Nobody pour l’info !

+ d’infos ici.