Aller au contenu
Korben, roi d’internet, logo bébé avec des lunettes en mode thug life

Buzz – Pour traduire ou transcrire de l’audio au format texte à l’aide de l’IA

Vous vous souvenez de mon article sur Whisper, cet outil d’IA mis au point par OpenAI ? Pour rappel, ce logiciel est capable de retranscrire en texte n’importe quel fichier audio ou vidéo.

C’est extrêmement pratique pour faire de la retranscription ou des sous-titres de qualité sans se prendre la tête. Et cela dans tout un tas de langues. Mais ce n’était pas forcement facile à prendre en main puisque ça passait par un colab avec des lignes de Python.

Heureusement, depuis les choses ont bien évolué et on a maintenant un logiciel fini très facile à utiliser. Ce logiciel c’est Buzz et ça fonctionne sous macOS, Linux et Windows.

Parmi ses atouts, on retrouve la transcription et la traduction en temps réel à partir du microphone de l’ordinateur, ce qui va faciliter quand même vachement le travail de ceux qui ont besoin de transcrire une réunion, une interview ou même des conversations informelles (un coup de fil par exemple).

L’application permet également d’importer des fichiers audio et vidéo et d’exporter les transcriptions au format CSV, SRT, TXT et VTT, permettant ainsi une compatibilité avec de nombreux logiciels et services comme Youtube.

Et comme si ça ne suffisait pas, Buzz prend en charge les modèles hors ligne tel que Whisper.cpp ou online comme l’API Whisper d’OpenAI. L’application propose également un moteur de recherche pour farfouiller dans les transcriptions audio et surtout un éditeur de texte intégré afin de faciliter le travail de révision des transcriptions.

Je l’ai testé à plusieurs reprises et ça fonctionne vraiment super bien, si vous prenez un modèle Small ou supérieur.

A télécharger ici.


Les articles du moment