Finie la tannée des transcriptions à la main des interviews, podcasts ou autres fichiers audio. Depuis fin 2022, on peut déléguer cette tâche à Whisper, un modèle de reconnaissance de langage qui fonctionne vraiment bien et qui s’exécute en local. Plusieurs applications Mac s’appuient sur la technologie d’OpenAI, l’une des dernières étant Chuchotis.
Chuchotis ne comprend pas autant de fonctionnalités que le pionnier MacWhisper, mais c’est un parti pris de son créateur qui vise une cible particulière : les journalistes. Denis Delbecq, lui-même journaliste, a privilégié la simplicité et les aides pour les reporters.
Chuchotis, qui est utilisé au quotidien par une vingtaine de personnes au média suisse Le Temps, se distingue notamment par la sélection du morceau à transcrire, l’ajout de suggestions de mots pour éviter les erreurs, le regroupement des phrases ou encore la détection des hallucinations. Le texte généré automatiquement peut être copié dans le presse-papier ou bien exporté au format Word, RTF ou SRT, avec ou sans les repères de temps.
L’application donne le choix entre le modèle moyen ou grand de Whisper, le second étant plus précis mais plus long à faire tourner. D’après mes essais, la durée de la transcription prend le même temps avec Chuchotis que MacWhisper, et le texte généré est quasi identique. À titre d’exemple, il a fallu 6 min 30 pour transcrire un podcast d’une quinzaine de minutes sur un MacBook Air M1 avec 16 Go de RAM.
MacWhisper a l’avantage d’avoir une version gratuite et plus de fonctions avancées dans sa version Pro, mais si vous cherchez un client Whisper tourné spécialement vers les journalistes, Chuchotis est pertinent. L’application est vendue 29,99 € sur le Mac App Store.
Dictée surprise pour Apple, Google et OpenAI : qui est le meilleur élève ?