Convertir un enregistrement audio en texte de façon semi-automatique

Écrire le verbatim d'un enregistrement audio est une tâche fastidieuse. Pour une personne inexpérimentée, malgré un bon doigté au clavier, transcrire minutieusement un fichier audio d'une trentaine de minutes peut prendre une demi-journée et même une journée entière.

Alors, pourquoi ne pas essayer de tirer profit de la technologie dans cette tâche ? Les outils de reconnaissance vocale ne sont pas encore tout à fait au point, j'en conviens. Malgré cela, ils peuvent donner un bon coup de main de départ, que l'on peaufinera à la main par la suite.

La technique présentée ici consiste à faire jouer un enregistrement audio et à répéter à voix haute ce que vous entendez. Un outil de saisie vocale se chargera alors de transcrire votre voix.

▼Publicité

Pourquoi ne pas faire la transcription directe de l'enregistrement audio ? Principalement parce que les outils de reconnaissance vocale effectuent un meilleur travail avec une voix qu'ils ont appris à connaître : la vôtre.

Matériel requis

Vous aurez besoin de :

  • Un enregistrement audio
  • Audacity : http://www.audacityteam.org/download/ (gratuit), pour manipuler votre fichier audio et pour le faire jouer
  • Le convertisseur Lame (fichier lame_enc.dll) : http://lame.buanzo.org/#lamewindl (gratuit), pour qu'Audacity puisse enregistrer les modifications à votre fichier audio en  format mp3
  • Pour convertir l'audio en texte , un compte Google Drive : https://drive.google.com (gratuit), afin de profiter de l'outil de saisie vocale
  • Une paire d'écouteurs

Préparation du fichier audio

Le travail sera plus facile si vous ralentissez le tempo de votre enregistrement. Ceci vous permettra de dicter de façon fluide ce que vous entendez.

Contrairement à un changement de vitesse, le changement de tempo ne modifiera pas la tonalité de la voix. Vous pourrez donc entendre un débit plus lent sans que la voix ne soit plus grave.

Pour ralentir le tempo dans Audacity :

  • Ouvrez votre fichier audio dans Audacity : menu Fichier / Importer / Audio.
  • Rendez-vous dans le menu Effets / Changer le tempo.

    Changer le tempo dans Audacity

  • Ajustez la valeur de modification. Personnellement, je trouve qu'un diminution de 20% est intéressante.

    Changer le tempo dans Audacity

  • Enregistrez les modifications à l'aide du menu Fichier / Exporter l'audio.

Préparation du fichier qui recevra le verbatim

Il existe une foule de formats de documents pour recevoir un verbatim. Personnellement, j'aime travailler avec un document en quatre colonnes.

Dans la première colonne, je note le minutage auquel la phrase a été dite. Il n'est pas nécessaire de le noter à chaque ligne. Une fois de temps en temps suffit. Ceci permet de retrouver plus facilement l'extrait sonore en cas de besoin.

Dans la seconde colonne, je note le nom de la personne qui parle ou, lorsque l'entretien est sous forme de question et réponse entre deux personnes, simplement Q ou R.

La troisième colonne est la plus importante. C'est elle qui recevra le verbatim.

La dernière colonne demeurera vierge. Il s'agit d'un espace qui pourra être utilisé par les personnes qui reliront le verbatim.

Exemple de document pour recevoir le verbatim

Important : si vous disposez d'un modèle Word de ce fichier, il ne faut pas tenter d'ouvrir le document Word dans Google Drive. L'outil de saisie vocale serait alors grisé donc non disponible.

Plutôt, créez un document Google Docs vierge et effectuez le copier-coller du contenu de votre document Word vers le document Google.

Génération du verbatim sous Windows

Une fois le fichier audio ajusté et le fichier du verbatim prêt, vous pouvez commencer le travail de transcription.

  • Branchez une paire d'écouteurs à votre ordinateur.
  • Dans Audacity, ouvrez le fichier audio dont vous avez ralenti le tempo.
  • Le travail dans Audacity sera plus facile si vous ajustez le zoom pour voir précisément le minutage où vous êtes rendus. Pour y arriver, appuyez sur la touche Ctrl et faites rouler la molette de la souris jusqu'à ce que qu'on voit les petits silences dans la narration enregistrée. Personnellement, j'aime travailler avec un zoom qui laisse voir à l'écran deux ou trois minutes à la fois.

    À titre d'exemple, voici une entrevue d'une durée de 1h45 dont le zoom n'a pas été modifié.

    Audacity : aucun zoom

    Voici la même entrevue affichée dans Audacity avec un zoom montrant environ 2 minutes à la fois.

    Audacity : Zoom à 2 minutes

  • Branchez-vous sur Google Drive et ouvrez le document qui recevra le verbatim. Placez le point d'insertion dans la colonne où la transcription doit être écrite.
  • Pour activer la saisie vocale de Google Docs, allez dans le menu Outils / Saisie vocale.

    Saisie vocale sous Google

  • Une boîte affichant un micro apparaîtra. Assurez-vous que la langue Français soit sélectionnée.

  • Lancez la lecture du fichier audio dans Audacity en appuyant sur Play.

    Bouton Play dans Audacity

  • Rapidement, cliquez la boîte affichant le micro dans Google. Le micro deviendra rouge pour indiquer qu'il est à l'écoute.

    Cliquez pour parler

  • Dictez ce que vous entendez et voyez comme Google réussit à reconnaître les mots !

    Saisie vocale en cours sous Google

  • Afin de pouvoir déplacer la souris rapidement entre Audacity et Google, j'aime placer les deux applications l'une sous l'autre dans le même écran.

    Audacity et Google dans le même écran

  • Au besoin, vous pouvez mettre le fichier audio en pause dans Audacity. Si le le focus est sur Google Drive, faites Alt+Tab pour donner le focus à Audacity. Vous pouvez ensuite activer la pause en appuyant sur la touche P. Ceci mettra automatiquement la saisie vocale en pause sur Google. Ce temps de pause vous permettra de noter le minutage dans votre fichier de verbatim, de corriger une erreur dans l'interprétation de Google ou encore de reprendre un passage manqué.

  • Dans Audacity, vous pouvez relancer la lecture de différentes façons : en appuyant à nouveau sur Pause, en appuyant sur la touche P ou en cliquant dans la ligne de temps sur le minutage auquel la lecture doit reprendre. Vous devrez également réactiver la saisie vocale dans Google.

    Attention : si vous cliquez sur Play dans Audacity, la lecture reprendra du début...

  • Lorsque vous détectez un changement de narrateur, cliquez sur la ligne suivante dans votre document Google. Le verbatim continuera à s'écrire à partir de cet endroit.

  • La dernière étape, et non la moindre, consiste à relire le document afin d'y ajouter la ponctuation, d'y corriger les fautes d'orthographe ou de corriger les mots qui sont erronés. Eh oui, Google est capable d'écrire « Pirate pharmacien » au lieu de « puis votre formation » !
Merci de partager ! Share on FacebookTweet about this on TwitterShare on Google+Share on LinkedInPin on PinterestShare on StumbleUponEmail this to someone
Catégories

2 commentaires