Met alle geweld die ChatGPT en DALL-E 2 oproepen zou je haast vergeten dat er nóg een neuraal netwerk door OpenAI gepubliceerd is de afgelopen maanden. Whisper, een open source automatisch spraakherkenningsmodel verdiend het om zeker een toelichtingsvideo en blogpost te krijgen.
Wil je er zelf mee aan de slag? Dan kan dan bv met onderstaande Colabs (die je ook kunt downloaden en lokaal in Jypiterlabs kunt gebruiken)
- Google Colab voor transcriptie: https://edu.nl/vjxmm
- Google Colab voor ondertiteling van YouTube videos: https://edu.nl/gdcwv
In de video verteld Andy over de twee testvideo’s met identieke audio die ik gemaakt heb om de kwaliteit van ondertiteling gegenereerd door YouTube en door Whisper met elkaar te vergelijken. Je kunt de video’s hieronder bekijken (wel even zorgen dat ondertiteling aan staat anders zie je geen verschil).