Volia compartir simplement que l’eina que utilitza Kdenlive per a fer Speech to Text es pot utilitzar des del terminal per a fer transcripcions d’àudio. L’eina en si és vosk.
He fet una petita prova amb un àudio que he gravat i ho ha reconegut bé (depèn de les paraules, del model i de la qualitat de l’àudio pot variar, però ja et deixa un esquelet que només s’ha de revisar).
vosk-transcriber -l ca -i Test.mp3 -o Test.txt
M’ha tornat:
això és una prova
a veure si funciona bé el programa de transcripció
He anat a la documentació i ho he tornat a intentar.
Sembla que s’instal·la bé (no em dona cap avís o recomanació). Però em no funcionen comandes: vosk-transcriber --list-languages vosk-transcriber -l ca -i Test.mp3 -o Test.txt
Per casualitat tens un dia de la setmana que ve per fer-nos una demo?
Hi ha una personeta que també vindria (de fet, és qui m’ha proposat revifar el fil).