diff --git a/README.md b/README.md index 8443819..01e3cf0 100644 --- a/README.md +++ b/README.md @@ -45,7 +45,7 @@ parti di un'ora ciascuna: ffmpeg -ss 00:00:00 -t 01:00:00 -i audio.mp4 -vcodec copy -acodec copy audio-0-1.mp4 - ffmpeg -ss 00:01:00 -t 01:00:00 -i audio.mp4 -vcodec copy -acodec copy audio-1-2.mp4 + ffmpeg -ss 01:00:00 -t 01:00:00 -i audio.mp4 -vcodec copy -acodec copy audio-1-2.mp4 audio-0-1.mp4 audio-1-2.mp4 @@ -62,26 +62,28 @@ Per trascrivere (o sbobinare), si installeranno videogrep e vosk Scaricare e scompattare il modulo lingua italiana per Vosk - wget https://alphacephei.com/vosk/models/vosk-model-small-it-0.4.zip +https://alphacephei.com/vosk/models - unzip vosk-model-small-it-0.4.zip +al momento la versione da usare è la small-it-0.22 (48MB) + + unzip vosk-model-small-it-0.22.zip # Trascrivere la prima ora: - videogrep --input audio-0-1.mp4 --model vosk-model-small-it-0.4/ --transcribe + videogrep --input audio1.mp4 --model vosk-model-small-it-0.4/ --transcribe Durata della conversione: circa 15 minuti. La durata dipenderà dalla potenza del PC usato. la seconda ora: - videogrep --input audio-1-2.mp4 --model vosk-model-small-it-0.4/ --transcribe + videogrep --input audio2.mp4 --model vosk-model-small-it-0.4/ --transcribe Si ottengono due JSON file -audio-0-1.json -audio-1-2.json +audio1.json +audio2.json I JSON file sono comodissimi dal punto di vista di una macchina. Se lo scopo della trascrizione è editare il video automaticamente usando videogrep, si può @@ -139,13 +141,13 @@ Una volta installato lo script, si può fare la conversione da JSON a SRT. Tornando al nostro esempio: - json2srt.py -i audio-0-1.json -o audio-0-1.srt + json2srt.py -i audio1.json -o audio1.srt - json2srt.py -i audio-1-2.json -o audio-1-2.srt + json2srt.py -i audio2.json -o audio2.srt Ora si potranno ricongiungere i due file, finalmente. - cat audio-0-1.srt audio-1-2.srt > audio.srt + cat audio1.srt audio2.srt > audio.srt E così ottenere l'agognato file: