sboby/README.md

215 lines
4.9 KiB
Markdown
Raw Permalink Normal View History

2022-06-06 00:42:46 +02:00
# sboby - Trascrivere una registrazione audio
2022-06-06 00:19:23 +02:00
2022-06-06 00:42:46 +02:00
*Sbobinare, parola amara.*
2022-06-06 01:08:11 +02:00
![sboby](sboby.jpg)
2022-06-06 00:42:46 +02:00
Il metodo gramo, passo passo ma così educazionale che ti sale la gioia.
Feel free di saltare le parti ovvie o di arredare il tunnel come meglio si crede.
Funziona con Debian 11 stable.
2022-06-06 01:08:11 +02:00
# Installare il software che verrà utilizzato
2022-06-06 00:42:46 +02:00
sudo apt install python3 ffmpeg unzip mediainfo
2022-06-06 01:08:11 +02:00
Lanciare un terminale e creare una directory dove lavorare con il file ad esempio: **audio.mp3**
2022-06-06 00:42:46 +02:00
mkdir ~/sbobina
2022-06-06 01:08:11 +02:00
cd ~/sbobina/
2022-06-06 00:42:46 +02:00
2022-06-06 01:08:11 +02:00
audio.mp3
2022-06-06 00:42:46 +02:00
# Convertire il file in mp4
ffmpeg -i audio.mp3 audio.mp4
2022-06-06 01:08:11 +02:00
audio.mp4
2022-06-06 00:42:46 +02:00
# Se il file è molto lungo
*es: più di due ore e mezzo*
Sarà utile spezzarlo in più parti, sennò lo script potrebbe fallire perché
gli finisce la memoria, ma non gliene faremo una colpa.
Sapere quanto dura:
mediainfo audio.mp4 | grep Duration
2022-06-06 01:08:11 +02:00
Duration: 2 h 00 min
2022-06-06 00:42:46 +02:00
In questo esempio il file esattamente dura due ore e lo si vuole dividere in due
parti di un'ora ciascuna:
ffmpeg -ss 00:00:00 -t 01:00:00 -i audio.mp4 -vcodec copy -acodec copy audio-0-1.mp4
2023-03-30 02:19:50 +02:00
ffmpeg -ss 01:00:00 -t 01:00:00 -i audio.mp4 -vcodec copy -acodec copy audio-1-2.mp4
2022-06-06 00:42:46 +02:00
2022-06-06 01:08:11 +02:00
audio-0-1.mp4
2022-06-06 00:42:46 +02:00
audio-1-2.mp4
# Trascrivere i file
Per trascrivere (o sbobinare), si installeranno videogrep e vosk
pip3 install videogrep
2022-06-06 01:08:11 +02:00
2022-06-06 00:42:46 +02:00
pip3 install vosk
# Modulo lingua italiana per Vosk
Scaricare e scompattare il modulo lingua italiana per Vosk
2023-03-30 02:19:50 +02:00
https://alphacephei.com/vosk/models
2022-06-06 00:42:46 +02:00
2023-03-30 02:19:50 +02:00
al momento la versione da usare è la small-it-0.22 (48MB)
unzip vosk-model-small-it-0.22.zip
2022-06-06 00:42:46 +02:00
# Trascrivere
la prima ora:
2023-03-30 02:19:50 +02:00
videogrep --input audio1.mp4 --model vosk-model-small-it-0.4/ --transcribe
2022-06-06 00:42:46 +02:00
Durata della conversione: circa 15 minuti. La durata dipenderà dalla potenza del PC usato.
la seconda ora:
2023-03-30 02:19:50 +02:00
videogrep --input audio2.mp4 --model vosk-model-small-it-0.4/ --transcribe
2022-06-06 00:42:46 +02:00
Si ottengono due JSON file
2023-03-30 02:19:50 +02:00
audio1.json
audio2.json
2022-06-06 00:42:46 +02:00
I JSON file sono comodissimi dal punto di vista di una macchina. Se lo scopo
2022-06-06 01:08:11 +02:00
della trascrizione è editare il video automaticamente usando videogrep, si può
procedere. Tra i link c'è il tutorial di videogrep.
2022-06-06 00:42:46 +02:00
2022-06-06 01:08:11 +02:00
Se lo scopo è fare dei sottotitoli, occorrerà convertire da JSON in SRT o XML.
2022-06-06 00:42:46 +02:00
Ma in questo caso siamo umani, si vuole ottenere del testo semplice da
allegare alla registrazione per ricerca e archivio (and for great justice).
Here comes Bomboclat, il quale ha scritto questo piccolo script che converte
(guarda un po') un JSON in un SRT.
# Convertire da JSON a SRT
Ecco lo script [json2srt](json2srt.py)
Per l'utilizzo lasciamo la parola a Bomboclat, cui rendiamo merito:
2022-06-06 01:08:11 +02:00
`sudo apt install python3-venv`
*nella tua home dai questo comando*
`python3 -m venv json_to_srt`
*ti crea una cartella json_to_srt
con dentro python3
fatto questo comando ne dai un altro per attivarlo*
`source ~/json_to_srt/bin/activate`
*a sto punto hai lo script che ora ti passo aggiornato
ha ancora un difetto, le ore sono espresse con una cifra
percio' anziche' scrivere per esempio:
00:00:00,000
ore minuti secondi, millesimi
scrive solo
0:00:00,000
che si risolve facile
aggiungendo lo 0 a mano nella stringa finale
ma per ora lasciamo perdere sto dettaglio*
`python json2srt.py -i un_file.json -o il_suo_output.srt`
2022-06-06 00:42:46 +02:00
A me mi funziona anche solo mettendo lo script in ~/bin e dandogli i permessi di esecuzione:
mv json2srt.py ~/bin/
2022-06-06 01:08:11 +02:00
2022-06-06 00:42:46 +02:00
chmod 755 ~/bin/json2srt.py
Però è anche vero che non si dice: "a me mi", dunque anche il vostro
chilometraggio potrebbe variare.
Una volta installato lo script, si può fare la conversione da JSON a SRT.
Tornando al nostro esempio:
2023-03-30 02:19:50 +02:00
json2srt.py -i audio1.json -o audio1.srt
2022-06-06 00:42:46 +02:00
2023-03-30 02:19:50 +02:00
json2srt.py -i audio2.json -o audio2.srt
2022-06-06 00:42:46 +02:00
Ora si potranno ricongiungere i due file, finalmente.
2023-03-30 02:19:50 +02:00
cat audio1.srt audio2.srt > audio.srt
2022-06-06 00:42:46 +02:00
E così ottenere l'agognato file:
2022-06-06 01:08:11 +02:00
**audio.srt**
2022-06-06 00:42:46 +02:00
# Il file audio.SRT
Un file SRT è testo puro e si presenta così:
2022-06-06 01:08:11 +02:00
1
0:00:01,680 --> 0:00:06,810
2022-06-06 00:42:46 +02:00
bla bla bla bla, bla bla bla
2022-06-06 01:08:11 +02:00
2
0:00:08,372 --> 0:00:13,830
2022-06-06 00:42:46 +02:00
bla bla bla bla e ancora bla
cioè:
* Numeroriga
* Timecode
* Testo
* Spazio
È già umanamente leggibile, ma per poterlo pubblicare come testo semplice si
potranno togliere le righe che contengono, come espressioni regolari, Numeroriga
e Timecode.
sed '/[0-9]/d' audio.srt > trascrizione.txt
Ed eventualmente anche levare la riga vuota!
sed '/^$/d' trascrizione.txt > wallof.txt
Poi rileggere, riascoltare e correggere.
# Share and enjoy
Shoutz a Debian, ffmpeg, videogrep e vosk, Bomboclat per lo script, ilLobo per
2022-06-06 01:08:11 +02:00
aver scoperto videogrep, dan che ha scritto, e Shoutz a te che leggi, possa la
2022-06-06 00:42:46 +02:00
sbobinatura esserti lieve.
This is a: DIWO (Do It With Others)
**WE ARE NOT MEN! WE ARE DIWO!**
# Links
Debian GNU/Linux Free OS
https://www.debian.org/
ffmpeg
https://ffmpeg.org/
Videogrep Tutorial
https://lav.io/notes/videogrep-tutorial/
Vosk speech recognition toolkit
https://alphacephei.com/vosk/
Vosk models
https://alphacephei.com/vosk/models
2022-06-06 01:08:11 +02:00
*bye bye sboby*