format fix
This commit is contained in:
parent
6fa0d0936b
commit
7648de212e
97
README.md
97
README.md
|
@ -2,30 +2,31 @@
|
||||||
|
|
||||||
*Sbobinare, parola amara.*
|
*Sbobinare, parola amara.*
|
||||||
|
|
||||||
![sboby](sboby.jpg){ width=90% }
|
![sboby](sboby.jpg)
|
||||||
|
|
||||||
Il metodo gramo, passo passo ma così educazionale che ti sale la gioia.
|
Il metodo gramo, passo passo ma così educazionale che ti sale la gioia.
|
||||||
Feel free di saltare le parti ovvie o di arredare il tunnel come meglio si crede.
|
Feel free di saltare le parti ovvie o di arredare il tunnel come meglio si crede.
|
||||||
|
|
||||||
Funziona con Debian 11 stable.
|
Funziona con Debian 11 stable.
|
||||||
|
|
||||||
# Installare il software che useremo:
|
# Installare il software che verrà utilizzato
|
||||||
|
|
||||||
sudo apt install python3 ffmpeg unzip mediainfo
|
sudo apt install python3 ffmpeg unzip mediainfo
|
||||||
|
|
||||||
Lanciare un terminale e creare una directory dove lavorare con il file ad esempio: audio.mp3
|
Lanciare un terminale e creare una directory dove lavorare con il file ad esempio: **audio.mp3**
|
||||||
|
|
||||||
mkdir ~/sbobina
|
mkdir ~/sbobina
|
||||||
|
|
||||||
cd ~/sbobina/
|
cd ~/sbobina/
|
||||||
|
|
||||||
ls
|
audio.mp3
|
||||||
|
|
||||||
`audio.mp3`
|
|
||||||
|
|
||||||
# Convertire il file in mp4
|
# Convertire il file in mp4
|
||||||
|
|
||||||
ffmpeg -i audio.mp3 audio.mp4
|
ffmpeg -i audio.mp3 audio.mp4
|
||||||
|
|
||||||
|
audio.mp4
|
||||||
|
|
||||||
# Se il file è molto lungo
|
# Se il file è molto lungo
|
||||||
|
|
||||||
*es: più di due ore e mezzo*
|
*es: più di due ore e mezzo*
|
||||||
|
@ -37,7 +38,7 @@ Sapere quanto dura:
|
||||||
|
|
||||||
mediainfo audio.mp4 | grep Duration
|
mediainfo audio.mp4 | grep Duration
|
||||||
|
|
||||||
`Duration: 2 h 00 min`
|
Duration: 2 h 00 min
|
||||||
|
|
||||||
In questo esempio il file esattamente dura due ore e lo si vuole dividere in due
|
In questo esempio il file esattamente dura due ore e lo si vuole dividere in due
|
||||||
parti di un'ora ciascuna:
|
parti di un'ora ciascuna:
|
||||||
|
@ -46,21 +47,15 @@ parti di un'ora ciascuna:
|
||||||
|
|
||||||
ffmpeg -ss 00:01:00 -t 01:00:00 -i audio.mp4 -vcodec copy -acodec copy audio-1-2.mp4
|
ffmpeg -ss 00:01:00 -t 01:00:00 -i audio.mp4 -vcodec copy -acodec copy audio-1-2.mp4
|
||||||
|
|
||||||
ls
|
audio-0-1.mp4
|
||||||
|
|
||||||
```
|
|
||||||
audio.mp3
|
|
||||||
audio.mp4
|
|
||||||
audio-0-1.mp4
|
|
||||||
audio-1-2.mp4
|
audio-1-2.mp4
|
||||||
```
|
|
||||||
|
|
||||||
# Trascrivere i file
|
# Trascrivere i file
|
||||||
|
|
||||||
Per trascrivere (o sbobinare), si installeranno videogrep e vosk
|
Per trascrivere (o sbobinare), si installeranno videogrep e vosk
|
||||||
|
|
||||||
pip3 install videogrep
|
pip3 install videogrep
|
||||||
|
|
||||||
pip3 install vosk
|
pip3 install vosk
|
||||||
|
|
||||||
# Modulo lingua italiana per Vosk
|
# Modulo lingua italiana per Vosk
|
||||||
|
@ -85,18 +80,14 @@ la seconda ora:
|
||||||
|
|
||||||
Si ottengono due JSON file
|
Si ottengono due JSON file
|
||||||
|
|
||||||
ls
|
audio-0-1.json
|
||||||
|
|
||||||
```
|
|
||||||
audio-0-1.json
|
|
||||||
audio-1-2.json
|
audio-1-2.json
|
||||||
```
|
|
||||||
|
|
||||||
I JSON file sono comodissimi dal punto di vista di una macchina. Se lo scopo
|
I JSON file sono comodissimi dal punto di vista di una macchina. Se lo scopo
|
||||||
della trascrizione è editare il video usando videogrep, si può procedere. Tra i
|
della trascrizione è editare il video automaticamente usando videogrep, si può
|
||||||
link c'è il tutorial di videogrep.
|
procedere. Tra i link c'è il tutorial di videogrep.
|
||||||
|
|
||||||
Se lo scopo è farne dei sottotitoli, occorrerà convertire da JSON in SRT o XML.
|
Se lo scopo è fare dei sottotitoli, occorrerà convertire da JSON in SRT o XML.
|
||||||
|
|
||||||
Ma in questo caso siamo umani, si vuole ottenere del testo semplice da
|
Ma in questo caso siamo umani, si vuole ottenere del testo semplice da
|
||||||
allegare alla registrazione per ricerca e archivio (and for great justice).
|
allegare alla registrazione per ricerca e archivio (and for great justice).
|
||||||
|
@ -110,30 +101,35 @@ Ecco lo script [json2srt](json2srt.py)
|
||||||
|
|
||||||
Per l'utilizzo lasciamo la parola a Bomboclat, cui rendiamo merito:
|
Per l'utilizzo lasciamo la parola a Bomboclat, cui rendiamo merito:
|
||||||
|
|
||||||
```
|
`sudo apt install python3-venv`
|
||||||
sudo apt install python3-venv
|
|
||||||
nella tua home dai questo comando
|
*nella tua home dai questo comando*
|
||||||
python3 -m venv json_to_srt
|
|
||||||
ti crea una cartella json_to_srt
|
`python3 -m venv json_to_srt`
|
||||||
con dentro python3
|
|
||||||
fatto questo comando ne dai un altro per attivarlo
|
*ti crea una cartella json_to_srt
|
||||||
source ~/json_to_srt/bin/activate
|
con dentro python3
|
||||||
a sto punto hai lo script che ora ti passo aggiornato
|
fatto questo comando ne dai un altro per attivarlo*
|
||||||
ha ancora un difetto, le ore sono espresse con una cifra
|
|
||||||
percio' anziche' scrivere per esempio:
|
`source ~/json_to_srt/bin/activate`
|
||||||
00:00:00,000
|
|
||||||
ore minuti secondi, millesimi
|
*a sto punto hai lo script che ora ti passo aggiornato
|
||||||
scrive solo
|
ha ancora un difetto, le ore sono espresse con una cifra
|
||||||
0:00:00,000
|
percio' anziche' scrivere per esempio:
|
||||||
che si risolve facile
|
00:00:00,000
|
||||||
aggiungendo lo 0 a mano nella stringa finale
|
ore minuti secondi, millesimi
|
||||||
ma per ora lasciamo perdere sto dettaglio
|
scrive solo
|
||||||
python json2srt.py -i un_file.json -o il_suo_output.srt
|
0:00:00,000
|
||||||
```
|
che si risolve facile
|
||||||
|
aggiungendo lo 0 a mano nella stringa finale
|
||||||
|
ma per ora lasciamo perdere sto dettaglio*
|
||||||
|
|
||||||
|
`python json2srt.py -i un_file.json -o il_suo_output.srt`
|
||||||
|
|
||||||
A me mi funziona anche solo mettendo lo script in ~/bin e dandogli i permessi di esecuzione:
|
A me mi funziona anche solo mettendo lo script in ~/bin e dandogli i permessi di esecuzione:
|
||||||
|
|
||||||
mv json2srt.py ~/bin/
|
mv json2srt.py ~/bin/
|
||||||
|
|
||||||
chmod 755 ~/bin/json2srt.py
|
chmod 755 ~/bin/json2srt.py
|
||||||
|
|
||||||
Però è anche vero che non si dice: "a me mi", dunque anche il vostro
|
Però è anche vero che non si dice: "a me mi", dunque anche il vostro
|
||||||
|
@ -153,21 +149,20 @@ Ora si potranno ricongiungere i due file, finalmente.
|
||||||
|
|
||||||
E così ottenere l'agognato file:
|
E così ottenere l'agognato file:
|
||||||
|
|
||||||
`audio.srt'
|
**audio.srt**
|
||||||
|
|
||||||
# Il file audio.SRT
|
# Il file audio.SRT
|
||||||
|
|
||||||
Un file SRT è testo puro e si presenta così:
|
Un file SRT è testo puro e si presenta così:
|
||||||
|
|
||||||
1
|
1
|
||||||
0:00:01,680 --> 0:00:06,810
|
0:00:01,680 --> 0:00:06,810
|
||||||
bla bla bla bla, bla bla bla
|
bla bla bla bla, bla bla bla
|
||||||
|
|
||||||
2
|
2
|
||||||
0:00:08,372 --> 0:00:13,830
|
0:00:08,372 --> 0:00:13,830
|
||||||
bla bla bla bla e ancora bla
|
bla bla bla bla e ancora bla
|
||||||
|
|
||||||
|
|
||||||
cioè:
|
cioè:
|
||||||
|
|
||||||
* Numeroriga
|
* Numeroriga
|
||||||
|
@ -190,7 +185,7 @@ Poi rileggere, riascoltare e correggere.
|
||||||
# Share and enjoy
|
# Share and enjoy
|
||||||
|
|
||||||
Shoutz a Debian, ffmpeg, videogrep e vosk, Bomboclat per lo script, ilLobo per
|
Shoutz a Debian, ffmpeg, videogrep e vosk, Bomboclat per lo script, ilLobo per
|
||||||
aver scoperto videogrep, dan che ha scritto e Shoutz a te che leggi, possa la
|
aver scoperto videogrep, dan che ha scritto, e Shoutz a te che leggi, possa la
|
||||||
sbobinatura esserti lieve.
|
sbobinatura esserti lieve.
|
||||||
|
|
||||||
This is a: DIWO (Do It With Others)
|
This is a: DIWO (Do It With Others)
|
||||||
|
@ -213,3 +208,5 @@ https://alphacephei.com/vosk/
|
||||||
|
|
||||||
Vosk models
|
Vosk models
|
||||||
https://alphacephei.com/vosk/models
|
https://alphacephei.com/vosk/models
|
||||||
|
|
||||||
|
*bye bye sboby*
|
||||||
|
|
Loading…
Reference in New Issue
Block a user