le grand remake fix

This commit is contained in:
dan 2024-09-04 16:22:47 +02:00
parent 44cf4367ff
commit 4454df741d

View File

@ -36,49 +36,49 @@ nota: qualsiasi OS con un ambiente python3 funzionante andrà bene, questa guida
Andiamo a installare python e altre cose utili:
`sudo apt install python3 python3-full python3-venv ffmpeg unzip mediainfo`
`$ sudo apt install python3 python3-full python3-venv ffmpeg unzip mediainfo`
Creiamo la cartella: "sboby" e al suo interno, la sotto-cartella: "vosk".
Creiamo la cartella: "sboby" e al suo interno, la sotto-cartella: "vosk":
`mkdir -p ~/sboby/vosk`
`$ mkdir -p ~/sboby/vosk`
Entriamo nella cartella sboby/vosk/.
Entriamo nella cartella sboby/vosk/:
`cd ~/sboby/vosk/`
`$ cd ~/sboby/vosk/`
Scarichiamo il modello, anche [https://en.wikipedia.org/wiki/Large_language_model](LLM), vosk-italiano, circa 2GB:
Scarichiamo il modello, anche [LLM](https://en.wikipedia.org/wiki/Large_language_model), vosk-italiano, circa 2GB:
`wget https://alphacephei.com/vosk/models/vosk-model-it-0.22.zip`
`$ wget https://alphacephei.com/vosk/models/vosk-model-it-0.22.zip`
Altre lingue sono scaricabili alla pagina dei [Vosk models](https://alphacephei.com/vosk/models).
Scompattiamo il modello appena scaricato:
`unzip vosk-model-it-0.22.zip`
`$ unzip vosk-model-it-0.22.zip`
Opzionale: possiamo ora cancellare il file zip.
Opzionale: possiamo ora cancellare il file zip:
`rm vosk-model-it-0.22.zip`
`$ rm vosk-model-it-0.22.zip`
Usciamo dalla cartella ~/sboby/vosk/
Usciamo dalla cartella ~/sboby/vosk/:
`cd`
`$ cd`
Creiamo un ambiente virtuale per Python
Creiamo un ambiente virtuale per Python:
`python3 -m venv /home/$USER/sboby`
`$ python3 -m venv /home/$USER/sboby`
Usiamo Python per scaricare e installare wheel (una libreria necessaria) e vosk-transcriber:
`./sboby/bin/pip3 install wheel`
`$ ./sboby/bin/pip3 install wheel`
`./sboby/bin/pip3 install vosk`
`$ ./sboby/bin/pip3 install vosk`
Ora possiamo effettuare la prima trascrizione, useremo ad esempio l'audio ![allunaggio.mp3](allunaggio.mp3).
Prima, vediamo quanto dura:
`mediainfo allunaggio.mp3 | grep Duration`
`$ mediainfo allunaggio.mp3 | grep Duration`
> Duration: 1 min 16 s
@ -87,25 +87,23 @@ Per un Pc di media potenza, un audio di 1 ora, potrebbe impiegare circa 1 ora.
Possiamo ora invocare il programma: "vosk-transcriber", indicando (-i) quale audio sbobinare, che modello usare (--model) e dove (-o) appoggiare il testo.
`~/sboby/bin/vosk-transcriber -i ~/sboby/allunaggio.mp3 --model /share/software/vosk/vosk-model-it-0.22/ -o ~/sboby/allunaggio.txt`
`$ ~/sboby/bin/vosk-transcriber -i ~/sboby/allunaggio.mp3 --model /share/software/vosk/vosk-model-it-0.22/ -o ~/sboby/allunaggio.txt`
Possiamo anche ottenere la trascrizione in formato testo sottotitolo (SRT) con time-code:
`~/sboby/bin/vosk-transcriber -i ~/sboby/allunaggio.mp3 --model /home/$USER/sboby/vosk/vosk-model-it-0.22/ -t srt -o ~/sboby/allunaggio.srt`
`$ ~/sboby/bin/vosk-transcriber -i ~/sboby/allunaggio.mp3 --model /home/$USER/sboby/vosk/vosk-model-it-0.22/ -t srt -o ~/sboby/allunaggio.srt`
Opzionale: Possiamo mettere tutto nello script sboby.sh in ~/bin/ che renderemo eseguibile (`chmod 755 ~/bin/sboby.sh`).
Opzionale: Possiamo mettere tutto nello script sboby.sh in ~/bin/ che renderemo eseguibile (`chmod 755 ~/bin/sboby.sh`):
`
#!/bin/sh
~/sboby/bin/vosk-transcriber -i ${1+"$@"} --model ~/sboby/vosk/vosk-model-it-0.22/ -o ${1+"$@"}.txt ;
sleep 5s ;
~/sboby/bin/vosk-transcriber -i ${1+"$@"} --model ~/sboby/vosk/vosk-model-it-0.22/ -t srt -o ${1+"$@"}.srt
echo 'bye bye sboby'
`
> #!/bin/sh
> ~/sboby/bin/vosk-transcriber -i ${1+"$@"} --model ~/sboby/vosk/vosk-model-it-0.22/ -o ${1+"$@"}.txt ;
> sleep 5s ;
> ~/sboby/bin/vosk-transcriber -i ${1+"$@"} --model ~/sboby/vosk/vosk-model-it-0.22/ -t srt -o ${1+"$@"}.srt
> echo 'bye bye sboby'
In modo da ottenere la trascrizione tramite il semplice comando: sboby.sh [FILE]..
`sboby.sh allunaggio.mp3`
`$ sboby.sh allunaggio.mp3`
Infine, se usiamo XFCE4 come ambiente scrivania, si potrà inserire una [custom action](https://docs.xfce.org/xfce/thunar/custom-actions)
in Thunar da usare cliccando col tasto destro sull'audio: