le grand remake fix

This commit is contained in:
dan 2024-09-04 16:22:47 +02:00
parent 44cf4367ff
commit 4454df741d

View File

@ -36,49 +36,49 @@ nota: qualsiasi OS con un ambiente python3 funzionante andrà bene, questa guida
Andiamo a installare python e altre cose utili: Andiamo a installare python e altre cose utili:
`sudo apt install python3 python3-full python3-venv ffmpeg unzip mediainfo` `$ sudo apt install python3 python3-full python3-venv ffmpeg unzip mediainfo`
Creiamo la cartella: "sboby" e al suo interno, la sotto-cartella: "vosk". Creiamo la cartella: "sboby" e al suo interno, la sotto-cartella: "vosk":
`mkdir -p ~/sboby/vosk` `$ mkdir -p ~/sboby/vosk`
Entriamo nella cartella sboby/vosk/. Entriamo nella cartella sboby/vosk/:
`cd ~/sboby/vosk/` `$ cd ~/sboby/vosk/`
Scarichiamo il modello, anche [https://en.wikipedia.org/wiki/Large_language_model](LLM), vosk-italiano, circa 2GB: Scarichiamo il modello, anche [LLM](https://en.wikipedia.org/wiki/Large_language_model), vosk-italiano, circa 2GB:
`wget https://alphacephei.com/vosk/models/vosk-model-it-0.22.zip` `$ wget https://alphacephei.com/vosk/models/vosk-model-it-0.22.zip`
Altre lingue sono scaricabili alla pagina dei [Vosk models](https://alphacephei.com/vosk/models). Altre lingue sono scaricabili alla pagina dei [Vosk models](https://alphacephei.com/vosk/models).
Scompattiamo il modello appena scaricato: Scompattiamo il modello appena scaricato:
`unzip vosk-model-it-0.22.zip` `$ unzip vosk-model-it-0.22.zip`
Opzionale: possiamo ora cancellare il file zip. Opzionale: possiamo ora cancellare il file zip:
`rm vosk-model-it-0.22.zip` `$ rm vosk-model-it-0.22.zip`
Usciamo dalla cartella ~/sboby/vosk/ Usciamo dalla cartella ~/sboby/vosk/:
`cd` `$ cd`
Creiamo un ambiente virtuale per Python Creiamo un ambiente virtuale per Python:
`python3 -m venv /home/$USER/sboby` `$ python3 -m venv /home/$USER/sboby`
Usiamo Python per scaricare e installare wheel (una libreria necessaria) e vosk-transcriber: Usiamo Python per scaricare e installare wheel (una libreria necessaria) e vosk-transcriber:
`./sboby/bin/pip3 install wheel` `$ ./sboby/bin/pip3 install wheel`
`./sboby/bin/pip3 install vosk` `$ ./sboby/bin/pip3 install vosk`
Ora possiamo effettuare la prima trascrizione, useremo ad esempio l'audio ![allunaggio.mp3](allunaggio.mp3). Ora possiamo effettuare la prima trascrizione, useremo ad esempio l'audio ![allunaggio.mp3](allunaggio.mp3).
Prima, vediamo quanto dura: Prima, vediamo quanto dura:
`mediainfo allunaggio.mp3 | grep Duration` `$ mediainfo allunaggio.mp3 | grep Duration`
> Duration: 1 min 16 s > Duration: 1 min 16 s
@ -87,25 +87,23 @@ Per un Pc di media potenza, un audio di 1 ora, potrebbe impiegare circa 1 ora.
Possiamo ora invocare il programma: "vosk-transcriber", indicando (-i) quale audio sbobinare, che modello usare (--model) e dove (-o) appoggiare il testo. Possiamo ora invocare il programma: "vosk-transcriber", indicando (-i) quale audio sbobinare, che modello usare (--model) e dove (-o) appoggiare il testo.
`~/sboby/bin/vosk-transcriber -i ~/sboby/allunaggio.mp3 --model /share/software/vosk/vosk-model-it-0.22/ -o ~/sboby/allunaggio.txt` `$ ~/sboby/bin/vosk-transcriber -i ~/sboby/allunaggio.mp3 --model /share/software/vosk/vosk-model-it-0.22/ -o ~/sboby/allunaggio.txt`
Possiamo anche ottenere la trascrizione in formato testo sottotitolo (SRT) con time-code: Possiamo anche ottenere la trascrizione in formato testo sottotitolo (SRT) con time-code:
`~/sboby/bin/vosk-transcriber -i ~/sboby/allunaggio.mp3 --model /home/$USER/sboby/vosk/vosk-model-it-0.22/ -t srt -o ~/sboby/allunaggio.srt` `$ ~/sboby/bin/vosk-transcriber -i ~/sboby/allunaggio.mp3 --model /home/$USER/sboby/vosk/vosk-model-it-0.22/ -t srt -o ~/sboby/allunaggio.srt`
Opzionale: Possiamo mettere tutto nello script sboby.sh in ~/bin/ che renderemo eseguibile (`chmod 755 ~/bin/sboby.sh`). Opzionale: Possiamo mettere tutto nello script sboby.sh in ~/bin/ che renderemo eseguibile (`chmod 755 ~/bin/sboby.sh`):
` > #!/bin/sh
#!/bin/sh > ~/sboby/bin/vosk-transcriber -i ${1+"$@"} --model ~/sboby/vosk/vosk-model-it-0.22/ -o ${1+"$@"}.txt ;
~/sboby/bin/vosk-transcriber -i ${1+"$@"} --model ~/sboby/vosk/vosk-model-it-0.22/ -o ${1+"$@"}.txt ; > sleep 5s ;
sleep 5s ; > ~/sboby/bin/vosk-transcriber -i ${1+"$@"} --model ~/sboby/vosk/vosk-model-it-0.22/ -t srt -o ${1+"$@"}.srt
~/sboby/bin/vosk-transcriber -i ${1+"$@"} --model ~/sboby/vosk/vosk-model-it-0.22/ -t srt -o ${1+"$@"}.srt > echo 'bye bye sboby'
echo 'bye bye sboby'
`
In modo da ottenere la trascrizione tramite il semplice comando: sboby.sh [FILE].. In modo da ottenere la trascrizione tramite il semplice comando: sboby.sh [FILE]..
`sboby.sh allunaggio.mp3` `$ sboby.sh allunaggio.mp3`
Infine, se usiamo XFCE4 come ambiente scrivania, si potrà inserire una [custom action](https://docs.xfce.org/xfce/thunar/custom-actions) Infine, se usiamo XFCE4 come ambiente scrivania, si potrà inserire una [custom action](https://docs.xfce.org/xfce/thunar/custom-actions)
in Thunar da usare cliccando col tasto destro sull'audio: in Thunar da usare cliccando col tasto destro sull'audio: