From 4454df741d97b2b7566ab49cf0ac504cf5f870f7 Mon Sep 17 00:00:00 2001 From: dan Date: Wed, 4 Sep 2024 16:22:47 +0200 Subject: [PATCH] le grand remake fix --- README.md | 54 ++++++++++++++++++++++++++---------------------------- 1 file changed, 26 insertions(+), 28 deletions(-) diff --git a/README.md b/README.md index b4993d2..0e8b820 100644 --- a/README.md +++ b/README.md @@ -36,49 +36,49 @@ nota: qualsiasi OS con un ambiente python3 funzionante andrĂ  bene, questa guida Andiamo a installare python e altre cose utili: -`sudo apt install python3 python3-full python3-venv ffmpeg unzip mediainfo` +`$ sudo apt install python3 python3-full python3-venv ffmpeg unzip mediainfo` -Creiamo la cartella: "sboby" e al suo interno, la sotto-cartella: "vosk". +Creiamo la cartella: "sboby" e al suo interno, la sotto-cartella: "vosk": -`mkdir -p ~/sboby/vosk` +`$ mkdir -p ~/sboby/vosk` -Entriamo nella cartella sboby/vosk/. +Entriamo nella cartella sboby/vosk/: -`cd ~/sboby/vosk/` +`$ cd ~/sboby/vosk/` -Scarichiamo il modello, anche [https://en.wikipedia.org/wiki/Large_language_model](LLM), vosk-italiano, circa 2GB: +Scarichiamo il modello, anche [LLM](https://en.wikipedia.org/wiki/Large_language_model), vosk-italiano, circa 2GB: -`wget https://alphacephei.com/vosk/models/vosk-model-it-0.22.zip` +`$ wget https://alphacephei.com/vosk/models/vosk-model-it-0.22.zip` Altre lingue sono scaricabili alla pagina dei [Vosk models](https://alphacephei.com/vosk/models). Scompattiamo il modello appena scaricato: -`unzip vosk-model-it-0.22.zip` +`$ unzip vosk-model-it-0.22.zip` -Opzionale: possiamo ora cancellare il file zip. +Opzionale: possiamo ora cancellare il file zip: -`rm vosk-model-it-0.22.zip` +`$ rm vosk-model-it-0.22.zip` -Usciamo dalla cartella ~/sboby/vosk/ +Usciamo dalla cartella ~/sboby/vosk/: -`cd` +`$ cd` -Creiamo un ambiente virtuale per Python +Creiamo un ambiente virtuale per Python: -`python3 -m venv /home/$USER/sboby` +`$ python3 -m venv /home/$USER/sboby` Usiamo Python per scaricare e installare wheel (una libreria necessaria) e vosk-transcriber: -`./sboby/bin/pip3 install wheel` +`$ ./sboby/bin/pip3 install wheel` -`./sboby/bin/pip3 install vosk` +`$ ./sboby/bin/pip3 install vosk` Ora possiamo effettuare la prima trascrizione, useremo ad esempio l'audio ![allunaggio.mp3](allunaggio.mp3). Prima, vediamo quanto dura: -`mediainfo allunaggio.mp3 | grep Duration` +`$ mediainfo allunaggio.mp3 | grep Duration` > Duration: 1 min 16 s @@ -87,25 +87,23 @@ Per un Pc di media potenza, un audio di 1 ora, potrebbe impiegare circa 1 ora. Possiamo ora invocare il programma: "vosk-transcriber", indicando (-i) quale audio sbobinare, che modello usare (--model) e dove (-o) appoggiare il testo. -`~/sboby/bin/vosk-transcriber -i ~/sboby/allunaggio.mp3 --model /share/software/vosk/vosk-model-it-0.22/ -o ~/sboby/allunaggio.txt` +`$ ~/sboby/bin/vosk-transcriber -i ~/sboby/allunaggio.mp3 --model /share/software/vosk/vosk-model-it-0.22/ -o ~/sboby/allunaggio.txt` Possiamo anche ottenere la trascrizione in formato testo sottotitolo (SRT) con time-code: -`~/sboby/bin/vosk-transcriber -i ~/sboby/allunaggio.mp3 --model /home/$USER/sboby/vosk/vosk-model-it-0.22/ -t srt -o ~/sboby/allunaggio.srt` +`$ ~/sboby/bin/vosk-transcriber -i ~/sboby/allunaggio.mp3 --model /home/$USER/sboby/vosk/vosk-model-it-0.22/ -t srt -o ~/sboby/allunaggio.srt` -Opzionale: Possiamo mettere tutto nello script sboby.sh in ~/bin/ che renderemo eseguibile (`chmod 755 ~/bin/sboby.sh`). +Opzionale: Possiamo mettere tutto nello script sboby.sh in ~/bin/ che renderemo eseguibile (`chmod 755 ~/bin/sboby.sh`): -` -#!/bin/sh -~/sboby/bin/vosk-transcriber -i ${1+"$@"} --model ~/sboby/vosk/vosk-model-it-0.22/ -o ${1+"$@"}.txt ; -sleep 5s ; -~/sboby/bin/vosk-transcriber -i ${1+"$@"} --model ~/sboby/vosk/vosk-model-it-0.22/ -t srt -o ${1+"$@"}.srt -echo 'bye bye sboby' -` +> #!/bin/sh +> ~/sboby/bin/vosk-transcriber -i ${1+"$@"} --model ~/sboby/vosk/vosk-model-it-0.22/ -o ${1+"$@"}.txt ; +> sleep 5s ; +> ~/sboby/bin/vosk-transcriber -i ${1+"$@"} --model ~/sboby/vosk/vosk-model-it-0.22/ -t srt -o ${1+"$@"}.srt +> echo 'bye bye sboby' In modo da ottenere la trascrizione tramite il semplice comando: sboby.sh [FILE].. -`sboby.sh allunaggio.mp3` +`$ sboby.sh allunaggio.mp3` Infine, se usiamo XFCE4 come ambiente scrivania, si potrĂ  inserire una [custom action](https://docs.xfce.org/xfce/thunar/custom-actions) in Thunar da usare cliccando col tasto destro sull'audio: