0. Voraussetzungen
Diese Doku setzt die Anaconda-Umgebung voraus, die JS für Vosk auf seinem Laptop eingerichtet hat. Bei Interesse einfach fragen.
1. Konversion
Audio-Datei kann mit ffmpeg den Anforderungen angepasst werden:
ffmpeg -i original.m4a -c:a pcm_s16le -ar 16k -ab 16k -ac 1 converted.wav
2. Transkription
Anaconda-Umgebung "vosk" im Terminal starten, dann ins Verzeichnis
/Users/ge52jep/vosk-api/python/example/
gehen.
2.1 für mehr als einen Satz
In der Datei test_simple-modJS.py sicherstellen, dass Zeile 29 aktiv und 35 auskommentiert ist, und dann die Datei converted.wav mit dem Befehl
python3 test_simple-modJS.py tests-deutsch/converted.wav > transkription.txt
transkribieren lassen.
2.2 für nur einen Satz
In der Datei test_simple-modJS.py sicherstellen, dass Zeile 29 auskommentiert und 35 aktiv ist, und dann die Datei converted.wav mit dem Befehl
python3 test_simple-modJS.py tests-deutsch/converted.wav > transkription.txt
transkribieren lassen.
Ausblick
Das ist nur ein primitiver Anfang. Die ffmpeg-Konversion lässt sich natürlich auch gleich mit der Transkription verknüpfen, siehe test_ffmpeg.py