0. Voraussetzungen

Diese Doku setzt die Anaconda-Umgebung voraus, die JS für Vosk auf seinem Laptop eingerichtet hat. Bei Interesse einfach fragen.

1. Konversion

Audio-Datei kann mit ffmpeg den Anforderungen angepasst werden: ffmpeg -i original.m4a -c:a pcm_s16le -ar 16k -ab 16k -ac 1 converted.wav

2. Transkription

Anaconda-Umgebung "vosk" im Terminal starten, dann ins Verzeichnis /Users/ge52jep/vosk-api/python/example/ gehen.

2.1 für mehr als einen Satz

In der Datei test_simple-modJS.py sicherstellen, dass Zeile 29 aktiv und 35 auskommentiert ist, und dann die Datei converted.wav mit dem Befehl python3 test_simple-modJS.py tests-deutsch/converted.wav > transkription.txt transkribieren lassen.

2.2 für nur einen Satz

In der Datei test_simple-modJS.py sicherstellen, dass Zeile 29 auskommentiert und 35 aktiv ist, und dann die Datei converted.wav mit dem Befehl python3 test_simple-modJS.py tests-deutsch/converted.wav > transkription.txt transkribieren lassen.

Ausblick

Das ist nur ein primitiver Anfang. Die ffmpeg-Konversion lässt sich natürlich auch gleich mit der Transkription verknüpfen, siehe test_ffmpeg.py