Ich versuche, in einem Jupyter-Notebook schnellere Whisper für die Transkription für Sprach-Text-Transkription zu verwenden. Ich habe ein YouTube -Tutorial gefolgt und meinen Code mit ChatGPT verfeinert, aber ich bekomme keine Transkriptionsausgabe. Die Aufzeichnung scheint zu funktionieren, aber die Funktion der Sprache_Recognition zeigt keinen Text an. < /P>
Hier ist mein Code: < /p>
Ich versuche, in einem Jupyter-Notebook schnellere Whisper für die Transkription für Sprach-Text-Transkription zu verwenden. Ich habe ein YouTube -Tutorial gefolgt und meinen Code mit ChatGPT verfeinert, aber ich bekomme keine Transkriptionsausgabe. Die Aufzeichnung scheint zu funktionieren, aber die Funktion der Sprache_Recognition zeigt keinen Text an. < /P> Hier ist mein Code: < /p> [code]import ipywidgets as wd from IPython.display import display from threading import Thread from queue import Queue import sounddevice as sd import numpy as np import faster_whisper import pyaudio
# Load the whisper model model = faster_whisper.WhisperModel("small", device="cpu", compute_type="int8") recordings = Queue()
while is_recording: data = stream.read(CHUNK) recordings.put(data)
stream.stop_stream() stream.close() p.terminate()
def speech_recognition(): """Processes audio from the queue and transcribes it using Faster-Whisper.""" audio_buffer = []
while is_recording or not recordings.empty(): if not recordings.empty(): data = recordings.get() audio_buffer.append(np.frombuffer(data, dtype=np.int16)) if len(audio_buffer) * CHUNK >= FRAME_RATE: # Normalize audio audio_chunk = np.concatenate(audio_buffer).astype(np.float32) / 32768 audio_buffer = [] segments, _ = model.transcribe(audio_chunk, language="en", beam_size=5) with output: for segment in segments: display(segment.text)
def start_recording(data): """Starts recording and transcription threads.""" global is_recording is_recording = True
Ich versuche, in einem Jupyter-Notebook schnellere Whisper für die Transkription für Sprach-Text-Transkription zu verwenden. Ich habe ein YouTube -Tutorial gefolgt und meinen Code mit ChatGPT...
Kürzlich habe ich die Leistung von Whisperx und schnellerem Whisper auf dem Runpod-Server mit dem folgenden Code-Snippet verglichen.model = whisperx.load_model(
large-v3 , cuda
)
Ich arbeite an einem Audio-Transkriptionstool für eine Sprache mit niedriger Ressourcen (ukrainisch), und die Ergebnisse sind unbefriedigend. Ich verstehe, dass die Auswahl eines größeren Modells und...