Glätten Sie Streamed Audio aus Chatgpt aus

Glätten Sie Streamed Audio aus Chatgpt aus ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Glätten Sie Streamed Audio aus Chatgpt aus

Post by Anonymous » 05 Mar 2025, 09:32

Für eine Klasse versuche ich, Audio aus einer Chatgpt -API -Antwort zu streamen. Der folgende Code funktioniert hauptsächlich und ich bekomme eine gute Qualität, wenn ich die gespeicherte Datei später abspiele. Wenn ich aber live versuche, ist es super abgehackt: < /p>

Code: Select all

# Initialize an empty AudioSegment for concatenation
full_audio = AudioSegment.empty()

stream_completion = client.chat.completions.create(
model="gpt-4o-audio-preview",
modalities=["text", "audio"],
audio={"voice": "alloy", "format": "pcm16"},
messages=[
{
"role": "user",
"content": "Can you tell me a funny short story about a pickle?"
}
],
stream=True
)

# Play the audio as it comes in and concatenate it
for chunk in stream_completion:
chunk_audio = getattr(chunk.choices[0].delta, 'audio', None)
if chunk_audio is not None:
pcm_bytes = base64.b64decode(chunk_audio.get('data', ''))
if pcm_bytes:
audio_segment = AudioSegment.from_raw(
io.BytesIO(pcm_bytes),
sample_width=2,  # 16-bit PCM
frame_rate=24000,  # 24kHz sample rate
channels=1  # Mono audio
)

play(audio_segment)
# Concatenate the audio segment
full_audio += audio_segment

# Save the concatenated audio to a file
full_audio.export("assets/audio/full_audio.wav", format="wav")

Eine Idee, wie man das Audio ausgleicht, während ich es live über Stream spiele?

1741163549

Anonymous

Für eine Klasse versuche ich, Audio aus einer Chatgpt -API -Antwort zu streamen. Der folgende Code funktioniert hauptsächlich und ich bekomme eine gute Qualität, wenn ich die gespeicherte Datei später abspiele. Wenn ich aber live versuche, ist es super abgehackt: < /p>
[code]# Initialize an empty AudioSegment for concatenation
full_audio = AudioSegment.empty()

stream_completion = client.chat.completions.create(
model="gpt-4o-audio-preview",
modalities=["text", "audio"],
audio={"voice": "alloy", "format": "pcm16"},
messages=[
{
"role": "user",
"content": "Can you tell me a funny short story about a pickle?"
}
],
stream=True
)

# Play the audio as it comes in and concatenate it
for chunk in stream_completion:
chunk_audio = getattr(chunk.choices[0].delta, 'audio', None)
if chunk_audio is not None:
pcm_bytes = base64.b64decode(chunk_audio.get('data', ''))
if pcm_bytes:
audio_segment = AudioSegment.from_raw(
io.BytesIO(pcm_bytes),
sample_width=2,  # 16-bit PCM
frame_rate=24000,  # 24kHz sample rate
channels=1  # Mono audio
)

play(audio_segment)
# Concatenate the audio segment
full_audio += audio_segment

# Save the concatenated audio to a file
full_audio.export("assets/audio/full_audio.wav", format="wav")
[/code]
Eine Idee, wie man das Audio ausgleicht, während ich es live über Stream spiele?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Glätten Sie Streamed Audio aus Chatgpt aus

Last post by Anonymous « 04 Mar 2025, 05:23
Posted in Python

by Anonymous » 04 Mar 2025, 05:23 » in Python

Für eine Klasse versuche ich, Audio aus einer Chatgpt -API -Antwort zu streamen. Der folgende Code funktioniert hauptsächlich und ich bekomme eine gute Qualität, wenn ich die gespeicherte Datei...

0 Replies

2 Views

Last post by Anonymous
04 Mar 2025, 05:23
Wie kann man eine Reihe von Asynchrongeneratoren asynchron glätten?

Last post by Guest « 05 Jan 2025, 15:56
Posted in Python

by Guest » 05 Jan 2025, 15:56 » in Python

Ich muss eine Reihe von Webseiten durchsuchen. Diese Webseiten haben Adressen, die sich nur in der Seitennummer unterscheiden, und können daher parallel mit aiohttp verarbeitet werden.
Jetzt verwende...

0 Replies

7 Views

Last post by Guest
05 Jan 2025, 15:56
Java AWT: Abgerundetes Bild mit glatten Kanten zeichnen

Last post by Anonymous « 17 Jan 2025, 08:28
Posted in Java

by Anonymous » 17 Jan 2025, 08:28 » in Java

Ich mache ein Spiel und würde gerne abgerundete Bilder rendern, aber jede Lösung, die ich ausprobiert habe, zeichnet entweder hässliche und gezackte Ecken oder verlangsamt meine Spielschleife...

0 Replies

9 Views

Last post by Anonymous
17 Jan 2025, 08:28
Warum unterscheidet sich Audio, das von der Elevenlabs-API in Python generiert wird, von Audio, das von einer Website ge

Last post by Guest « 07 Jan 2025, 02:22
Posted in Python

by Guest » 07 Jan 2025, 02:22 » in Python

Der Code, den ich unten erwähnen werde, erzeugt einen sehr schlechten Ton (output.mp3), wie ich auf elevanlabs getestet habe. Was ist Ihrer Meinung nach der Grund dafür? Gibt es ein Problem mit den...

0 Replies

21 Views

Last post by Guest
07 Jan 2025, 02:22
Die Verwendung von swr_convert zum Wiederverhalten von Audio -Rahmen führte zu Audio mit erheblichen Rauschen

Last post by Guest « 14 Feb 2025, 04:51
Posted in C++

by Guest » 14 Feb 2025, 04:51 » in C++

Ich habe versucht, SWR_Convert zu verwenden, um Audio -Frames von 44100 Hz auf 16000 Hz wiederzuproben und die Frames einzeln für Testzwecke zu verarbeiten. Das resultierende Audio scheint jedoch mit...

0 Replies

8 Views

Last post by Guest
14 Feb 2025, 04:51

Return to “Python”