Streamieren des Lesens einer sehr großen komprimierten JSON -Datei in Python

Streamieren des Lesens einer sehr großen komprimierten JSON -Datei in Python ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Streamieren des Lesens einer sehr großen komprimierten JSON -Datei in Python

Report
Quote

Post by Anonymous » 24 Jul 2025, 12:30

Ich habe eine sehr große (zu groß, um im RAM zu halten) .json.zstd Datei, die ich iterativ mit einem Generator von Texts Data_Chunks erstellt habe.

Code: Select all

[{"text": "very very"}," very very", " very very very", {"text": " very very long"}]
< /code>
hier in diesem Spielzeugbeispiel kann es offensichtlich in RAM gehalten.import zstandard as zstd

# real code used to write the very large file
def write_to_file(output_path, data_chunks, level=22):
cctx = zstd.ZstdCompressor(level=level)

with open(output_path, 'wb') as f_out:
with cctx.stream_writer(f_out) as compressor:
for idx, chunk in enumerate(data_chunks):
if isinstance(chunk, str):
pass
elif isinstance(chunk, dict):
chunk = chunk["text"]
else:
raise ValueError(f"Unrecognized chunk {type(chunk)}")
if idx == 0:
chunk = '{"text": "' + chunk
chunk = chunk.encode("utf-8")
compressor.write(chunk)
compressor.write('"}'.encode("utf-8"))

# toy example
write_to_file("test.json.zstd", [{"text": "very very"}," very very", " very very very", {"text": " very very long"}], level=22)
< /code>
Diese komprimierte Datei enthält jetzt nur eine JSON-Datei.import io
def read_zstd_lines(input_path):
dctx = zstd.ZstdDecompressor()
with open(input_path, 'rb') as compressed:
with dctx.stream_reader(compressed) as decompressor:
text_stream = io.TextIOWrapper(decompressor, encoding='utf-8')
for line in text_stream:
if line.strip():
yield json.loads(line)
next(read_zstd_lines("test.json.zstd"))

Ich suche nach einer Lösung, die IJSON ähnelt, die sie in RAM iterativ durch (potenziell Größenanpassungsabwände) (oder nur in den Töpfen nicht größer als eine feste Größe) lesen würde, aber das würde auf der komprimierten Datei wie das obige Beispiel funktionieren.

1753353050

Anonymous

Ich habe eine sehr große (zu groß, um im RAM zu halten) .json.zstd  Datei, die ich iterativ mit einem Generator von Texts Data_Chunks  erstellt habe.[code][{"text": "very very"}," very very", " very very very", {"text": " very very long"}]
< /code>
hier in diesem Spielzeugbeispiel kann es offensichtlich in RAM gehalten.import zstandard as zstd

# real code used to write the very large file
def write_to_file(output_path, data_chunks, level=22):
cctx = zstd.ZstdCompressor(level=level)

with open(output_path, 'wb') as f_out:
with cctx.stream_writer(f_out) as compressor:
for idx, chunk in enumerate(data_chunks):
if isinstance(chunk, str):
pass
elif isinstance(chunk, dict):
chunk = chunk["text"]
else:
raise ValueError(f"Unrecognized chunk {type(chunk)}")
if idx == 0:
chunk = '{"text": "' + chunk
chunk = chunk.encode("utf-8")
compressor.write(chunk)
compressor.write('"}'.encode("utf-8"))

# toy example
write_to_file("test.json.zstd", [{"text": "very very"}," very very", " very very very", {"text": " very very long"}], level=22)
< /code>
Diese komprimierte Datei enthält jetzt nur eine JSON-Datei.import io
def read_zstd_lines(input_path):
dctx = zstd.ZstdDecompressor()
with open(input_path, 'rb') as compressed:
with dctx.stream_reader(compressed) as decompressor:
text_stream = io.TextIOWrapper(decompressor, encoding='utf-8')
for line in text_stream:
if line.strip():
yield json.loads(line)
next(read_zstd_lines("test.json.zstd"))
[/code]
Ich suche nach einer Lösung, die IJSON ähnelt, die sie in RAM  iterativ  durch (potenziell Größenanpassungsabwände) (oder nur in den Töpfen nicht größer als eine feste Größe) lesen würde, aber das würde  auf der komprimierten Datei  wie das obige Beispiel funktionieren.

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Probleme mit sehr großen komprimierten Wörterbüchern in Python

Last post by Anonymous « 12 Feb 2025, 00:54
Posted in Python

by Anonymous » 12 Feb 2025, 00:54 » in Python

Ich habe derzeit ein sehr seltsames und spezifisches Problem. Wie viele von uns dachte, erstelle ich derzeit ein -Video zu ASCII -Konverter ( in Farbe bitte ), dies gibt eine sehr große aus. TXT...

0 Replies

32 Views

Last post by Anonymous
12 Feb 2025, 00:54
Erhalten Sie einen schwarzen Bildschirm beim Streamieren von Videos von der Android -Kamera zu einem Webbrowser über Web

Last post by Anonymous « 17 Mar 2025, 14:22
Posted in Java

by Anonymous » 17 Mar 2025, 14:22 » in Java

Ich habe ein Android -Telefon und möchte es in einem Webbrowser streamen. Mein Webbrowser, obwohl er am Telefon sichtbar ist.
Hier habe ich bisher versucht. // Code on android phone.
private void...

0 Replies

35 Views

Last post by Anonymous
17 Mar 2025, 14:22
Effizienter Algorithmus zum Feststellen, ob die Zahlen, die durch Substrings einer sehr großen Ziffer -Saite dargestellt

Last post by Guest « 09 Feb 2025, 09:54
Posted in Java

by Guest » 09 Feb 2025, 09:54 » in Java

Dies war also eine Frage zu einer der Herausforderungen, die ich vor einigen Tagen in einem Online -Wettbewerb gestoßen habe.

Akzeptieren Sie zwei Eingänge.

Eine große Anzahl von n Ziffern,...

0 Replies

35 Views

Last post by Guest
09 Feb 2025, 09:54
Können Sie einen komprimierten Apache -Protokolleintrag dekomprimieren?

Last post by Anonymous « 20 Mar 2025, 22:27
Posted in Apache

by Anonymous » 20 Mar 2025, 22:27 » in Apache

Ich habe ein Apache -Protokoll, das einige komprimierte Informationen enthält, vermutlich b/c Die Nutzlast ist groß:
EAEREAEREAEohOQgxEdqQYUAREQAREQARH4NxVCN+/SYaZZAAAAAElFTkSuQmCC , is_visible =>...

0 Replies

41 Views

Last post by Anonymous
20 Mar 2025, 22:27
Wie kann ich sehr großen alten JavaScript-Code umgestalten? [geschlossen]

Last post by Guest « 05 Jan 2025, 12:17
Posted in JavaScript

by Guest » 05 Jan 2025, 12:17 » in JavaScript

Ich habe eine große JavaScript-Datei mit über 20.000 Codezeilen. Der Code ist in Objekten organisiert, mit Funktionen wie diesen:
let module1 = {
fun1:function() {
console.log( module1 fun1 called...

0 Replies

34 Views

Last post by Guest
05 Jan 2025, 12:17

Return to “Python”