Laden Sie die defekte JSON-Datei

Laden Sie die defekte JSON-Datei ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Post by Anonymous » 17 Jan 2025, 11:11

Es gibt eine Datei mit Hunderten MB, bei der es sich angeblich um eine JSON-Datei handelt. Leider wurde die Datei mit einem Fehler geschlossen und die JSON-Struktur ist nicht korrekt.
Außerdem ist die Datei eine einzeilige Zeichenfolge.
Datei endet mit zahlreichen ....\x00\ x00\x00
Ich habe viele Varianten mit dem Lesen der JSON-Datei mit Fehlerkontrolle und manueller Dekodierung ausprobiert, kann die Daten aber immer noch nicht in den Pandas-Datenrahmen analysieren.
Letzte Idee, wo ich aufgehört habe: Lesen Sie die Zeile von:

Code: Select all

with open('data.json', 'r', encoding='utf-8') as f:
dt = f.read()

und dann muss ich mit der Zeile als String arbeiten und versucht, die JSON-Struktur zu korrigieren, indem ich den letzten richtigen Datenblock finde und fehlende }]-Symbole und das Ende hinzufüge, um JSON zu lassen. Die Dekodierungsfunktion funktioniert korrekt.
Gibt es noch andere Varianten wie teilweise gelesene Dateien oder automatische Korrektur von Fehlern in der JSON-Struktur?
Ich habe diesen Ansatz auch ausprobiert :

Code: Select all

import json
import re

class LazyDecoder(json.JSONDecoder):
def decode(self, s, **kwargs):
regex_replacements = [
(re.compile(r'([^\\])\\([^\\])'), r'\1\\\\\2'),
(re.compile(r',(\s*])'), r'\1'),
]
for regex, replacement in regex_replacements:
s = regex.sub(replacement, s)
return super().decode(s, **kwargs)

with open(r'data.json') as result:
data = json.load(result, cls=LazyDecoder, strict=False)

aber es gibt einen Fehler mit dem Trennzeichen JSONDecodeError: Expecting ',' delimiter: line 1 columns 73900 (char 73899)

1737108718

Anonymous

Es gibt eine Datei mit Hunderten MB, bei der es sich angeblich um eine JSON-Datei handelt. Leider wurde die Datei mit einem Fehler geschlossen und die JSON-Struktur ist nicht korrekt.
Außerdem ist die Datei eine einzeilige Zeichenfolge.
Datei endet mit zahlreichen ....\x00\ x00\x00
Ich habe viele Varianten mit dem Lesen der JSON-Datei mit Fehlerkontrolle und manueller Dekodierung ausprobiert, kann die Daten aber immer noch nicht in den Pandas-Datenrahmen analysieren.
Letzte Idee, wo ich aufgehört habe: Lesen Sie die Zeile von:
[code]with open('data.json', 'r', encoding='utf-8') as f:
dt = f.read()
[/code]
und dann muss ich mit der Zeile als String arbeiten und versucht, die JSON-Struktur zu korrigieren, indem ich den letzten richtigen Datenblock finde und fehlende }]-Symbole und das Ende hinzufüge, um JSON zu lassen. Die Dekodierungsfunktion funktioniert korrekt.
Gibt es noch andere Varianten wie teilweise gelesene Dateien oder automatische Korrektur von Fehlern in der JSON-Struktur?
Ich habe diesen Ansatz auch ausprobiert :
[code]import json
import re

class LazyDecoder(json.JSONDecoder):
def decode(self, s, **kwargs):
regex_replacements = [
(re.compile(r'([^\\])\\([^\\])'), r'\1\\\\\2'),
(re.compile(r',(\s*])'), r'\1'),
]
for regex, replacement in regex_replacements:
s = regex.sub(replacement, s)
return super().decode(s, **kwargs)

with open(r'data.json') as result:
data = json.load(result, cls=LazyDecoder, strict=False)
[/code]
aber es gibt einen Fehler mit dem Trennzeichen JSONDecodeError: Expecting ',' delimiter: line 1 columns 73900 (char 73899)

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Ein Rechtsklick im Hintergrundmenü zeigt defekte Elemente an

Last post by Guest « 05 Jan 2025, 14:43
Posted in C++

by Guest » 05 Jan 2025, 14:43 » in C++

Ich versuche, ein Rechtsklick-Hintergrundmenü für einen Ordner anzuzeigen.
Das Menü wird angezeigt, aber es gibt die folgenden Probleme:

Wenn ich den Pfad zum Ordner als...

0 Replies

6 Views

Last post by Guest
05 Jan 2025, 14:43
Ein Rechtsklick im Hintergrundmenü zeigt defekte Elemente an

Last post by Guest « 05 Jan 2025, 17:06
Posted in C++

by Guest » 05 Jan 2025, 17:06 » in C++

Ich versuche, ein Rechtsklick-Hintergrundkontextmenü für einen Ordner anzuzeigen.
Das Menü wird angezeigt, aber es gibt die folgenden Probleme:

Wenn ich den Pfad zum Ordner als...

0 Replies

1 Views

Last post by Guest
05 Jan 2025, 17:06
Erstellen und laden Sie die PPTX -Datei von Controller herunter und laden Sie sie herunter

Last post by Guest « 07 Feb 2025, 12:21
Posted in Java

by Guest » 07 Feb 2025, 12:21 » in Java

Ich erstelle eine Funktion, in der Benutzer eine dynamische im Controller konstruierte PowerPoint (PPTX) -Datei herunterladen können.
Hier ist mein Code:
@RequestMapping(value = /download/ppt/{id}...

0 Replies

30 Views

Last post by Guest
07 Feb 2025, 12:21
So drücken Sie JSON -Werte mit Python nach eins von JSON -Array von JSON Array auf die API.

Last post by Anonymous « 23 Feb 2025, 16:58
Posted in Python

by Anonymous » 23 Feb 2025, 16:58 » in Python

Ich habe eine .json Datei mit einigen JSON -Daten wie unten,

main.json

Mein Problem ist, wie ich diesen folgenden Code an API
analysiere und auch die Werte einzeln analysieren möchte:
{...

0 Replies

30 Views

Last post by Anonymous
23 Feb 2025, 16:58
So teilen Sie die Big JSON -Schema -Datei in mehrere Dateien auf, die Sie mit Newtonsoft json.net verwenden können

Last post by Anonymous « 23 May 2025, 01:19
Posted in C#

by Anonymous » 23 May 2025, 01:19 » in C#

Ich muss eine JSON-Schema-Datei für einige Anforderungs-/Antwortstrukturen eines API-Project schreiben, damit ich sie mit JSON.NET-Schema verwenden kann. Da einige der Objekte in Mutiple...

0 Replies

1 Views

Last post by Anonymous
23 May 2025, 01:19

Return to “Python”