Wie kann ich eine Python -DateTime über Avro an BigQuery übergeben? - Programmiererforum

Wie kann ich eine Python -DateTime über Avro an BigQuery übergeben? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Wie kann ich eine Python -DateTime über Avro an BigQuery übergeben?

Report
Quote

Post by Anonymous » 23 Sep 2025, 11:37

Ich habe eine Python -Pipeline, in der ich versuche: < /p>

Holen Sie sich einige JSON -Daten aus einer API -Antwort < /li>
Ändern Sie sie über Duckdb (nur im Gedächtnis) < /li>
Konvertieren Sie die resultierenden Daten zu einer Liste von Python -Dicts (1 Rhow). Python datetime zu jedem Diktieren in der Liste
Schreiben Sie eine Avro -Datei aus diesem Diktat
Laden Sie die AVRO -Datei in BigQuery

, aber ich habe Probleme aufgrund des DateTime -Felds. Zeitstempel
Mein Avro -Schema wird von der Py_avro_schema -Bibliothek über eine Datenklasse generiert. Also modifiziere ich mein Schema manuell: < /p>

Code: Select all

schema_bytes = generate(MyClass, namespace="myclass")
schema_str = schema_bytes.decode("utf-8") if isinstance(schema_bytes, bytes) else schema_bytes
schema = json.loads(schema_str)
schema["fields"][0] = {
"name": "request_ts",
"type": [
"null",
{
"type": "long",
"logicalType": "timestamp-micros"
}
],
"default": None,
}

Ich habe versucht, Request_ts als Python DateTime, Isoformat DateTime und Timestamp
zu generieren

Code: Select all

# tried eeach approach individually
datetime.datetime.now(tz=datetime.timezone.utc)
datetime.datetime.now(tz=datetime.timezone.utc).isoformat()
int(datetime.datetime.now(tz=datetime.timezone.utc).timestamp())
< /code>
Aber es führt immer zu Fehlern in BigQuery, es kann Request_ts in einen Zeitstempel nicht unterdrücken. Mit dem Zeitstempel behauptet BQ, es sei nur ein int64-Wert (auch wenn das Schema das Feld "Typ" sein sollte: ["null", {"Typ": "Long", "logicalType": "Timestamp-Millis"}]

Ich habe auch versucht, nur ein TISTAMP. Ein Pandas -Zeitstempel, der auch fehlschlägt, weil er nicht langen Avro zugeordnet ist. Zusätzlich versucht, die Tabelle ohne zeitliche Partitionierung nachzubilden. In diesem Fall ist der Job erfolgreich, aber der Zeitstempel ist nur der Epochen -Zeitstempel im Jahr 1970, nicht aktuelles

1758620240

Anonymous

Ich habe eine Python -Pipeline, in der ich versuche: < /p>
[list]
[*] Holen Sie sich einige JSON -Daten aus einer API -Antwort < /li>
 Ändern Sie sie über Duckdb (nur im Gedächtnis) < /li>
 Konvertieren Sie die resultierenden Daten zu einer Liste von Python -Dicts (1 Rhow). Python datetime zu jedem Diktieren in der Liste
[*] Schreiben Sie eine Avro -Datei aus diesem Diktat
[*] Laden Sie die AVRO -Datei in BigQuery
[/list]
, aber [url=viewtopic.php?t=18848]ich habe Probleme[/url] aufgrund des DateTime -Felds. Zeitstempel  
Mein Avro -Schema wird von der Py_avro_schema -Bibliothek über eine Datenklasse generiert. Also modifiziere ich mein Schema manuell: < /p>
[code]schema_bytes = generate(MyClass, namespace="myclass")
schema_str = schema_bytes.decode("utf-8") if isinstance(schema_bytes, bytes) else schema_bytes
schema = json.loads(schema_str)
schema["fields"][0] = {
"name": "request_ts",
"type": [
"null",
{
"type": "long",
"logicalType": "timestamp-micros"
}
],
"default": None,
}
[/code]
Ich habe versucht, Request_ts  als Python DateTime, Isoformat DateTime und Timestamp 
zu generieren[code]# tried eeach approach individually
datetime.datetime.now(tz=datetime.timezone.utc)
datetime.datetime.now(tz=datetime.timezone.utc).isoformat()
int(datetime.datetime.now(tz=datetime.timezone.utc).timestamp())
< /code>
Aber es führt immer zu Fehlern in BigQuery, es kann Request_ts in einen Zeitstempel nicht unterdrücken. Mit dem Zeitstempel behauptet BQ, es sei nur ein int64-Wert (auch wenn das Schema das Feld "Typ" sein sollte: ["null", {"Typ": "Long", "logicalType": "Timestamp-Millis"}] [/code] 

Ich habe auch versucht, nur ein TISTAMP. Ein Pandas -Zeitstempel, der auch fehlschlägt, weil er nicht langen Avro zugeordnet ist. Zusätzlich versucht, die Tabelle ohne zeitliche Partitionierung nachzubilden. In diesem Fall ist der Job erfolgreich, aber der Zeitstempel ist nur der Epochen -Zeitstempel im Jahr 1970, nicht aktuelles

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie kann ich eine Python -DateTime über Avro an BigQuery übergeben?

Last post by Anonymous « 23 Sep 2025, 14:07
Posted in Python

by Anonymous » 23 Sep 2025, 14:07 » in Python

Ich habe eine Python -Pipeline, in der ich versuche:

Holen Sie sich einige JSON -Daten aus einer API -Antwort
Ändern Sie sie über Duckdb (nur im Gedächtnis)
Konvertieren Sie die...

0 Replies

381 Views

Last post by Anonymous
23 Sep 2025, 14:07
Google BigQuery - Streaming von Daten in BigQuery

Last post by Anonymous « 28 May 2025, 11:56
Posted in Java

by Anonymous » 28 May 2025, 11:56 » in Java

Ich benutze Google BigQuery für mein Projekt
Im Moment versuche ich, eine neue Zeile in BQ zu fügen, basierend auf diesem
private void insertRowsToBQ(MyCustomObject data) {
String datasetName =...

0 Replies

12 Views

Last post by Anonymous
28 May 2025, 11:56
Logical DateTime wird bei der Parsen des AVRO -Schemas beim Lesen der Daten von GCP nicht unterstützt

Last post by Anonymous « 14 Feb 2025, 09:01
Posted in C#

by Anonymous » 14 Feb 2025, 09:01 » in C#

Ich erhalte Logical DateTime wird nicht unterstützt.
ReadSession rd= new ReadSession();
rd.table = 'mytemptable';
rd.DataFormat = DataFormat.Avro;
ReadSession response =...

0 Replies

25 Views

Last post by Anonymous
14 Feb 2025, 09:01
Logical DateTime wird bei der Parsen des AVRO -Schemas beim Lesen der Daten von GCP nicht unterstützt

Last post by Guest « 16 Feb 2025, 11:27
Posted in C#

by Guest » 16 Feb 2025, 11:27 » in C#

Ich erhalte Logical DateTime wird nicht unterstützt.
ReadSession rd= new ReadSession();
rd.table = 'mytemptable';
rd.DataFormat = DataFormat.Avro;
ReadSession response =...

0 Replies

31 Views

Last post by Guest
16 Feb 2025, 11:27
Wie kann ich AVRO C ++ verwenden, um eine Datei für ein Schema zu schreiben, das ich programmatisch definiert habe?

Last post by Guest « 14 Feb 2025, 01:57
Posted in C++

by Guest » 14 Feb 2025, 01:57 » in C++

Ich habe ein Beispielschema, das ich programmatisch definiere. Es ist so etwas wie

struct UserEntry {
int64_t user_id;
std::string user_name;
std::string user_email;
int64_t user_phn;
}...

0 Replies

29 Views

Last post by Guest
14 Feb 2025, 01:57

Return to “Python”