Mir wurde kürzlich eine Parquet-Datei mit einer Größe von mehr als dem Speicher gegeben, in der jede Spalte ein String-Datentyp ist. Ich möchte eine Typinferenz durchführen, die Spalten konvertieren, die in Ints und Floats konvertiert werden können, und die richtigen String-Spalten als Strings beibehalten und dann mit den richtigen Typen in eine neue Parkettdatei umwandeln. Irgendwelche Vorschläge dazu?
Ich habe versucht, ein Casting mit den integrierten Cast-Funktionen durchzuführen und strict=False festzulegen, aber das führt letztendlich dazu, dass alle Strings auf Null gesetzt werden.
Ableiten des Datentyps beim Streamen in Polaren ⇐ Python
-
- Similar Topics
- Replies
- Views
- Last post
Mobile version