Konvertieren Sie Pipelinedrdd in DataFrame

Post a reply

Smilies
:) :( :oops: :chelo: :roll: :wink: :muza: :sorry: :angel: :read: *x) :clever:
View more smilies

BBCode is ON
[img] is ON
[flash] is OFF
[url] is ON
Smilies are ON

Topic review
   

Expand view Topic review: Konvertieren Sie Pipelinedrdd in DataFrame

by Anonymous » 12 Jul 2025, 22:02

Ich versuche, einen Pipelinedrdd in PySpark in einen Datenrahmen umzuwandeln. Dies ist der Code -Snippet: < /p>

newRDD = rdd.map(lambda row: Row(row.__fields__ + ["tag"])(row + (tagScripts(row), )))
df = newRDD.toDF()< /code> < /p>

Wenn ich den Code jedoch ausführe, erhalte ich diesen Fehler: < /p>

'list' object has no attribute 'encode'< /code> < /p>

Ich habe mehrere andere Kombinationen ausprobiert, z.newRDD = rdd.map(lambda row: Row(row.__fields__ + ["tag"])(row + (tagScripts(row), )))
df = newRDD.toPandas()< /code> < /p>

Aber dann empfange ich diesen Fehler: < /p>

AttributeError: 'PipelinedRDD' object has no attribute 'toPandas'< /code> < /p>

Jede Hilfe wäre sehr geschätzt. Vielen Dank für Ihre Zeit.

Top