Extrahieren Sie mehrere Zeichenfolgen aus einer Spalte in einer neuen Spalte als Liste in PySpark DataFrame
Posted: 22 May 2025, 22:40
haben einen pyspark-Datenframe mit einer einzelnen Spalte mit folgenden Werten (z. B. nur 2 Datensätze)-< /p>
Auf einfache Weise kann ich es in pyspark machen?
Code: Select all
+------------------------------------------------------------------------------------------------------+
|data |
+------------------------------------------------------------------------------------------------------+
{Job : "Job A", Condition: "Pass"},{Job : "Job B", Condition: "Pass"}
{Job : "Job C", Condition: "Pass"},{Job : "Job D", Condition: "Pass"},{Job : "Job E", Condition: "Pass"}
+------------------------------------------------------------------------------------------------------+
< /code>
Ich möchte die Jobnamen nur in einer Liste in einer separaten Spalte extrahieren.+-----------------------+
|data1 |
+-----------------------+
["Job A","Job B"]
["Job C","Job D","Job E"]
+-----------------------+