Extrahieren Sie mehrere Zeichenfolgen aus einer Spalte in einer neuen Spalte als Liste in PySpark DataFramePython

Python-Programme
Anonymous
 Extrahieren Sie mehrere Zeichenfolgen aus einer Spalte in einer neuen Spalte als Liste in PySpark DataFrame

Post by Anonymous »

haben einen pyspark-Datenframe mit einer einzelnen Spalte mit folgenden Werten (z. B. nur 2 Datensätze)-< /p>

Code: Select all

+------------------------------------------------------------------------------------------------------+
|data                                                                                                  |
+------------------------------------------------------------------------------------------------------+
{Job : "Job A", Condition: "Pass"},{Job : "Job B", Condition: "Pass"}
{Job : "Job C", Condition: "Pass"},{Job : "Job D", Condition: "Pass"},{Job : "Job E", Condition: "Pass"}
+------------------------------------------------------------------------------------------------------+
< /code>
Ich möchte die Jobnamen nur in einer Liste in einer separaten Spalte extrahieren.+-----------------------+
|data1                                                                                                  |
+-----------------------+
["Job A","Job B"]
["Job C","Job D","Job E"]
+-----------------------+
Auf einfache Weise kann ich es in pyspark machen?

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post