ValueError: RDD ist leer – Pyspark (Windows Standalone)Python

Python-Programme
Anonymous
 ValueError: RDD ist leer – Pyspark (Windows Standalone)

Post by Anonymous »

Ich versuche, ein RDD zu erstellen, aber Spark erstellt es nicht, was zu einem Fehler führt, der unten eingefügt wird;

Code: Select all

data = records.map(lambda r: LabeledPoint(extract_label(r), extract_features(r)))
first_point = data.first()

Py4JJavaError                             Traceback (most recent call last)
 in ()
----> 1 first_point = data.first()
2 print "Raw data: " + str(first[2:])
3 print "Label: " + str(first_point.label)
4 print "Linear Model feature vector:\n" + str(first_point.features)
5 print "Linear Model feature vector length: " + str(len    (first_point.features))

C:\spark\python\pyspark\rdd.pyc in first(self)
1313         ValueError: RDD is empty
1314         """
-> 1315         rs = self.take(1)
1316         if rs:
1317             return rs[0]

C:\spark\python\pyspark\rdd.pyc in take(self, num)
1295
1296             p = range(partsScanned, min(partsScanned + numPartsToTry, totalParts))
-> 1297             res = self.context.runJob(self, takeUpToNumLeft, p)..................
Jede Hilfe wird sehr geschätzt.

Danke,
Innocent

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post