Wie ersetzt ich den GroupByKey durch Redebykey, um als iterable Wert in Spark Java zurückzukehren? - Programmiererforum

Wie ersetzt ich den GroupByKey durch Redebykey, um als iterable Wert in Spark Java zurückzukehren? ⇐ Java

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Wie ersetzt ich den GroupByKey durch Redebykey, um als iterable Wert in Spark Java zurückzukehren?

Report
Quote

Post by Anonymous » 12 Feb 2025, 21:41

Ich habe ein Spark Java -Programm, bei dem ein GroupByKey mit einem MapValues -Schritt durchgeführt wird und ein Paar mit Wert als iterable aller Eingabe -RDD -Werte zurückgibt.
Ich habe gelesen, dass das Ersetzen von Redebykey an der Stelle von GroupByKey durch MapValues einen Leistungsgewinn verleiht, aber ich weiß nicht, wie ich RedByKey < /code> auf mein Problem hier anwenden soll. < /p>

speziell habe ich ein Eingangspaar RDD, das mit Typ Tuple5 < /code> Wert aufweist. Nach den Transformationen von GroupByKey und MapValues muss ich ein Schlüsselwertpaar RDD abrufen, bei dem der Wert eine iterable der Eingabestalte sein muss. < /P>

JavaPairRDD inputRDD;
...
...
...
JavaPairRDD groupedRDD = inputRDD
.groupByKey()
.mapValues(
new Function() {

@Override
public Iterable call(
Iterable v1)
throws Exception {

/*
Some steps here..
*/

return mappedValue;
}
});
< /code>

Gibt es eine Möglichkeit, wie ich die obige Transformation mit redebykey < /code> erhalten könnte?

1739392876

Anonymous

Ich habe ein Spark Java -Programm, bei dem ein GroupByKey mit einem MapValues -Schritt durchgeführt wird und ein Paar mit Wert als iterable  aller Eingabe -RDD -Werte zurückgibt.
Ich habe gelesen, dass das Ersetzen von Redebykey an der Stelle von GroupByKey durch MapValues einen Leistungsgewinn verleiht, aber ich weiß nicht, wie ich RedByKey < /code> auf mein [url=viewtopic.php?t=11587]Problem[/url] hier anwenden soll. < /p>

speziell habe ich ein Eingangspaar RDD, das mit Typ Tuple5 < /code> Wert aufweist. Nach den Transformationen von GroupByKey und MapValues muss ich ein Schlüsselwertpaar RDD abrufen, bei dem der Wert eine iterable der Eingabestalte sein muss. < /P>

JavaPairRDD inputRDD;
...
...
...
JavaPairRDD groupedRDD = inputRDD
.groupByKey()
.mapValues(
new Function() {

@Override
public Iterable call(
Iterable v1)
throws Exception {

/*
Some steps here..
*/

return mappedValue;
}
});
< /code>

Gibt es eine Möglichkeit, wie ich die obige Transformation mit redebykey < /code> erhalten könnte?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Ist es möglich, Daten von Spark Executors in Java Spark zu schreiben?

Last post by Anonymous « 27 Mar 2025, 15:45
Posted in Java

by Anonymous » 27 Mar 2025, 15:45 » in Java

Ich habe eine Java -Spark -Anwendung, die Daten von Kafka erhält, einige Arbeiten an den Daten ausführt und dann mit dem Befehl toundswrite () Parquetdateien in S3 speichert. Bis zu diesem Zeitpunkt...

0 Replies

40 Views

Last post by Anonymous
27 Mar 2025, 15:45
Ist es möglich, Daten von Spark Executors in Java Spark zu schreiben?

Last post by Anonymous « 02 Apr 2025, 12:13
Posted in Java

by Anonymous » 02 Apr 2025, 12:13 » in Java

Ich habe eine Java -Spark -Anwendung, die Daten von Kafka erhält, einige Arbeiten an den Daten ausführt und dann mit dem Befehl toundswrite () Parquetdateien in S3 speichert. Bis zu diesem Zeitpunkt...

0 Replies

53 Views

Last post by Anonymous
02 Apr 2025, 12:13
Fehler: Spark User hat den Spark -Kontext nicht initialisiert

Last post by Anonymous « 13 May 2025, 04:16
Posted in Python

by Anonymous » 13 May 2025, 04:16 » in Python

Ich bekomme diesen Fehler vom Spark mit Hadoop und PySpark
ApplicationMaster: Waiting for spark context initialization...
25/05/12 23:56:11 INFO ApplicationMaster: Final app status: FAILED,...

0 Replies

39 Views

Last post by Anonymous
13 May 2025, 04:16
Anhänge an Delta -Tabellen im Stoff mit Spark VS ohne Spark

Last post by Anonymous « 10 Apr 2025, 12:53
Posted in Python

by Anonymous » 10 Apr 2025, 12:53 » in Python

Ich bin neu im Stoff und habe ein paar Udemy -Kurse durchgeführt. Ich bin mir jedoch nicht sicher, wie ich dieses Problem angehen soll. Die Transformationen sind kleine, umgebende Spalten...

0 Replies

48 Views

Last post by Anonymous
10 Apr 2025, 12:53
So beheben Sie org.apache.spark.SparkException: Job abgebrochen aufgrund eines Phasenfehlers Task & com.datastax.spark.c

Last post by Anonymous « 23 Dec 2025, 17:02
Posted in Java

by Anonymous » 23 Dec 2025, 17:02 » in Java

In meinem Projekt verwende ich den Spark-Cassandra-Connector, um die aus der Cassandra-Tabelle zu lesen und sie weiter in JavaRDD zu verarbeiten, aber ich habe ein Problem bei der Verarbeitung der...

0 Replies

7 Views

Last post by Anonymous
23 Dec 2025, 17:02

Return to “Java”