Wie kann die Leistung von spark.write für JDBC verbessert werden? - Programmiererforum

Wie kann die Leistung von spark.write für JDBC verbessert werden? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Wie kann die Leistung von spark.write für JDBC verbessert werden?

Report
Quote

Post by Anonymous » 16 Jan 2026, 09:43

Ich habe mit einer Sache zu kämpfen. Ich habe 700 MB CSV, das über 6 Millionen Zeilen enthält. Nach dem Filtern enthält es ~3 Millionen.
Ich muss es über JDBC direkt in Azure SQL schreiben. Es ist sehr langsam und benötigt 20 Minuten für die Eingabe von 3 Millionen Zeilen.
Mein Cluster verfügt über 14 GB RAM und 4 Kerne. Hier ist mein Code.

Code: Select all

(clearedDF.repartition(4)
.write
.format("jdbc")
.option("driver", "com.microsoft.sqlserver.jdbc.SQLServerDriver")
.option("batchsize", 10000)
.option("url", jdbcUrl)
.option("dbtable", "dbo.weather")
.option("user", properties["user"])
.option("password", properties["password"])
.mode("append")
.save()
)

Gibt es eine Möglichkeit, diesen Prozess zu beschleunigen?

1768553023

Anonymous

Ich habe mit einer Sache zu kämpfen. Ich habe 700 MB CSV, das über 6 Millionen Zeilen enthält. Nach dem Filtern enthält es ~3 Millionen.
Ich muss es über JDBC direkt in Azure SQL schreiben. Es ist sehr langsam und benötigt 20 Minuten für die Eingabe von 3 Millionen Zeilen.
Mein Cluster verfügt über 14 GB RAM und 4 Kerne. Hier ist mein Code.
[code](clearedDF.repartition(4)
.write
.format("jdbc")
.option("driver", "com.microsoft.sqlserver.jdbc.SQLServerDriver")
.option("batchsize", 10000)
.option("url", jdbcUrl)
.option("dbtable", "dbo.weather")
.option("user", properties["user"])
.option("password", properties["password"])
.mode("append")
.save()
)
[/code]
Gibt es eine Möglichkeit, diesen Prozess zu beschleunigen?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie verbessert man die Leistung dieses Sortieralgorithmus? Gibt es hier einen ähnlichen Algorithmus?

Last post by Anonymous « 23 Feb 2025, 15:12
Posted in C#

by Anonymous » 23 Feb 2025, 15:12 » in C#

Ich hatte eine Vorstellung von einem neuen Sortieralgorithmus, der sich teilt und erobert, indem er einen zufälligen Index aufnimmt und das Array in zwei separate Arrays aufteilt. Algorithmusarbeit?...

0 Replies

28 Views

Last post by Anonymous
23 Feb 2025, 15:12
Ist es möglich, Daten von Spark Executors in Java Spark zu schreiben?

Last post by Anonymous « 27 Mar 2025, 15:45
Posted in Java

by Anonymous » 27 Mar 2025, 15:45 » in Java

Ich habe eine Java -Spark -Anwendung, die Daten von Kafka erhält, einige Arbeiten an den Daten ausführt und dann mit dem Befehl toundswrite () Parquetdateien in S3 speichert. Bis zu diesem Zeitpunkt...

0 Replies

44 Views

Last post by Anonymous
27 Mar 2025, 15:45
Ist es möglich, Daten von Spark Executors in Java Spark zu schreiben?

Last post by Anonymous « 02 Apr 2025, 12:13
Posted in Java

by Anonymous » 02 Apr 2025, 12:13 » in Java

Ich habe eine Java -Spark -Anwendung, die Daten von Kafka erhält, einige Arbeiten an den Daten ausführt und dann mit dem Befehl toundswrite () Parquetdateien in S3 speichert. Bis zu diesem Zeitpunkt...

0 Replies

58 Views

Last post by Anonymous
02 Apr 2025, 12:13
Anhänge an Delta -Tabellen im Stoff mit Spark VS ohne Spark

Last post by Anonymous « 10 Apr 2025, 12:53
Posted in Python

by Anonymous » 10 Apr 2025, 12:53 » in Python

Ich bin neu im Stoff und habe ein paar Udemy -Kurse durchgeführt. Ich bin mir jedoch nicht sicher, wie ich dieses Problem angehen soll. Die Transformationen sind kleine, umgebende Spalten...

0 Replies

50 Views

Last post by Anonymous
10 Apr 2025, 12:53
Fehler: Spark User hat den Spark -Kontext nicht initialisiert

Last post by Anonymous « 13 May 2025, 04:16
Posted in Python

by Anonymous » 13 May 2025, 04:16 » in Python

Ich bekomme diesen Fehler vom Spark mit Hadoop und PySpark
ApplicationMaster: Waiting for spark context initialization...
25/05/12 23:56:11 INFO ApplicationMaster: Final app status: FAILED,...

0 Replies

43 Views

Last post by Anonymous
13 May 2025, 04:16

Return to “Python”