Ich muss es über JDBC direkt in Azure SQL schreiben. Es ist sehr langsam und benötigt 20 Minuten für die Eingabe von 3 Millionen Zeilen.
Mein Cluster verfügt über 14 GB RAM und 4 Kerne. Hier ist mein Code.
Code: Select all
(clearedDF.repartition(4)
.write
.format("jdbc")
.option("driver", "com.microsoft.sqlserver.jdbc.SQLServerDriver")
.option("batchsize", 10000)
.option("url", jdbcUrl)
.option("dbtable", "dbo.weather")
.option("user", properties["user"])
.option("password", properties["password"])
.mode("append")
.save()
)
Mobile version