Schnellere Methoden zum Erstellen von Geodataframe aus einem Dask- oder Pandas -Datenframe

Schnellere Methoden zum Erstellen von Geodataframe aus einem Dask- oder Pandas -Datenframe ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Guest

Schnellere Methoden zum Erstellen von Geodataframe aus einem Dask- oder Pandas -Datenframe

Post by Guest » 28 Jan 2025, 05:29

Problem
Ich versuche, ein sehr großes Blockmodell (5,8 GB CSV -Datei) mit Zentroid -X-, Y- und Z -Koordinaten mit einem zu klemmen Höhenraster. Ich versuche nur die Blöcke zu erhalten, die direkt über der Rasterschicht liegen. Werte zu den Blockmodellpunkten. Für große Datensätze dauert dies eine gottlose Zeit (ja, das ist ein technischer Begriff) in Arcgis. BR /> Ich möchte dies beschleunigen, indem ich den CSV in Python importiere. Mit Dask ist dies schnell und einfach: < /p>

Code: Select all

import dask
from dask import dataframe as dd

BM = dd.read_csv(BM_path, skiprows=2,names=["X","Y","Z","Lith"])
< /code>
, aber ein Geodataframe mit Geopandas zu erstellen, ist keinerlei schneller Prozess. Ich dachte, dass das Beschleunigen mit dem folgenden Multiprocessing -Code möglicherweise funktioniert: < /p>
import multiprocessing as mp
from multiprocessing import pool
import geopandas as gpd

pool=mp.Pool(mp.cpu_count())
geometry = pool.apply(gpd.points_from_xy, args=(BM.X,BM.Y,BM.Z))
pool.close()
< /code>
Ich warte jedoch eine Stunde, um dies zu verarbeiten, ohne dass das Ende in Sicht ist. < /p>
Ich habe auch versucht Sofort im folgenden Code, aber stellen Sie fest, dass es einige Syntaxfehler gibt, die ich nicht korrigieren soll, insbesondere wenn "Geometry =" zu args =: < /p>
bestanden wirdpool = mp.Pool(mp.cpu_count())
results = pool.apply(gpd.GeoDataFrame, args=(BM,geometry=(BM.X,BM.Y,BM.Z)))
pool.close()

Ich habe mich gefragt, ob jemand eine bessere Vorstellung davon hatte, wie ich dies beschleunigen und diesen Prozess effizienter machen kann, ob ich parallelisieren kann oder nicht.

1738038576

Guest

[b] Problem [/b] 
Ich versuche, ein sehr großes Blockmodell (5,8 GB CSV -Datei) mit Zentroid -X-, Y- und Z -Koordinaten mit einem zu klemmen Höhenraster. Ich versuche nur die Blöcke zu erhalten, die direkt über der Rasterschicht liegen. Werte zu den Blockmodellpunkten. Für große Datensätze dauert dies eine gottlose Zeit (ja, das ist ein technischer Begriff) in Arcgis. BR />  Ich möchte dies beschleunigen, indem ich den CSV in Python importiere. Mit Dask ist dies schnell und einfach: < /p>
[code]import dask
from dask import dataframe as dd

BM = dd.read_csv(BM_path, skiprows=2,names=["X","Y","Z","Lith"])
< /code>
, aber ein Geodataframe mit Geopandas zu erstellen, ist keinerlei schneller Prozess. Ich dachte, dass das Beschleunigen mit dem folgenden Multiprocessing -Code möglicherweise funktioniert: < /p>
import multiprocessing as mp
from multiprocessing import pool
import geopandas as gpd

pool=mp.Pool(mp.cpu_count())
geometry = pool.apply(gpd.points_from_xy, args=(BM.X,BM.Y,BM.Z))
pool.close()
< /code>
Ich warte jedoch eine Stunde, um dies zu verarbeiten, ohne dass das Ende in Sicht ist. < /p>
Ich habe auch versucht Sofort im folgenden Code, aber stellen Sie fest, dass es einige Syntaxfehler gibt, die ich nicht korrigieren soll, insbesondere wenn "Geometry =" zu args =: < /p>
bestanden wirdpool = mp.Pool(mp.cpu_count())
results = pool.apply(gpd.GeoDataFrame, args=(BM,geometry=(BM.X,BM.Y,BM.Z)))
pool.close()
[/code]
Ich habe mich gefragt, ob jemand eine bessere Vorstellung davon hatte, wie ich dies beschleunigen und diesen Prozess effizienter machen kann, ob ich parallelisieren kann oder nicht.

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Richten Sie einen GeoDataFrame aus Punkten an der nächstgelegenen Linie in einem separaten GeoDataFrame aus

Last post by Guest « 03 Jan 2025, 09:44
Posted in Python

by Guest » 03 Jan 2025, 09:44 » in Python

Ich habe einen GeoDataFrame-Ereignisse, der nur Punktgeometrien enthält, und einen anderen GeoDataFrame-Straßen, der alle LineString-Geometrien enthält. Ich versuche, alle Punkte in Ereignissen am...

0 Replies

20 Views

Last post by Guest
03 Jan 2025, 09:44
So erstellen Sie eine Spalte mit zufällig generierten Werten in einem Pandas -Datenframe [Duplikat]

Last post by Anonymous « 05 Feb 2025, 00:24
Posted in Python

by Anonymous » 05 Feb 2025, 00:24 » in Python

Ich möchte einer Spalte einen zufälligen Float (von 0 bis 1) zuweisen, der einen eindeutigen Wert innerhalb eines Pandas -Datenfreame enthält. ; Ich möchte eine neue Spalte mit einem einzigartigen...

0 Replies

15 Views

Last post by Anonymous
05 Feb 2025, 00:24
Warum ist Dask bei der Berechnung des Mittelwerts eines großen Datensatzes langsamer als Pandas und wie kann ich die Lei

Last post by Guest « 19 Jan 2025, 21:07
Posted in Python

by Guest » 19 Jan 2025, 21:07 » in Python

Ich lerne Dask, um meine Python-Projekte effizienter und skalierbarer zu machen. Um die Leistung besser zu verstehen, habe ich ein Skript geschrieben, das die Rechenzeit von Pandas und Dask bei der...

0 Replies

19 Views

Last post by Guest
19 Jan 2025, 21:07
Pandas Multi -Index -Datenframe zum verschachtelten Wörterbuch

Last post by Anonymous « 13 Feb 2025, 23:17
Posted in Python

by Anonymous » 13 Feb 2025, 23:17 » in Python

Nehmen wir an, ich habe den folgenden DataFrame

df = pd.DataFrame({0: {('A', 'a'): 1, ('A', 'b'): 6, ('B', 'a'): 2, ('B', 'b'): 7},
1: {('A', 'a'): 2, ('A', 'b'): 7, ('B', 'a'): 3, ('B', 'b'):...

0 Replies

23 Views

Last post by Anonymous
13 Feb 2025, 23:17
Wie löste ich Speicher frei, das von einem Pandas -Datenframe verwendet wird?

Last post by Anonymous « 03 Mar 2025, 02:15
Posted in Python

by Anonymous » 03 Mar 2025, 02:15 » in Python

Ich habe eine wirklich große CSVimport pandas
df = pandas.read_csv('large_txt_file.txt')

Sobald ich dies mache, erhöht sich meine Speicherverwendung um 2 GB, was erwartet wird, da diese Datei...

0 Replies

20 Views

Last post by Anonymous
03 Mar 2025, 02:15

Return to “Python”