Warum ist die Anwendungsfunktion der Panda so langsam, wenn sie über eine ganze Zeile iteriert, und nicht eine bestimmte

Warum ist die Anwendungsfunktion der Panda so langsam, wenn sie über eine ganze Zeile iteriert, und nicht eine bestimmte ⇐ Python

1 post • Page 1 of 1

Anonymous

Warum ist die Anwendungsfunktion der Panda so langsam, wenn sie über eine ganze Zeile iteriert, und nicht eine bestimmte

Report
Quote

Post by Anonymous » 08 Aug 2025, 00:04

Meine Intuition bei der Verwendung von Pandas ist, dass es optimaler ist, alle Antragsvorgänge in einem Anruf zu gruppieren, wenn Sie df.apply verwenden müssen. Dies wurde weiter verstärkt, indem ich erfuhr, dass Numpy Daten in einer Reihe von Zeilen und Major speichert, und damit das Aufrufen von Anwenden über eine ganze Zeile von der räumlichen Zeitlichkeit profitieren würde. Nach meiner Erfahrung ist es jedoch deutlich langsamer, anwenden in einer Funktion zu kombinieren, und es ist optimaler, in jeder Spalte die Anwendung separat aufzurufen. Erhöhen Sie. < /p>

Code: Select all

import pandas as pd
import numpy as np
import time

df = pd.DataFrame(
data = np.random.randint(0, 100, size=(1000, 5)).astype(float),
columns = [f'col{i}' for i in range(1, 6)]
)

def apply_row(row):
row['col1'] = row['col1'] * 2 + 3
row['col2'] = row['col2'] + 5
row['col3'] = row['col3'] - 1
row['col4'] = row['col4'] / 2
row['col5'] = row['col5'] ** 2
return row

start = time.time()
df.apply(apply_row, axis=1)
end = time.time()
print(f"Row-based time: {end - start} seconds")

start = time.time()
df['col1'] = df['col1'].apply(lambda x: x* 2 + 3)
df['col2'] = df['col2'].apply(lambda x: x + 5)
df['col3'] = df['col3'].apply(lambda x: x - 1)
df['col4'] = df['col4'].apply(lambda x: x / 2)
df['col5'] = df['col5'].apply(lambda x: x ** 2)
end = time.time()
print(f"Column-based time: {end - start} seconds")

Ich erkenne natürlich, dass die Operationen im obigen Snippet nicht anwenden . Aber der Punkt bleibt und ich stelle mir vor, dass String -Operationen noch signifikantere Leistungsunterschiede sehen.>

1754604250

Anonymous

Meine Intuition bei der Verwendung von Pandas ist, dass es optimaler ist, alle Antragsvorgänge in einem Anruf zu gruppieren, wenn Sie df.apply  verwenden müssen. Dies wurde weiter verstärkt, indem ich erfuhr, dass Numpy Daten in einer Reihe von Zeilen und Major speichert, und damit das Aufrufen von Anwenden  über eine ganze Zeile von der räumlichen Zeitlichkeit profitieren würde. Nach meiner Erfahrung ist es jedoch deutlich langsamer, anwenden  in einer Funktion zu kombinieren, und es ist optimaler, in jeder Spalte die Anwendung  separat aufzurufen. Erhöhen Sie. < /p>
[code]import pandas as pd
import numpy as np
import time

df = pd.DataFrame(
data = np.random.randint(0, 100, size=(1000, 5)).astype(float),
columns = [f'col{i}' for i in range(1, 6)]
)

def apply_row(row):
row['col1'] = row['col1'] * 2 + 3
row['col2'] = row['col2'] + 5
row['col3'] = row['col3'] - 1
row['col4'] = row['col4'] / 2
row['col5'] = row['col5'] ** 2
return row

start = time.time()
df.apply(apply_row, axis=1)
end = time.time()
print(f"Row-based time: {end - start} seconds")

start = time.time()
df['col1'] = df['col1'].apply(lambda x: x* 2 + 3)
df['col2'] = df['col2'].apply(lambda x: x + 5)
df['col3'] = df['col3'].apply(lambda x: x - 1)
df['col4'] = df['col4'].apply(lambda x: x / 2)
df['col5'] = df['col5'].apply(lambda x: x ** 2)
end = time.time()
print(f"Column-based time: {end - start} seconds")
[/code]
Ich erkenne natürlich, dass die Operationen im obigen Snippet nicht anwenden . Aber der Punkt bleibt und ich stelle mir vor, dass String -Operationen noch signifikantere Leistungsunterschiede sehen.>

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Panda iteriert Zeilen und multipliziert die Werte der n-ten Zeile mit dem Wert der nächsten (n+1) Zeile

Last post by Guest « 08 Jan 2025, 09:24
Posted in Python

by Guest » 08 Jan 2025, 09:24 » in Python

Ich versuche, mehrere Spaltenzeilen zu iterieren und die n-te Zeile mit n+1 Zeile zu multiplizieren, danach füge ich Spalten hinzu.
Ich habe den folgenden Code ausprobiert und er funktioniert...

0 Replies

29 Views

Last post by Guest
08 Jan 2025, 09:24
Wie finden Sie eine ganze Stunde des Tages die nächste ganze Stunde?

Last post by Anonymous « 07 Aug 2025, 23:30
Posted in Java

by Anonymous » 07 Aug 2025, 23:30 » in Java

Ich muss die gesamten Stunden eines Tages des Tages durchführen. Wie finde ich die nächste ganze Stunde angesichts der Tageszeit um eine ganze Stunde, um 01:00 Uhr? Die nächste ganze Stunde würde...

0 Replies

0 Views

Last post by Anonymous
07 Aug 2025, 23:30
Warum muss ich Element => Element angeben, wenn ich über eine! Array.Exists der bedingten Anweisung iteriert?

Last post by Anonymous « 15 May 2025, 03:18
Posted in C#

by Anonymous » 15 May 2025, 03:18 » in C#

Fange gerade an zu lernen und C# zu erfassen und entschuldige mich, wenn dies irgendwo gefragt wurde, aber ich habe nach ein paar Stunden gesucht und kann nicht genau verstehen, warum ich die Syntax...

0 Replies

7 Views

Last post by Anonymous
15 May 2025, 03:18
So erhalten Sie die ganze Woche über Daten für das bestimmte Datum Java

Last post by Anonymous « 02 Feb 2025, 09:57
Posted in Java

by Anonymous » 02 Feb 2025, 09:57 » in Java

Ich habe ein Datum. Wie bekomme ich alle Daten, die in der Woche fallen, dass das angegebene Datum in Java gehört?
Beispiel:
Wenn ich das heutige Datum gebe, sollte ich alle Daten zu dieser Woche...

0 Replies

16 Views

Last post by Anonymous
02 Feb 2025, 09:57
C# Enumeratefiles sehr langsam iteriert viele Dateien

Last post by Anonymous « 28 Feb 2025, 08:44
Posted in C#

by Anonymous » 28 Feb 2025, 08:44 » in C#

Ich verwende .NET 8 und habe die folgende Funktion in einer Foreach -Schleife ausgeführt:
private bool LookupHistoryFile(string salesID, MapValueContainer folderInfo, string created)
{
var...

0 Replies

20 Views

Last post by Anonymous
28 Feb 2025, 08:44

Return to “Python”