Warum sollte ich eine Funktion mit Initializer übergeben und kann ich stattdessen gemeinsam genutztes Speicher verwenden

Warum sollte ich eine Funktion mit Initializer übergeben und kann ich stattdessen gemeinsam genutztes Speicher verwenden ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Guest

Warum sollte ich eine Funktion mit Initializer übergeben und kann ich stattdessen gemeinsam genutztes Speicher verwenden

Post by Guest » 10 Feb 2025, 10:01

Nehmen Sie diesen MWE: < /p>

Code: Select all

from multiprocessing import Pool
from time import perf_counter as now
import numpy as np

def make_func():
n = 20000
np.random.seed(7)
M = np.random.rand(n, n)
return lambda x, y: M[x, x] + M[y, y]

class ParallelProcessor:
def __init__(self):
pass

def process_task(self, args):
"""Unpack arguments internally"""
index, integer_arg = args
print(f(index, integer_arg))

def run_parallel(self, tasks, num_cores=None):
"""Simplified parallel execution without partial"""
num_cores = num_cores

task_args = [(idx, val) for idx, val in enumerate(tasks)]
start = now()
global f
f = make_func()
print(f"************** {now() - start} seconds to make f")
start = now()
with Pool(num_cores) as pool:
results = pool.map( self.process_task, task_args)
print(f"************** {now() - start} seconds to run all jobs")
return results

if __name__ == "__main__":
processor = ParallelProcessor()
processor.run_parallel(tasks=[1, 2, 3, 4, 5], num_cores=2)

Ich habe f global erklärt. Ich denke, das bedeutet, dass in jedem Arbeiter eine Kopie des großen Numpy -Arrays vorgenommen wird.

Code: Select all

from multiprocessing import Pool
from time import perf_counter as now
import time
import os
import numpy as np

def make_func():
n = 20000
np.random.seed(7)
M = np.random.rand(n, n)
return lambda x, y: M[x, x] + M[y, y]

def init_worker():
global f
f = make_func()

class ParallelProcessor:
def __init__(self):
pass

def process_task(self, args):
"""Unpack arguments internally"""
index, integer_arg = args
print(f(index, integer_arg))

def run_parallel(self, tasks, num_cores=None):
"""Parallel execution with proper initialization"""
num_cores = num_cores or len(os.sched_getaffinity(0))
task_args = [(idx, val) for idx, val in enumerate(tasks)]

start = now()
with Pool(num_cores, initializer=init_worker) as pool:
results = pool.map(self.process_task, task_args)
print(f"************** {now() - start} seconds to run all jobs")
return results

if __name__ == "__main__":
processor = ParallelProcessor()
processor.run_parallel(tasks=[1, 2, 3, 4, 5], num_cores=2)
< /code>
Mir wird gesagt, dass dies ein besserer Stil ist, aber ich kann nicht sehen, was der Vorteil ist.  Ich bin mir nicht sicher, warum F

in `init_worker global erklärt werden muss. In jedem Fall wird immer noch eine Kopie des großen Numpy -Arrays an jeden Arbeiter gesendet. Insgesamt scheint es auch langsamer zu sein. < /P>
Ich verwende Linux. eine Kopie des Arrays bei jedem Arbeiter. Gibt es einen schnellen Weg, um den gemeinsam genutzten Speicher zu verwenden, um dies zu vermeiden?

1739178075

Guest

Nehmen Sie diesen MWE: < /p>
[code]from multiprocessing import Pool
from time import perf_counter as now
import numpy as np

def make_func():
n = 20000
np.random.seed(7)
M = np.random.rand(n, n)
return lambda x, y: M[x, x] + M[y, y]

class ParallelProcessor:
def __init__(self):
pass

def process_task(self, args):
"""Unpack arguments internally"""
index, integer_arg = args
print(f(index, integer_arg))

def run_parallel(self, tasks, num_cores=None):
"""Simplified parallel execution without partial"""
num_cores = num_cores

task_args = [(idx, val) for idx, val in enumerate(tasks)]
start = now()
global f
f = make_func()
print(f"************** {now() - start} seconds to make f")
start = now()
with Pool(num_cores) as pool:
results = pool.map( self.process_task, task_args)
print(f"************** {now() - start} seconds to run all jobs")
return results

if __name__ == "__main__":
processor = ParallelProcessor()
processor.run_parallel(tasks=[1, 2, 3, 4, 5], num_cores=2)
[/code]
Ich habe f  global erklärt. Ich denke, das bedeutet, dass in jedem Arbeiter eine Kopie des großen Numpy -Arrays vorgenommen wird.[code]from multiprocessing import Pool
from time import perf_counter as now
import time
import os
import numpy as np

def make_func():
n = 20000
np.random.seed(7)
M = np.random.rand(n, n)
return lambda x, y: M[x, x] + M[y, y]

def init_worker():
global f
f = make_func()

class ParallelProcessor:
def __init__(self):
pass

def process_task(self, args):
"""Unpack arguments internally"""
index, integer_arg = args
print(f(index, integer_arg))

def run_parallel(self, tasks, num_cores=None):
"""Parallel execution with proper initialization"""
num_cores = num_cores or len(os.sched_getaffinity(0))
task_args = [(idx, val) for idx, val in enumerate(tasks)]

start = now()
with Pool(num_cores, initializer=init_worker) as pool:
results = pool.map(self.process_task, task_args)
print(f"************** {now() - start} seconds to run all jobs")
return results

if __name__ == "__main__":
processor = ParallelProcessor()
processor.run_parallel(tasks=[1, 2, 3, 4, 5], num_cores=2)
< /code>
Mir wird gesagt, dass dies ein besserer Stil ist, aber ich kann nicht sehen, was der Vorteil ist.  Ich bin mir nicht sicher, warum F [/code] in `init_worker global erklärt werden muss. In jedem Fall wird immer noch eine Kopie des großen Numpy -Arrays an jeden Arbeiter gesendet. Insgesamt scheint es auch langsamer zu sein. < /P>
Ich verwende Linux. eine Kopie des Arrays bei jedem Arbeiter. Gibt es einen schnellen Weg, um den gemeinsam genutzten Speicher zu verwenden, um dies zu vermeiden?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Bei der Integration von Chaquopy 16.0 in das gemeinsam genutzte Modul von Kotlin Multiplatform kann im gemeinsam genutzt

Last post by Guest « 03 Jan 2025, 09:40
Posted in Python

by Guest » 03 Jan 2025, 09:40 » in Python

Ich entwickle eine Kotlin-Multiplattform-App. Im gemeinsam genutzten Modul möchte ich das Numpy-Paket verwenden, um einige .pkl-Dateien zu bearbeiten.
Ich folge dem Setup, das im offiziellen...

0 Replies

24 Views

Last post by Guest
03 Jan 2025, 09:40
Wie erhalte ich die Größe gemeinsam nutzbarer und gemeinsam genutzter Arbeitssätze für einen Prozess?

Last post by Guest « 30 Dec 2024, 19:46
Posted in C#

by Guest » 30 Dec 2024, 19:46 » in C#

Ich versuche, die Größe der gemeinsam nutzbaren und gemeinsam genutzten Arbeitssätze eines Prozesses zu ermitteln.
Dies ist der Code, den ich verwende:
internal static unsafe WorkingSetInfo?...

0 Replies

35 Views

Last post by Guest
30 Dec 2024, 19:46
Wie erhalte ich die Größe gemeinsam nutzbarer und gemeinsam genutzter Arbeitssätze für einen Prozess?

Last post by Guest « 31 Dec 2024, 15:49
Posted in C#

by Guest » 31 Dec 2024, 15:49 » in C#

Ich versuche, die Größe der gemeinsam nutzbaren und gemeinsam genutzten Arbeitssätze eines Prozesses zu ermitteln.
Dies ist der Code, den ich verwende:
internal static unsafe WorkingSetInfo?...

0 Replies

31 Views

Last post by Guest
31 Dec 2024, 15:49
Wie kann ich einen gemeinsam genutzten Speicher in einem benutzerdefinierten Ringpuffer-Datentyp verwalten?

Last post by Guest « 12 Jan 2025, 11:40
Posted in Python

by Guest » 12 Jan 2025, 11:40 » in Python

Ich schreibe ein Programm für die folgende Aufgabe
Die Aufgabe besteht darin, ein Programm zu schreiben, das zwei Prozesse erstellt:
a) Die ' Der Producer-Prozess liest ein Video-Frame-Bild direkt in...

0 Replies

20 Views

Last post by Guest
12 Jan 2025, 11:40
Verwenden Sie Ausgang anstelle von einer virtuellen Umgebung? : Verwenden Sie stattdessen eine Unterschale [geschlossen]

Last post by Anonymous « 29 Apr 2025, 13:07
Posted in Python

by Anonymous » 29 Apr 2025, 13:07 » in Python

Ich bin ein gelegentlicher Python -Programmierer und vergisst immer wieder, deaktiviert zu verwenden.

Ich bemerke, dass sogar Astals UV Quelle .venv/bin/aktivieren
Das Skript von kiosk.tm...

0 Replies

11 Views

Last post by Anonymous
29 Apr 2025, 13:07

Return to “Python”