Kombinieren Sie Async mit Parallelität

Kombinieren Sie Async mit Parallelität ⇐ Python

1 post • Page 1 of 1

Anonymous

Post by Anonymous » 29 Dec 2024, 11:54

Ich habe den folgenden Code:

async def run_task(...):
...
semaphore = asyncio.Semaphore(cfg.concurrency_limit)

async def run_single_sample(task_sample: TaskSample):
async with semaphore:
await run_agent(cfg, task_sample, cfg.output_dir / task.value)

samples = [run_single_sample(task_sample) for task_sample in sliced_samples]
await tqdm.gather(*samples, desc=f"Task: {task.value}")

Es ist Teil einer ML-Anwendung. Stellen Sie sich also vor, run_agent wäre ein asynchrones Chat-System, in dem LLMs ein Problem lösen. In diesem Prozess werden mehrere API-Aufrufe an OpenAI, an einige lokale Modalitäten und auch ein wenig an CPU-Prozesse zur Ausführung von lokalem Code durchgeführt.
Während die asynchronen/blockierenden Dinge für die API-Aufrufe sinnvoll sind Ich bin mir nicht sicher, ob es für die CPU-Prozesse Sinn macht. Denn nach meinem Verständnis ist alles immer noch sequentiell. Z.B. Während Beispiel 1 möglicherweise auf einen CPU-Aufruf wartet, beginnt Beispiel 2, aber dann wird Beispiel 1 erneut fortgesetzt.
Wenn ich mir meine htop-Ausgabe anschaue, sieht es so aus, als würde sie 1 CPU zu 100 % nutzen, also dachte ich mir Möglicherweise stellt die CPU aufgrund der lokalen Ausführung des Codes innerhalb der Agentenausführung hier einen Engpass dar.
Daher habe ich versucht, es mit etwas wie ThreadPoolExecutor, asyncio.to_thread, asyncio.run_in_executor, ...
aber anscheinend sind alle für die Ausführung von Synchronisierungsmethoden gedacht.
Wie könnte ich es richtig machen? Oder ist mein Anwendungsfall irgendwie fehlerhaft?

1735469653

Anonymous

Ich habe den folgenden Code:
[code]async def run_task(...):
...
semaphore = asyncio.Semaphore(cfg.concurrency_limit)

async def run_single_sample(task_sample: TaskSample):
async with semaphore:
await run_agent(cfg, task_sample, cfg.output_dir / task.value)

samples = [run_single_sample(task_sample) for task_sample in sliced_samples]
await tqdm.gather(*samples, desc=f"Task: {task.value}")
[/code]
Es ist Teil einer ML-Anwendung. Stellen Sie sich also vor, run_agent wäre ein asynchrones Chat-System, in dem LLMs ein Problem lösen. In diesem Prozess werden mehrere API-Aufrufe an OpenAI, an einige lokale Modalitäten und auch ein wenig an CPU-Prozesse zur Ausführung von lokalem Code durchgeführt.
Während die asynchronen/blockierenden Dinge für die API-Aufrufe sinnvoll sind Ich bin mir nicht sicher, ob es für die CPU-Prozesse Sinn macht. Denn nach meinem Verständnis ist alles immer noch sequentiell. Z.B. Während Beispiel 1 möglicherweise auf einen CPU-Aufruf wartet, beginnt Beispiel 2, aber dann wird Beispiel 1 erneut fortgesetzt.
Wenn ich mir meine htop-Ausgabe anschaue, sieht es so aus, als würde sie 1 CPU zu 100 % nutzen, also dachte ich mir Möglicherweise stellt die CPU aufgrund der lokalen Ausführung des Codes innerhalb der Agentenausführung hier einen Engpass dar.
Daher habe ich versucht, es mit etwas wie ThreadPoolExecutor, asyncio.to_thread, asyncio.run_in_executor, ...
aber anscheinend sind alle für die Ausführung von Synchronisierungsmethoden gedacht.
Wie könnte ich es richtig machen? Oder ist mein Anwendungsfall irgendwie fehlerhaft?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Python -Programm zum Kombinieren von zwei Wörterbuch -Werten für gemeinsame Schlüssel zu kombinieren

Last post by Anonymous « 13 Apr 2025, 11:36
Posted in Python

by Anonymous » 13 Apr 2025, 11:36 » in Python

Ich habe zwei Wörterbücher und ich muss sie kombinieren. Ich muss die Werte ähnlicher Schlüssel zusammenfassen und die verschiedenen Schlüssel lassen sie ohne Summe.

Dies sind die beiden...

0 Replies

22 Views

Last post by Anonymous
13 Apr 2025, 11:36
Das Testen des Async-Kontextmanager-Fixtures in Pytest führt zu einem unerwarteten Async-Generatorobjekt

Last post by Guest « 19 Jan 2025, 20:25
Posted in Python

by Guest » 19 Jan 2025, 20:25 » in Python

Dies hängt in gewisser Weise mit meinem tatsächlichen Code zusammen. Die in Pytest Fixture verwendete Async-Kontextmanagerklasse gibt ein Async-Generatorobjekt anstelle der erwarteten...

0 Replies

15 Views

Last post by Guest
19 Jan 2025, 20:25
Verschachtelte Parallelität mit GridSearchCV verursacht unendlich hängen

Last post by Anonymous « 06 Mar 2025, 12:14
Posted in Python

by Anonymous » 06 Mar 2025, 12:14 » in Python

Ich führe eine GridSearchCV -Optimierung in eine parallelisierte Funktion aus. Der Pseudocode sieht so aus
from tqdm.contrib.concurrent import process_map
from sklearn.model_selection import...

0 Replies

8 Views

Last post by Anonymous
06 Mar 2025, 12:14
Das in der Push-Funktion einer sperrenfreien Warteschlange in Abschnitt 7.15 „C++-Parallelität in Aktion“ erwähnte Probl

Last post by Guest « 07 Jan 2025, 12:32
Posted in C++

by Guest » 07 Jan 2025, 12:32 » in C++

Ich habe in Listing 7.15 „C++ Concurrency in Action“ gelesen:

Die Verwendung des Referenzzählschemas vermeidet dieses spezielle Rennen, aber es ist nicht das einzige Rennen in push(). Wenn Sie sich...

0 Replies

26 Views

Last post by Guest
07 Jan 2025, 12:32
Java 21 strukturierte Parallelität, erfordert eine vorhersehbare Reihenfolge der Unteraufgaben-Ausnahmen

Last post by Guest « 13 Jan 2025, 19:58
Posted in Java

by Guest » 13 Jan 2025, 19:58 » in Java

Ich bin relativ neu im Bereich des parallelen Codes und habe versucht, einige Codes, die auf Executoren basieren, in strukturierte Parallelität umzuwandeln, aber ich habe eine wichtige Eigenschaft...

0 Replies

20 Views

Last post by Guest
13 Jan 2025, 19:58

Return to “Python”