Ich möchte eine Punkt-zu-Punkt-Kommunikation zwischen Rang 1 und Rang 2 durchführen, aber der folgende Fehler tritt auf. Ich habe jedoch bereits überprüft, dass in meinem Code alle Ränge mit Rang 0 kommunizieren können. Außerdem ist die Topologiestruktur meiner GPUs eine vollständig verbundene Struktur mit vier GPUs, und es gibt keine Situation, in der sie nicht physisch verbunden werden können . mein Pytorch ist 2.0
RuntimeError: [2] is setting up NCCL communicator and retrieving ncclUniqueId from [0] via c10d key-value store by key '1:2', but store->get('1:2') got error: Connection reset by peer
Exception raised from recvBytes at /home/whyin/pnp_new/PNP/torch/csrc/distributed/c10d/Utils.hpp:616 (most recent call first)
Ich möchte eine Kommunikationsgruppe erstellen, finde aber, dass die Kommunikation auf diese Weise immer noch nicht möglich ist. Ich hoffe, eine direkte Kommunikation zwischen zwei Rängen zu erreichen, ohne über Rang 0 zu gehen.
world_size = 4 # GPU数目 print(torch.__file__) pp, pk, cs = load("/home/whyin/data/9-data/") domain= Radix2EvaluationDomain.new(cs.circuit_bound()) spawn(runTpoly, args=(world_size,pp,cs,pk.arithmetics_evals,pk.selectors_evals,domain), nprocs=world_size, join=True) [/code] Ich möchte eine Punkt-zu-Punkt-Kommunikation zwischen Rang 1 und Rang 2 durchführen, aber der folgende Fehler tritt auf. Ich habe jedoch bereits überprüft, dass in meinem Code alle Ränge mit Rang 0 kommunizieren können. Außerdem ist die Topologiestruktur meiner GPUs eine vollständig verbundene Struktur mit vier GPUs, und es gibt keine Situation, in der sie nicht physisch verbunden werden können . mein Pytorch ist 2.0 [img]https://i.sstatic.net/oTuubLwA.png[/img]
[code]RuntimeError: [2] is setting up NCCL communicator and retrieving ncclUniqueId from [0] via c10d key-value store by key '1:2', but store->get('1:2') got error: Connection reset by peer Exception raised from recvBytes at /home/whyin/pnp_new/PNP/torch/csrc/distributed/c10d/Utils.hpp:616 (most recent call first) [/code] Ich möchte eine Kommunikationsgruppe erstellen, finde aber, dass die Kommunikation auf diese Weise immer noch nicht möglich ist. Ich hoffe, eine direkte Kommunikation zwischen zwei Rängen zu erreichen, ohne über Rang 0 zu gehen.
Ich mache derzeit eine Simulation von Partikelbewegungen auf einer 2D -Ebene der Größe LXL. Ich versuche Hindernisse hinzuzufügen, durch die sich die Partikel nicht bewegen können.
Mein Problem ist...
Ich versuche also, ein Artefakt meines Javafx -Programms mit Intellij -Idee zu erstellen, aber wenn ich versuche, die JAR -Datei auszuführen, erhalte ich immer wieder Fehler: Javafx...
Bis heute habe ich eine C ++ - Anwendung im Debug -Modus erstellt. Ich habe es jetzt mit dem Release -Modus erstellt und möchte beurteilen, welchen Unterschied dies für die Anwendungsleistung macht....
Ich habe eine ausführbare Datei mit PyInstaller erstellt und festgestellt, dass das Paket auch nach einigen Größenreduzierungstricks (Erstellen einer benutzerdefinierten Umgebung, Verwendung von...
Ich habe eine Phoenix -App, in der ich LiveView verwende, um Benutzereingaben über eine Benutzeroberfläche zu erhalten. Diese Eingaben werden in JSON verpackt und an einen Python -Geschäftsprozess...