Ich verwende ein M4 MacBook Pro und versuche, ein einfaches NN für MNIST-Daten auszuführen. Die Leistung auf MPS soll besser sein als die auf CPU. Aber es ist dramatisch langsamer. Selbst für ein einfaches NN wie das folgende dauert es auf der CPU etwa 1 Sekunde, auf MPS jedoch etwa 8 Sekunden. Vermisse ich etwas?
Ich verwende ein M4 MacBook Pro und versuche, ein einfaches NN für MNIST-Daten auszuführen. Die Leistung auf MPS soll besser sein als die auf CPU. Aber es ist dramatisch langsamer. Selbst für ein einfaches NN wie das folgende dauert es auf der CPU etwa 1 Sekunde, auf MPS jedoch etwa 8 Sekunden. Vermisse ich etwas? [code]def fit(X, Y, epochs, model, optimizer): for epoch in range(epochs): y_pred = model.forward(X)
loss = F.binary_cross_entropy(y_pred, Y)
optimizer.zero_grad() # zero the gradients loss.backward() # Compute new gradients optimizer.step() # update the parameters (weights)
Ich habe Probleme mit dem Versuch, Yolov11 mit Pytorch -Abgeordneten auf Apple Silicon zu arbeiten. Erhalten Sie diesen C ++ - OPS -Fehler immer wieder und kann nicht herausfinden, was los ist....
Ich versuche, Docker für ein Python-Projekt auf meinem Mac einzurichten und möchte MPS (Metal Performance Shaders) für die GPU-Beschleunigung mit PyTorch im Container verwenden.
Was ich bisher...
Ich versuche, die Ausführung eines Python -Codes zu parallelisieren, der ein numerisches Problem löst. Es ist ein relativ komplizierter Code, der Numpy stark benutzt. Ich möchte das numerische...
Ich untersuche einen Unterschied im Verhalten bei der Verwendung von Top -H -p
und mpStat -p All 2 . Die App meines Unternehmens ist ein Multi-Thread-Prozess, bei dem wir jeden Thread an bestimmte...
Ich bekomme sowohl in Julia als auch in Python die gleichen Ergebnisse. Die Zersetzung von Singularwert ist bei der GPU langsamer als bei der CPU für Float64 -Arrays. (Float32-Arrays verhalten sich,...