PyTorch auf M4 Mac auf MPS läuft im Vergleich zur CPU deutlich langsamer

PyTorch auf M4 Mac auf MPS läuft im Vergleich zur CPU deutlich langsamer ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

PyTorch auf M4 Mac auf MPS läuft im Vergleich zur CPU deutlich langsamer

Report
Quote

Post by Anonymous » 26 Nov 2025, 20:47

Ich verwende ein M4 MacBook Pro und versuche, ein einfaches NN für MNIST-Daten auszuführen. Die Leistung auf MPS soll besser sein als die auf CPU. Aber es ist dramatisch langsamer. Selbst für ein einfaches NN wie das folgende dauert es auf der CPU etwa 1 Sekunde, auf MPS jedoch etwa 8 Sekunden. Vermisse ich etwas?

Code: Select all

def fit(X, Y, epochs, model, optimizer):
for epoch in range(epochs):
y_pred = model.forward(X)

loss = F.binary_cross_entropy(y_pred, Y)

optimizer.zero_grad() # zero the gradients
loss.backward() # Compute new gradients
optimizer.step() # update the parameters (weights)

if (epoch % 2000 == 0):
print(f'Epoch: {epoch} | Loss: {loss.item()}')

class NeuralNet(nn.Module):
def __init__(self):
super().__init__()

self.fc1 = nn.Linear(X.shape[1], 3)
self.fc2 = nn.Linear(3, 1)

def forward(self, x):
x = F.sigmoid(self.fc1(x))
x = F.sigmoid(self.fc2(x))
return x

def predict(self, x):
output = self.forward(x)
return (output > 0.5).int()

model = NeuralNet().to(device=device)
optimizer = torch.optim.SGD(model.parameters(), lr=0.1)

1764186427

Anonymous

Ich verwende ein M4 MacBook Pro und versuche, ein einfaches NN für MNIST-Daten auszuführen. Die Leistung auf MPS soll besser sein als die auf CPU. Aber es ist dramatisch langsamer. Selbst für ein einfaches NN wie das folgende dauert es auf der CPU etwa 1 Sekunde, auf MPS jedoch etwa 8 Sekunden. Vermisse ich etwas?
[code]def fit(X, Y, epochs, model, optimizer):
for epoch in range(epochs):
y_pred = model.forward(X)

loss = F.binary_cross_entropy(y_pred, Y)

optimizer.zero_grad() # zero the gradients
loss.backward() # Compute new gradients
optimizer.step() # update the parameters (weights)

if (epoch % 2000 == 0):
print(f'Epoch: {epoch} | Loss: {loss.item()}')

class NeuralNet(nn.Module):
def __init__(self):
super().__init__()

self.fc1 = nn.Linear(X.shape[1], 3)
self.fc2 = nn.Linear(3, 1)

def forward(self, x):
x = F.sigmoid(self.fc1(x))
x = F.sigmoid(self.fc2(x))
return x

def predict(self, x):
output = self.forward(x)
return (output > 0.5).int()

model = NeuralNet().to(device=device)
optimizer = torch.optim.SGD(model.parameters(), lr=0.1)
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

YOLO11 FALT MIT C ++ OPS -Fehler auf M3 Mac - Pytorch/MPS -Problem?

Last post by Guest « 05 Feb 2025, 02:35
Posted in Python

by Guest » 05 Feb 2025, 02:35 » in Python

Ich habe Probleme mit dem Versuch, Yolov11 mit Pytorch -Abgeordneten auf Apple Silicon zu arbeiten. Erhalten Sie diesen C ++ - OPS -Fehler immer wieder und kann nicht herausfinden, was los ist....

0 Replies

35 Views

Last post by Guest
05 Feb 2025, 02:35
Wie aktiviere ich die MPS-Beschleunigung für PyTorch in Docker auf dem Mac?

Last post by Anonymous « 05 Dec 2025, 01:26
Posted in Python

by Anonymous » 05 Dec 2025, 01:26 » in Python

Ich versuche, Docker für ein Python-Projekt auf meinem Mac einzurichten und möchte MPS (Metal Performance Shaders) für die GPU-Beschleunigung mit PyTorch im Container verwenden.
Was ich bisher...

0 Replies

7 Views

Last post by Anonymous
05 Dec 2025, 01:26
Python-Multiprozessing verwendet nicht 100% CPU für perfekt paralleles, cpu-begrenztes Problem

Last post by Guest « 06 Sep 2025, 13:50
Posted in Python

by Guest » 06 Sep 2025, 13:50 » in Python

Ich versuche, die Ausführung eines Python -Codes zu parallelisieren, der ein numerisches Problem löst. Es ist ein relativ komplizierter Code, der Numpy stark benutzt. Ich möchte das numerische...

0 Replies

51 Views

Last post by Guest
06 Sep 2025, 13:50
Linux: Warum gibt es eine CPU% -Ausgangsdifferenz zwischen "Top -h -p <pid>" und "mpStat" für CPU -gebundene Multi -Thre

Last post by Anonymous « 02 Oct 2025, 23:02
Posted in Linux

by Anonymous » 02 Oct 2025, 23:02 » in Linux

Ich untersuche einen Unterschied im Verhalten bei der Verwendung von Top -H -p
und mpStat -p All 2 . Die App meines Unternehmens ist ein Multi-Thread-Prozess, bei dem wir jeden Thread an bestimmte...

0 Replies

62 Views

Last post by Anonymous
02 Oct 2025, 23:02
Warum ist die GPU langsamer als die CPU bei der Durchführung von SVD in einem doppelten Präzisionsarray?

Last post by Guest « 14 Feb 2025, 04:40
Posted in Python

by Guest » 14 Feb 2025, 04:40 » in Python

Ich bekomme sowohl in Julia als auch in Python die gleichen Ergebnisse. Die Zersetzung von Singularwert ist bei der GPU langsamer als bei der CPU für Float64 -Arrays. (Float32-Arrays verhalten sich,...

0 Replies

63 Views

Last post by Guest
14 Feb 2025, 04:40

Return to “Python”