RuntimeError: Es wurde erwartet, dass sich alle Tensoren auf demselben Gerät befinden, aber es wurden mindestens zwei Ge

RuntimeError: Es wurde erwartet, dass sich alle Tensoren auf demselben Gerät befinden, aber es wurden mindestens zwei Ge ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Guest

RuntimeError: Es wurde erwartet, dass sich alle Tensoren auf demselben Gerät befinden, aber es wurden mindestens zwei Ge

Report
Quote

Post by Guest » 03 Jan 2025, 16:50

Ich habe beim Training auf der GPU einen Kontrollpunkt gespeichert. Nachdem ich den Checkpoint neu geladen und das Training fortgesetzt habe, erhalte ich die folgende Fehlermeldung:

Code: Select all

Traceback (most recent call last):
File "main.py", line 140, in 
train(model,optimizer,train_loader,val_loader,criteria=args.criterion,epoch=epoch,batch=batch)
File "main.py", line 71, in train
optimizer.step()
File "/opt/conda/lib/python3.7/site-packages/torch/autograd/grad_mode.py", line 26, in decorate_context
return func(*args, **kwargs)
File "/opt/conda/lib/python3.7/site-packages/torch/optim/sgd.py", line 106, in step
buf.mul_(momentum).add_(d_p, alpha=1 - dampening)
RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu!

Mein Trainingscode lautet wie folgt:

Code: Select all

def train(model,optimizer,train_loader,val_loader,criteria,epoch=0,batch=0):
batch_count = batch
if criteria == 'l1':
criterion = L1_imp_Loss()
elif criteria == 'l2':
criterion = L2_imp_Loss()
if args.gpu and torch.cuda.is_available():
model.cuda()
criterion = criterion.cuda()

print(f'{datetime.datetime.now().time().replace(microsecond=0)} Starting to train..')

while epoch

1735919425

Guest

Ich habe beim Training auf der GPU einen Kontrollpunkt gespeichert. Nachdem ich den Checkpoint neu geladen und das Training fortgesetzt habe, erhalte ich die folgende Fehlermeldung:
[code]Traceback (most recent call last):
File "main.py", line 140, in 
train(model,optimizer,train_loader,val_loader,criteria=args.criterion,epoch=epoch,batch=batch)
File "main.py", line 71, in train
optimizer.step()
File "/opt/conda/lib/python3.7/site-packages/torch/autograd/grad_mode.py", line 26, in decorate_context
return func(*args, **kwargs)
File "/opt/conda/lib/python3.7/site-packages/torch/optim/sgd.py", line 106, in step
buf.mul_(momentum).add_(d_p, alpha=1 - dampening)
RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu!
[/code]
Mein Trainingscode lautet wie folgt:
[code]def train(model,optimizer,train_loader,val_loader,criteria,epoch=0,batch=0):
batch_count = batch
if criteria == 'l1':
criterion = L1_imp_Loss()
elif criteria == 'l2':
criterion = L2_imp_Loss()
if args.gpu and torch.cuda.is_available():
model.cuda()
criterion = criterion.cuda()

print(f'{datetime.datetime.now().time().replace(microsecond=0)} Starting to train..')

while epoch

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Comfyui -Fehler: Erwartete, dass alle Tensoren auf demselben Gerät liegen, aber mindestens zwei Geräte gefunden, CPU und

Last post by Anonymous « 11 Jul 2025, 14:35
Posted in Python

by Anonymous » 11 Jul 2025, 14:35 » in Python

Ich versuche, eine Lora in Comfyui mit der modifizierten Version des Beispiel-Workflows für comfyui-fluxtrainer ( zu trainieren. Ich habe hier auf Reddit gefunden ( Dies ist die erste Version, in der...

0 Replies

11 Views

Last post by Anonymous
11 Jul 2025, 14:35
RuntimeError mit Pytorch beim Feinabstimmung LLM: "Element 0 der Tensoren erfordert keinen Grad"

Last post by Guest « 31 Jan 2025, 13:05
Posted in Python

by Guest » 31 Jan 2025, 13:05 » in Python

Ich versuche, ein Lama-Modell mit LORA zu optimieren, aber ich erhalte den folgenden Fehler während des Trainings:
RuntimeError: element 0 of tensors does not require grad and does not have a...

0 Replies

30 Views

Last post by Guest
31 Jan 2025, 13:05
Wie kann man eine Exe ausführen, ohne dass sich alle DLL-Dateien im selben Verzeichnis befinden müssen?

Last post by Guest « 13 Jan 2025, 20:03
Posted in C#

by Guest » 13 Jan 2025, 20:03 » in C#

Also versuche ich, wenn möglich, alle meine DLL-Dateien in meiner Exe-Datei zusammenzuführen, damit ich die Exe-Datei ausführen kann, ohne die DLL-Dateien im selben Verzeichnis zu benötigen.
Ich habe...

0 Replies

30 Views

Last post by Guest
13 Jan 2025, 20:03
Keine qualifizierende Bean von Typ 'Java.lang.String' erhältlich: Erwartet mindestens 1 Bohne, was als Autowire -Kandida

Last post by Anonymous « 19 Aug 2025, 10:23
Posted in Java

by Anonymous » 19 Aug 2025, 10:23 » in Java

Ich verwende den Frühlingsstarter-E-E-Mail-Service, um E-Mails an die Benutzer zu senden, wenn es neue Stellenangebote geben wird: Ich folge diesem Artikel von Geeks for Geeks. Ich denke, das Problem...

0 Replies

4 Views

Last post by Anonymous
19 Aug 2025, 10:23
Ungültiges Gerät angeforderter Kompositionstyp Änderung: Gerät (2) -> Gerät (2) Fehler mit 4x4 -Gitter, jedoch nicht 3x3

Last post by Anonymous « 22 Sep 2025, 22:17
Posted in Android

by Anonymous » 22 Sep 2025, 22:17 » in Android

ein Invalid device requested composition type change: Device (2) --> Device (2)

Problem Details:

3x3 grid with images: Works fine, no errors
4x4 grid with images: Throws the above error
Same...

0 Replies

7 Views

Last post by Anonymous
22 Sep 2025, 22:17

Return to “Python”