Mlflow hängt an pytorch log_model für eine große ModelldateiPython

Python-Programme
Anonymous
 Mlflow hängt an pytorch log_model für eine große Modelldatei

Post by Anonymous »

Beim Versuch, ein VLM -Modellartefakt auf einen Remote -Tracking -URI hochzuladen, hängt der MLFlow -Lauf nach einigen Stunden. Ich verwende Mlflow 3.1.1. Ich kann mit der .PTH -Datei mit Taschenlampe inferenziert und durchführen. Es scheint so einfach, aber ich kann es nicht zum Laufen bringen.

Code: Select all

torch.save(module_model.model, "/workspace/saved_models/vlm_model.pth")
< /code>
und bin versuchen, eine Ausführung zu starten und die Modelldatei auf den Remote -Server hochzuladen mit: < /p>
model = torch.load("/workspace/saved_models/vlm_model.pth", weights_only=False).to('cuda')

mlflow.pytorch.log_model(
pytorch_model=model,
name="model",
)

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post