'sloth/llava-v1.6-MISTRAL-7B-HF' Modell Inferenz RunTimeError: Unloth: Fehlgeschlagen, um Eingänge zu erfordern

Similar Topics

Replies

Views

Last post

Unsloth save_pretrained_gguf FEHLGESCHLAGEN. RuntimeError: Kompilieren von llama.cpp fehlgeschlagen. Bitte melden Sie di

Last post by Guest « 27 Dec 2024, 10:55
Posted in Python

by Guest » 27 Dec 2024, 10:55 » in Python

Wenn ich „unsloth“ verwende und versuche, das Modell als gguf zu speichern, erhalte ich die folgende Fehlermeldung:
1053 check = os.system( rm -rf llama.cpp/build )
1054 if check != 0: raise...

0 Replies

79 Views

Last post by Guest
27 Dec 2024, 10:55
Fastapi + Transformatoren + 4-Bit Mistral: .to () wird für BitsandBytes 4-Bit-Modelle Fehler nicht unterstützt

Last post by Anonymous « 03 Apr 2025, 06:07
Posted in Python

by Anonymous » 03 Apr 2025, 06:07 » in Python

Ich setze ein Fastapi-Backend mit umarmenden Gesichtstransformatoren mit dem Mistralai/Mistral-7b-Instruct-V0.1-Modell ein, das mit BitsandByTesconfig nach 4-Bit quantisiert wurde. Ich leite dies in...

0 Replies

45 Views

Last post by Anonymous
03 Apr 2025, 06:07
MISTRAL API HOCHLADEN

Last post by Anonymous « 28 Dec 2025, 19:54
Posted in C#

by Anonymous » 28 Dec 2025, 19:54 » in C#

Die MISTRAL-Dokumentation gibt an, dass Textdateien (.txt) akzeptiert werden, ebenso wie PDF und DOCX und andere. Tatsächlich kann mit der CHAT-Funktion eine Textdatei gesendet werden, bevor eine...

0 Replies

1 Views

Last post by Anonymous
28 Dec 2025, 19:54
MISTRAL API UPLOAD [geschlossen]

Last post by Anonymous « 29 Dec 2025, 22:33
Posted in C#

by Anonymous » 29 Dec 2025, 22:33 » in C#

In der Dokumentation von Mistral heißt es, dass die API Textdateien (.txt) sowie PDFs, DOCX und andere akzeptiert. Mit der Mistral-API „Dateien“ kann ich mit dem folgenden Code ganz einfach eine...

0 Replies

0 Views

Last post by Anonymous
29 Dec 2025, 22:33
Beschleunigen Sie die ONNX-Inferenz in C#

Last post by Guest « 13 Jan 2025, 16:03
Posted in C#

by Guest » 13 Jan 2025, 16:03 » in C#

Ich verwende ONNX, um ein in Python trainiertes Modell zu exportieren und in C# auszuführen.
Alles funktioniert ziemlich gut, aber ich möchte die Inferenz beschleunigen auf der C#-Seite mithilfe von...

0 Replies

50 Views

Last post by Guest
13 Jan 2025, 16:03

Return to “Python”