Fastapi + Transformatoren + 4-Bit Mistral: .to () wird für BitsandBytes 4-Bit-Modelle Fehler nicht unterstützt

Fastapi + Transformatoren + 4-Bit Mistral: .to () wird für BitsandBytes 4-Bit-Modelle Fehler nicht unterstützt ⇐ Python

1 post • Page 1 of 1

Anonymous

Fastapi + Transformatoren + 4-Bit Mistral: .to () wird für BitsandBytes 4-Bit-Modelle Fehler nicht unterstützt

Post by Anonymous » 03 Apr 2025, 06:07

Ich setze ein Fastapi-Backend mit umarmenden Gesichtstransformatoren mit dem Mistralai/Mistral-7b-Instruct-V0.1-Modell ein, das mit BitsandByTesconfig nach 4-Bit quantisiert wurde. Ich leite dies in einem NVIDIA -GPU -Container (CUDA 12.1, A10G GPU mit 22 GB VRAM) aus, und ich drücke diesen Fehler während des Modells des Modells immer wieder: < /p>

Code: Select all

 ValueError: `.to` is not supported for `4-bit` or `8-bit` bitsandbytes models. Please use the model as it is...< /code> < /p>
Was ich bisher getan habe:
-Ich rufe nicht an (...) überall-explizit alle solchen Zeilen entfernt. Device_map = "auto" gemäß den Transformatoren github problem✅ < /p>
< /li>
[*]  Ich nenne .cuda () Nur einmal auf dem Modell nach .from_pretrained (...), wie vorgeschlagen, dass ✅ < /p> < /> < /> < /la>
  model und token -model und token mit harming mithb />         
 -Schuls und ToKenizer mit HUGGUGGE -SETH -SAKGUS MIT HUB -SETH MOBLE MIT HUB -SETH MIT HUBE MOBLE MOBLE MOBEL MIT HUBE -MODEL. ✅

[*]  Das System erkennt Cuda richtig: Torch.cuda.is_available () ist wahr ✅ 

   und letztes löste ich das umarme Gesichtsgesichts-Cache (~/.Cache/. />  Hier ist der relevante Teil des Codes, der den Fehler auslöst: < /p>
    "mistralai/Mistral-7B-Instruct-v0.1",
quantization_config=quant_config,
device_map=None,  # I explicitly removed this
token=hf_token
).cuda()  # This is the only use of `.cuda()`

tokenizer = AutoTokenizer.from_pretrained(model_name, token=hf_token)```

Yet I still get the same ValueError. Thank you in advance.

1743653263

Anonymous

Ich setze ein Fastapi-Backend mit umarmenden Gesichtstransformatoren mit dem Mistralai/Mistral-7b-Instruct-V0.1-Modell ein, das mit BitsandByTesconfig nach 4-Bit quantisiert wurde. Ich leite dies in einem NVIDIA -GPU -Container (CUDA 12.1, A10G GPU mit 22 GB VRAM) aus, und ich drücke diesen Fehler während des Modells des Modells immer wieder: < /p>
[code] ValueError: `.to` is not supported for `4-bit` or `8-bit` bitsandbytes models. Please use the model as it is...< /code> < /p>
Was ich bisher getan habe:
-Ich rufe nicht an (...) überall-explizit alle solchen Zeilen entfernt. Device_map = "auto" gemäß den Transformatoren github problem✅ < /p>
< /li>
[*]  Ich nenne .cuda () Nur einmal auf dem Modell nach .from_pretrained (...), wie vorgeschlagen, dass ✅ < /p> < /> < /> < /la>
  model und token -model und token mit harming mithb />         
 -Schuls und ToKenizer mit HUGGUGGE -SETH -SAKGUS MIT HUB -SETH MOBLE MIT HUB -SETH MIT HUBE MOBLE MOBLE MOBEL MIT HUBE -MODEL. ✅

[*]  Das System erkennt Cuda richtig: Torch.cuda.is_available () ist wahr ✅ 

   und letztes löste ich das umarme Gesichtsgesichts-Cache (~/.Cache/. />  Hier ist der relevante Teil des Codes, der den Fehler auslöst: < /p>
    "mistralai/Mistral-7B-Instruct-v0.1",
quantization_config=quant_config,
device_map=None,  # I explicitly removed this
token=hf_token
).cuda()  # This is the only use of `.cuda()`

tokenizer = AutoTokenizer.from_pretrained(model_name, token=hf_token)```

Yet I still get the same ValueError. Thank you in advance.
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

"Sie haben eine Version von" Bitsandbytes ", die nicht mit 4 -Bit -Inferenz und Training kompatibel ist"

Last post by Guest « 09 Feb 2025, 11:52
Posted in Python

by Guest » 09 Feb 2025, 11:52 » in Python

Ich versuche jetzt, ein LAMA3 -Modell zu beenden. from unsloth import FastLanguageModel

Dann lade ich das LLAMA3 -Modell.
model, tokenizer = FastLanguageModel.from_pretrained(
model_name =...

0 Replies

7 Views

Last post by Guest
09 Feb 2025, 11:52
Fehler bei der Zusammenfassung: „>=“ wird zwischen Instanzen von „int“ und „str“ unter Verwendung von Transformatoren ni

Last post by Guest « 03 Jan 2025, 07:31
Posted in Python

by Guest » 03 Jan 2025, 07:31 » in Python

Beim Senden von Anfragen an
outputs = model.generate(inputs, max_length=hf_max_length, num_return_sequences=1)

Ich habe diesen Fehler erhalten
Error during summarization: '>=' not supported...

0 Replies

10 Views

Last post by Guest
03 Jan 2025, 07:31
Fehler bei der Zusammenfassung: „>=“ wird zwischen Instanzen von „int“ und „str“ unter Verwendung von Transformatoren ni

Last post by Guest « 03 Jan 2025, 08:20
Posted in Python

by Guest » 03 Jan 2025, 08:20 » in Python

Beim Senden von Anfragen an
outputs = model.generate(inputs, max_length=hf_max_length, num_return_sequences=1)

Ich habe diesen Fehler erhalten
Error during summarization: '>=' not supported...

0 Replies

12 Views

Last post by Guest
03 Jan 2025, 08:20
'sloth/llava-v1.6-MISTRAL-7B-HF' Modell Inferenz RunTimeError: Unloth: Fehlgeschlagen, um Eingänge zu erfordern

Last post by Anonymous « 05 Mar 2025, 14:02
Posted in Python

by Anonymous » 05 Mar 2025, 14:02 » in Python

Ich habe die Modellinferenz mit Llavanext Mistral 7B -Unloth -Modell getestet, empfangen jedoch den folgenden Fehler (Bild). Bereits ein Problem für das Github Repo eröffnet, aber noch keine Antwort...

0 Replies

9 Views

Last post by Anonymous
05 Mar 2025, 14:02
Der effizienteste Weg, eine 32-Bit-Ganzzahl in einen 16-Bit-Wert umzuwandeln?

Last post by Guest « 04 Jan 2025, 07:16
Posted in C++

by Guest » 04 Jan 2025, 07:16 » in C++

Ich schreibe einen DSP-Code, der eine Wellenfaltungsverzerrung an einem Eingangssignal durchführt. Dieser Code wendet eine Amplitudenverstärkung an (multipliziert die Eingabe mit einem...

0 Replies

16 Views

Last post by Guest
04 Jan 2025, 07:16

Return to “Python”