Ist der Context Manager von Huggingface Accelerate (ordnungsgemäß) für einen Diffusor implementiert? - Programmiererforum

Ist der Context Manager von Huggingface Accelerate (ordnungsgemäß) für einen Diffusor implementiert? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Ist der Context Manager von Huggingface Accelerate (ordnungsgemäß) für einen Diffusor implementiert?

Report
Quote

Post by Anonymous » 18 Aug 2025, 22:09

Diskussion < /h1>
Huggingface Accelerate Init_empty_weights () lädt alle Text -Encoder, die ich auf das Pytorch -Meta -Gerät getestet habe, ordnungsgemäß und verbraucht während des Ladens kein scheinbarer Speicher oder Scheibenraum. Sie wurden entweder in die "CPU "- oder" CUDA "-Geräte geladen und veranlassten den Speicher, der durch den Windows 11 Performance -Manager erkennbar wurde. /> init_eMpty_weights () funktioniert für Text Encoder < /h2>
with init_empty_weights():
text_encoder_2 = T5EncoderModel.from_pretrained(
"black-forest-labs/FLUX.1-dev",
subfolder="text_encoder_2",
torch_dtype=torch.float32
)

text_encoder_2.device
< /code>
Jupyter Notebook -Antwort: < /p>
device(type='meta')
< /code>
Wie erwartet wird das Modell nur in das Meta -Gerät geladen und Windows 11 -Leistungsmonitor zeigt keinen zusätzlichen RAM oder VRAM -Gebrauch.with init_empty_weights():
transformer = FluxTransformer2DModel.from_pretrained(
"black-forest-labs/FLUX.1-dev",
subfolder="transformer",
torch_dtype=torch.bfloat16
)

transformer.device
< /code>
Jupyter Notebook -Antwort: < /p>
device(type='cpu')
< /code>
Unerwartet (für mich) wurde das Modell in CPU (VICE -Meta) geladen und Windows 11 Performance Monitor zeigt die entsprechende Zunahme der RAM -Verwendung.with init_empty_weights():
pipeline = StableDiffusionXLPipeline.from_pretrained(
"stabilityai/stable-diffusion-xl-base-1.0",
torch_dtype=torch.float16,
variant="fp16",
use_safetensors=True
)

pipeline.unet.device
< /code>
Jupyter Notebook -Antwort: < /p>
device(type='cpu')
< /code>
unerwartet (für mich) wurde das Modell in CPU (VICE Meta) geladen und Windows 11 Performance Monitor zeigt die entsprechende Zunahme der RAM -Verwendung. infer_auto_device_map (), so dass beschleunigt werden kann, um das Beste zu erraten, auf welchem Gerät die verschiedenen Modellschichten geladen werden sollten. Das Laden der vollständigen Modelle, um ihre Form nur zu erhalten, ist langsam. Es ist möglich (zwar unpraktisch), ein vollständiges Modell zu laden, seine abgeleitete Gerätekarte zu erhalten, eine Textdarstellung dieser Gerätekarte in Text auszugeben, den Python -Kernel neu zu starten, den Text für die Ausgabegerätskarte zu einer neuen Gerätekarte zuzuordnen und schließlich die neue Gerätekarte beim Laden des Modells zum zweiten Mal zu verwenden. Eine unangenehme Problemumgehung.

1755547781

Anonymous

Diskussion < /h1>
Huggingface Accelerate Init_empty_weights () lädt alle Text -Encoder, die ich auf das Pytorch -Meta -Gerät getestet habe, ordnungsgemäß und verbraucht während des Ladens kein scheinbarer Speicher oder Scheibenraum.  Sie wurden entweder in die "CPU "- oder" CUDA "-Geräte geladen und veranlassten den Speicher, der durch den Windows 11 Performance -Manager erkennbar wurde. />  init_eMpty_weights () funktioniert für Text Encoder < /h2>
with init_empty_weights():
text_encoder_2 = T5EncoderModel.from_pretrained(
"black-forest-labs/FLUX.1-dev",
subfolder="text_encoder_2",
torch_dtype=torch.float32
)

text_encoder_2.device
< /code>
Jupyter Notebook -Antwort: < /p>
device(type='meta')
< /code>
Wie erwartet wird das Modell nur in das Meta -Gerät geladen und Windows 11 -Leistungsmonitor zeigt keinen zusätzlichen RAM oder VRAM -Gebrauch.with init_empty_weights():
transformer = FluxTransformer2DModel.from_pretrained(
"black-forest-labs/FLUX.1-dev",
subfolder="transformer",
torch_dtype=torch.bfloat16
)

transformer.device
< /code>
Jupyter Notebook -Antwort: < /p>
device(type='cpu')
< /code>
Unerwartet (für mich) wurde das Modell in CPU (VICE -Meta) geladen und Windows 11 Performance Monitor zeigt die entsprechende Zunahme der RAM -Verwendung.with init_empty_weights():
pipeline = StableDiffusionXLPipeline.from_pretrained(
"stabilityai/stable-diffusion-xl-base-1.0",
torch_dtype=torch.float16,
variant="fp16",
use_safetensors=True
)

pipeline.unet.device
< /code>
Jupyter Notebook -Antwort: < /p>
device(type='cpu')
< /code>
unerwartet (für mich) wurde das Modell in CPU (VICE Meta) geladen und Windows 11 Performance Monitor zeigt die entsprechende Zunahme der RAM -Verwendung. infer_auto_device_map (), so dass beschleunigt werden kann, um das Beste zu erraten, auf welchem Gerät die verschiedenen Modellschichten geladen werden sollten.  Das Laden der vollständigen Modelle, um ihre Form nur zu erhalten, ist langsam.  Es ist möglich (zwar unpraktisch), ein vollständiges Modell zu laden, seine abgeleitete Gerätekarte zu erhalten, eine Textdarstellung dieser Gerätekarte in Text auszugeben, den Python -Kernel neu zu starten, den Text für die Ausgabegerätskarte zu einer neuen Gerätekarte zuzuordnen und schließlich die neue Gerätekarte beim Laden des Modells zum zweiten Mal zu verwenden.  Eine unangenehme Problemumgehung.

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

GPT -2 und andere Modelle von Huggingface -100 Label -Index für das Training anstelle von Pad Token

Last post by Anonymous « 02 Apr 2025, 19:11
Posted in Python

by Anonymous » 02 Apr 2025, 19:11 » in Python

Ich verstehe, dass die Label -ID -100 -ID so verwendet wird, dass die Vorhersagen für diese bei der Berechnung des Verlusts nicht enthalten sind. In ihrer Implementierung verwenden sie...

0 Replies

20 Views

Last post by Anonymous
02 Apr 2025, 19:11
Fehler beim Konvertieren von Huggingface -Datensatz in den TensorFlow -Datensatz während der Verwendung von CUDA

Last post by Anonymous « 11 Jul 2025, 11:08
Posted in Python

by Anonymous » 11 Jul 2025, 11:08 » in Python

Ich versuche, Fonetuning mit einem Datensatz von Suggingface zu erledigen. Ich bekomme immer wieder InternalError....

0 Replies

11 Views

Last post by Anonymous
11 Jul 2025, 11:08
Wie kann ich einen Umarmungsface -Dataset über Huggingface -CLI herunterladen, während ich die ursprünglichen Dateinamen

Last post by Anonymous « 28 Feb 2025, 10:10
Posted in Python

by Anonymous » 28 Feb 2025, 10:10 » in Python

Ich habe einen Datensatz heruntergeladen, der über die CLI von Huggingface wie folgt gehostet wird:
pip install huggingface_hub
huggingface-cli download huuuyeah/MeetingBank_Audio --repo-type...

0 Replies

16 Views

Last post by Anonymous
28 Feb 2025, 10:10
DateTime funktioniert ordnungsgemäß in localhost, funktioniert jedoch nach der Bereitstellung nicht ordnungsgemäß, selbs

Last post by Guest « 16 Jan 2025, 12:06
Posted in JavaScript

by Guest » 16 Jan 2025, 12:06 » in JavaScript

Ich verwende Node JS für das Backend und EJS-Vorlage für mein Frontend. Im Grunde erstelle ich ein Salon-Terminsystem, bei dem Benutzer ein Datum auswählen und auf der Grundlage des ausgewählten...

0 Replies

35 Views

Last post by Guest
16 Jan 2025, 12:06
Warum führt der von Huggingface vorbereitete Deek-Code zu einem Fehler "Unbekannter Quantisierungstyp"?

Last post by Anonymous « 22 Mar 2025, 03:44
Posted in Python

by Anonymous » 22 Mar 2025, 03:44 » in Python

Ich verwende diesen Code von Huggingface:
Dieser Code wird direkt von der Seite der Huggingface-Website auf Deepseek eingefügt und soll Plug-and-Play-Code sein:

from transformers import pipeline...

0 Replies

19 Views

Last post by Anonymous
22 Mar 2025, 03:44

Return to “Python”