Optimales Quanto -Speicherfehler mit Aktivierungsquantisierungskalibrierung

Optimales Quanto -Speicherfehler mit Aktivierungsquantisierungskalibrierung ⇐ Python

1 post • Page 1 of 1

Guest

Optimales Quanto -Speicherfehler mit Aktivierungsquantisierungskalibrierung

Post by Guest » 25 Jan 2025, 17:05

Verwenden von optimalem Quanto Ich versuche, sowohl Gewichte als auch Aktivierungen zu quantisieren und dann die Daten in Google Colab zu kalibrieren. /p>
unten ist der Code dafür. < /p>

Code: Select all

!pip install -q datasets
!pip install -q optimum-quanto

Code: Select all

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "meta-llama/Llama-3.2-1B-Instruct"
model = AutoModelForCausalLM.from_pretrained(model_name, low_cpu_mem_usage=True)
tokenizer = AutoTokenizer.from_pretrained(model_name)

from optimum.quanto import quantize, qint8

quantize(model, weights=qint8, activations=qint8)

# Example using Hugging Face dataset
from datasets import load_dataset
from optimum.quanto import Calibration

# Load a representative subset of your data
# with more data I am getting memory error
calibration_samples = load_dataset("allenai/c4", data_files="en/c4-train.00001-of-01024.json.gz", split='train[:20]')

print('number of samples', len(calibration_samples))

# the tokenizer does not have a pad token
tokenizer.pad_token = tokenizer.eos_token

# Prepare samples (convert to model input format)
samples = [item['text'] for item in calibration_samples]

# Tokenize and prepare samples
inputs = tokenizer(samples, return_tensors='pt', padding=True, truncation=True)

# Use these inputs in calibration
with Calibration(momentum=0.9):
model(inputs['input_ids']) #

1737821154

Guest

Verwenden von optimalem Quanto Ich versuche, sowohl Gewichte als auch Aktivierungen zu quantisieren und dann die Daten in Google Colab zu kalibrieren. /p>
unten ist der Code dafür. < /p>
[code]!pip install -q datasets
!pip install -q optimum-quanto
[/code]
[code]from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "meta-llama/Llama-3.2-1B-Instruct"
model = AutoModelForCausalLM.from_pretrained(model_name, low_cpu_mem_usage=True)
tokenizer = AutoTokenizer.from_pretrained(model_name)

from optimum.quanto import quantize, qint8

quantize(model, weights=qint8, activations=qint8)

# Example using Hugging Face dataset
from datasets import load_dataset
from optimum.quanto import Calibration

# Load a representative subset of your data
# with more data I am getting memory error
calibration_samples = load_dataset("allenai/c4", data_files="en/c4-train.00001-of-01024.json.gz", split='train[:20]')

print('number of samples', len(calibration_samples))

# the tokenizer does not have a pad token
tokenizer.pad_token = tokenizer.eos_token

# Prepare samples (convert to model input format)
samples = [item['text'] for item in calibration_samples]

# Tokenize and prepare samples
inputs = tokenizer(samples, return_tensors='pt', padding=True, truncation=True)

# Use these inputs in calibration
with Calibration(momentum=0.9):
model(inputs['input_ids']) #

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Effiziente Möglichkeit, mit großen Dateien umzugehen: Zu viele Speicherfehler

Last post by Anonymous « 04 Mar 2025, 10:16
Posted in Python

by Anonymous » 04 Mar 2025, 10:16 » in Python

Ich brauche bitte Rat. Ich arbeite an einem konditionierten Wartungsschulprojekt für Meeresmotoren mit KI- und ML -Techniken. Die Daten, die ich habe, enthält sowohl normale als auch fehlerhafte...

0 Replies

8 Views

Last post by Anonymous
04 Mar 2025, 10:16
Offene FoodFacts - Problem zur Lösung von Parsen aufgrund von Speicherfehler [geschlossen]

Last post by Anonymous « 12 Apr 2025, 16:58
Posted in Python

by Anonymous » 12 Apr 2025, 16:58 » in Python

Ich versuche, Datenbank von OpenFoodFacts zu verwenden, aber ich begegne Parser -Fehler. Als ich versuchte, es zu lösen, begegne ich das Problem mit dem Gedächtnis. /> />
Aufgenommen, mein Versuch...

0 Replies

6 Views

Last post by Anonymous
12 Apr 2025, 16:58
Problem mit Pandas: Umgang mit Wörterbüchern mit gemischten Listen und Bereichen

Last post by Guest « 22 Dec 2024, 20:30
Posted in Python

by Guest » 22 Dec 2024, 20:30 » in Python

Ich arbeite mit einem Wörterbuch, das eine Mischung aus Listen und Bereichen enthält (die in Listen verarbeitet werden), aber wenn ich versuche, es in einen Pandas-DataFrame zu konvertieren, erhalte...

0 Replies

33 Views

Last post by Guest
22 Dec 2024, 20:30
Problem mit Pandas: Umgang mit Wörterbüchern mit gemischten Listen und Bereichen

Last post by Anonymous « 23 Dec 2024, 12:58
Posted in Python

by Anonymous » 23 Dec 2024, 12:58 » in Python

Ich arbeite mit einem Wörterbuch, das eine Mischung aus Listen und Bereichen enthält (die in Listen verarbeitet werden), aber wenn ich versuche, es in einen Pandas-DataFrame zu konvertieren, erhalte...

0 Replies

27 Views

Last post by Anonymous
23 Dec 2024, 12:58
Warum führt Camel 4 mit Java 21 meinen Code mit mehreren Threads aus, während Camel 3 mit Java 11 einen einzelnen Thread

Last post by Guest « 13 Jan 2025, 16:25
Posted in Java

by Guest » 13 Jan 2025, 16:25 » in Java

Ich habe die folgenden Codezeilen in meiner Apache Camel-Route:
.split().method(SomeDataCacheSplitter.class, split ).streaming()
.marshal(gsonDataFormat)
.aggregate(constant(true), new...

0 Replies

22 Views

Last post by Guest
13 Jan 2025, 16:25

Return to “Python”