Arbeiten mit Llama 3.2 Vision Multimodal zur Objekterkennung mit Roboflow

Arbeiten mit Llama 3.2 Vision Multimodal zur Objekterkennung mit Roboflow ⇐ Python

1 post • Page 1 of 1

Guest

Arbeiten mit Llama 3.2 Vision Multimodal zur Objekterkennung mit Roboflow

Report
Quote

Post by Guest » 03 Jan 2025, 09:46

Ich arbeite also an einem Projekt, bei dem ich einen von Roboflow heruntergeladenen Datensatz im Yolo-Format verwende und dann versuche, den Trainingsordner an Llama 3.2 zu übergeben, um diesen Datensatz von den Umarmungsgesichtstransformatoren überwacht zu lernen, aber das Problem ist dass es beim Training anfängt, aber meistens von selbst ohne Fehler stoppt.
Ich habe verschiedene Methoden zur Feinabstimmung ausprobiert, aber keine davon hat funktioniert.
Ich habe auch einen Ausschnitt meiner Feinabstimmungsmethode für Llama geteilt und derzeit kommt es während des Trainings immer wieder zu Fehlern.
Ich möchte auch klarstellen, dass ich sie verwende eine RTX 4090 mit 64 GB RAM und einem I9-14900k.
Und unten ist das Format für meinen Roboflow-Datensatz:
Yolov8-Format für Datensatz

Code: Select all

def train_llama(images, descriptions):
print("Initializing model and processor...")
model_id = "meta-llama/Llama-Guard-3-11B-Vision"

# Initialize processor
processor = AutoProcessor.from_pretrained(model_id)

# Initialize model
model = AutoModelForImageTextToText.from_pretrained(
model_id,
torch_dtype=torch.float16,
device_map="cuda"
)
model.config.use_cache = False

print("Creating dataset...")
dataset = CustomImageTextDataset(images, descriptions, processor)

# Split dataset
train_size = int(0.9 * len(dataset))
val_size = len(dataset) - train_size
train_dataset, val_dataset = torch.utils.data.random_split(dataset, [train_size, val_size])
print(f"Train size: {train_size}, Validation size: {val_size}")

# Training arguments
training_args = TrainingArguments(
output_dir="./llama_finetuned",
learning_rate=1e-5,
num_train_epochs=3,
per_device_train_batch_size=2,
gradient_accumulation_steps=4,
warmup_ratio=0.05,
logging_steps=10,
eval_strategy="steps",
eval_steps=50,
save_strategy="steps",
save_steps=100,
fp16=True,
gradient_checkpointing=True,
remove_unused_columns=False,
report_to="tensorboard",
load_best_model_at_end=True,
metric_for_best_model="loss",
dataloader_num_workers=0
)

# Initialize trainer
trainer = CustomTrainer(
model=model,
args=training_args,
train_dataset=train_dataset,
eval_dataset=val_dataset
)

print("Starting Llama training...")
try:
trainer.train()
print("Training completed successfully!")

print("Saving model...")
trainer.save_model("./final_llama_model")
print("Model saved successfully!")
return True

except Exception as e:
print(f"Error during training: {str(e)}")
print(f"Traceback: {traceback.format_exc()}")
return False

1735894018

Guest

Ich arbeite also an einem Projekt, bei dem ich einen von Roboflow heruntergeladenen Datensatz im Yolo-Format verwende und dann versuche, den Trainingsordner an Llama 3.2 zu übergeben, um diesen Datensatz von den Umarmungsgesichtstransformatoren überwacht zu lernen, aber das Problem ist dass es beim Training anfängt, aber meistens von selbst ohne Fehler stoppt.
Ich habe verschiedene Methoden zur Feinabstimmung ausprobiert, aber keine davon hat funktioniert.
Ich habe auch einen Ausschnitt meiner Feinabstimmungsmethode für Llama geteilt und derzeit kommt es während des Trainings immer wieder zu Fehlern.
Ich möchte auch klarstellen, dass ich sie verwende eine RTX 4090 mit 64 GB RAM und einem I9-14900k.
Und unten ist das Format für meinen Roboflow-Datensatz:
Yolov8-Format für Datensatz
[code]def train_llama(images, descriptions):
print("Initializing model and processor...")
model_id = "meta-llama/Llama-Guard-3-11B-Vision"

# Initialize processor
processor = AutoProcessor.from_pretrained(model_id)

# Initialize model
model = AutoModelForImageTextToText.from_pretrained(
model_id,
torch_dtype=torch.float16,
device_map="cuda"
)
model.config.use_cache = False

print("Creating dataset...")
dataset = CustomImageTextDataset(images, descriptions, processor)

# Split dataset
train_size = int(0.9 * len(dataset))
val_size = len(dataset) - train_size
train_dataset, val_dataset = torch.utils.data.random_split(dataset, [train_size, val_size])
print(f"Train size: {train_size}, Validation size: {val_size}")

# Training arguments
training_args = TrainingArguments(
output_dir="./llama_finetuned",
learning_rate=1e-5,
num_train_epochs=3,
per_device_train_batch_size=2,
gradient_accumulation_steps=4,
warmup_ratio=0.05,
logging_steps=10,
eval_strategy="steps",
eval_steps=50,
save_strategy="steps",
save_steps=100,
fp16=True,
gradient_checkpointing=True,
remove_unused_columns=False,
report_to="tensorboard",
load_best_model_at_end=True,
metric_for_best_model="loss",
dataloader_num_workers=0
)

# Initialize trainer
trainer = CustomTrainer(
model=model,
args=training_args,
train_dataset=train_dataset,
eval_dataset=val_dataset
)

print("Starting Llama training...")
try:
trainer.train()
print("Training completed successfully!")

print("Saving model...")
trainer.save_model("./final_llama_model")
print("Model saved successfully!")
return True

except Exception as e:
print(f"Error during training: {str(e)}")
print(f"Traceback: {traceback.format_exc()}")
return False
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Unsloth save_pretrained_gguf FEHLGESCHLAGEN. RuntimeError: Kompilieren von llama.cpp fehlgeschlagen. Bitte melden Sie di

Last post by Guest « 27 Dec 2024, 10:55
Posted in Python

by Guest » 27 Dec 2024, 10:55 » in Python

Wenn ich „unsloth“ verwende und versuche, das Modell als gguf zu speichern, erhalte ich die folgende Fehlermeldung:
1053 check = os.system( rm -rf llama.cpp/build )
1054 if check != 0: raise...

0 Replies

45 Views

Last post by Guest
27 Dec 2024, 10:55
Übergabe einer Eingabeaufforderung über Python an llama.cpp

Last post by Guest « 05 Jan 2025, 06:40
Posted in Python

by Guest » 05 Jan 2025, 06:40 » in Python

Ich habe den folgenden Code geschrieben:
import subprocess
import os
import mysql.connector
from dotenv import load_dotenv

def run_llama_cpp(prompt):
# Specify the absolute path of the executable...

0 Replies

26 Views

Last post by Guest
05 Jan 2025, 06:40
Das Problem mit der Objekterkennung führt in Java mit dem Yolov5 -ONNX -Modell zu

Last post by Anonymous « 23 Feb 2025, 22:08
Posted in Java

by Anonymous » 23 Feb 2025, 22:08 » in Java

Ich habe ein neuronales Netzwerk zur Objekterkennung mit Yolov5 ausgebildet und es in das ONNX -Format exportiert, da ich es in einer Java -Anwendung verwenden muss. Ich begegne jedoch Probleme mit...

0 Replies

9 Views

Last post by Anonymous
23 Feb 2025, 22:08
Probleme mit Google MLKit -Objekterkennung auf iOS

Last post by Anonymous « 09 Apr 2025, 05:06
Posted in IOS

by Anonymous » 09 Apr 2025, 05:06 » in IOS

Ich versuche derzeit, dem Entwickler zu folgen, um MLKit in iOS von
Wenn die Kamera öffnen und Objekte öffnen, erhalte ich einen Laufzeitfehler:
Precondition failed: NSArray element failed to...

0 Replies

23 Views

Last post by Anonymous
09 Apr 2025, 05:06
Objekterkennung nur mit OpenCV

Last post by Anonymous « 10 Apr 2025, 06:35
Posted in Python

by Anonymous » 10 Apr 2025, 06:35 » in Python

Ich mache eine Eindringlingserkennung aus Ringkamera -Filmmaterial; Ich muss eine Grenze um den erkannten Eindringling zeichnen. Ich muss wissen, welchen Fluss und welcher Prozess durchgehen soll.

0 Replies

11 Views

Last post by Anonymous
10 Apr 2025, 06:35

Return to “Python”