Ich versuche, das Blenderbot-Modell facebook/blenderbot-90m auf einer Reihe von Fragebögen basierend auf meinem Eingabe-JSON zu trainieren.
Das Beispiel-JSON (Snippet) sieht so aus dies:
[
{
"input": "Who is Carole Nicholas?",
"output": "She is a software engineer !"
},
{
"input": "Where was Carole Nicholas born?",
"output": "She was born in San Franscisco."
},
{
"input": "Which was Carole's school?",
"output": "Lake Side school."
},
{
"input": "Where is Lakeside school located?",
"output": "It is located at Seattle!"
}
]
Ich versuche, das Blenderbot-Modell facebook/blenderbot-90m auf einer Reihe von Fragebögen basierend auf meinem Eingabe-JSON zu trainieren. Das Beispiel-JSON (Snippet) sieht so aus dies: [code][ { "input": "Who is Carole Nicholas?", "output": "She is a software engineer !" }, { "input": "Where was Carole Nicholas born?", "output": "She was born in San Franscisco." }, { "input": "Which was Carole's school?", "output": "Lake Side school." }, { "input": "Where is Lakeside school located?", "output": "It is located at Seattle!" } ] [/code] Code für die Schulung: [code]from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, DataCollatorWithPadding from datasets import Dataset import torch
modelName = "facebook/blenderbot-90m"
# Load the dataset dataset = Dataset.from_json("C:\\Users\\Raj\\Desktop\\To-Dos\\AI_related\\chatInput.json")
model = AutoModelForSeq2SeqLM.from_pretrained(modelName) tokenizer = AutoTokenizer.from_pretrained(modelName)
# Preprocess the data def preprocess(examples): model_inputs = tokenizer( examples["input"], examples["output"], padding="max_length", truncation=True, max_length=512, ) return model_inputs
Wie kann ich eine Listenfunktion auf einen gruppierten Pandas-Datenrahmen anwenden, der nicht mit apply, sondern mit transform aggregiert wird?
Bei mir schlägt Folgendes fehl mit: KeyError: „None of...
In meinem Sprachassistentenprojekt möchte ich eine Prognose festlegen. Daher verwende ich den API-Schlüssel von openweather.org und mein Code ist wie folgt
import requests
from os import *...
Ich möchte ein ML-Modell erstellen, das handgeschriebene Ziffern aus dem MNIST-Datensatz erkennt. Das ML-Modell ist in C++ unter Verwendung der OpenCV-Bibliothek geschrieben. Nachdem ich das Modell...
Ich habe an einem NLP-Hackathon teilgenommen, um die Ner_tags vorherzusagen, aber ich kann den Datenrahmen anscheinend nicht zum Trainieren des Modells verwenden, es heißt: KeyError und
öffne den...
Ich habe seit Januar einige CNNs auf Colab mit Tensorflow und TensorFlow-io trainiert. Das Training eines Modells dauerte vor ein paar Monaten mehr oder weniger 30 Minuten. Jetzt, seit einigen...