Fine Tune -Satztransformator mit einzelnen Satz- und Beschriftungsdaten

Fine Tune -Satztransformator mit einzelnen Satz- und Beschriftungsdaten ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Fine Tune -Satztransformator mit einzelnen Satz- und Beschriftungsdaten

Post by Anonymous » 12 Mar 2025, 00:28

Ich versuche, ein Satztransformatormodell einzustellen. Die Daten, die ich habe, enthält die folgenden Spalten: < /p>

RAW_TEXT - Die rohen Textbrocken < /li>
Beschriftung - Entsprechende Beschriftung für den Text - True oder False. (1 oder 0) < /li>
< /ol>
Ich wollte ein Satztransformatormodell einstellen, so dass die Einbettungen auf eine Weise optimiert werden, dass alle wahren Sätze im Vektorraum näher sind als alle falschen Satz-TRANS-Dokumentationen. Für meine Art von Daten und Anwendungsfall. Ich beuge mich unten in Richtung:

Da es mit meinem Datenformat übereinstimmt. Wenn ich mehr über diese Verluste und die Art und Weise, wie sie mit Anker berechnet werden, lesen, ist ich weniger zuversichtlich, sie zu verwenden, da meine Daten diese Art von Paar nicht haben.

Code: Select all

from sentence_transformers import SentenceTransformer, InputExample, SentencesDataset, LoggingHandler, losses
from torch.utils.data import DataLoader
import pandas as pd

# Load a pre-trained Sentence Transformer model
# model = SentenceTransformer('stsb-roberta-base') #Hugging face says this model produces embeddings of low quality
model = SentenceTransformer('all-mpnet-base-v2')

# Assume 'transportation_data' is your dataset containing 'page_raw_text' and 'is_practical' columns
data = pd.DataFrame({'text': train_data['page_raw_text'], 'label': train_data['label']})

# Create InputExample objects
examples = [InputExample(texts=[txt], label=label) for txt, label in zip(data['text'], data['label'])]

# Create a DataLoader object and a Loss model
train_dataset = SentencesDataset(examples=examples, model=model)
train_dataloader = DataLoader(train_dataset, shuffle=True, batch_size=8)
train_loss = losses.BatchAllTripletLoss(model=model)

# Define your training arguments
num_epochs = 10
evaluation_steps = 1

model.fit(train_objectives=[(train_dataloader, train_loss)], epochs=num_epochs,evaluation_steps=1)

1741735688

Anonymous

Ich versuche, ein Satztransformatormodell einzustellen. Die Daten, die ich habe, enthält die folgenden Spalten: < /p>

 RAW_TEXT - Die rohen Textbrocken < /li>
 Beschriftung - Entsprechende Beschriftung für den Text - True oder False. (1 oder 0) < /li>
< /ol>
Ich wollte ein Satztransformatormodell einstellen, so dass die Einbettungen auf eine Weise optimiert werden, dass alle wahren Sätze im Vektorraum näher sind als alle falschen Satz-TRANS-Dokumentationen. Für meine Art von Daten und Anwendungsfall. Ich beuge mich unten in Richtung: 
 
Da es mit meinem Datenformat übereinstimmt. Wenn ich mehr über diese Verluste und die Art und Weise, wie sie mit Anker berechnet werden, lesen, ist ich weniger zuversichtlich, sie zu verwenden, da meine Daten diese Art von Paar nicht haben.[code]from sentence_transformers import SentenceTransformer, InputExample, SentencesDataset, LoggingHandler, losses
from torch.utils.data import DataLoader
import pandas as pd

# Load a pre-trained Sentence Transformer model
# model = SentenceTransformer('stsb-roberta-base') #Hugging face says this model produces embeddings of low quality
model = SentenceTransformer('all-mpnet-base-v2')

# Assume 'transportation_data' is your dataset containing 'page_raw_text' and 'is_practical' columns
data = pd.DataFrame({'text': train_data['page_raw_text'], 'label': train_data['label']})

# Create InputExample objects
examples = [InputExample(texts=[txt], label=label) for txt, label in zip(data['text'], data['label'])]

# Create a DataLoader object and a Loss model
train_dataset = SentencesDataset(examples=examples, model=model)
train_dataloader = DataLoader(train_dataset, shuffle=True, batch_size=8)
train_loss = losses.BatchAllTripletLoss(model=model)

# Define your training arguments
num_epochs = 10
evaluation_steps = 1

model.fit(train_objectives=[(train_dataloader, train_loss)], epochs=num_epochs,evaluation_steps=1)

[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Maui Android Fine Location Erlaubnis wird nicht gebeten, obwohl acess_fine_location in AndroidManifest.xml ist

Last post by Anonymous « 11 Apr 2025, 20:46
Posted in C#

by Anonymous » 11 Apr 2025, 20:46 » in C#

Ich habe eine MAUI Mobile App, die einen guten Standort- und Hintergrund -Standortberechtigungen benötigt. Ich habe alle erforderlichen Einträge zu AndroidManifest.xml einschließlich...

0 Replies

12 Views

Last post by Anonymous
11 Apr 2025, 20:46
Maui Android Fine Location Erlaubnis wird nicht gebeten, obwohl acess_fine_location in AndroidManifest.xml ist

Last post by Anonymous « 14 Apr 2025, 15:33
Posted in C#

by Anonymous » 14 Apr 2025, 15:33 » in C#

Ich habe eine MAUI Mobile App, die einen guten Standort- und Hintergrund -Standortberechtigungen benötigt. Ich habe alle erforderlichen Einträge zu AndroidManifest.xml einschließlich...

0 Replies

13 Views

Last post by Anonymous
14 Apr 2025, 15:33
Holen Sie sich einen einzelnen Spaltenwert von einer einzelnen Zeile aus einer Abfrage in Codesigniter

Last post by Anonymous « 13 Apr 2025, 10:41
Posted in Php

by Anonymous » 13 Apr 2025, 10:41 » in Php

Die folgende Funktion soll den Namen des angegebenen Asset-Code aus der Datenbank lesen, aber er löst den Fehler aus: Versuch, die Eigenschaft des Nicht-Objekts zu erhalten
public function...

0 Replies

9 Views

Last post by Anonymous
13 Apr 2025, 10:41
Warum wird die While -Schleife nicht mit Strlen (Satz) - 1 ausgeführt?

Last post by Anonymous « 06 Apr 2025, 22:15
Posted in C++

by Anonymous » 06 Apr 2025, 22:15 » in C++

Der Code soll die Wörter umkehren, die die Länge = längste Wortlänge aus der Phrase haben. /> while (Position maxLength) {
maxLength = wordLength;
}

wordPtr = strtok(NULL, # );
}

int position =...

0 Replies

5 Views

Last post by Anonymous
06 Apr 2025, 22:15
Warum wird die While -Schleife nicht mit Strlen (Satz) - 1 ausgeführt?

Last post by Anonymous « 07 Apr 2025, 05:27
Posted in C++

by Anonymous » 07 Apr 2025, 05:27 » in C++

Der Code soll die Wörter umkehren, die die Länge = längste Wortlänge aus der Phrase haben. /> while (Position maxLength) {
maxLength = wordLength;
}

wordPtr = strtok(NULL, # );
}

int position =...

0 Replies

3 Views

Last post by Anonymous
07 Apr 2025, 05:27

Return to “Python”