GPT -2 und andere Modelle von Huggingface -100 Label -Index für das Training anstelle von Pad Token

GPT -2 und andere Modelle von Huggingface -100 Label -Index für das Training anstelle von Pad Token ⇐ Python

1 post • Page 1 of 1

Anonymous

GPT -2 und andere Modelle von Huggingface -100 Label -Index für das Training anstelle von Pad Token

Post by Anonymous » 02 Apr 2025, 19:11

Ich verstehe, dass die Label -ID -100 -ID so verwendet wird, dass die Vorhersagen für diese bei der Berechnung des Verlusts nicht enthalten sind. In ihrer Implementierung verwenden sie nn.crossentropyloss (), das ein Argument "Ignore_index" hat. Oder sind die Ergebnisse gleich?

1743613903

Anonymous

Ich verstehe, dass die Label -ID -100 -ID so verwendet wird, dass die Vorhersagen für diese bei der Berechnung des Verlusts nicht enthalten sind. In ihrer Implementierung verwenden sie nn.crossentropyloss (), das ein Argument "Ignore_index" hat. Oder sind die Ergebnisse gleich?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Inkrementieren Sie das 4-stellige, 0-Pad-Substring am Ende einer Zeichenfolge [Duplikat]

Last post by Anonymous « 04 Mar 2025, 00:06
Posted in Php

by Anonymous » 04 Mar 2025, 00:06 » in Php

Ich versuche, eine Seriennummer in zwei Teile aufzuteilen, in der zweiten Halbzeit einige Berechnungen durchzuführen und wieder in die erste Halbzeit zu verbinden. Kleinere Saiten, alle Methoden, die...

0 Replies

6 Views

Last post by Anonymous
04 Mar 2025, 00:06
Wie verteile ich die Zahlen 1-100 (einschließlich) genau auf eine gewichtete Liste mit einer Länge von <= 100?

Last post by Guest « 20 Jan 2025, 15:58
Posted in C++

by Guest » 20 Jan 2025, 15:58 » in C++

Ich habe eine Liste mit Artikeln, jeder Artikel hat ein Gewicht;
std::vector weights{0.5, 2, 5};

Diese Liste ist höchstens 100 Elemente lang und mindestens 2 Elemente lang.
Ich möchte die ganzen...

0 Replies

14 Views

Last post by Guest
20 Jan 2025, 15:58
Wie kann ich ein feinstimmiges GPT-Modell in Azure über Python einsetzen, ohne ein Token zu verwenden (z. B. stattdessen

Last post by Anonymous « 14 Apr 2025, 21:39
Posted in Python

by Anonymous » 14 Apr 2025, 21:39 » in Python

Ich folge Azures Tutorial zum Feinabstimmungs-GPT. Ich folge der Bereitstellungsphase.
Code:
# Deploy fine-tuned model

import json
import requests

token = ' '
subscription = ' '
resource_group =...

0 Replies

9 Views

Last post by Anonymous
14 Apr 2025, 21:39
OpenAI GPT-3 Token LogProbs und Word-Level Surpur

Last post by Anonymous « 20 May 2025, 17:08
Posted in Python

by Anonymous » 20 May 2025, 17:08 » in Python

Ich versuche, überraschige Werte auf Wortebene zu berechnen. In:

nehme ich meinen Kaffee mit Creme und Hund
Das Wort „Hund“ sollte ein hohes Überraschern ergeben (weil unerwartet/unvorhersehbar)....

0 Replies

6 Views

Last post by Anonymous
20 May 2025, 17:08
Wie ändere ich die Vordergrundfarbe eines Balkens: Ribbontabitem -Label in Actiprosoftware

Last post by Anonymous « 04 Mar 2025, 08:08
Posted in C#

by Anonymous » 04 Mar 2025, 08:08 » in C#

Ich habe Probleme, die Vordergrundfarbe eines Etiketts in Actiprosoftware zu ändern. Es scheint sich nicht zu ändern, wenn ich den Vordergrund = Rot stecke. Ich habe auch einige Dinge im...

0 Replies

9 Views

Last post by Anonymous
04 Mar 2025, 08:08

Return to “Python”