GPT -2 und andere Modelle von Huggingface -100 Label -Index für das Training anstelle von Pad Token

GPT -2 und andere Modelle von Huggingface -100 Label -Index für das Training anstelle von Pad Token ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

GPT -2 und andere Modelle von Huggingface -100 Label -Index für das Training anstelle von Pad Token

Report
Quote

Post by Anonymous » 02 Apr 2025, 19:11

Ich verstehe, dass die Label -ID -100 -ID so verwendet wird, dass die Vorhersagen für diese bei der Berechnung des Verlusts nicht enthalten sind. In ihrer Implementierung verwenden sie nn.crossentropyloss (), das ein Argument "Ignore_index" hat. Oder sind die Ergebnisse gleich?

1743613903

Anonymous

Ich verstehe, dass die Label -ID -100 -ID so verwendet wird, dass die Vorhersagen für diese bei der Berechnung des Verlusts nicht enthalten sind. In ihrer Implementierung verwenden sie nn.crossentropyloss (), das ein Argument "Ignore_index" hat. Oder sind die Ergebnisse gleich?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

ChatGPT-API – Erstellen einer längeren JSON-Antwort, die größer ist als das gpt-3.5-turbo-Token-Limit

Last post by Anonymous « 27 Dec 2025, 17:53
Posted in Python

by Anonymous » 27 Dec 2025, 17:53 » in Python

Ich habe einen Anwendungsfall für die ChatGPT-API, mit dem ich nicht umgehen kann.
Ich erstelle eine Python-App und habe eine Methode, die eine Anfrage mit einigen Anweisungen und einigen Daten...

0 Replies

13 Views

Last post by Anonymous
27 Dec 2025, 17:53
Inkrementieren Sie das 4-stellige, 0-Pad-Substring am Ende einer Zeichenfolge [Duplikat]

Last post by Anonymous « 04 Mar 2025, 00:06
Posted in Php

by Anonymous » 04 Mar 2025, 00:06 » in Php

Ich versuche, eine Seriennummer in zwei Teile aufzuteilen, in der zweiten Halbzeit einige Berechnungen durchzuführen und wieder in die erste Halbzeit zu verbinden. Kleinere Saiten, alle Methoden, die...

0 Replies

38 Views

Last post by Anonymous
04 Mar 2025, 00:06
Wie kann ich ein feinstimmiges GPT-Modell in Azure über Python einsetzen, ohne ein Token zu verwenden (z. B. stattdessen

Last post by Anonymous « 14 Apr 2025, 21:39
Posted in Python

by Anonymous » 14 Apr 2025, 21:39 » in Python

Ich folge Azures Tutorial zum Feinabstimmungs-GPT. Ich folge der Bereitstellungsphase.
Code:
# Deploy fine-tuned model

import json
import requests

token = ' '
subscription = ' '
resource_group =...

0 Replies

44 Views

Last post by Anonymous
14 Apr 2025, 21:39
OpenAI GPT-3 Token LogProbs und Word-Level Surpur

Last post by Anonymous « 20 May 2025, 17:08
Posted in Python

by Anonymous » 20 May 2025, 17:08 » in Python

Ich versuche, überraschige Werte auf Wortebene zu berechnen. In:

nehme ich meinen Kaffee mit Creme und Hund
Das Wort „Hund“ sollte ein hohes Überraschern ergeben (weil unerwartet/unvorhersehbar)....

0 Replies

46 Views

Last post by Anonymous
20 May 2025, 17:08
So erhalten Sie ein Number -Pad -Dialog in einer Blazor -Server -Web -App

Last post by Anonymous « 14 Jul 2025, 14:14
Posted in C#

by Anonymous » 14 Jul 2025, 14:14 » in C#

Ich entwickle eine Web -App für ein Touch -Panel, in dem keine Tastatur verfügbar ist (und ich möchte die Tastatur auf dem Bildschirm vermeiden). Ich habe eine Reihe von Möglichkeiten ausprobiert, um...

0 Replies

20 Views

Last post by Anonymous
14 Jul 2025, 14:14

Return to “Python”