Erhalten Sie den Text und die Token mit Layoutlmv3

Erhalten Sie den Text und die Token mit Layoutlmv3 ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Erhalten Sie den Text und die Token mit Layoutlmv3

Post by Anonymous » 05 Mar 2025, 12:16

Ich habe ein LayoutLMV3 -Modell trainiert, das mit Label Studio einen Etikettendatensatz erstellt hat. Ich konnte die Ausgabe des Modells mit dem folgenden Code < /p>
testen

Code: Select all

encoding = processor(image, words, boxes=boxes, word_labels=word_labels, return_tensors="pt")
for k,v in encoding.items():
print(k,v.shape)
< /code>
und zeichnen Sie die Felder im PDF mit dem folgenden Code < /p>
zurückimport torch

with torch.no_grad():
outputs = model(**encoding)
logits = outputs.logits
logits.shape
print (outputs)

predictions = logits.argmax(-1).squeeze().tolist()
print(predictions)
labels = encoding.labels.squeeze().tolist()
print(labels)
def unnormalize_box(bbox, width, height):
return [
width * (bbox[0] / 1000),
height * (bbox[1] / 1000),
width * (bbox[2] / 1000),
height * (bbox[3] / 1000),
]

token_boxes = encoding.bbox.squeeze().tolist()
width, height = image.size

true_predictions = [model.config.id2label[pred] for pred, label in zip(predictions, labels) if label != - 100]
true_labels = [model.config.id2label[label] for prediction, label in zip(predictions, labels) if label != -100]
true_boxes = [unnormalize_box(box, width, height) for box, label in zip(token_boxes, labels) if label != -100]

print(encoding.values)

Was ich zu verstehen versuche, ist, ob die Vorhersagen, die das Modell gibt>

1741173391

Anonymous

Ich habe ein LayoutLMV3 -Modell trainiert, das mit Label Studio einen Etikettendatensatz erstellt hat. Ich konnte die Ausgabe des Modells mit dem folgenden Code < /p>
testen[code]encoding = processor(image, words, boxes=boxes, word_labels=word_labels, return_tensors="pt")
for k,v in encoding.items():
print(k,v.shape)
< /code>
und zeichnen Sie die Felder im PDF mit dem folgenden Code < /p>
zurückimport torch

with torch.no_grad():
outputs = model(**encoding)
logits = outputs.logits
logits.shape
print (outputs)

predictions = logits.argmax(-1).squeeze().tolist()
print(predictions)
labels = encoding.labels.squeeze().tolist()
print(labels)
def unnormalize_box(bbox, width, height):
return [
width * (bbox[0] / 1000),
height * (bbox[1] / 1000),
width * (bbox[2] / 1000),
height * (bbox[3] / 1000),
]

token_boxes = encoding.bbox.squeeze().tolist()
width, height = image.size

true_predictions = [model.config.id2label[pred] for pred, label in zip(predictions, labels) if label != - 100]
true_labels = [model.config.id2label[label] for prediction, label in zip(predictions, labels) if label != -100]
true_boxes = [unnormalize_box(box, width, height) for box, label in zip(token_boxes, labels) if label != -100]

print(encoding.values)
[/code]
Was ich zu verstehen versuche, ist, ob die Vorhersagen, die das Modell gibt>

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Versuchen Sie, Zugangs -Token zu erhalten und Token von Spotify API (Python) zu aktualisieren.

Last post by Guest « 18 Feb 2025, 13:56
Posted in Python

by Guest » 18 Feb 2025, 13:56 » in Python

Ich habe es geschafft, den Auth -Code aus dem URI zu erhalten, und ich benutze ihn aus der Dokumentation. und Token -Anfragen 'url. parameters = {
grant_type : authorization_code ,
code : code,...

0 Replies

27 Views

Last post by Guest
18 Feb 2025, 13:56
Entschlüsseln und überprüfen Sie den Integrity -Token -Standard fehlen falsche Anzahl von Segmenten im Token

Last post by Guest « 10 Feb 2025, 02:43
Posted in Android

by Guest » 10 Feb 2025, 02:43 » in Android

Ich habe ein Problem für das Entschlüsseln von Token aus StandardintegrityToken in Einheit und Back-End-Verwenden Sie Firebase-Funktion.
Code in Einheit:
public async UniTask...

0 Replies

25 Views

Last post by Guest
10 Feb 2025, 02:43
Wie kann ich Token trennen, wenn einige Null-Token vorhanden sind?

Last post by Guest « 18 Jan 2025, 21:05
Posted in Java

by Guest » 18 Jan 2025, 21:05 » in Java

Ich habe eine Zeile in der CSV-Datei als
abc,bcc,
Ich muss sie in drei Token aufteilen: abc, bcc und null.
Zuerst habe ich StringTokenizer ausprobiert, aber es wurde kein Null-Token zurückgegeben....

0 Replies

29 Views

Last post by Guest
18 Jan 2025, 21:05
Token Token Google Sheets aktualisieren

Last post by Anonymous « 05 Mar 2025, 05:52
Posted in Java

by Anonymous » 05 Mar 2025, 05:52 » in Java

Fehler: Es wird kein Zugriff, kein API -Taste, API -Taste oder Refresh -Handler -Rückruf gesetzt.
Ich habe mich bereits erfolgreich angemeldet. Ich habe auch Refresh -Token bekommen. Aber danach...

0 Replies

21 Views

Last post by Anonymous
05 Mar 2025, 05:52
Fügen Sie den Text ersetzen Sie den Text basierend auf einem Namen in einem anderen Skript für Datei -Python -Skript

Last post by Anonymous « 04 Mar 2025, 14:35
Posted in Python

by Anonymous » 04 Mar 2025, 14:35 » in Python

Ich habe zwei Textdateien, Datei 1 ist eine Liste von Namen von Maschen mit einem Pfad. Manchmal ist der Name der gleiche Pfadname und kann Zahlen enthalten. Die Zeilen haben immer staticMesh =...

0 Replies

22 Views

Last post by Anonymous
04 Mar 2025, 14:35

Return to “Python”