Wie kann ich die Option is_split_into_words an layoutlmv3Processor übergeben? - Programmiererforum

Wie kann ich die Option is_split_into_words an layoutlmv3Processor übergeben? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Wie kann ich die Option is_split_into_words an layoutlmv3Processor übergeben?

Report
Quote

Post by Anonymous » 01 Jul 2025, 11:13

Ich bin ein Layoutlmv3 -Modell mit Huggingface-Transformatoren gut ab. Während der Vorverarbeitung möchte ich is_split_into_words = true verwenden, um eine ordnungsgemäße Etikettenausrichtung für die Token -Klassifizierung sicherzustellen.

Code: Select all

example["words"]

), Begrenzungsboxen und Bezeichnungen
Ich möchte während der Tokenisierung is_split_into_words = true bestehen

Code: Select all

LayoutLMv3Tokenizer.from_pretrained("microsoft/layoutlmv3-base")
processor = LayoutLMv3Processor.from_pretrained("microsoft/layoutlmv3-base")

...
def preprocess(example):

image = Image.open(example["image_path"]).convert("RGB")
image_width, image_height = image.size
normalized_bboxes = [normalize_bbox(bbox, image_width, image_height) for bbox in example["bboxes"]]

encoding = processor(
image,
example["words"],
is_split_into_words=True,
boxes=normalized_bboxes,
word_labels=[label2id[l] for l in example["labels"]],
truncation=True,
padding="max_length",
return_tensors="pt"
)

return {
"input_ids": encoding["input_ids"].squeeze(0),
"attention_mask": encoding["attention_mask"].squeeze(0),
"bbox": encoding["bbox"].squeeze(0),
"pixel_values": encoding["pixel_values"].squeeze(0),
"labels": encoding["labels"].squeeze(0)
}

tokenized_dataset = dataset.map(preprocess, remove_columns=dataset.column_names)
< /code>
, aber es löscht: < /p>
TypeError: LayoutLMv3TokenizerFast._batch_encode_plus() got an unexpected keyword argument 'is_split_into_words'

Es sieht so aus>

1751361235

Anonymous

Ich bin ein Layoutlmv3  -Modell mit Huggingface-Transformatoren gut ab. Während der Vorverarbeitung möchte ich is_split_into_words = true  verwenden, um eine ordnungsgemäße Etikettenausrichtung für die Token -Klassifizierung sicherzustellen.[code]example["words"][/code]), Begrenzungsboxen und Bezeichnungen 
 [url=viewtopic.php?t=14917]Ich möchte[/url] während der Tokenisierung is_split_into_words = true  bestehen[code]LayoutLMv3Tokenizer.from_pretrained("microsoft/layoutlmv3-base")
processor = LayoutLMv3Processor.from_pretrained("microsoft/layoutlmv3-base")

...
def preprocess(example):

image = Image.open(example["image_path"]).convert("RGB")
image_width, image_height = image.size
normalized_bboxes = [normalize_bbox(bbox, image_width, image_height) for bbox in example["bboxes"]]

encoding = processor(
image,
example["words"],
is_split_into_words=True,
boxes=normalized_bboxes,
word_labels=[label2id[l] for l in example["labels"]],
truncation=True,
padding="max_length",
return_tensors="pt"
)

return {
"input_ids": encoding["input_ids"].squeeze(0),
"attention_mask": encoding["attention_mask"].squeeze(0),
"bbox": encoding["bbox"].squeeze(0),
"pixel_values": encoding["pixel_values"].squeeze(0),
"labels": encoding["labels"].squeeze(0)
}

tokenized_dataset = dataset.map(preprocess, remove_columns=dataset.column_names)
< /code>
, aber es löscht: < /p>
TypeError: LayoutLMv3TokenizerFast._batch_encode_plus() got an unexpected keyword argument 'is_split_into_words'[/code] 
Es sieht so aus>

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie fusioniere ich alle Zusammenführungsfelder in einem Word -Dokument mit asspotieren. Words und C#?

Last post by Anonymous « 17 Aug 2025, 18:47
Posted in C#

by Anonymous » 17 Aug 2025, 18:47 » in C#

Ich habe ein Wortdokument, das viele Zusammenführungsfelder enthält, und derzeit habe ich eine funktionierende Lösung, um alle verfügbaren Zusammenführungsfelder in meinem Dokument zu verschmelzen....

0 Replies

4 Views

Last post by Anonymous
17 Aug 2025, 18:47
Ich möchte ein Stil zum Tischobjekt hinzufügen, das mit Inserthtml () in asspose.words hinzugefügt wurde

Last post by Anonymous « 28 Feb 2025, 03:55
Posted in Java

by Anonymous » 28 Feb 2025, 03:55 » in Java

Ich verwende asspose.Words, um Lesezeichen in einem Word -Dokument zu finden und eine Tabelle einzufügen. Ich möchte den im Dokument gespeicherten Stil importieren und diesen Stil anwenden, aber er...

0 Replies

18 Views

Last post by Anonymous
28 Feb 2025, 03:55
Was ist die Verwendung von ASSON-WORDSS-25.4.POM in https://release.aspsid.com/java/repo/com/asspins/asips-words/25.4/as

Last post by Anonymous « 02 May 2025, 04:50
Posted in Java

by Anonymous » 02 May 2025, 04:50 » in Java

In meinem Projekt benutze ich ASSONE, indem ich so etwas wie
hinzufüge
com.aspose
aspose-words
21.5
jdk16

com.aspose
aspose-words
21.5
javadoc

Jetzt möchte ich auf die neueste Version upgraden...

0 Replies

5 Views

Last post by Anonymous
02 May 2025, 04:50
Ändern Sie die Auswahl der Liste Option Option Hintergrundfarbe bei Schwebe

Last post by Anonymous « 02 May 2025, 05:40
Posted in HTML

by Anonymous » 02 May 2025, 05:40 » in HTML

Ist es möglich, die Standard-Hintergrundfarbe einer Auswahllistenoption für Schwebeplätze zu ändern? option:hover {
background-color: red;
}

One
Two
Three

Ich habe Option ausprobiert: Hover...

0 Replies

14 Views

Last post by Anonymous
02 May 2025, 05:40
Ändern Sie die Auswahl der Liste Option Option Hintergrundfarbe bei Schwebe

Last post by Anonymous « 02 May 2025, 05:40
Posted in CSS

by Anonymous » 02 May 2025, 05:40 » in CSS

Ist es möglich, die Standard-Hintergrundfarbe einer Auswahllistenoption für Schwebeplätze zu ändern? option:hover {
background-color: red;
}

One
Two
Three

Ich habe Option ausprobiert: Hover...

0 Replies

10 Views

Last post by Anonymous
02 May 2025, 05:40

Return to “Python”