Imbetten der Bildeinbettungen nicht erzeugen: Die Größe des Tensors A (1246) muss mit der Größe des Tensors B (77) in de

Imbetten der Bildeinbettungen nicht erzeugen: Die Größe des Tensors A (1246) muss mit der Größe des Tensors B (77) in de ⇐ Python

1 post • Page 1 of 1

Anonymous

Imbetten der Bildeinbettungen nicht erzeugen: Die Größe des Tensors A (1246) muss mit der Größe des Tensors B (77) in de

Report
Quote

Post by Anonymous » 05 Mar 2025, 13:30

Ich verwende ein Modell für Satztransformatoren, um Einbetten von Bilddateien (PIL-Image-Datei) zu erstellen. Es gibt jedoch den Fehler im Titel. Ich habe eine Reihe von Dingen versucht, um es zu lösen, aber ohne Erfolg. Ich denke, es kann eine einfache Lösung geben, aber ich kann sie nicht finden.

Code: Select all

import pandas as pd
from sentence_transformers import SentenceTransformer
import os
import numpy as np
from PIL import Image, ImageFile

ImageFile.LOAD_TRUNCATED_IMAGES = True

image_files = ['.jpg', '.jpeg', '.png']

class Analyzer:

def __init__(self):
self.image_model = SentenceTransformer("clip-ViT-B-32")

def analyze_directory(self, path):

files_data = []

with os.scandir(path) as dir_iter:
for entry in dir_iter:
try:
if entry.is_file():
_, ext = os.path.splitext(entry.name)
if ext in image_files:
try:
with Image.open(os.path.join(path, entry.name)) as img:
img.convert("RGB")
file_data = {
"Path": entry.name,
"Content": img,
"Type": "image"
}
except Exception as e:
file_data = {
"Path": entry.name,
"Content": "",
"Type": "image"
}

else:
file_data = {
"Path": entry.name,
"Content": "",
"Type": "unknown"
}

files_data.append(file_data)

except Exception as e:
continue

df = pd.DataFrame(files_data)

embeddings = []
for _, row in df.iterrows():
if row["Type"] == "image":
try:
img = img.resize((224, 224))
# Convert PIL Image to tensor
img_tensor = np.array(img)
# Normalize pixel values to [-1, 1] range expected by CLIP
img_normalized = (img_tensor / 255.0 * 2.0) - 1.0
img_batch = np.expand_dims(img_normalized, axis=0)
embedding = self.image_model.encode(str(img_batch)).numpy()[0]
except Exception as e:
raise RuntimeError(f"Failed to generate image embeddings: {str(e)}")
else:
# Handle unknown types
embedding = np.zeros(384)

embeddings.append(embedding)

embeddings = np.array(embeddings)

return embeddings
< /code>
Ich habe versucht, den Tensor abzuschneiden, aber ich konnte keinen Weg finden, dies zu tun.Traceback (most recent call last):
File "", line 198, in _run_module_as_main
File "", line 88, in _run_code
File "C:\Users\...\src\document_analyzer\main.py", line 15, in 
main()
~~~~^^
File "C:\Users\...\src\document_analyzer\main.py", line 6, in main
folder_structure = analyzer.analyze_directory(path)
File "C:\Users\...\src\document_analyzer\analyzer.py", line 69, in analyze_directory
raise RuntimeError(f"Failed to generate image embeddings: {str(e)}")
RuntimeError: Failed to generate image embeddings: The size of tensor a (1203) must match the size of tensor b (77) at non-singleton dimension 1

1741177852

Anonymous

Ich verwende ein Modell für Satztransformatoren, um Einbetten von Bilddateien (PIL-Image-Datei) zu erstellen. Es gibt jedoch den Fehler im Titel. Ich habe eine Reihe von Dingen versucht, um es zu lösen, aber ohne Erfolg. Ich denke, es kann eine einfache Lösung geben, aber ich kann sie nicht finden.[code]import pandas as pd
from sentence_transformers import SentenceTransformer
import os
import numpy as np
from PIL import Image, ImageFile

ImageFile.LOAD_TRUNCATED_IMAGES = True

image_files = ['.jpg', '.jpeg', '.png']

class Analyzer:

def __init__(self):
self.image_model = SentenceTransformer("clip-ViT-B-32")

def analyze_directory(self, path):

files_data = []

with os.scandir(path) as dir_iter:
for entry in dir_iter:
try:
if entry.is_file():
_, ext = os.path.splitext(entry.name)
if ext in image_files:
try:
with Image.open(os.path.join(path, entry.name)) as img:
img.convert("RGB")
file_data = {
"Path": entry.name,
"Content": img,
"Type": "image"
}
except Exception as e:
file_data = {
"Path": entry.name,
"Content": "",
"Type": "image"
}

else:
file_data = {
"Path": entry.name,
"Content": "",
"Type": "unknown"
}

files_data.append(file_data)

except Exception as e:
continue

df = pd.DataFrame(files_data)

embeddings = []
for _, row in df.iterrows():
if row["Type"] == "image":
try:
img = img.resize((224, 224))
# Convert PIL Image to tensor
img_tensor = np.array(img)
# Normalize pixel values to [-1, 1] range expected by CLIP
img_normalized = (img_tensor / 255.0 * 2.0) - 1.0
img_batch = np.expand_dims(img_normalized, axis=0)
embedding = self.image_model.encode(str(img_batch)).numpy()[0]
except Exception as e:
raise RuntimeError(f"Failed to generate image embeddings: {str(e)}")
else:
# Handle unknown types
embedding = np.zeros(384)

embeddings.append(embedding)

embeddings = np.array(embeddings)

return embeddings
< /code>
Ich habe versucht, den Tensor abzuschneiden, aber ich konnte keinen Weg finden, dies zu tun.Traceback (most recent call last):
File "", line 198, in _run_module_as_main
File "", line 88, in _run_code
File "C:\Users\...\src\document_analyzer\main.py", line 15, in 
main()
~~~~^^
File "C:\Users\...\src\document_analyzer\main.py", line 6, in main
folder_structure = analyzer.analyze_directory(path)
File "C:\Users\...\src\document_analyzer\analyzer.py", line 69, in analyze_directory
raise RuntimeError(f"Failed to generate image embeddings: {str(e)}")
RuntimeError: Failed to generate image embeddings: The size of tensor a (1203) must match the size of tensor b (77) at non-singleton dimension 1
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Imbetten der Bildeinbettungen nicht erzeugen: Die Größe des Tensors A (1246) muss mit der Größe des Tensors B (77) in de

Last post by Anonymous « 05 Mar 2025, 07:33
Posted in Python

by Anonymous » 05 Mar 2025, 07:33 » in Python

Ich verwende ein Modell für Satztransformatoren, um Einbetten von Bilddateien (PIL-Image-Datei) zu erstellen. Es gibt jedoch den Fehler im Titel. Ich habe eine Reihe von Dingen versucht, um es zu...

0 Replies

25 Views

Last post by Anonymous
05 Mar 2025, 07:33
Erstellen Sie native Bildeinbettungen und führen Sie dann eine Ähnlichkeitssuche mit Text durch

Last post by Guest « 03 Jan 2025, 08:31
Posted in Python

by Guest » 03 Jan 2025, 08:31 » in Python

Ist es generell möglich, Bildeinbettungen direkt (ohne zusätzlichen Text) zu erstellen und in einer Datenbank zu speichern? Ziel ist es, den Inhalt der Bilder später über eine Texteingabe im Frontend...

0 Replies

22 Views

Last post by Guest
03 Jan 2025, 08:31
Aufrufen mehrerer Funktionen auf mehreren Zeilen eines Tensors

Last post by Anonymous « 25 Feb 2025, 23:13
Posted in Python

by Anonymous » 25 Feb 2025, 23:13 » in Python

import torch

x = torch.ones(3, 3)

factors =
indices = torch.tensor( )

def multiply_row_by_factor(row, idx):
return factors (row)

result = torch.vmap(multiply_row_by_factor, in_dims=(0, 0))(x,...

0 Replies

17 Views

Last post by Anonymous
25 Feb 2025, 23:13
Ist es möglich, einen Excel mit Slicers mit Python zu erzeugen? Und mit der XLSXWriter -Bibliothek?

Last post by Anonymous « 21 May 2025, 14:25
Posted in Python

by Anonymous » 21 May 2025, 14:25 » in Python

Ich möchte in der Excel-Blatt aus Python-Code Slicer (Zugriff auf Tasten auf Spaltenfilteroptionen) einbeziehen. import xlsxwriter

workbook = xlsxwriter.Workbook('tables.xlsx')
worksheet =...

0 Replies

12 Views

Last post by Anonymous
21 May 2025, 14:25
Was ist der schnellste Weg, um alle N-Bit-Graucodes mit Numpy zu erzeugen?

Last post by Anonymous « 12 Mar 2025, 02:07
Posted in Python

by Anonymous » 12 Mar 2025, 02:07 » in Python

My goal is to create images using gray codes, an example would be this:

It is all modulo 64 groups in gray codes in polar form.
Now of Natürlich kenne ich die einfache Zuordnung n ^ (n >> 1) aus...

0 Replies

15 Views

Last post by Anonymous
12 Mar 2025, 02:07

Return to “Python”