Das CLIP-Modell aus dem Modul „open_clip“ gibt eine einzelne Einbettung für 77 Token zurück

Das CLIP-Modell aus dem Modul „open_clip“ gibt eine einzelne Einbettung für 77 Token zurück ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Das CLIP-Modell aus dem Modul „open_clip“ gibt eine einzelne Einbettung für 77 Token zurück

Report
Quote

Post by Anonymous » 14 Jan 2026, 20:37

Ich verwende das Modul open_clip, um Texteinbettungen aus dem CLIP-Modell zu erhalten. Wenn ich eine Liste einer einzelnen Textsequenz tokenisiere und sie an die Methode encode_text des Modells übergebe, erwarte ich Einbettungen mit der Form [77, 1024]. Ich erhalte jedoch eine Ausgabeform von [1, 1024].
Hier ist der relevante Code:

Code: Select all

import open_clip

model, preprocess_train, preprocess_val = open_clip.create_model_and_transforms('hf-hub:laion/CLIP-ViT-H-14-laion2B-s32B-b79K')
tokenizer = open_clip.get_tokenizer('hf-hub:laion/CLIP-ViT-H-14-laion2B-s32B-b79K')

text_inputs = ["cat"]
tokenized_inputs = tokenizer(text_inputs)
print(len(tokenized_inputs))  # This prints 77

text_embeddings = model.encode_text(tokenized_inputs)
print(text_embeddings.shape)  # This prints [1, 1024]

Übersehe ich etwas bei der Verwendung des Tokenizers oder der encode_text-Methode des Modells? Wie kann ich für jede der 77 Token-Sequenzen individuelle Einbettungen erhalten? Ich erwarte [77, 1024]

1768419458

Anonymous

Ich verwende das Modul open_clip, um Texteinbettungen aus dem CLIP-Modell zu erhalten. Wenn ich eine Liste einer einzelnen Textsequenz tokenisiere und sie an die Methode encode_text des Modells übergebe, erwarte ich Einbettungen mit der Form [77, 1024]. Ich erhalte jedoch eine Ausgabeform von [1, 1024].
Hier ist der relevante Code:
[code]import open_clip

model, preprocess_train, preprocess_val = open_clip.create_model_and_transforms('hf-hub:laion/CLIP-ViT-H-14-laion2B-s32B-b79K')
tokenizer = open_clip.get_tokenizer('hf-hub:laion/CLIP-ViT-H-14-laion2B-s32B-b79K')

text_inputs = ["cat"]
tokenized_inputs = tokenizer(text_inputs)
print(len(tokenized_inputs))  # This prints 77

text_embeddings = model.encode_text(tokenized_inputs)
print(text_embeddings.shape)  # This prints [1, 1024]
[/code]
Übersehe ich etwas bei der Verwendung des Tokenizers oder der encode_text-Methode des Modells? Wie kann ich für jede der 77 Token-Sequenzen individuelle Einbettungen erhalten? Ich erwarte [77, 1024]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

So erstellen Sie eine Einbettung für ein 4-Bit-quantisiertes Lama3-Modell mithilfe von Huggingface und Langchain

Last post by Anonymous « 12 Nov 2025, 12:05
Posted in Python

by Anonymous » 12 Nov 2025, 12:05 » in Python

Ich versuche, einen Rag mit Longchain und Huggingface zu machen,
from langchain_huggingface import HuggingFaceEmbeddings

model_name = unsloth/llama-3-8b-Instruct-bnb-4bit
model_kwargs = {'device':...

0 Replies

12 Views

Last post by Anonymous
12 Nov 2025, 12:05
Fehler "Name 'Clip' ist nicht definiert", wenn Clip mit FastSAM verwendet wird

Last post by Guest « 31 Jan 2025, 12:20
Posted in Python

by Guest » 31 Jan 2025, 12:20 » in Python

Ich verfolge einige Tutorials und habe den folgenden Code in Google Colab:
!pip install matplotlib==3.7.3
!git clone
!pip -q install -r FastSAM/requirements.txt

# install CLIP ----------
#!pip -q...

0 Replies

62 Views

Last post by Guest
31 Jan 2025, 12:20
Wie fahre ich Open-Webui als Python-App aus, ohne die Open-Webui.exe zu verwenden (was macht es wirklich?)

Last post by Anonymous « 30 Apr 2025, 21:48
Posted in Python

by Anonymous » 30 Apr 2025, 21:48 » in Python

Ich möchte Open-Webui als Python-App ausführen, wie sie mit Python xxx.py zu beginnen, aber ich sehe nicht wie. Es scheint alles in Python zu sein, aber es gibt einen mysteriösen (für mich)...

0 Replies

56 Views

Last post by Anonymous
30 Apr 2025, 21:48
Warum liest ZipArchiveEntry.Open().ReadAsync(...) weniger Bytes als ZipArchiveEntry.Open().Stream.Read(...)?

Last post by Guest « 20 Jan 2025, 14:18
Posted in C#

by Guest » 20 Jan 2025, 14:18 » in C#

Dies ist bei einem 400-MB-Archiv innerhalb von Sekunden abgeschlossen.
private static async Task ExtractFilesAsync(this ZipArchive archive, string destination, IProgress progress = null)
{
await...

0 Replies

75 Views

Last post by Guest
20 Jan 2025, 14:18
Das Chat-Modell gibt leeren Inhalt zurück, wenn ich eine verzögerte ToolMessage aus einem geplanten Rückruf einfüge

Last post by Anonymous « 26 Oct 2025, 11:12
Posted in Python

by Anonymous » 26 Oct 2025, 11:12 » in Python

Ich habe einen Planer, der später eine Tool-Funktion auslöst (außerhalb des ursprünglichen Benutzer-Modell-Austauschs).
Wenn die geplante Zeit kommt, sendet er eine ToolMessage zurück an das...

0 Replies

16 Views

Last post by Anonymous
26 Oct 2025, 11:12

Return to “Python”