Verbessern Sie die RAGFlow RAG-Suche und Chunk-Einbettungen

Verbessern Sie die RAGFlow RAG-Suche und Chunk-Einbettungen ⇐ Python

1 post • Page 1 of 1

Anonymous

Verbessern Sie die RAGFlow RAG-Suche und Chunk-Einbettungen

Report
Quote

Post by Anonymous » 06 Jan 2026, 06:21

Problem 1
Ich möchte die RAGFlow RAG-Suchgeschwindigkeit und die Chunk-Einbettungsgeschwindigkeit verbessern. Derzeit dauert die Einbettung pro PDF fast eine Minute. Wenn ein PDF beispielsweise 12 Seiten umfasst, dauert die Aufteilung fast 1,5 Minuten. Ich habe den Chunking-Typ in eine andere Methode geändert, z. B. manuell, Buch, Fragen und Antworten. Ich erhalte nur Änderungen hinsichtlich der Anzahl der Chunks.
Problem 2
Nach dem Chunking dauert die RAG-Suche fast 20 Sekunden. Selbst wenn es sich um die erste Sitzung mit erstem Gespräch handelt, dauert es fast 1 Minute. Ich muss auch diese RAG-Suchgeschwindigkeit verbessern. Dafür habe ich verschiedene Kombinationen wie das Ändern der Temperatur, oberen N, oberen K usw. ausprobiert, aber keine Änderungen.
Für die Einbettung verwenden wir maxba-embedd-largei:335m und für Chat gpt-oss:20b. Beide Modelle werden lokal bereitgestellt.

1767676896

Anonymous

[b]Problem 1[/b]
Ich möchte die RAGFlow RAG-Suchgeschwindigkeit und die Chunk-Einbettungsgeschwindigkeit verbessern. Derzeit dauert die Einbettung pro PDF fast eine Minute. Wenn ein PDF beispielsweise 12 Seiten umfasst, dauert die Aufteilung fast 1,5 Minuten. Ich habe den Chunking-Typ in eine andere Methode geändert, z. B. manuell, Buch, Fragen und Antworten. Ich erhalte nur Änderungen hinsichtlich der Anzahl der Chunks.
[b]Problem 2[/b]
Nach dem Chunking dauert die RAG-Suche fast 20 Sekunden. Selbst wenn es sich um die erste Sitzung mit erstem Gespräch handelt, dauert es fast 1 Minute. Ich muss auch diese RAG-Suchgeschwindigkeit verbessern. Dafür habe ich verschiedene Kombinationen wie das [url=viewtopic.php?t=12045]Ändern[/url] der Temperatur, oberen N, oberen K usw. ausprobiert, aber keine Änderungen.
Für die Einbettung verwenden wir maxba-embedd-largei:335m und für Chat gpt-oss:20b. Beide Modelle werden lokal bereitgestellt.

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie kann man Text für Einbettungen in einer RAG-Pipeline richtig aufteilen?

Last post by Anonymous « 07 Jan 2026, 11:56
Posted in Python

by Anonymous » 07 Jan 2026, 11:56 » in Python

Ich verwende Einbettungen für die semantische Suche. Wie wirken sich Blockgröße und Überlappung auf Genauigkeit und Leistung aus und wie sollte ich sie auswählen?

0 Replies

0 Views

Last post by Anonymous
07 Jan 2026, 11:56
Chunk-Größe immer 4 im Multi-Thread-Schritt, obwohl die Chunk-Größe auf 6 eingestellt ist

Last post by Anonymous « 09 Sep 2025, 13:27
Posted in Java

by Anonymous » 09 Sep 2025, 13:27 » in Java

Ich verwende Spring Batch 5.2.2 mit einem kugelorientierten Schritt und einer Multi-Thread-Ausführung. Here’s my setup:

Chunk size: 6 (new SimpleCompletionPolicy(6))
Thread pool: corePoolSize=5,...

0 Replies

37 Views

Last post by Anonymous
09 Sep 2025, 13:27
Behält das Hinzufügen einer Reihe von Nullen zu Wort -Einbettungen die semantische Bedeutung bei?

Last post by Anonymous « 12 Jul 2025, 21:08
Posted in Python

by Anonymous » 12 Jul 2025, 21:08 » in Python

Ich habe vor heruntergeladene 300-dimensionale Vektoren in 768 dimensionale Vektoren analysiert, indem sie einfach weitere 468 Nullen hs. Ich habe dies getan, damit es mit der Abfrage-, Schlüssel-...

0 Replies

47 Views

Last post by Anonymous
12 Jul 2025, 21:08
So streamen Sie Audio aus Google Cloud -Speicher in Stücken und konvertieren Sie jeden Chunk in WAV für Whisper -Transkr

Last post by Anonymous « 25 Jul 2025, 16:13
Posted in Python

by Anonymous » 25 Jul 2025, 16:13 » in Python

Ich arbeite an einem Projekt, bei dem ich mit dem Flüstermodell von OpenAI in einem Google Cloud -Speicher -Bucket Audio transkribieren muss. Das Audio wird im Webm-Format mit OPUS-Codierung...

0 Replies

22 Views

Last post by Anonymous
25 Jul 2025, 16:13
Was ist der beste Weg, um die Chunk -Größe zu kontrollieren, die von XML -iterativen Parsers in Python verwendet wird, o

Last post by Anonymous « 25 Feb 2025, 09:25
Posted in Python

by Anonymous » 25 Feb 2025, 09:25 » in Python

Frage: Was ist der beste Weg, um die Chunk -Größe zu kontrollieren, die von Standard -XML -iterativen Parsers in Python verwendet wird? Chunk -Größe zur Verwendung durch iterative Parser, was ist...

0 Replies

40 Views

Last post by Anonymous
25 Feb 2025, 09:25

Return to “Python”