Problem 1
Ich möchte die RAGFlow RAG-Suchgeschwindigkeit und die Chunk-Einbettungsgeschwindigkeit verbessern. Derzeit dauert die Einbettung pro PDF fast eine Minute. Wenn ein PDF beispielsweise 12 Seiten umfasst, dauert die Aufteilung fast 1,5 Minuten. Ich habe den Chunking-Typ in eine andere Methode geändert, z. B. manuell, Buch, Fragen und Antworten. Ich erhalte nur Änderungen hinsichtlich der Anzahl der Chunks.
Problem 2
Nach dem Chunking dauert die RAG-Suche fast 20 Sekunden. Selbst wenn es sich um die erste Sitzung mit erstem Gespräch handelt, dauert es fast 1 Minute. Ich muss auch diese RAG-Suchgeschwindigkeit verbessern. Dafür habe ich verschiedene Kombinationen wie das Ändern der Temperatur, oberen N, oberen K usw. ausprobiert, aber keine Änderungen.
Für die Einbettung verwenden wir maxba-embedd-largei:335m und für Chat gpt-oss:20b. Beide Modelle werden lokal bereitgestellt.
Verbessern Sie die RAGFlow RAG-Suche und Chunk-Einbettungen ⇐ Python
-
- Similar Topics
- Replies
- Views
- Last post
-
-
Wie kann man Text für Einbettungen in einer RAG-Pipeline richtig aufteilen?
by Anonymous » » in Python - 0 Replies
- 0 Views
-
Last post by Anonymous
-
Mobile version