Verbessern Sie die RAGFlow RAG-Suche und Chunk-EinbettungenPython

Python-Programme
Anonymous
 Verbessern Sie die RAGFlow RAG-Suche und Chunk-Einbettungen

Post by Anonymous »

Problem 1
Ich möchte die RAGFlow RAG-Suchgeschwindigkeit und die Chunk-Einbettungsgeschwindigkeit verbessern. Derzeit dauert die Einbettung pro PDF fast eine Minute. Wenn ein PDF beispielsweise 12 Seiten umfasst, dauert die Aufteilung fast 1,5 Minuten. Ich habe den Chunking-Typ in eine andere Methode geändert, z. B. manuell, Buch, Fragen und Antworten. Ich erhalte nur Änderungen hinsichtlich der Anzahl der Chunks.
Problem 2
Nach dem Chunking dauert die RAG-Suche fast 20 Sekunden. Selbst wenn es sich um die erste Sitzung mit erstem Gespräch handelt, dauert es fast 1 Minute. Ich muss auch diese RAG-Suchgeschwindigkeit verbessern. Dafür habe ich verschiedene Kombinationen wie das Ändern der Temperatur, oberen N, oberen K usw. ausprobiert, aber keine Änderungen.
Für die Einbettung verwenden wir maxba-embedd-largei:335m und für Chat gpt-oss:20b. Beide Modelle werden lokal bereitgestellt.

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post