Programmiererforum

Gegenseitige Hilfe

Skip to content

Quick links
⛳ Active Topics ⤇
- by Anonymous Today, 03:18 Konvertierung zwischen Typen 'signiertes Zeichen' zu 'uint32_t' und von 'uint16_t' zu 'uint32_t' in CPP liefert verschie View the latest post
- by Anonymous Today, 03:11 JQuery anzeigen "Standard" -Wählen Sie den Wert bei der Änderung der ersten Auswahl aus MySQL -Werten aus View the latest post
- by Anonymous Today, 03:04 Langsame PHP/MySQL -Skriptausführung View the latest post
- by Anonymous Today, 03:03 Die React -Komponente kann erfolgreich erfolgreich in DOM ausgegeben werden View the latest post
- by Anonymous Today, 03:00 Httpclient Post -Anfrage mit Header und Körper View the latest post
- by Anonymous Today, 03:00 So rufen Sie Länge, Breite, Höhe, Fläche, Volumen einer Box -Klasse mit Boxtest auf View the latest post
- by Anonymous Today, 02:52 Ist es möglich, ein neues Mitglied über Telegram -API hinzuzufügen, nachdem ich den Chat -Anfrage von Benutzern, die sic View the latest post
- by Anonymous Today, 02:46 Ersetzen Sie Punkte durch Commas Onkeyup durch JQuery View the latest post
- by Anonymous Today, 02:36 Was sind die Verhaltensdetails des EF Core Query -Cache? View the latest post
- by Anonymous Today, 02:36 Wie kann ich überprüfen, ob die Nachricht erfolgreich in Appium gesendet wurde? View the latest post
- by Anonymous Today, 02:35 Komponist: So verwenden Sie lokale Symlinks für Pakete in der Entwicklung, aber Git -Versionen in der Produktion View the latest post
- by Anonymous Today, 02:35 React Native Flatlist React Anpassen Sie die SnaptoInterval -Animationsgeschwindigkeit an View the latest post
- by Anonymous Today, 02:30 TypeError: Objekt vom Typ Relativeby ist nicht json serialisierbar mit Find_elements mit relativen Locators View the latest post
- by Anonymous Today, 02:29 Uibutton wird unter bestimmten Umständen nicht ermöglichen View the latest post
- by Anonymous Today, 02:29 Das Attribut von AccountExpires nicht aus Active Directory mit Spring LDAP lesen kann View the latest post
- by Anonymous Today, 02:28 Warum kann ich mit int> +32767 arbeiten? View the latest post
- by Anonymous Today, 02:24 Fokusanforderung für Komponenten in sichtbarem Rahmen verweigert [geschlossen] View the latest post
- by Anonymous Today, 02:20 Wie kann man die Halbfloatnummern richtig rassen? View the latest post
- by Anonymous Today, 02:18 JAXB (javax.xml.bind) wird nicht mit dem -Element (Geschwister bindend) verschachtelt. Wie soll ich kommentieren? View the latest post
- by Anonymous Today, 02:11 FATFS - kann nicht formatiert werden, FR_MKFS_ABORTED View the latest post
Login
Register

Forum Board index Programmierung Python
Advanced search
Search

Skalierung von Lag -QA mit großen Dokumenten, Tischen und 30k+ Stücken (keine Langchain)

Post a reply

Post icon:: None

Username:

Subject:

Font colour:

Smilies

View more smilies

BBCode is ON
[img] is ON
[flash] is OFF
[url] is ON
Smilies are ON

Topic review

Options

Disable BBCode

Disable smilies

Do not automatically parse URLs

Expand view Topic review: Skalierung von Lag -QA mit großen Dokumenten, Tischen und 30k+ Stücken (keine Langchain)

Quote Anonymous

by Anonymous » 02 Jun 2025, 18:30

Ich baue ein QA-System auf rappenbasiertem Dokument mit Python (no Langchain), Lama (50K-Kontext), PostgreSQL mit PGVector und Docling for Parsing. Benutzer können bis zu 10 große Dokumente hochladen (jeweils 300 Seiten), die häufig zahlreiche Tabellen und Diagramme enthalten. Chunk zur Verbesserung der rensiver, aber:
Es ist zu teuer, LLM-Zusammenfassungen für alle 30k-Abschnitte zu erzeugen. bewährte Strategien zu:
Präzision beim ersten Abrufen in der Skala
tabel-haavy-Inhalt effektiver
Kosten reduzieren und gleich

Ich baue ein QA-System auf rappenbasiertem Dokument mit Python (no Langchain), Lama (50K-Kontext), PostgreSQL mit PGVector und Docling for Parsing. Benutzer können bis zu 10 große Dokumente hochladen (jeweils 300 Seiten), die häufig zahlreiche Tabellen und Diagramme enthalten. Chunk zur Verbesserung der rensiver, aber:
Es ist zu teuer, LLM-Zusammenfassungen für alle 30k-Abschnitte zu erzeugen. bewährte Strategien zu:
Präzision beim ersten Abrufen in der Skala
tabel-haavy-Inhalt effektiver
Kosten reduzieren und gleich

Forum Board index
All times are UTC+02:00
Delete cookies

Powered by phpBB® Forum Software © phpBB Limited

Time: 0.046s | Peak Memory Usage: 2.78 MiB | GZIP: On