Elasticsearch-Volldokument- oder seitenweise TextindizierungC#

Ein Treffpunkt für C#-Programmierer
Guest
 Elasticsearch-Volldokument- oder seitenweise Textindizierung

Post by Guest »

Ich baue eine Webanwendung auf .Net und PostgreSql.
Eine der Anforderungen besteht darin, viele Dokumente hochzuladen, etwa 200 davon, die das können in einigen Formaten wie pdf, doc, rtf, odt sein.
Ich speichere sie derzeit in Elasticsearch.
Also, wenn ein Dokument hochgeladen wird Ich verwende dazu das Toxy-Nuget-Paket Extrahieren Sie den gesamten Dokumenttext und indizieren Sie ihn in Elasticsearch.
Die Dateien können maximal 50 MB groß sein und es könnte eine große Anzahl von Dokumenten mit etwa 100–200 Seiten sein.Derzeit funktioniert es gut, aber ich muss als Ergebnis auch den Ort/die Seite zurückgeben, an dem die Suche gefunden wurde.
Irgendwelche Vorschläge oder Erkenntnisse, was gut wäre Ansatz, dies zu tun?
Was ist außerdem die beste Vorgehensweise: Volltextindizierung oder teilweise/seitenweise Indizierung von Dokumenten in ElasticSearch.

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post