Ich erstelle eine Azure Retrieval-Augmented Generation (RAG)-Anwendung mit Azure Cognitive Search, um in JSON-Dateien gespeicherte Daten zu Auszubildenden zu verarbeiten. Hier ist der allgemeine Arbeitsablauf:
Datenstruktur: Jede JSON-Datei stellt einen Plan dar (z. B. free-trainees-project-data. json, premium-trainees-project-data.json). Unten finden Sie eine Beispielstruktur:
[
{
"overview": "The user John Doe (UUID: 00000000-0000-0000-0000-000000000001) has subscribed to the plan 'Free' starting from 2024-07-08 00:00:00.0. The user isn't associated with any tracks or projects.",
"user_name": "John Doe",
"user_uuid": "00000000-0000-0000-0000-000000000001",
"plan_start_date": "2024-07-08 00:00:00.0",
"plan_name": "Free",
"tracks": []
},
{
"overview": "The user Jane Smith (UUID: 00000000-0000-0000-0000-000000000002) has subscribed to the plan 'Free' starting from 2024-02-21 00:00:00.0. The user is associated with the following skill tracks: Track 'Quality Assurance' includes the following projects: [Project 'Sample Project A' (UUID: 00000000-0000-0000-0000-000000000003) has tags [[\"TESTNG\",\"Postman\"]], difficulty level 'intermediate', and is currently 'In Progress'. It is led by Team Lead ABC, started on 2024-06-06 08:14:06.758, and ended on Ongoing. ]",
"user_name": "Jane Smith",
"user_uuid": "00000000-0000-0000-0000-000000000002",
"plan_start_date": "2024-02-21 00:00:00.0",
"plan_name": "Free",
"tracks": [
{
"track_name": "Quality Assurance",
"projects": [
{
"project_name": "Sample Project A",
"project_uuid": "00000000-0000-0000-0000-000000000003",
"project_tags": "[\"TESTNG\",\"Postman\"]",
"team_lead": "Team Lead ABC",
"joining_date": "2024-06-06 08:14:06.758",
"project_difficulty": "intermediate",
"project_status": "In Progress",
"updated_by": "Team Lead ABC",
"exit_date": "Ongoing"
}
]
}
]
},
...
]
Azure-Workflow:
Laden Sie JSON-Dateien in einen Azure Storage-Container hoch.
Konfigurieren Sie Azure Cognitive Search so, dass das JSON-Array im JSON-Array-Analysemodus analysiert wird.< /p>
Übersicht vektorisieren Feld unter Verwendung des Modells text-embedding-ada-003.
Problem: Abfragen geben unzuverlässige Ergebnisse zurück Ergebnisse. Beispiel:
Abfrage: „Benutzer im Starter-Plan ohne Tracks oder Projekte auflisten“
Erwartet: Eine Liste von Benutzern, die diese Bedingung erfüllen.
Tatsächlich: Falsche Benutzer oder eine unvollständige Liste.
Abfrage: „Zählen Sie die Anzahl der Benutzer, die den kostenlosen Plan abonniert haben.“
Erwartet: Genaue Zählung.
Tatsächlich: Es wird eine falsche Anzahl zurückgegeben.
Schritte Aufgenommen:
Überprüfte JSON-Struktur und -Analyse Modus.
Verwendete Übersicht als Vektorisierungsziel.
Überprüfte die Verbindung zwischen Azure Search und OpenAI-Diensten.
Fragen:
Strukturiere ich meine JSON-Daten oder den Vektorisierungsprozess? falsch?
Wie kann ich die Abfragegenauigkeit für solche Anwendungsfälle verbessern?
Ich erstelle eine Azure Retrieval-Augmented Generation (RAG)-Anwendung mit Azure Cognitive Search, um in JSON-Dateien gespeicherte Daten zu Auszubildenden zu verarbeiten. Hier ist der allgemeine Arbeitsablauf: [list] [*][b]Datenstruktur[/b]: Jede JSON-Datei stellt einen Plan dar (z. B. free-trainees-project-data. json, premium-trainees-project-data.json). Unten finden Sie eine Beispielstruktur: [/list] [code][ { "overview": "The user John Doe (UUID: 00000000-0000-0000-0000-000000000001) has subscribed to the plan 'Free' starting from 2024-07-08 00:00:00.0. The user isn't associated with any tracks or projects.", "user_name": "John Doe", "user_uuid": "00000000-0000-0000-0000-000000000001", "plan_start_date": "2024-07-08 00:00:00.0", "plan_name": "Free", "tracks": [] }, { "overview": "The user Jane Smith (UUID: 00000000-0000-0000-0000-000000000002) has subscribed to the plan 'Free' starting from 2024-02-21 00:00:00.0. The user is associated with the following skill tracks: Track 'Quality Assurance' includes the following projects: [Project 'Sample Project A' (UUID: 00000000-0000-0000-0000-000000000003) has tags [[\"TESTNG\",\"Postman\"]], difficulty level 'intermediate', and is currently 'In Progress'. It is led by Team Lead ABC, started on 2024-06-06 08:14:06.758, and ended on Ongoing. ]", "user_name": "Jane Smith", "user_uuid": "00000000-0000-0000-0000-000000000002", "plan_start_date": "2024-02-21 00:00:00.0", "plan_name": "Free", "tracks": [ { "track_name": "Quality Assurance", "projects": [ { "project_name": "Sample Project A", "project_uuid": "00000000-0000-0000-0000-000000000003", "project_tags": "[\"TESTNG\",\"Postman\"]", "team_lead": "Team Lead ABC", "joining_date": "2024-06-06 08:14:06.758", "project_difficulty": "intermediate", "project_status": "In Progress", "updated_by": "Team Lead ABC", "exit_date": "Ongoing" } ] } ] }, ...
] [/code] [list] [*][b]Azure-Workflow[/b]:
[*] Laden Sie JSON-Dateien in einen Azure Storage-Container hoch.
[*]Konfigurieren Sie Azure Cognitive Search so, dass das JSON-Array im JSON-Array-Analysemodus analysiert wird.< /p>
[*]Übersicht vektorisieren Feld unter Verwendung des Modells text-embedding-ada-003.
[*][b]Problem[/b]: Abfragen geben unzuverlässige Ergebnisse zurück Ergebnisse. Beispiel:
[*]Abfrage: „Benutzer im Starter-Plan ohne Tracks oder Projekte auflisten“
[*]Erwartet: Eine Liste von Benutzern, die diese Bedingung erfüllen.
[*] Tatsächlich: Falsche Benutzer oder eine unvollständige Liste.
[*]Abfrage: „Zählen Sie die Anzahl der Benutzer, die den kostenlosen Plan abonniert haben.“
[*]Erwartet: Genaue Zählung.
Tatsächlich: Es wird eine falsche Anzahl zurückgegeben.
[/list] [b]Schritte Aufgenommen:[/b] [list] [*]Überprüfte JSON-Struktur und -Analyse Modus. [*]Verwendete Übersicht als Vektorisierungsziel. [*]Überprüfte die Verbindung zwischen Azure Search und OpenAI-Diensten.[/list] [b]Fragen:[/b] [list] [*]Strukturiere ich meine JSON-Daten oder den Vektorisierungsprozess? falsch? [*]Wie kann ich die Abfragegenauigkeit für solche Anwendungsfälle verbessern? [/list] [b]Umgebungsdetails:[/b] 3. Azure Cognitive Search mit OpenAI-Integration. 4. Modell: text-embedding-ada-003. [b]Mein Code:[/b] [code] @Override public Flux getOpenAIAsyncClientChatStream( ModelConfiguration modelConfiguration, List messages) {
Ich erstelle eine Azure Retrieval-Augmented Generation (RAG)-Anwendung mit Azure Cognitive Search, um in JSON-Dateien gespeicherte Daten zu Auszubildenden zu verarbeiten. Hier ist der allgemeine...
Ich wollte eine Azure Cognitive Search erstellen, um den Kurskatalog mithilfe von Vektoren abzufragen. Ich habe einen Pandas-Datenrahmen mit dem Namen „courses_pd“ und er hat zwei Spalten, „Inhalt“...
I added a RAG AI assistant using AWS Bedrock to our website so customers can ask questions and get answers about the four products we sell. Jeder hat die gleichen zwei Dokumente wie:...
Wir verwenden Nhibernate v4.0.30319 und wir verwenden Flushmode.Commit. Betrachten wir eine Beispiel-Employee-Tabelle mit der IsActive-Spalte in der Datenbank.
In einer der Transaktionen rufen wir...