Azure Documen Intelligence Python SDK trennen keine Seiten

Azure Documen Intelligence Python SDK trennen keine Seiten ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Azure Documen Intelligence Python SDK trennen keine Seiten

Post by Anonymous » 05 Mar 2025, 08:17

Beim Versuch, Inhalte aus einer MS -Word -.docx -Datei mithilfe von Azure Document Intelligence zu extrahieren, erwartete ich, dass die zurückgegebene Antwort ein Seitenelement für jede Seite im Dokument enthält, und dass jede dieser Seitenelemente mehrere Zeilen in Übereinstimmung mit der Dokumentation enthält.

Code: Select all

None

) Zeilen und das gesamte Dokumentinhalt als eine Liste von Wörtern. PrettyPrint-Override ">

Code: Select all

from azure.core.credentials import AzureKeyCredential
from azure.ai.documentintelligence import DocumentIntelligenceClient
from azure.ai.documentintelligence.models import DocumentAnalysisFeature, AnalyzeResult, AnalyzeDocumentRequest

def main():
client = DocumentIntelligenceClient(
'MY ENDPOINT',
AzureKeyCredential('MY KEY')
)

document = 'small_test_document.docx'

with open(document, "rb") as f:
poller = client.begin_analyze_document(
"prebuilt-layout",
analyze_request=f,
content_type="application/octet-stream"
)
result = poller.result()

print(f'Found {len(result.pages)} page(s)')
for page in result.pages:
print(f'Page #{page.page_number}')
print(f'  {page.lines=}')
print(f'  {len(page.words)=}')

if __name__ == '__main__':
main()
< /code>
Erwartete Ausgabe: < /p>
Found 2 page(s)
Page #1
page.lines=6
len(page.words)=58
Page #2
page.lines=1
len(page.words)=8
< /code>
Tatsächliche Ausgabe: < /p>
Found 1 page(s)
Page #1
page.lines=None
len(page.words)=66

Meine Frage lautet: Warum und was soll ich anders machen, um die erwartete Ausgabe zu erhalten?

1741159026

Anonymous

Beim Versuch, Inhalte aus einer MS -Word -.docx -Datei mithilfe von Azure Document Intelligence zu extrahieren, erwartete ich, dass die zurückgegebene Antwort ein Seitenelement für jede Seite im Dokument enthält, und dass jede dieser Seitenelemente mehrere Zeilen in Übereinstimmung mit der Dokumentation enthält.[code]None[/code]) Zeilen und das gesamte Dokumentinhalt als eine Liste von Wörtern. PrettyPrint-Override ">[code]from azure.core.credentials import AzureKeyCredential
from azure.ai.documentintelligence import DocumentIntelligenceClient
from azure.ai.documentintelligence.models import DocumentAnalysisFeature, AnalyzeResult, AnalyzeDocumentRequest

def main():
client = DocumentIntelligenceClient(
'MY ENDPOINT',
AzureKeyCredential('MY KEY')
)

document = 'small_test_document.docx'

with open(document, "rb") as f:
poller = client.begin_analyze_document(
"prebuilt-layout",
analyze_request=f,
content_type="application/octet-stream"
)
result = poller.result()

print(f'Found {len(result.pages)} page(s)')
for page in result.pages:
print(f'Page #{page.page_number}')
print(f'  {page.lines=}')
print(f'  {len(page.words)=}')

if __name__ == '__main__':
main()
< /code>
Erwartete Ausgabe: < /p>
Found 2 page(s)
Page #1
page.lines=6
len(page.words)=58
Page #2
page.lines=1
len(page.words)=8
< /code>
Tatsächliche Ausgabe: < /p>
Found 1 page(s)
Page #1
page.lines=None
len(page.words)=66
[/code]
Meine Frage lautet: Warum und was soll ich anders machen, um die erwartete Ausgabe zu erhalten?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Android Studio Fehlerbehandlung SDK -Verarbeitung. Diese Version versteht nur SDK XML -Versionen bis zu 3, aber eine SDK

Last post by Guest « 10 Feb 2025, 07:59
Posted in Android

by Guest » 10 Feb 2025, 07:59 » in Android

meine Programmversionen aus Flutterterminal:
Flutter 3.27.3 • channel stable •
Framework • revision
c519ee916e (3 weeks ago) • 2025-01-21 10:32:23 -0800 Engine •
revision e672b006cb Tools • Dart...

0 Replies

35 Views

Last post by Guest
10 Feb 2025, 07:59
Python Plotly – benutzerdefinierte Daten, die alle Spalten am ersten Index speichern und durch Kommas trennen

Last post by Guest « 11 Jan 2025, 07:40
Posted in Python

by Guest » 11 Jan 2025, 07:40 » in Python

Immer wenn ich mehr als eine Spalte zu meinen benutzerdefinierten Daten hinzufüge, werden die Daten im ersten Index (benutzerdefinierte Daten ) gespeichert und durch Kommas getrennt, anstatt sie auf...

0 Replies

20 Views

Last post by Guest
11 Jan 2025, 07:40
Python Plotly – benutzerdefinierte Daten, die alle Spalten am ersten Index speichern und durch Kommas trennen

Last post by Guest « 11 Jan 2025, 11:53
Posted in Python

by Guest » 11 Jan 2025, 11:53 » in Python

Immer wenn ich mehr als eine Spalte zu meinen benutzerdefinierten Daten hinzufüge, werden die Daten im ersten Index (benutzerdefinierte Daten ) gespeichert und durch Kommas getrennt, anstatt sie auf...

0 Replies

17 Views

Last post by Guest
11 Jan 2025, 11:53
Lokales Ausführen der Python Azure-Funktion. Microsoft.Azure.WebJobs.Script: WorkerConfig für Laufzeit: Python nicht gef

Last post by Guest « 03 Jan 2025, 17:12
Posted in Python

by Guest » 03 Jan 2025, 17:12 » in Python

Es wurde versucht, eine Python-Azure-Funktion lokal auszuführen, aber es wird ein
„Microsoft.Azure.WebJobs.Script: WorkerConfig für Laufzeit: Python nicht gefunden“ angezeigt.
Das ist trotz ein venv...

0 Replies

37 Views

Last post by Guest
03 Jan 2025, 17:12
Python optimiert Realtime Speech-to-Text mit Azure SDK

Last post by Anonymous « 21 Mar 2025, 10:01
Posted in Python

by Anonymous » 21 Mar 2025, 10:01 » in Python

Hallo, ich versuche, mit Streamlit- und Azure Speech SDK eine Echtzeit-Rede zum Text zu erstellen. Verwendet Dateien, übergeben Sie den AudioTream und drehen Sie ihn asynchronisiert, haben jedoch...

0 Replies

16 Views

Last post by Anonymous
21 Mar 2025, 10:01

Return to “Python”