Kann mir jemand helfen, Text aus einer PDF-Datei mit einem bestimmten Bereich von Seitenzahlen zu extrahieren (z. B. TexPython

Python-Programme
Guest
 Kann mir jemand helfen, Text aus einer PDF-Datei mit einem bestimmten Bereich von Seitenzahlen zu extrahieren (z. B. Tex

Post by Guest »

import PyPDF2
pdfFileObj = open('C:\\sem1\\691-project\\Dataset\\Maths\\A Spiral Workbook for Discrete Mathematics.pdf', 'rb')
pdfReader = PyPDF2.PdfReader(pdfFileObj)
out_file = open('C:\\sem1\\691-project\\Dataset\\Maths\\A Spiral Workbook for Discrete Mathematics.txt', 'a')
for pageObj in pdfReader.pages:
page_text = pageObj.extract_text()
print(page_text)
out_file.write(page_text)
out_file.close()
pdfFileObj.close()
< /code>
Ich bin in der Lage, Text aus dem gesamten Buch zu extrahieren. Vielmehr brauche ich Text nur aus ausgewählten Seitenzahlen oder ausgewählten Bereichen.

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post