Rekursive Suche nach Dateien auf einer Website (Python)

Rekursive Suche nach Dateien auf einer Website (Python) ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Guest

Rekursive Suche nach Dateien auf einer Website (Python)

Report
Quote

Post by Guest » 05 Jan 2025, 14:34

Ich versuche zu bestätigen, ob es möglich ist, eine Website rekursiv zu durchsuchen, einschließlich Website-Links (Unterseiten) und Dateien von auf den Unterseiten eingebetteten Links herunterzuladen. Als Basistest versuche ich festzustellen, wie das Vorhandensein von PDFs auf der folgenden Website (https://file-examples.com/index.php/sam ... -download/) überprüft werden kann Sie können diese PDFs über die zugehörigen Links herunterladen.
Ich bin der Meinung, dass dies mit den Requests und BeautifulSoup-Bibliotheken in Python möglich sein sollte, kann es aber scheinbar nicht herausfinden. Hier ist der Code, den ich verwende, um zu versuchen, die PDFs lokal zu speichern:

Code: Select all

import shutil
from bs4 import BeautifulSoup
import requests
import os
from urllib.parse import urlparse

url = 'https://file-examples.com/index.php/sample-documents-download/sample-pdf-download/'
for page in range(2):
r = requests.get(url.format(page))
soup = BeautifulSoup(r.content, "html.parser")
for link in soup.select("h3[class='sv-card-title']>a"):
r = requests.get(link.get("href"), stream=True)
r.raw.decode_content = True
with open(link.text+'.pdf', 'wb') as f:
shutil.copyfileobj(r.raw, f)

1736084091

Guest

Ich versuche zu bestätigen, ob es möglich ist, eine Website rekursiv zu durchsuchen, einschließlich Website-Links (Unterseiten) und Dateien von auf den Unterseiten eingebetteten Links herunterzuladen.  Als Basistest versuche ich festzustellen, wie das Vorhandensein von PDFs auf der folgenden Website (https://file-examples.com/index.php/sample-documents-download/sample-pdf-download/) überprüft werden kann Sie können diese PDFs über die zugehörigen Links herunterladen.
Ich bin der Meinung, dass dies mit den Requests und BeautifulSoup-Bibliotheken in Python möglich sein sollte, kann es aber scheinbar nicht herausfinden.  Hier ist der Code, den ich verwende, um zu versuchen, die PDFs lokal zu speichern:
[code]import shutil
from bs4 import BeautifulSoup
import requests
import os
from urllib.parse import urlparse

url = 'https://file-examples.com/index.php/sample-documents-download/sample-pdf-download/'
for page in range(2):
r = requests.get(url.format(page))
soup = BeautifulSoup(r.content, "html.parser")
for link in soup.select("h3[class='sv-card-title']>a"):
r = requests.get(link.get("href"), stream=True)
r.raw.decode_content = True
with open(link.text+'.pdf', 'wb') as f:
shutil.copyfileobj(r.raw, f)
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Rekursive Suche nach Dateien auf einer Website (Python)

Last post by Guest « 05 Jan 2025, 14:34
Posted in HTML

by Guest » 05 Jan 2025, 14:34 » in HTML

Ich versuche zu bestätigen, ob es möglich ist, eine Website rekursiv zu durchsuchen, einschließlich Website-Links (Unterseiten) und Dateien von auf den Unterseiten eingebetteten Links...

0 Replies

22 Views

Last post by Guest
05 Jan 2025, 14:34
Wie kann ich meinen Algorithmus zur Suche nach Tiefe zuerst für die Suche nach Dateien in meinem Datenträger-Laufwerk op

Last post by Anonymous « 17 Aug 2025, 02:28
Posted in Python

by Anonymous » 17 Aug 2025, 02:28 » in Python

Dieses kleine Skript findet Dateien und Ordner, indem sie rekursiv durch Verzeichnisstrukturen analysiert und die von ihnen gespeicherten Pfade zurückgegeben werden. Dies geschah, um einen Ordner auf...

0 Replies

21 Views

Last post by Anonymous
17 Aug 2025, 02:28
Wie kann ich meinen Algorithmus zur Suche nach Tiefe zuerst für die Suche nach Dateien in meinem Datenträger-Laufwerk op

Last post by Anonymous « 17 Aug 2025, 15:16
Posted in Python

by Anonymous » 17 Aug 2025, 15:16 » in Python

Dieses kleine Skript findet Dateien und Ordner, indem sie rekursiv durch Verzeichnisstrukturen analysiert und die von ihnen gespeicherten Pfade zurückgegeben werden. Dies geschah, um einen Ordner auf...

0 Replies

15 Views

Last post by Anonymous
17 Aug 2025, 15:16
Die Suche im AutoSuggest-Textfeld funktioniert mit Visual Studio, funktioniert aber nach dem Hochladen auf die Website n

Last post by Anonymous « 01 Jan 2025, 20:41
Posted in C#

by Anonymous » 01 Jan 2025, 20:41 » in C#

Ich möchte einen automatischen Vorschlag, wenn der Benutzer in TexBox1 etwas auf meiner Website durchsucht. Er schlägt automatisch Text aus meiner SQL-Datenbank unter TextBox1 vor. Ich verwende C#...

0 Replies

17 Views

Last post by Anonymous
01 Jan 2025, 20:41
Was könnte ein praktisches Beispiel sein, um den Betrieb der binären Suche und die lineare Suche zu beschreiben? [GESCHL

Last post by Anonymous « 19 May 2025, 07:29
Posted in Python

by Anonymous » 19 May 2025, 07:29 » in Python

Ich möchte, dass Ihre Hilfe ein praktisches Beispiel für diese Arten von Suchfaktoren findet, damit die Unterschiede und ihre Verwendungszwecke gesehen werden. # Búsqueda lineal
def lineal(arr,...

0 Replies

16 Views

Last post by Anonymous
19 May 2025, 07:29

Return to “Python”