Wie lade ich zusätzliche Episoden für eine Serie über den IMDB-Paginierungscontainer?
Posted: 08 Jan 2025, 10:09
Ich schreibe diesen Code:
Ich möchte Daten wie Episoden-ID und -Namen für alle 80 Episoden erhalten, aber wenn ich diesen Code ausführe, erhalte ich nur 50 Episoden und andere stehen unter der Paginierung „30 weitere“.
Ich habe viele Dinge ausprobiert, wie zum Beispiel den HTML-Code der Website zu entdecken und die Klasse zu finden
aber ich konnte keine Möglichkeit finden, alle Daten abzurufen
Code: Select all
import requests
from bs4 import BeautifulSoup
url = 'https://www.imdb.com/title/tt5189554/episodes/'
headers = {
"Connection": "keep-alive",
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 "
"(KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36"
}
response = requests.get(url,headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')
Ich habe viele Dinge ausprobiert, wie zum Beispiel den HTML-Code der Website zu entdecken und die Klasse zu finden
Code: Select all
30 more