Erstens gibt es beim Versuch, den HTML-Quellcode der Website von „requests“ oder „urllib“ abzurufen, einen SSl:certificate_verify_error, den ich umgangen habe, indem ich den Verifizierungsparameter für „requests.get()“ auf „False“ gesetzt oder einen nicht überprüften Kontext für „urllib“ erstellt habe (eine schnelle Lösung). tbody-Tags, aber mein Befehl „requests.get()“ liefert mir nur diese Tags und nicht den Inhalt dazwischen. Ich bin sehr neu im Schaben, eine kleine Anleitung wäre dankbar. ty
Code: Select all
from urllib.request import urlopen as uReq
import ssl
from bs4 import BeautifulSoup as soup
my_url = 'https://www.eraktkosh.in/BLDAHIMS/bloodbank/campSchedule.cnt'
sp_context = ssl._create_unverified_context()
uClient = uReq(my_url,context=sp_context)
page_html = uClient.read()
uClient.close()
page_soup=soup(page_html,"html.parser")
table = page_soup.find('tbody')
print (table) #this outputs ""
trow = table.find('tr')
print (trow) #this outputs "None"
Code: Select all
Code: Select all
None
Mobile version