by Guest » 24 Feb 2025, 04:52
Ich versuche, eine Site mit einer CloudFlare -Bot -Prüfung zu kratzen. Ich verwende derzeit < /p>
Code: Select all
import undetected_chromedriver as uc
und tragbare Chrome.exe
Dies scheint mich jedoch nicht durch den Bot -Check zu bringen. Jetzt werde ich es versuchen
Code: Select all
from seleniumbase import SB
< /code>
, aber mit < /p>
SB(uc=True,agent=user_agent_cycle,binary_location=chromedriver_path) as sb:
< /code>
am mit statemen es friert und alles was ich bekomme ist: < /p>
PS D:\code\Arcgis\FissionStaking2> python .\testbaseuc3.py
< /code>
Vorschläge? Hier ist der vollständige Code: < /p>
from seleniumbase import SB
chromedriver_path = "C:\\temp\\GoogleChromePortable64-132\\App\\Chrome-bin\\chrome.exe"
import random
import itertools
def user_agent_rotator(user_agent_list):
# shuffle the User Agent list
random.shuffle(user_agent_list)
# rotate the shuffle to ensure all User Agents are used
return itertools.cycle(user_agent_list)
# define Chrome options
#options = SB.ChromeOptions()
# create a User Agent list
user_agents = [
"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36",
"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36",
"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36",
# ... add more User Agents
]
# initialize a generator for the User Agent rotator
user_agent_cycle = user_agent_rotator(user_agents)
print(user_agent_cycle)
with SB(uc=True,agent=user_agent_cycle,binary_location=chromedriver_path) as sb:
print(1)
sb.open("https://google.com/ncr")
print(2)
sb.type('[title="Search"]', "SeleniumBase GitHub page\n")
print(3)
sb.click('[href*="github.com/seleniumbase/"]')
sb.save_screenshot_to_logs() # ./latest_logs/
print(sb.get_page_title())
Ich versuche, eine Site mit einer CloudFlare -Bot -Prüfung zu kratzen. Ich verwende derzeit < /p>
[code]import undetected_chromedriver as uc
[/code]
und tragbare Chrome.exe
Dies scheint mich jedoch nicht durch den Bot -Check zu bringen. Jetzt werde ich es versuchen
[code]from seleniumbase import SB
< /code>
, aber mit < /p>
SB(uc=True,agent=user_agent_cycle,binary_location=chromedriver_path) as sb:
< /code>
am mit statemen es friert und alles was ich bekomme ist: < /p>
PS D:\code\Arcgis\FissionStaking2> python .\testbaseuc3.py
< /code>
Vorschläge? Hier ist der vollständige Code: < /p>
from seleniumbase import SB
chromedriver_path = "C:\\temp\\GoogleChromePortable64-132\\App\\Chrome-bin\\chrome.exe"
import random
import itertools
def user_agent_rotator(user_agent_list):
# shuffle the User Agent list
random.shuffle(user_agent_list)
# rotate the shuffle to ensure all User Agents are used
return itertools.cycle(user_agent_list)
# define Chrome options
#options = SB.ChromeOptions()
# create a User Agent list
user_agents = [
"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36",
"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36",
"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36",
# ... add more User Agents
]
# initialize a generator for the User Agent rotator
user_agent_cycle = user_agent_rotator(user_agents)
print(user_agent_cycle)
with SB(uc=True,agent=user_agent_cycle,binary_location=chromedriver_path) as sb:
print(1)
sb.open("https://google.com/ncr")
print(2)
sb.type('[title="Search"]', "SeleniumBase GitHub page\n")
print(3)
sb.click('[href*="github.com/seleniumbase/"]')
sb.save_screenshot_to_logs() # ./latest_logs/
print(sb.get_page_title())
[/code]