Ich baue eine App, die französische Verben analysiert. Ich habe einen Datensatz von über 7000 Verben und ihren Konjugationen und möchte die Genauigkeit im Vergleich zu Online-Konjugatoren auf Websites bestätigen. Ich habe den Prozess für mehrere Websites (Wiktionary, Reverso, ...) mit Python, Anfragen, Selenium automatisiert, aber der Versuch, auf die Website der Academie française zuzugreifen, ist fehlgeschlagen.
An Reproduzieren Sie das Problem:
Schritt 1: Geben Sie https://www.dictionnaire-academie.fr/?search=donner in einen beliebigen Browser ein – ich verwende Firefox – eine Seite wird mit der URL angezeigt https://www.dictionnaire-academie.fr/article/A9D3041 und die Verbdaten sind von dort aus zugänglich.
Schritt 2: Stellen Sie die gleiche search=donner-Anfrage programmgesteuert ein von Python mit Selen, z. B.
element = self.driver.find_element
(By.XPATH("//meta[@property='og:url']
[@content]"))
ec = expected_conditions.attribute_matches_regex(element,
'https://dictionnaire-academie.fr/article*')
element = WebDriverWait(self.driver, 15).until(ec)
page_source = self.driver.page_source
Wenn ich den Antwort-HTML-Code überprüfe, wird der Artikelcode „A9D3041“ nicht erwähnt, was bedeutet, dass ich ihn nicht extrahieren und die Verbdaten nicht automatisch anfordern kann. Die Verbdaten sind auch nicht in dieser Antwort enthalten.
Wenn ich Schritt 1 ausführe, sieht es so aus, als würde die Website eine Weiterleitung (302) mit einer Standort-URL einschließlich des Artikelcodes zurückgeben, aber das tue ich nicht Holen Sie sich das – nur 200
Ich hoffe, diese Beschreibung erfüllt die Website-Kriterien.
Problem beim Automatisieren des Abrufens von Daten von einer Webseite (Python, Selenium) [geschlossen] ⇐ Python
-
- Similar Topics
- Replies
- Views
- Last post