Scrapy-Handle-Status 202 - Programmiererforum

Scrapy-Handle-Status 202 ⇐ Python

1 post • Page 1 of 1

Anonymous

Report
Quote

Post by Anonymous » 07 Nov 2025, 13:46

Ich bin ziemlich neu im Web-Scraping und insbesondere in der Verwendung von Scrapys Spidern, Pipelines...
Ich erhalte den Status 202 aus der Antwort einiger Spider-Anfragen, daher ist der Seiteninhalt noch nicht verfügbar.
Wie gehe ich mit diesen Statuscodes richtig um, z. B. „Warten Sie, bis die Seite vollständig geladen ist“?
Ich habe sowohl get_retry_request von Scrapys Downloadermiddleware als auch den Aufruf von Reactor später gesehen bzw. angeschaut mit einem Lambda, um zu versuchen, Wiederholungsversuche mit Verzögerung zu verarbeiten, aber bisher ohne Erfolg...
(z. B.

Code: Select all

yield scrapy.downloadermiddlewares.retry.get_retry_request(
request=response.request, spider=self, reason='202 Accepted - retrying after delay', max_retry_times=self.max_retries)

oder so etwas wie:

Code: Select all

reactor.callLater(self.retry_delay,
lambda: self.crawler.engine.crawl(
scrapy.Request(
url=response.url,
callback=self.parse,
meta={'location_name': response.meta.get('location_name', ''),'retries': retries + 1})))

)
Vielen Dank im Voraus für jede Unterstützung!

1762519618

Anonymous

Ich bin ziemlich neu im Web-Scraping und insbesondere in der Verwendung von Scrapys Spidern, Pipelines...
Ich erhalte den Status 202 aus der Antwort einiger Spider-Anfragen, daher ist der Seiteninhalt noch nicht verfügbar.
Wie gehe ich mit diesen Statuscodes richtig um, z. B. „Warten Sie, bis die Seite vollständig geladen ist“?
Ich habe sowohl get_retry_request von Scrapys Downloadermiddleware als auch den Aufruf von Reactor später gesehen bzw. angeschaut mit einem Lambda, um zu versuchen, Wiederholungsversuche mit Verzögerung zu verarbeiten, aber bisher ohne Erfolg...
(z. B.
[code]yield scrapy.downloadermiddlewares.retry.get_retry_request(
request=response.request, spider=self, reason='202 Accepted - retrying after delay', max_retry_times=self.max_retries)
[/code]
oder so etwas wie:
[code]reactor.callLater(self.retry_delay,
lambda: self.crawler.engine.crawl(
scrapy.Request(
url=response.url,
callback=self.parse,
meta={'location_name': response.meta.get('location_name', ''),'retries': retries + 1})))
[/code]
)
Vielen Dank im Voraus für jede Unterstützung!

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

CMake-Handle in Quellabhängigkeiten

Last post by Guest « 03 Jan 2025, 14:06
Posted in C++

by Guest » 03 Jan 2025, 14:06 » in C++

Ich bin mir nicht wirklich sicher, wie ich das betiteln soll, aber für eine einfachere Verwendung benötige ich eine Open-Source-Bibliothek, die CMake als Teil desselben Projekts verwendet wie eine...

0 Replies

43 Views

Last post by Guest
03 Jan 2025, 14:06
Migration von Polly nach microsoft.extensions.http.resilience - Erweiterung sollte HANDLE

Last post by Anonymous « 14 Apr 2025, 09:43
Posted in C#

by Anonymous » 14 Apr 2025, 09:43 » in C#

Ich möchte von Polly auf microsoft.extensions.http.resilience addStandardResilienceHandler migrieren. Mein verkürzter Polly -Code ist der folgende:
services.AddHttpClient()
.AddPolicyHandler((_, _)...

0 Replies

29 Views

Last post by Anonymous
14 Apr 2025, 09:43
So erstellen Sie einen WPF -Cursor aus einem INTPTR -Handle

Last post by Anonymous « 14 Apr 2025, 11:49
Posted in C#

by Anonymous » 14 Apr 2025, 11:49 » in C#

Angenommen, ich habe den Handle eines Cursors, und ich möchte eine Instanz von WPF Cursor verwenden. Irgendeine Idee, wie man dies umgeht und einen WPF -Cursor aus dem INTPTR -Handle erstellt?...

0 Replies

27 Views

Last post by Anonymous
14 Apr 2025, 11:49
Wie erstelle ich einen filestream aus einem Roh -INTPTR -Handle? (Dtwain)

Last post by Anonymous « 19 Aug 2025, 21:06
Posted in C#

by Anonymous » 19 Aug 2025, 21:06 » in C#

Ich verwende eine DLL, die ein Bild von einem Scanner abruft und es mir als INTPTR zurückgibt, das einen Griff darstellt. Ich habe versucht, einen fileStream mit dem Rohzeiger zu erstellen und ihn...

0 Replies

22 Views

Last post by Anonymous
19 Aug 2025, 21:06
Kompilierungsfehler: Deklaration von Symfony\Bridge\Monolog\Handler\ConsoleHandler::handle(array $record): bool muss kom

Last post by Anonymous « 07 Jan 2026, 23:21
Posted in Php

by Anonymous » 07 Jan 2026, 23:21 » in Php

Ich aktualisiere Symfony 4.4 auf 5.4 mit PHP 8.2, nachdem ich den Composer-Update-Befehl ausgeführt habe, dann stehe ich vor diesem Problem.
ERROR: Compile Error: Declaration of...

0 Replies

2 Views

Last post by Anonymous
07 Jan 2026, 23:21

Return to “Python”