Scrapy: Gibt eine Liste relativer URLs zurück, in denen ein bestimmtes Wort vorkommt

Scrapy: Gibt eine Liste relativer URLs zurück, in denen ein bestimmtes Wort vorkommt ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Scrapy: Gibt eine Liste relativer URLs zurück, in denen ein bestimmtes Wort vorkommt

Report
Quote

Post by Anonymous » 29 Dec 2024, 07:01

Auf dieser Website gibt es viele Karten, die in mehreren Bereichen der Website zugänglich sind. Ich versuche, die Site zu durchsuchen, um alle ihre Instanzen (in Form ihrer URL) basierend auf dem Titel zurückzugeben. Eine Karte mit dem Titel „AZ School Safety Program“ finden Sie beispielsweise unter: https://lawforkids.org/officers und https://lawforkids.org/educators. Mein Ziel ist es, dass Scrapy dies für mich erledigt, anstatt jede Instanz manuell zu finden.

Code: Select all

import scrapy

class PostsSpider(scrapy.Spider):

name = "card"

start_urls = [ 'https://lawforkids.org/',]

def parse(self, response):

for card in response.css('h5.card-title::text').re(r'AZ School Safety Program'):
yield{
'url': card.css('base::attr(href)').getall()
}

Abgesehen davon, dass ich nicht sicher bin, ob der URL-Selektor korrekt ist, führt mein Versuch, zu crawlen, zu Folgendem:
PostsSpider.parse-Rückruf ist nicht definiert. Wir freuen uns über jeden Einblick, vielen Dank!

1735452075

Anonymous

Auf dieser Website gibt es viele Karten, die in mehreren Bereichen der Website zugänglich sind. Ich versuche, die Site zu durchsuchen, um alle ihre Instanzen (in Form ihrer URL) basierend auf dem Titel zurückzugeben. Eine Karte mit dem Titel „AZ School Safety Program“ finden Sie beispielsweise unter: https://lawforkids.org/officers und https://lawforkids.org/educators. Mein Ziel ist es, dass Scrapy dies für mich erledigt, anstatt jede Instanz manuell zu finden.
[code]import scrapy

class PostsSpider(scrapy.Spider):

name = "card"

start_urls = [ 'https://lawforkids.org/',]

def parse(self, response):

for card in response.css('h5.card-title::text').re(r'AZ School Safety Program'):
yield{
'url': card.css('base::attr(href)').getall()
}
[/code]
Abgesehen davon, dass ich nicht sicher bin, ob der URL-Selektor korrekt ist, führt mein Versuch, zu crawlen, zu Folgendem:
PostsSpider.parse-Rückruf ist nicht definiert. Wir freuen uns über jeden Einblick, vielen Dank!

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Ersetzen relativer WordPress-Bild-URLs durch absolute für den WordPress-Gutenberg-Editor

Last post by Guest « 15 Jan 2025, 14:30
Posted in Php

by Guest » 15 Jan 2025, 14:30 » in Php

Ich habe versucht, das in seinem Beitrag erwähnte Problem zu lösen:
Gutenberg-Editor fehlt Stil und Bilder, aber das Frontend wird korrekt angezeigt
Ich hatte nicht viel Glück von anderen Benutzern,...

0 Replies

3 Views

Last post by Guest
15 Jan 2025, 14:30
Wie man aus [RSYNC] [1] alle Verzeichnisse ausschließt, die ein bestimmtes Wort enthalten

Last post by Anonymous « 12 Feb 2025, 10:28
Posted in Linux

by Anonymous » 12 Feb 2025, 10:28 » in Linux

Wie schließe ich alle Verzeichnisse aus RSYNC aus, die ein Wort Cache enthalten, Fall unempfindlich?

0 Replies

13 Views

Last post by Anonymous
12 Feb 2025, 10:28
Auflösen relativer URIs in Java 8 bei gleichzeitiger Behebung des JDK-Fehlers

Last post by Guest « 16 Jan 2025, 03:30
Posted in Java

by Guest » 16 Jan 2025, 03:30 » in Java

Ich befinde mich in einem Szenario, in dem ich bei Java 8 feststecke. Ich habe ein Programm, das URIs mithilfe von java.net.URI erstellt und auflöst. Dies wird im Allgemeinen immer ein http-Schema...

0 Replies

5 Views

Last post by Guest
16 Jan 2025, 03:30
Wie finde ich den Index für ein bestimmtes Element in einer Liste?

Last post by Anonymous « 27 Feb 2025, 06:52
Posted in Python

by Anonymous » 27 Feb 2025, 06:52 » in Python

Angesichts einer Liste und ein Element in der Liste Bar , wie erhalte ich den Index 1 ?

0 Replies

0 Views

Last post by Anonymous
27 Feb 2025, 06:52
Bei Instanz von in ein bestimmtes untergeordnetes Element umwandeln. Gibt es einen besseren Weg? [Duplikat]

Last post by Guest « 20 Jan 2025, 15:42
Posted in Java

by Guest » 20 Jan 2025, 15:42 » in Java

Übergeordnetes Element an Methode senden und dann AllBy ähnliche Produkte in der Datenbank finden.
Meine Datenbank hat 3 Tabellen. Produkt, Tischbier und Tischchips
class Product {
String name;...

0 Replies

2 Views

Last post by Guest
20 Jan 2025, 15:42

Return to “Python”