Wie gehe ich mit relativen/vollen URLs in Python um?

Post a reply

Smilies
:) :( :oops: :chelo: :roll: :wink: :muza: :sorry: :angel: :read: *x) :clever:
View more smilies

BBCode is ON
[img] is ON
[flash] is OFF
[url] is ON
Smilies are ON

Topic review
   

Expand view Topic review: Wie gehe ich mit relativen/vollen URLs in Python um?

by Anonymous » Today, 02:45

Eine HTML -Seite kann auf unterschiedliche Weise einen Link enthalten. Zum Beispiel können wir ein Bild wie folgt einfügen:
Angenommen, wir sind derzeit bei: https://example.com/Folder

Code: Select all

https://example.com/images/picture.jpg
, der sich auf das gleiche auflöst.

Code: Select all

/images/picture.jpg
, der sich beschließt: https://example.com/images/picture.jpg.

Code: Select all

images/picture.jpg
die sich beschließt: https://example.com/folder/images/picture.jpg.
Wie kann Python all diese Fälle für mich umgehen?

Code: Select all

response = requests.get(url)
...
for link in links:
if link.startswith('/'):
print(url+link)
else:
print(url)
Ein weiterer Grund dafür, warum es falsch ist, ist, dass wir beim Besuch https://example.com möglicherweise umgeleitet werden, um: https://example.com/homepage?ignore=yes also die Basis -URL nicht länger die besuchten Eins, aber https:/xample.com/homepage/homepage>

Top