by Anonymous » Today, 02:45
Eine HTML -Seite kann auf unterschiedliche Weise einen Link enthalten. Zum Beispiel können wir ein Bild wie folgt einfügen:
Angenommen, wir sind derzeit bei:
https://example.com/Folder
Code: Select all
https://example.com/images/picture.jpg
, der sich auf das gleiche auflöst.
, der sich beschließt:
https://example.com/images/picture.jpg.
die sich beschließt:
https://example.com/folder/images/picture.jpg.
Wie kann Python all diese Fälle für mich umgehen?
Code: Select all
response = requests.get(url)
...
for link in links:
if link.startswith('/'):
print(url+link)
else:
print(url)
Ein weiterer Grund dafür, warum es falsch ist, ist, dass wir beim Besuch
https://example.com möglicherweise umgeleitet werden, um:
https://example.com/homepage?ignore=yes also die Basis -URL nicht länger die besuchten Eins, aber https:/xample.com/homepage/homepage>
Eine HTML -Seite kann auf unterschiedliche Weise einen Link enthalten. Zum Beispiel können wir ein Bild wie folgt einfügen:
Angenommen, wir sind derzeit bei: https://example.com/Folder
[code]https://example.com/images/picture.jpg[/code], der sich auf das gleiche auflöst.
[code]/images/picture.jpg[/code], der sich beschließt: https://example.com/images/picture.jpg.
[code]images/picture.jpg[/code] die sich beschließt: https://example.com/folder/images/picture.jpg.
Wie kann Python all diese Fälle für mich umgehen?[code]response = requests.get(url)
...
for link in links:
if link.startswith('/'):
print(url+link)
else:
print(url)
[/code]
Ein weiterer Grund dafür, warum es falsch ist, ist, dass wir beim Besuch https://example.com möglicherweise umgeleitet werden, um: https://example.com/homepage?ignore=yes also die Basis -URL nicht länger die besuchten Eins, aber https:/xample.com/homepage/homepage>