Leere Datenrahmen nach dem Webscraping von Wikipedia erhalten

Leere Datenrahmen nach dem Webscraping von Wikipedia erhalten ⇐ HTML

1 post • Page 1 of 1

Guest

Leere Datenrahmen nach dem Webscraping von Wikipedia erhalten

Post by Guest » 23 Jan 2025, 08:07

Ich versuche, Daten von einer Wikipedia-Seite zu extrahieren und sie in einen Datenrahmen zu laden. Nach dem Webscraping und Ausführen des Datenrahmens gibt Python einen leeren Datenrahmen zurück, was nicht der Fall sein sollte. Hier ist mein Codeausschnitt:

Code: Select all

import pandas as pd
import requests
from bs4 import BeautifulSoup
html = requests.get('https://en.wikipedia.org/wiki/List_of_countries_by_Human_Development_Index')
soup = BeautifulSoup(html.text, 'html.parser')
table = soup.find('table', {'class': 'wikitable'})
rows = table.find_all('tr')[1:]
countries = []
hdi_index = []
for row in rows:
cols = row.find_all('td')
if len(cols) > 2:
countries.append(cols[1].text.strip())
hdi_index.append(cols[2].text.strip())
hdi_df = pd.DataFrame({'Country': countries, 'HDI': hdi_index})
print(hdi_df.head())

1737616052

Guest

Ich versuche, Daten von einer Wikipedia-Seite zu extrahieren und sie in einen Datenrahmen zu laden. Nach dem Webscraping und Ausführen des Datenrahmens gibt Python einen leeren Datenrahmen zurück, was nicht der Fall sein sollte. Hier ist mein Codeausschnitt:
[code]import pandas as pd
import requests
from bs4 import BeautifulSoup
html = requests.get('https://en.wikipedia.org/wiki/List_of_countries_by_Human_Development_Index')
soup = BeautifulSoup(html.text, 'html.parser')
table = soup.find('table', {'class': 'wikitable'})
rows = table.find_all('tr')[1:]
countries = []
hdi_index = []
for row in rows:
cols = row.find_all('td')
if len(cols) > 2:
countries.append(cols[1].text.strip())
hdi_index.append(cols[2].text.strip())
hdi_df = pd.DataFrame({'Country': countries, 'HDI': hdi_index})
print(hdi_df.head())

[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

X (Twitter) Webscraping mit Twikit. Wie kann ich überprüfen, ob auth_token abgelaufen ist?

Last post by Guest « 16 Jan 2025, 11:51
Posted in Python

by Guest » 16 Jan 2025, 11:51 » in Python

Ich versuche, Twikit Python Lib zum Webscrapen von X (früher bekannt als Twitter) zu verwenden.
Ich kann nicht überprüfen, ob das auth_token abgelaufen ist oder nicht.
Hier ist der Codeausschnitt als...

0 Replies

12 Views

Last post by Guest
16 Jan 2025, 11:51
Wie bekomme ich mit Python Koordinaten von einer Wikipedia -Seite?

Last post by Guest « 28 Jan 2025, 07:03
Posted in Python

by Guest » 28 Jan 2025, 07:03 » in Python

Ich möchte die Koordinaten einer bestimmten Wikipedia -Seite erhalten. Ich habe versucht, die Wikipedia -API zu verwenden. Die einzige relevante Methode ist jedoch die GeoSearch (), die eine Seite...

0 Replies

14 Views

Last post by Guest
28 Jan 2025, 07:03
Verständnis von Wikipedia -Titeln, die API batchieren

Last post by Anonymous « 12 Feb 2025, 12:02
Posted in Python

by Anonymous » 12 Feb 2025, 12:02 » in Python

Mit der Mediawiki -API können wir die Wikipedia -API abfragen. Eines der Felder sind Titel wobei ein oder mehr Titel gleichzeitig abgefragt werden kann. Das Zusammenstellen von Szenarien mit hoher...

0 Replies

5 Views

Last post by Anonymous
12 Feb 2025, 12:02
Wie bekomme ich aus einem Artikel mit> 500 Überarbeitungen eine vollständige Wikipedia-Revisions-Geschichts-Liste?

Last post by Guest « 09 Feb 2025, 11:15
Posted in Python

by Guest » 09 Feb 2025, 11:15 » in Python

Wie kann ich die vollständige Wikipedia-Revisions-History-Liste erhalten? (Ich möchte nicht kratzen)

import wapiti
import pdb
import pylab as plt
client =...

0 Replies

10 Views

Last post by Guest
09 Feb 2025, 11:15
Wie kann ich in einem Datenrahmen in Pandas ein Kreuz-TAB von zwei Spalten in einem Datenrahmen erstellen und eine Gesam

Last post by Anonymous « 01 Mar 2025, 15:44
Posted in Python

by Anonymous » 01 Mar 2025, 15:44 » in Python

Ich habe einen Datenrahmen aus einer CSV-Datei erstellt und versuche jetzt, ein Kreuz-TAB von zwei Spalten ( Personal_status und Geschlecht ) zu erstellen. Die Ausgabe sollte so aussehen,...

0 Replies

20 Views

Last post by Anonymous
01 Mar 2025, 15:44

Return to “HTML”