Scraping einer dynamischen Datentabelle ohne einfache Referenzen

Scraping einer dynamischen Datentabelle ohne einfache Referenzen ⇐ Python

1 post • Page 1 of 1

Guest

Scraping einer dynamischen Datentabelle ohne einfache Referenzen

Post by Guest » 20 Jan 2025, 18:40

Ich versuche, die Daten aus einer einfachen Tabelle von der folgenden Website abzurufen (https://bvmf.bmfbovespa.com.br/clube-de ... Idioma=pt- br). Ich konnte die Daten von der ersten Seite abrufen, aber wie wir sehen können, ist die Paginierung nicht mit der URL verknüpft und ich konnte sie nicht abrufen, obwohl ich unten auf der Seite die Schaltflächen „ProximoPaginacao“ und „ProximoPaginacao“ finden konnte „MeioPaginacao“, aber ich konnte mit dieser Implementierung nicht umgehen. Irgendwelche Ideen?

Code: Select all

import requests
from bs4 import BeautifulSoup
import pandas as pd

def extract_table_data(url, table_id):

try:
response = requests.get(url,verify=False)
response.raise_for_status()
html_content = response.text
soup = BeautifulSoup(html_content, 'html.parser')
table = soup.find('table', id=table_id)
if not table:
print(f"Table with ID '{table_id}' not found.")
return None

# Extract header row
header_row = [th.get_text(strip=True) for th in table.find_all('th')]

# Extract data rows
data_rows = []
for row in table.find('tbody').find_all('tr'):
data_rows.append([td.get_text(strip=True) for td in row.find_all('td')])

# Create DataFrame
df = pd.DataFrame(data_rows, columns=header_row)
return df
except requests.exceptions.RequestException as e:
print(f"Error during requests: {e}")
return None
except Exception as e:
print(f"An error occurred: {e}")
return None

# Example usage
url = "https://bvmf.bmfbovespa.com.br/clube-de-investimento/clube-de-investimento.aspx?
Idioma=pt-br"  # Replace with the actual URL
table_id = "ctl00_contentPlaceHolderConteudo_grdAtivo_ctl01"  # Replace with the actual
table ID
table_data = extract_table_data(url, table_id)

if table_data is not None:
print(table_data)

1737394846

Guest

Ich versuche, die Daten aus einer einfachen Tabelle von der folgenden Website abzurufen (https://bvmf.bmfbovespa.com.br/clube-de-investimento/clube-de-investimento.aspx?Idioma=pt- br). Ich konnte die Daten von der ersten Seite abrufen, aber wie wir sehen können, ist die Paginierung nicht mit der URL verknüpft und ich konnte sie nicht abrufen, obwohl ich unten auf der Seite die Schaltflächen „ProximoPaginacao“ und „ProximoPaginacao“ finden konnte „MeioPaginacao“, aber ich konnte mit dieser Implementierung nicht umgehen. Irgendwelche Ideen?
[code]import requests
from bs4 import BeautifulSoup
import pandas as pd

def extract_table_data(url, table_id):

try:
response = requests.get(url,verify=False)
response.raise_for_status()
html_content = response.text
soup = BeautifulSoup(html_content, 'html.parser')
table = soup.find('table', id=table_id)
if not table:
print(f"Table with ID '{table_id}' not found.")
return None

# Extract header row
header_row = [th.get_text(strip=True) for th in table.find_all('th')]

# Extract data rows
data_rows = []
for row in table.find('tbody').find_all('tr'):
data_rows.append([td.get_text(strip=True) for td in row.find_all('td')])

# Create DataFrame
df = pd.DataFrame(data_rows, columns=header_row)
return df
except requests.exceptions.RequestException as e:
print(f"Error during requests: {e}")
return None
except Exception as e:
print(f"An error occurred: {e}")
return None

# Example usage
url = "https://bvmf.bmfbovespa.com.br/clube-de-investimento/clube-de-investimento.aspx?
Idioma=pt-br"  # Replace with the actual URL
table_id = "ctl00_contentPlaceHolderConteudo_grdAtivo_ctl01"  # Replace with the actual
table ID
table_data = extract_table_data(url, table_id)

if table_data is not None:
print(table_data)
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Was genau ist für Objekte ohne Referenzen passiert?

Last post by Guest « 04 Feb 2025, 14:51
Posted in Python

by Guest » 04 Feb 2025, 14:51 » in Python

Ich habe ein Testskript mit abendlicher Schleife erstellt Python -Objekte. Zunächst versuchte ich zu verstehen, was mit a () Objekten passiert ist, die keine Referenzen hatten (in Bezug auf die...

0 Replies

7 Views

Last post by Guest
04 Feb 2025, 14:51
Übergeben einer Datentabelle an gespeichertes Verfahren - C#

Last post by Anonymous « 29 Apr 2025, 14:17
Posted in C#

by Anonymous » 29 Apr 2025, 14:17 » in C#

Ich erstellt eine Datentabelle und übertrage sie als Parameter an die gespeicherte Prozedur. Nach der Ausführung stellt das gespeicherte Prozedur einen Ergebnissatz bereit.CREATE TYPE . AS TABLE(...

0 Replies

5 Views

Last post by Anonymous
29 Apr 2025, 14:17
Beim Laden einer neuen Szene gehen Referenzen von verschobenen Objekten verloren, die FishNet in Unity verwenden

Last post by Guest « 15 Jan 2025, 15:38
Posted in C#

by Guest » 15 Jan 2025, 15:38 » in C#

Ich verwende FishNet und versuche, eine neue Szene mit dem folgenden Code zu laden, aber ich erhalte diese Warnung in den Clients für jedes Netzwerkobjekt, das nicht diesem Client gehört und das ich...

0 Replies

15 Views

Last post by Guest
15 Jan 2025, 15:38
Wie können Referenzen in einer sauberen Architektur standardmäßig auf die Klasse und nicht auf den Namespace verweisen?

Last post by Anonymous « 17 Jan 2025, 07:46
Posted in C#

by Anonymous » 17 Jan 2025, 07:46 » in C#

Ich implementieren eine Lösung, die einer sauberen Architektur entspricht:

AssetGovernance.Function
AssetGovernance.Infrastructure
AssetGovernance.Application
AssetGovernance.Tests

Innerhalb...

0 Replies

17 Views

Last post by Anonymous
17 Jan 2025, 07:46
Primeng ermöglicht eine reaktionsfähige Höhe der scrollbaren Datentabelle

Last post by Guest « 07 Jan 2025, 12:50
Posted in CSS

by Guest » 07 Jan 2025, 12:50 » in CSS

PrimeNG DataTable bietet eine -Eigenschaft, um vertikales und/oder horizontales Scrollen zu definieren. Dies muss mit einer Kombination aus einer festgelegten scrollHeight und/oder scrollWidth...

0 Replies

5 Views

Last post by Guest
07 Jan 2025, 12:50

Return to “Python”