Ich arbeite mit einer Duckdb -Datenbank (merged.duckdb), die Auktionsdaten in einer Tabelle mit dem Namen Auction_TimeSeries enthält, die von Auction_ID und Auction_active_Date geordnet wurde. Das Schema lautet:
Auction_id : Eindeutige Auktionskennung. /> Total_view_count : kumulative Ansichten bis zu diesem Datum. A ',' DPOing B ',' Doping C 'oder Null, wenn kein Doping). Total_view_count - e.g. Wie oft mehr Ansichten auftreten, wenn doping_is_active = 1 vs. 0 oder für bestimmte Doping -Typen. Ergibt sich beispielsweise die Doping 2x oder 10x mehr tägliche Ansichten? Ich betrachte eine Regression des Panels mit festen Effekten für Auction_ID, um versteigerspezifische Faktoren zu berücksichtigen. Ich bin mir jedoch nicht sicher, ob dies der beste Ansatz ist, wenn die Zeit der Daten der Daten der Daten am besten ist. Hier ist der relevante Code: < /p>
import duckdb
import pandas as pd
import numpy as np
# Connect to DuckDB
con = duckdb.connect('merged.duckdb')
# Calculate doping multipliers
multipliers = con.execute("""
SELECT
(AVG(CASE WHEN doping_is_active = 1 THEN daily_view_count ELSE NULL END) /
NULLIF(AVG(CASE WHEN doping_is_active = 0 THEN daily_view_count ELSE NULL END), 0)) AS overall_doping_multiplier,
(AVG(CASE WHEN doping_name = 'Doping A' THEN daily_view_count ELSE NULL END) /
NULLIF(AVG(CASE WHEN doping_name IS NULL THEN daily_view_count ELSE NULL END), 0)) AS DopingA_multiplier,
(AVG(CASE WHEN doping_name = 'Doping B' THEN daily_view_count ELSE NULL END) /
NULLIF(AVG(CASE WHEN doping_name IS NULL THEN daily_view_count ELSE NULL END), 0)) AS DopingB_multiplier,
(AVG(CASE WHEN doping_name = 'Doping C' THEN daily_view_count ELSE NULL END) /
NULLIF(AVG(CASE WHEN doping_name IS NULL THEN daily_view_count ELSE NULL END), 0)) AS DopingC_multiplier
FROM main.auction_timeseries
""").fetchone()
print("\nDoping Multipliers:")
print(f"Overall Doping Multiplier: {multipliers[0] if multipliers[0] else 'Undefined'}")
print(f"Doping A Multiplier: {multipliers[1] if multipliers[1] else 'Undefined'}")
print(f"Doping B Multiplier: {multipliers[2] if multipliers[2] else 'Undefined'}")
print(f"Doping C Multiplier: {multipliers[3] if multipliers[3] else 'Undefined'}")
con.close()
< /code>
Fragen: < /p>
Ist die Panel-Regression (z. B. Modell mit festem Effekt für Auction_ID) logisch zur Schätzung des Doping-Multiplikators? Warum oder warum nicht?>
Ist die Regression der Panel zur Quantifizierung des Doping -Multiplikators für tägliche und Gesamtansichten in Python m ⇐ Python
-
- Similar Topics
- Replies
- Views
- Last post