Bereinigen eines TMDb-FilmdatensatzesPython

Python-Programme
Anonymous
 Bereinigen eines TMDb-Filmdatensatzes

Post by Anonymous »

Ich brauche Hilfe für mein Dissertationsprojekt. Ich arbeite im Rahmen meines Masterstudiums an meiner Universität in England, Großbritannien, an einem Python-Projekt. Ich bin gerade dabei, den Datensatz zu bereinigen, den ich über die Kaggle-Plattform erhalten habe und der über eine Million Filme in Bezug auf Titel, Budget, Einspielergebnisse, Genres, Beliebtheit, Rezensionen, Schlüsselwörter usw. enthält. Hier ist der Weblink zur Verdeutlichung (Ich habe das neueste Update erhalten):
https://www.kaggle.com/datasets/asanicz ... 30k-movies
Ich brauche dringend Hilfe beim Löschen mehrerer Zeilen außer für die Zeilen, die die Namen der Produktionsländer Vereinigtes Königreich und Vereinigte Staaten von Amerika in den Daten enthalten.
Zum Beispiel (sieht aus wie dies in der Datensatz):

Code: Select all

production_countries
United Kingdom
United States of America
Japan, Canada, Sweden, United Kingdom
United States of America, United Kingdom
Ich habe mehrere Codes ausprobiert, um die Art von Daten zu erhalten, die ich benötige, aber nichts funktioniert. Es gibt eine Methode, die funktioniert hat, aber sie ist zeitaufwändig und ich muss die Datenbereinigung effizient und schnell durchführen. Jede Hilfe wird geschätzt. Vielen Dank für Ihre Zeit.

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post