Ich brauche Hilfe für mein Dissertationsprojekt. Ich arbeite im Rahmen meines Masterstudiums an meiner Universität in England, Großbritannien, an einem Python-Projekt. Ich bin gerade dabei, den Datensatz zu bereinigen, den ich über die Kaggle-Plattform erhalten habe und der über eine Million Filme in Bezug auf Titel, Budget, Einspielergebnisse, Genres, Beliebtheit, Rezensionen, Schlüsselwörter usw. enthält. Hier ist der Weblink zur Verdeutlichung (Ich habe das neueste Update erhalten):
https://www.kaggle.com/datasets/asanicz ... 30k-movies
Ich brauche dringend Hilfe beim Löschen mehrerer Zeilen außer für die Zeilen, die die Namen der Produktionsländer
Vereinigtes Königreich und
Vereinigte Staaten von Amerika in den Daten enthalten.
Zum Beispiel (sieht aus wie dies in der Datensatz):
Code: Select all
production_countries
United Kingdom
United States of America
Japan, Canada, Sweden, United Kingdom
United States of America, United Kingdom
Ich habe mehrere Codes ausprobiert, um die Art von Daten zu erhalten, die ich benötige, aber nichts funktioniert. Es gibt eine Methode, die funktioniert hat, aber sie ist zeitaufwändig und ich muss die Datenbereinigung effizient und schnell durchführen. Jede Hilfe wird geschätzt. Vielen Dank für Ihre Zeit.