Ich habe zwei verknüpfte Datenrahmen, die Daten zum Status von etwas enthalten, aber beide Datenquellen sind schlecht. Ich habe den Status (z. B. 1 = verloren, 2 = gefunden, 3 = unbekannt) und das Datum, falls gefunden.
Ich möchte einen neuen Datenframe erstellen, der die letzte Zeile aus entweder aus DFA oder dfb basierend auf dem neuesten RegisterDate/Date_registered. Die ideale Ausgabe wäre: < /p>
Ich habe zwei verknüpfte Datenrahmen, die Daten zum Status von etwas enthalten, aber beide Datenquellen sind schlecht. Ich habe den Status (z. B. 1 = verloren, 2 = gefunden, 3 = unbekannt) und das Datum, falls gefunden.[code]ID, status, dateFound, registerDate 1, 1, NaN , 5/3/24 2, 2, 1/1/24, 1/1/24 3, 2, 2/1/24, 3/1/24 < /code> und DFB 'ist so: < /p> ID, thing_status, dateFound, date_registered 1, 2, 6/4/24, 23/4/24 2, 1, NaN, 24/12/23 3, 2, 4/1/24, 5/1/24 [/code] Ich möchte einen neuen Datenframe erstellen, der die letzte Zeile aus entweder aus DFA oder dfb basierend auf dem neuesten RegisterDate/Date_registered. Die ideale Ausgabe wäre: < /p> [code]ID, status, dateFound, registerDate 1, 2, 6/4/24, 23/4/24 2, 2, 1/1/24, 1/1/24 3, 2, 4/1/24, 5/1/24 [/code] Ich mache dies derzeit mit einem For-Loop, aber vermute, es gibt einen einfacheren Weg.
Es gibt viele Beispiele dafür, wie man zwei Pandas-Datenrahmen zusammenführt, aber mein Problem ist, dass ich zwei Arten von Daten habe. data1 sind CSV-Daten, die ich mit Pandas gelesen und in einen...
Ich versuche, zwei Pandas-Datenrahmen zusammenzuführen, die einen MultiIndex für die Spalten haben. Dies funktioniert wie erwartet, wenn keine doppelten Spalten vorhanden sind. Wenn jedoch doppelte...