Hier ist mein Datenrahmen < /p> [code]my_df = pd.DataFrame({'col_1': ['A', 'A', 'B', 'B', 'C', 'C'], 'col_2': [1, 2, 1, 2, 1, 2]}) [/code] Ich möchte nach col_1 gruppieren und alles streng größer als eins mit col_2 herausfiltern. Das Endergebnis sollte aussehen wie: < /p> [code]final_df = pd.DataFrame({'col_1': ['A', 'B', 'C'], 'col_2': [1, 1, 1, ]}) < /code> Hier ist, was ich versucht habe: < /p> df_ts = my_df.groupby('col_1').filter(lambda x: (x['col_2'] Es gibt denselben Datenfreame < /p> Ich habe auch versucht: < /p> df_ts = my_df.groupby('col_1').filter(lambda x: x['col_2']
Ich verwende den folgenden regulären Ausdruck in Python: ^( .+?)?( Com:.*)?$
(Dieser Regex mag dumm aussehen, aber es ist tatsächlich Teil einer größeren komplexeren Zeichenfolge. Ich habe gerade...
Das DF enthält 100 Millionen Zeilen und die Spalten „group_by“ sind etwa 25–30. Gibt es eine Möglichkeit, diesen Vorgang von hier aus zu beschleunigen? oder das ist das Beste, was ich bekommen kann....
In einem benutzerdefinierten Schlüsselcloak -Plugin versuche ich, feinkörnige Administratorberechtigungen zu erstellen und zu ändern. Nach einigen Graben stellte ich fest, dass dieser Code perfekt...
Ich habe einen Datenrahmen. Es wird wie folgt nach „ex“ gruppiert:
Geben Sie hier die Bildbeschreibung ein
Jetzt möchte ich Zeilen erhalten, die in jeder Gruppe den Maximalwert haben