Ich möchte die Werte in einer Spalte zurückgeben, basierend darauf, ob sein Wert (d. H., hat Substring) eine Zeichenfolge in einer Liste von Zeichenfolgen. < /p>
values = ['dog', 'cat', 'ant']
df = pd.DataFrame({'col1': ['dog', 'cat', 'fox', 'monkey', 'antelope'], 'col2': [3, 4, 1, 6, 9]})
< /code>
Ich weiß, wenn ich mit einem Substring vergleichen möchte, kann ich: < /p>
df[df['col1'].str.contains('dog')
< /code>
Und wenn ich die vollständigen Werte kann (im Gegensatz zu nur einem Substring), könnte ich: < /p>
tundf.loc[df['col1'].isin(values)]
< /code>
Ich bin mir jedoch nicht sicher, wie ich die beiden Funktionen kombinieren soll. Over. < /p>
def func(data):
for x in values:
if x in data:
return True
return False
df['include'] = df.apply(func)
< /code>
Aber das funktioniert nicht (meine Spalte ist einfach 'nan' Werte)-und es scheint ehrlich gesagt, es gibt wahrscheinlich einen besseren Weg. < /p>
Überprüfen Sie die Datenframespalte in Pandas mit .ISIN- und STR.Contains ⇐ Python
-
- Similar Topics
- Replies
- Views
- Last post