So erstellen Sie ein inkrementelles Suffix für Werte in einer Pandas-Spalte, die doppelte Werte in einer anderen Spalte

So erstellen Sie ein inkrementelles Suffix für Werte in einer Pandas-Spalte, die doppelte Werte in einer anderen Spalte ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

So erstellen Sie ein inkrementelles Suffix für Werte in einer Pandas-Spalte, die doppelte Werte in einer anderen Spalte

Report
Quote

Post by Anonymous » 15 Oct 2025, 09:03

SETUP
Ich habe einen Datenrahmen, df

Code: Select all

import pandas as pd

pd.DataFrame(
{
'Name':['foo','foo','foo','bar','bar','bar','baz','baz','baz'],
'Color':['red','blue','red','green','green','blue','yellow','orange','red']
}
)

GEWÜNSCHTE AUSGABE
Ich möchte für jeden Namen ein Aufzählungssuffix hinzufügen, der eine doppelte Farbe hat

Code: Select all

pd.DataFrame(
{
'Name':['foo_1','foo','foo_2','bar_1','bar_2','bar','baz','baz','baz'],
'Color':['red','blue','red','green','green','blue','yellow','orange','red']
}
)

Wie Sie sehen können, gibt es ein Suffix mit einer inkrementellen Zählung für jedes Mal, wenn ein Name eine Wiederholungsfarbe hat. Wenn ein Name nur einmal eine Farbe hat, wird kein Suffix hinzugefügt.
WAS ICH VERSUCHT HABE
Ich habe darüber nachgedacht, eine .groupby() mit einem Aggregat von .value_counts() zu nehmen, um eine Gesamtzahl zu erhalten, und diese bei Bedarf irgendwie zum Zuweisen der Suffixe zu verwenden. Hier ist eine Idee, die ich hatte und die sehr ineffizient erscheint:

Code: Select all

# group by name aggregate color value counts
gb = df.groupby(['Name']).agg(Color_count=('Color','value_counts')).reset_index()

# keep only counts that are >1 ie need a suffix
gb = gb.loc[gb.Color_count > 1].copy()

# merge back to original df
df.merge(gb, on=['Name','Color'],how='left').fillna(0)

# from here, somehow start an incremental suffix for nonzero values of `Color_count`...

1760511818

Anonymous

SETUP
Ich habe einen Datenrahmen, df
[code]import pandas as pd

pd.DataFrame(
{
'Name':['foo','foo','foo','bar','bar','bar','baz','baz','baz'],
'Color':['red','blue','red','green','green','blue','yellow','orange','red']
}
)
[/code]
GEWÜNSCHTE AUSGABE
Ich möchte für jeden Namen ein Aufzählungssuffix hinzufügen, der eine doppelte Farbe hat
[code]pd.DataFrame(
{
'Name':['foo_1','foo','foo_2','bar_1','bar_2','bar','baz','baz','baz'],
'Color':['red','blue','red','green','green','blue','yellow','orange','red']
}
)

[/code]
Wie Sie sehen können, gibt es ein Suffix mit einer inkrementellen Zählung für jedes Mal, wenn ein Name eine Wiederholungsfarbe hat. Wenn ein Name nur einmal eine Farbe hat, wird kein Suffix hinzugefügt.
WAS ICH VERSUCHT HABE
Ich habe darüber nachgedacht, eine .groupby() mit einem Aggregat von .value_counts() zu nehmen, um eine Gesamtzahl zu erhalten, und diese bei Bedarf irgendwie zum Zuweisen der Suffixe zu verwenden. Hier ist eine Idee, die ich hatte und die sehr ineffizient erscheint:
[code]# group by name aggregate color value counts
gb = df.groupby(['Name']).agg(Color_count=('Color','value_counts')).reset_index()

# keep only counts that are >1 ie need a suffix
gb = gb.loc[gb.Color_count > 1].copy()

# merge back to original df
df.merge(gb, on=['Name','Color'],how='left').fillna(0)

# from here, somehow start an incremental suffix for nonzero values of `Color_count`...
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Erstellen Sie ein inkrementelles Suffix für Werte in einer Pandas-Spalte, die doppelte Werte in einer anderen Spalte hab

Last post by Anonymous « 15 Oct 2025, 09:51
Posted in Python

by Anonymous » 15 Oct 2025, 09:51 » in Python

Setup
Ich habe einen Datenrahmen, df
import pandas as pd

df = pd.DataFrame(
{
'Name': ,
'Color':
}
)

Name Color
0 foo red
1 foo blue
2 foo red
3 bar green
4 bar green
5 bar blue
6 baz yellow
7...

0 Replies

19 Views

Last post by Anonymous
15 Oct 2025, 09:51
Pandas-Pivot-Tabelle für mehrere Spalten gleichzeitig, die doppelte Werte enthält

Last post by Anonymous « 26 Oct 2025, 11:34
Posted in Python

by Anonymous » 26 Oct 2025, 11:34 » in Python

Ich habe einen Pandas-Datenrahmen mit den Spalten Name, Schule und Noten
name school marks

tom HBS 55
tom HBS 55
tom HBS 14
mark HBS 28
mark HBS 19
lewis HBS 88

So transponieren und umwandeln...

0 Replies

11 Views

Last post by Anonymous
26 Oct 2025, 11:34
Wie entfernen Sie doppelte Zeilen in Pandas DataFrame basierend auf einer Spalte?

Last post by Anonymous « 19 Aug 2025, 23:13
Posted in Python

by Anonymous » 19 Aug 2025, 23:13 » in Python

Ich habe einen Pandas -Datenfreame mit mehreren Zeilen, und einige Zeilen haben den gleichen Wert in einer bestimmten Spalte (z. B. ID). Ich möchte die doppelten Zeilen entfernen, während ich nur das...

0 Replies

22 Views

Last post by Anonymous
19 Aug 2025, 23:13
Wie kann ich kontinuierliches (inkrementelles) Lernen in einem Gesichtserkennungsmodell implementieren, ohne von Grund a

Last post by Anonymous « 04 Dec 2025, 13:12
Posted in Python

by Anonymous » 04 Dec 2025, 13:12 » in Python

Ich baue ein Gesichtserkennungssystem mit Python und einem Deep-Learning-Modell auf (experimentiere derzeit mit FaceNet / ArcFace + PyTorch). Das System erkennt Identitäten, auf die das Modell...

0 Replies

4 Views

Last post by Anonymous
04 Dec 2025, 13:12
Subtrahieren Sie 2 Werte aus derselben Spalte, wenn eine andere Spalte für 2 Werte angegeben ist

Last post by Anonymous « 06 Oct 2025, 10:47
Posted in MySql

by Anonymous » 06 Oct 2025, 10:47 » in MySql

Ich bin irgendwie neu in MySQL. Ich habe seit einer Woche mit diesem Problem zu kämpfen und komme nicht weiter ...
In einfachem Text möchte ich, dass MySQL dies in einer Aussage durchführen soll:...

0 Replies

71 Views

Last post by Anonymous
06 Oct 2025, 10:47

Return to “Python”