Mischung/Durchdringung eines Datenrahmens in Pandas

Mischung/Durchdringung eines Datenrahmens in Pandas ⇐ Python

1 post • Page 1 of 1

Anonymous

Mischung/Durchdringung eines Datenrahmens in Pandas

Report
Quote

Post by Anonymous » 30 Apr 2025, 23:35

Was ist ein einfacher und effizienter Weg, um einen Datenrahmen in Pandas, nach Zeilen oder durch Spalten zu mischen? D.h. So schreiben Sie eine Funktionsmischung (df, n, axis = 0) mit einem Datenrahmen, einer Reihe von Mischungen n und einer Achse (Achse (

Code: Select all

axis=0

IS Zeilen, Axis = 1 ist Spalten) und gibt eine Kopie des Datenrahmens zurück, der n Zeiten gemischt wurde.

Bearbeiten : Key ist, dies zu tun, ohne die Zeilen-/Spaltenbezeichnungen des Datenrahmens zu zerstören. Wenn Sie nur df.index mischen, verliert das alle Informationen. Ich möchte, dass das resultierende df das gleiche wie das Original entspricht, außer mit der Reihenfolge der Zeilen oder der Reihenfolge von Spalten unterschiedlich. Wenn ich sage, dass die Reihen mischen, meine ich jede Reihe unabhängig voneinander. Wenn Sie also zwei Spalten a und b haben, möchte ich, dass jede Zeile selbst gemischt wird, damit Sie nicht die gleichen Assoziationen zwischen einem und b haben, wie Sie es tun, wenn Sie jede Zeile nur wiederbestellen. So etwas wie: < /p>

Code: Select all

for 1...n:
for each col in df: shuffle column
return new_df
< /code>

, aber hoffentlich effizienter als naive Looping. Dies funktioniert bei mir nicht: < /p>

def shuffle(df, n, axis=0):
shuffled_df = df.copy()
for k in range(n):
shuffled_df.apply(np.random.shuffle(shuffled_df.values),axis=axis)
return shuffled_df

df = pandas.DataFrame({'A':range(10), 'B':range(10)})
shuffle(df, 5)

1746048938

Anonymous

Was ist ein einfacher und effizienter Weg, um einen Datenrahmen in Pandas, nach Zeilen oder durch Spalten zu mischen? D.h. So schreiben Sie eine Funktionsmischung (df, n, axis = 0)  mit einem Datenrahmen, einer Reihe von Mischungen n  und einer Achse (Achse ([code]axis=0[/code] IS Zeilen, Axis = 1  ist Spalten) und gibt eine Kopie des Datenrahmens zurück, der n  Zeiten gemischt wurde. 

[b] Bearbeiten [/b]: Key ist, dies zu tun, ohne die Zeilen-/Spaltenbezeichnungen des Datenrahmens zu zerstören. Wenn Sie nur df.index  mischen, verliert das alle Informationen. Ich möchte, dass das resultierende df  das gleiche wie das Original entspricht, außer mit der Reihenfolge der Zeilen oder der Reihenfolge von Spalten unterschiedlich. Wenn ich sage, dass die Reihen mischen, meine ich jede Reihe unabhängig voneinander. Wenn Sie also zwei Spalten a  und b  haben, möchte ich, dass jede Zeile selbst gemischt wird, damit Sie nicht die gleichen Assoziationen zwischen einem  und b  haben, wie Sie es tun, wenn Sie jede Zeile nur wiederbestellen. So etwas wie: < /p>

[code]for 1...n:
for each col in df: shuffle column
return new_df
< /code>

, aber hoffentlich effizienter als naive Looping. Dies funktioniert bei mir nicht: < /p>

def shuffle(df, n, axis=0):
shuffled_df = df.copy()
for k in range(n):
shuffled_df.apply(np.random.shuffle(shuffled_df.values),axis=axis)
return shuffled_df

df = pandas.DataFrame({'A':range(10), 'B':range(10)})
shuffle(df, 5)
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie teile ich Daten aus einer Spalte eines Pandas-Datenrahmens in mehrere Spalten eines neuen Datenrahmens auf?

Last post by Anonymous « 27 Dec 2025, 20:54
Posted in Python

by Anonymous » 27 Dec 2025, 20:54 » in Python

Ich möchte Daten aus diesem Pandas-Datenrahmen (nennen wir ihn df1) aufteilen:

YEAR CODE DIFF
2013 XXXX 5.50
2013 YYYY 8.50
2013 ZZZZ 6.50
2014 XXXX 4.50
2014 YYYY 2.50
2014 ZZZZ 3.50

So dass...

0 Replies

6 Views

Last post by Anonymous
27 Dec 2025, 20:54
So iterieren Sie über Spalten eines Pandas-Datenrahmens

Last post by Guest « 07 Jan 2025, 05:23
Posted in Python

by Guest » 07 Jan 2025, 05:23 » in Python

Ich habe diesen Code mit Pandas in Python:
all_data = {}
for ticker in :
all_data = web.get_data_yahoo(ticker, '1/1/2010', '1/1/2015')

prices = DataFrame({tic: data for tic, data in...

0 Replies

58 Views

Last post by Guest
07 Jan 2025, 05:23
Das Indizieren eines Pandas-Datenrahmens mit dem datetime.date-Index führt zu KeyError

Last post by Anonymous « 30 Nov 2025, 22:35
Posted in Python

by Anonymous » 30 Nov 2025, 22:35 » in Python

Ich rufe einige Daten aus meiner MySQL-Datenbank ab. Diese Daten enthalten das Datum (nicht Datum/Uhrzeit) in einer Spalte und einige andere Zufallsdaten in den anderen Spalten. Nehmen wir an, dtf...

0 Replies

23 Views

Last post by Anonymous
30 Nov 2025, 22:35
Durch das Ändern einer Teilmenge des Pandas-Datenrahmens wird auch der ursprüngliche Datenrahmen geändert

Last post by Guest « 27 Dec 2024, 10:43
Posted in Python

by Guest » 27 Dec 2024, 10:43 » in Python

Ich habe Pandas DataFrame, über den ich iteriere, um Werte aus zwei Spalten zu erhalten ( col_1 und col_2). Die zweite Spalte enthält Listen. Was ich tun muss, ist für jeden Wert in col_1 eine Liste...

0 Replies

66 Views

Last post by Guest
27 Dec 2024, 10:43
Analysieren des Pandas-Datenrahmens mit mehreren Indizes für den Schlüsselanhang des Tupelwörterbuchs

Last post by Guest « 06 Jan 2025, 22:24
Posted in Python

by Guest » 06 Jan 2025, 22:24 » in Python

Problem/Aufgabe: Erstellen Sie eine Funktion, die einen Pandas-Datenrahmen eingibt, der durch den Markdown in Abb. 1 dargestellt wird, und ihn in ein Diktat mit der in Abb. 2 dargestellten Struktur...

0 Replies

43 Views

Last post by Guest
06 Jan 2025, 22:24

Return to “Python”