So führen Sie eine Neuabtastung eines Datensatzes durch, um eine gleichmäßige Verteilung zu erreichen

So führen Sie eine Neuabtastung eines Datensatzes durch, um eine gleichmäßige Verteilung zu erreichen ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

So führen Sie eine Neuabtastung eines Datensatzes durch, um eine gleichmäßige Verteilung zu erreichen

Report
Quote

Post by Anonymous » 31 Oct 2025, 23:24

Ich habe einen Datensatz mit einem Schema wie:

Code: Select all

df = pl.DataFrame(
{
"target": [
[1.0, 1.0, 0.0],
[1.0, 1.0, 0.1],
[1.0, 1.0, 0.2],
[1.0, 1.0, 0.8],
[1.0, 1.0, 0.9],
[1.0, 1.0, 1.0],
],
"feature": ["a", "b", "c", "d", "e", "f"],
},
schema={
"target": pl.Array(pl.Float32, 3),
"feature": pl.String,
},
)

Wenn ich ein Histogramm der Ziel-z-Werte erstelle, sieht es so aus:

Ich möchte die Daten erneut abtasten, sodass sie flach entlang z liegen.
Ich habe es auf eine knifflige Weise mit vielen Schritten geschafft (auch sehr langsam). Ich habe mich gefragt, ob die Leute einen saubereren (und effizienteren) Weg vorschlagen könnten?
Was ich mache ist:

Finden Sie die Bin-Kanten des besagten Histogramms:

Code: Select all

bins = 2 # Use e.g. 100 or larger in reality
z = df.select(z=pl.col("target").arr.get(2))
z_min = z.min()
z_max = z.max()
breaks = np.linspace(z_min, z_max, num=bins+1)

Finden Sie heraus, wie viele Zählungen sich im Behälter mit den wenigsten Zählungen befinden:

Code: Select all

counts = (
df.with_columns(bin=pl.col("target").arr.get(2).cut(breaks))
.with_columns(counter=pl.int_range(pl.len()).over("bin"))
.group_by("bin")
.agg(pl.col("counter").max())
.filter(pl.col("counter") > 0)  #

1761949468

Anonymous

Ich habe einen Datensatz mit einem Schema wie:
[code]df = pl.DataFrame(
{
"target": [
[1.0, 1.0, 0.0],
[1.0, 1.0, 0.1],
[1.0, 1.0, 0.2],
[1.0, 1.0, 0.8],
[1.0, 1.0, 0.9],
[1.0, 1.0, 1.0],
],
"feature": ["a", "b", "c", "d", "e", "f"],
},
schema={
"target": pl.Array(pl.Float32, 3),
"feature": pl.String,
},
)
[/code]
Wenn ich ein Histogramm der Ziel-z-Werte erstelle, sieht es so aus:
[img]https://i.sstatic.net/0bMhF5HC.png[/img]
Ich möchte die Daten erneut abtasten, sodass sie flach entlang z liegen.
Ich habe es auf eine knifflige Weise mit vielen Schritten geschafft (auch sehr langsam). Ich habe mich gefragt, ob die Leute einen saubereren (und effizienteren) Weg vorschlagen könnten?
Was ich mache ist:
[list]
[*]Finden Sie die Bin-Kanten des besagten Histogramms:
[/list]
[code]bins = 2 # Use e.g. 100 or larger in reality
z = df.select(z=pl.col("target").arr.get(2))
z_min = z.min()
z_max = z.max()
breaks = np.linspace(z_min, z_max, num=bins+1)
[/code]
[list]
[*]Finden Sie heraus, wie viele Zählungen sich im Behälter mit den wenigsten Zählungen befinden:
[/list]
[code]counts = (
df.with_columns(bin=pl.col("target").arr.get(2).cut(breaks))
.with_columns(counter=pl.int_range(pl.len()).over("bin"))
.group_by("bin")
.agg(pl.col("counter").max())
.filter(pl.col("counter") > 0)  #

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

1d linearer Wert Rauschen nicht gleichmäßige Verteilung; Gibt es eine bessere Rauschenfunktion?

Last post by Anonymous « 23 May 2025, 00:58
Posted in C#

by Anonymous » 23 May 2025, 00:58 » in C#

Ich habe hier eine einfache 1D -Wert -Rauschfunktion:
public float ValueNoise1D(float x)
{
int l = Mathf.FloorToInt(x);
int r = l + 1;

float vl = hashToFloat(hash(l));

float vr =...

0 Replies

23 Views

Last post by Anonymous
23 May 2025, 00:58
Goldbachs Vermutung - Finden Sie die Anzahl der Möglichkeiten, wie eine gleichmäßige Zahl als Summe von zwei Primzahlen

Last post by Anonymous « 23 Feb 2025, 17:33
Posted in Python

by Anonymous » 23 Feb 2025, 17:33 » in Python

Ich möchte wissen, wie viele Möglichkeiten eine bestimmte positive gleiche Zahl als Summe von zwei Primzahlen geschrieben werden kann.

Im Moment habe ich diesen Code :

n = int(input( > ))
def...

0 Replies

39 Views

Last post by Anonymous
23 Feb 2025, 17:33
So behalten Sie den vorhandenen Wert bei (anhängen), während Sie SqlParameter zum Aktualisieren eines Datensatzes verwen

Last post by Guest « 14 Jan 2025, 11:37
Posted in C#

by Guest » 14 Jan 2025, 11:37 » in C#

Ich möchte eine Spalte in SQL Server aktualisieren, indem ich ihren ursprünglichen Wert behalte und einen neuen Wert durch Komma getrennt anhänge. Dies kann folgendermaßen erfolgen:
string sql =...

0 Replies

37 Views

Last post by Guest
14 Jan 2025, 11:37
KI in Java geschrieben, das gleichmäßige und seltsame Zahlen klassifiziert

Last post by Guest « 05 Feb 2025, 03:47
Posted in Java

by Guest » 05 Feb 2025, 03:47 » in Java

Ich habe derzeit neuronale Netzwerke studiert und als Praxis habe ich versucht, ein Modell zu machen, das Zahlen klassifiziert. Es dauert Zahlen als Eingänge und gibt eine 1 aus, wenn die Zahl gerade...

0 Replies

33 Views

Last post by Guest
05 Feb 2025, 03:47
KI in Java geschrieben, das gleichmäßige und ungerade Zahlen klassifiziert [geschlossen] nicht funktioniert [geschlossen

Last post by Anonymous « 10 Feb 2025, 12:01
Posted in Java

by Anonymous » 10 Feb 2025, 12:01 » in Java

Ich studiere neuronale Netzwerke und als Praxis habe ich versucht, ein Modell zu machen, das Zahlen klassifiziert. Es dauert Zahlen als Eingänge und gibt eine 1 aus, wenn die Zahl gerade oder 0 ist,...

0 Replies

37 Views

Last post by Anonymous
10 Feb 2025, 12:01

Return to “Python”