Der richtige Umgang mit stark unausgeglichenen Daten ist die binäre Klassifizierung

Der richtige Umgang mit stark unausgeglichenen Daten ist die binäre Klassifizierung ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Guest

Der richtige Umgang mit stark unausgeglichenen Daten ist die binäre Klassifizierung

Report
Quote

Post by Guest » 25 Jan 2025, 15:13

Ich habe einen wirklich großen Datensatz mit 60 Millionen Zeilen und 11 Funktionen. Dieses Problem: < /p>
Erstens: Unterabtastung /Überabtastung. < /strong>

Ich habe auf diese Weise zwei Probleme /Fragen.
Wenn ich vor dem Zugtest auf der Auftest-Aufteilung Unterabtastung mache, verliere ich viele Daten. Nehmen wir an, die Häufigkeit eines gutartigen Tumors über bösartig), und da das Modell eingeschult und bewertet wird, funktioniert das Modell gut. Aber wenn ich irgendwann in der Zukunft mein Modell für neue Daten ausprobieren werde, wird es schlecht ausführen, da echte Daten nicht ausgleichet werden. Unterfit, weil es auf ausgeglichenen Daten trainiert wird, aber auf unausgewogene validiert/getestet wird. XBG, zufälliger Wald, logistische Regression?

1737814414

Guest

Ich habe einen wirklich großen Datensatz mit 60 Millionen Zeilen und 11 Funktionen. Dieses Problem: < /p>
 Erstens: Unterabtastung /Überabtastung. < /strong>

Ich habe auf diese Weise zwei Probleme /Fragen.
Wenn ich vor dem Zugtest auf der Auftest-Aufteilung Unterabtastung mache, verliere ich viele Daten. Nehmen wir an, die Häufigkeit eines gutartigen Tumors über bösartig), und da das Modell eingeschult und bewertet wird, funktioniert das Modell gut. Aber wenn ich irgendwann in der Zukunft mein Modell für neue Daten ausprobieren werde, wird es schlecht ausführen, da echte Daten nicht ausgleichet werden. Unterfit, weil es auf ausgeglichenen Daten trainiert wird, aber auf unausgewogene validiert/getestet wird. XBG, zufälliger Wald, logistische Regression?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie integriere ich einen Image-Klassifizierer in OpendLP für eine sensible und nicht sensitive Klassifizierung über APIs

Last post by Anonymous « 25 Jul 2025, 16:59
Posted in Python

by Anonymous » 25 Jul 2025, 16:59 » in Python

Ich arbeite an einer Open-Source-Datenverlust-Prävention (DLP) -Lösung (Open-Source Data Loss Prevention), die versucht, Bildscanfunktionen mithilfe von maschinellem Lernen (ML) zur...

0 Replies

16 Views

Last post by Anonymous
25 Jul 2025, 16:59
Umgang mit der Datenvermietung Daten kopieren und einfügen und das Löschen der Daten

Last post by Guest « 11 Feb 2025, 03:40
Posted in HTML

by Guest » 11 Feb 2025, 03:40 » in HTML

Ich habe den folgenden Code, in dem ich kopiere und dann einige Dinge wie Folgendes im Textbereich einfüge. Ich habe es auf diese Weise eingerichtet, denn wenn ich die folgenden drei Zeilen einfüge,...

0 Replies

16 Views

Last post by Guest
11 Feb 2025, 03:40
Umgang mit der Datenvermietung Daten kopieren und einfügen und das Löschen der Daten

Last post by Guest « 11 Feb 2025, 03:40
Posted in JavaScript

by Guest » 11 Feb 2025, 03:40 » in JavaScript

Ich habe den folgenden Code, in dem ich kopiere und dann einige Dinge wie Folgendes im Textbereich einfüge. Ich habe es auf diese Weise eingerichtet, denn wenn ich die folgenden drei Zeilen einfüge,...

0 Replies

16 Views

Last post by Guest
11 Feb 2025, 03:40
ASP.NET 5: So laden Sie stark typisierte Konfigurationen bei Änderungen neu

Last post by Guest « 16 Jan 2025, 11:27
Posted in C#

by Guest » 16 Jan 2025, 11:27 » in C#

Ich konnte in ASP.NET 5 eine stark typisierte Konfiguration einrichten und sie funktioniert perfekt. Ich habe die Konfiguration auch so eingestellt, dass sie automatisch neu geladen wird, wenn die...

0 Replies

28 Views

Last post by Guest
16 Jan 2025, 11:27
Wie konvertiere ich eine Arraylist in eine stark typisierte generische Liste, ohne eine Foreach zu verwenden?

Last post by Anonymous « 06 Feb 2025, 05:42
Posted in C#

by Anonymous » 06 Feb 2025, 05:42 » in C#

Siehe das Code -Beispiel unten. Ich muss die ArrayList eine generische Liste sein. Ich möchte nicht für .

verwenden ArrayList arrayList = GetArrayListOfInts();
List intList = new List();

//Can...

0 Replies

22 Views

Last post by Anonymous
06 Feb 2025, 05:42

Return to “Python”