Drei verschiedene CNN-Architekturen, die identische Metriken erzeugen (VGG16, DenseNet, ResNet)

Drei verschiedene CNN-Architekturen, die identische Metriken erzeugen (VGG16, DenseNet, ResNet) ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Drei verschiedene CNN-Architekturen, die identische Metriken erzeugen (VGG16, DenseNet, ResNet)

Report
Quote

Post by Anonymous » 31 Dec 2025, 18:46

Problem
Ich trainiere drei verschiedene CNN-Architekturen (VGG16, ResNet50, DenseNet121) mit demselben medizinischen Bildgebungsdatensatz, aber alle drei Modelle erzeugen identische Metriken (gleiche Genauigkeit, F1, AUC bis auf 4 Dezimalstellen). Dies bleibt über mehrere Trainingsläufe hinweg bestehen.
Einrichtung
Datensatz: 1016 medizinische Bilder -> konvertiert in das .npy-Format (binäre Klassifizierung)
Modelle: VGG16, ResNet50, DenseNet121 (alle ohne vorab trainierte Gewichte, von Grund auf trainiert)
Framework: TensorFlow 2.x
Eingabe: Graustufen Bilder (224 x 224 x 1), aus Gründen der Architekturkompatibilität in 3-Kanal konvertiert
Codestruktur

Code: Select all

python# Simplified version
def build_model(backbone_name, random_seed):
tf.random.set_seed(random_seed)
np.random.seed(random_seed)

# Grayscale to 3-channel conversion
image_input = tf.keras.Input(shape=(224, 224, 1))
x = augmentation_layer(image_input)
x = tf.keras.layers.Concatenate()([x, x, x])  # (224, 224, 3)

# Load backbone (VGG16/ResNet50/DenseNet121)
backbone = get_backbone(backbone_name, use_pretrained=False)
features = backbone(x)

# Independent classifier head with unique name
x = Dense(128, activation='relu', name=f'fc1_{backbone_name}_{random_seed}')(features)
x = Dropout(0.5)(x)
x = Dense(64, activation='relu', name=f'fc2_{backbone_name}_{random_seed}')(x)
output = Dense(1, activation='sigmoid', name=f'output_{backbone_name}_{random_seed}')(x)

model = tf.keras.Model(inputs=image_input, outputs=output)
return model

# Training
for model_name, seed in [('VGG16', 100), ('ResNet50', 200), ('DenseNet121', 300)]:
model = build_model(model_name, seed)
model.compile(optimizer=Adam(1e-4), loss='binary_crossentropy', metrics=['accuracy', AUC()])
model.fit(train_ds, validation_data=val_ds, epochs=25)

# Evaluate
predictions = model.predict(test_ds)
# Calculate metrics...

tf.keras.backend.clear_session()  # Clear between models

Beispielergebnisse

Code: Select all

Model       | Accuracy | F1     | AUC
------------|----------|--------|--------
VGG16       | 0.8234   | 0.8156 | 0.8891
ResNet50    | 0.8234   | 0.8156 | 0.8891  ← Identical!
DenseNet121 | 0.8234   | 0.8156 | 0.8891  ← Identical!

Durchgeführte Diagnosen
Vorhersagestatistiken (Mittelwert, Standard) SIND leicht unterschiedlich
Anzahl eindeutiger Vorhersagen variiert (Bereich 100–150)
Trainingsverläufe zeigen unterschiedliche Konvergenzmuster
Modellparameteranzahlen sind unterschiedlich (VGG: 15 Mio., ResNet: 24 Mio., DenseNet: 7M)
Fragen

Könnte es sich um einen Fehler bei der Metrikberechnung handeln, bei dem ich versehentlich Arrays wiederverwende?
Gibt es ein TensorFlow-Caching-Problem trotz Clearing-Sitzungen?
Könnten die Modelle in diesem Datensatz tatsächlich die gleiche Leistung erbringen? Chance?
Übersehe ich etwas über die ordnungsgemäße Modellisolation in TensorFlow?

Umgebung:

Code: Select all

TensorFlow 2.15
Python 3.10
Windows 11
GPU: RTX 3060

1767203208

Anonymous

[b]Problem[/b]
Ich trainiere drei verschiedene CNN-Architekturen (VGG16, ResNet50, DenseNet121) mit demselben medizinischen Bildgebungsdatensatz, aber alle drei Modelle erzeugen identische Metriken (gleiche Genauigkeit, F1, AUC bis auf 4 Dezimalstellen). Dies bleibt über mehrere Trainingsläufe hinweg bestehen.
Einrichtung
Datensatz: 1016 medizinische Bilder -> konvertiert in das .npy-Format (binäre Klassifizierung)
Modelle: VGG16, ResNet50, DenseNet121 (alle ohne vorab trainierte Gewichte, von Grund auf trainiert)
Framework: TensorFlow 2.x
Eingabe: Graustufen Bilder (224 x 224 x 1), aus Gründen der Architekturkompatibilität in 3-Kanal konvertiert
[b]Codestruktur[/b]
[code]python# Simplified version
def build_model(backbone_name, random_seed):
tf.random.set_seed(random_seed)
np.random.seed(random_seed)

# Grayscale to 3-channel conversion
image_input = tf.keras.Input(shape=(224, 224, 1))
x = augmentation_layer(image_input)
x = tf.keras.layers.Concatenate()([x, x, x])  # (224, 224, 3)

# Load backbone (VGG16/ResNet50/DenseNet121)
backbone = get_backbone(backbone_name, use_pretrained=False)
features = backbone(x)

# Independent classifier head with unique name
x = Dense(128, activation='relu', name=f'fc1_{backbone_name}_{random_seed}')(features)
x = Dropout(0.5)(x)
x = Dense(64, activation='relu', name=f'fc2_{backbone_name}_{random_seed}')(x)
output = Dense(1, activation='sigmoid', name=f'output_{backbone_name}_{random_seed}')(x)

model = tf.keras.Model(inputs=image_input, outputs=output)
return model

# Training
for model_name, seed in [('VGG16', 100), ('ResNet50', 200), ('DenseNet121', 300)]:
model = build_model(model_name, seed)
model.compile(optimizer=Adam(1e-4), loss='binary_crossentropy', metrics=['accuracy', AUC()])
model.fit(train_ds, validation_data=val_ds, epochs=25)

# Evaluate
predictions = model.predict(test_ds)
# Calculate metrics...

tf.keras.backend.clear_session()  # Clear between models
[/code]
[b]Beispielergebnisse[/b]
[code]Model       | Accuracy | F1     | AUC
------------|----------|--------|--------
VGG16       | 0.8234   | 0.8156 | 0.8891
ResNet50    | 0.8234   | 0.8156 | 0.8891  ← Identical!
DenseNet121 | 0.8234   | 0.8156 | 0.8891  ← Identical!
[/code]
[b]Durchgeführte Diagnosen[/b]
Vorhersagestatistiken (Mittelwert, Standard) SIND leicht unterschiedlich
Anzahl eindeutiger Vorhersagen variiert (Bereich 100–150)
Trainingsverläufe zeigen unterschiedliche Konvergenzmuster
Modellparameteranzahlen sind unterschiedlich (VGG: 15 Mio., ResNet: 24 Mio., DenseNet: 7M)
[b]Fragen[/b]
[list]
[*]Könnte es sich um einen Fehler bei der Metrikberechnung handeln, bei dem ich versehentlich Arrays wiederverwende?

[*]Gibt es ein TensorFlow-Caching-Problem trotz Clearing-Sitzungen?

[*]Könnten die Modelle in diesem Datensatz tatsächlich die gleiche Leistung erbringen? Chance?

[*]Übersehe ich etwas über die ordnungsgemäße Modellisolation in TensorFlow?

[/list]
Umgebung:
[code]TensorFlow 2.15
Python 3.10
Windows 11
GPU: RTX 3060
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Verschiedene Ergebniswahrscheinlichkeiten zwischen VGG16 in MATLAB und in Python beim Speichern im Onnx -Format

Last post by Anonymous « 12 Feb 2025, 12:10
Posted in Python

by Anonymous » 12 Feb 2025, 12:10 » in Python

Ich habe die letzte Schicht eines VGG16 mit MATLAB erneut ausgeschaltet und im ONNX-Format gespeichert. Machen Sie die Schlussfolgerung. Es ist alles funktional, aber die Klassen...

0 Replies

32 Views

Last post by Anonymous
12 Feb 2025, 12:10
OSError: Das Modell für „facebook/detr-resnet-101“ kann nicht geladen werden.

Last post by Guest « 03 Jan 2025, 13:47
Posted in Python

by Guest » 03 Jan 2025, 13:47 » in Python

Dieser Code wird zweimal gerendert
Ich erhalte die erwartete Ausgabe, werde sie aber noch einmal rendern, sodass ich dieses Mal diesen Betriebssystemfehler erhalte
wie ich ihn beheben kann Dieser...

0 Replies

34 Views

Last post by Guest
03 Jan 2025, 13:47
Replikation der GPU -Umgebung über Architekturen hinweg

Last post by Anonymous « 27 Feb 2025, 03:28
Posted in Python

by Anonymous » 27 Feb 2025, 03:28 » in Python

Ich trainiere ein Mamba -Modell für zwei verschiedene GPU -Architekturen: RTX 4090 und RTX A6000. Obwohl ich alle zufälligen Saatgut setzt und deterministische Algorithmen verwendet habe, beobachte...

0 Replies

1 Views

Last post by Anonymous
27 Feb 2025, 03:28
Warum mein Code Referenzfehler macht, wenn ich die drei.js importiere, sind drei nicht definiert, während sript tagetyp

Last post by Anonymous « 04 Mar 2025, 08:43
Posted in HTML

by Anonymous » 04 Mar 2025, 08:43 » in HTML

Browser kann keine Funktion mit dem Namen loadSVG im aktuellen Bereich finden, wenn das Einklickereignis der Taste ausgelöst wird. Aus '
window.innerHeight, 0.1, 1000); Loader.Parse (svgdata); //...

0 Replies

45 Views

Last post by Anonymous
04 Mar 2025, 08:43
Warum mein Code Referenzfehler macht, wenn ich die drei.js importiere, sind drei nicht definiert, während sript tagetyp

Last post by Anonymous « 04 Mar 2025, 08:43
Posted in JavaScript

by Anonymous » 04 Mar 2025, 08:43 » in JavaScript

Browser kann keine Funktion mit dem Namen loadSVG im aktuellen Bereich finden, wenn das Einklickereignis der Taste ausgelöst wird. Aus '
window.innerHeight, 0.1, 1000); Loader.Parse (svgdata); //...

0 Replies

62 Views

Last post by Anonymous
04 Mar 2025, 08:43

Return to “Python”