GradientTape berechnet die Gradienten nach der Wiederherstellung eines Modells von ModelCheckpoint (TensorFlow) nicht

GradientTape berechnet die Gradienten nach der Wiederherstellung eines Modells von ModelCheckpoint (TensorFlow) nicht ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

GradientTape berechnet die Gradienten nach der Wiederherstellung eines Modells von ModelCheckpoint (TensorFlow) nicht

Report
Quote

Post by Anonymous » 11 Jul 2025, 12:00

Ich trainiere einen CNN auf Tensorflow für binäre Klassifizierung und führt meinen Code in Google Colab aus.

Code: Select all

CNN_model = tf.keras.Sequential([
tf.keras.layers.Input(shape=(IMAGE_SIZE, IMAGE_SIZE, 3)),
tf.keras.layers.Conv2D(filters=32, kernel_size=3, activation="relu", name='conv1'),
tf.keras.layers.Conv2D(filters=64, kernel_size=3, activation="relu", name='conv2'),
tf.keras.layers.MaxPooling2D(pool_size=2, name='maxpool1'),
tf.keras.layers.Conv2D(filters=128, kernel_size=3, activation="relu", name='conv3'),

tf.keras.layers.Flatten(),
tf.keras.layers.Dense(128, activation='relu', name='dense1'),
tf.keras.layers.Dense(1, activation='sigmoid', name='prediction')

], name='CNN_model')
< /code>
Da es eine Weile dauert, bis das Modell trainiert, sollte ich es speichern (über den Modellcheckpoint -Rückruf) und bei Bedarf wiederherstellen. < /p>
callbacks = [
tf.keras.callbacks.ModelCheckpoint("best_CNN.keras",
save_best_only=True),
]
< /code>
CNN_model = tf.keras.models.load_model("best_CNN.keras")
< /code>
Es ging in Ordnung, bis ich Grad-CAM implementiert habe (zur Entscheidungstransparenz). Ich werde den ersten Abschnitt von make_gradcam_heatmap

:
einfügen

Code: Select all

def make_gradcam_heatmap(img_array, model, last_conv_layer_name):

grad_model = tf.keras.models.Model(
model.inputs,
[model.get_layer(last_conv_layer_name).output, model.layers[-1].input]
)

with tf.GradientTape() as tape:
tape.watch(img_array)

last_conv_layer_output, last_layer_input = grad_model(img_array)

logits = tf.matmul(last_layer_input, model.layers[-1].kernel) + model.layers[-1].bias

grads = tape.gradient(logits, last_conv_layer_output)

Beim Training des Modells und beim Erstellen von Heatmaps in derselben Sitzung gibt es kein Problem, aber wenn ich make_gradcam_heatmap ein restauriertes Modell, Tape.gradient (Logits, last_conv_layer_output) zurückgibt. Cnn_model.trainable ist wahr.

Code: Select all

for layer in CNN_model.layers:
layer.trainable = True

Für den Fall, dass es hilfreich ist, verwende ich Datensatz 'Malaria' aus TensorFlow -Datensätzen

1752228041

Anonymous

Ich trainiere einen CNN auf Tensorflow für binäre Klassifizierung und führt meinen Code in Google Colab aus.[code]CNN_model = tf.keras.Sequential([
tf.keras.layers.Input(shape=(IMAGE_SIZE, IMAGE_SIZE, 3)),
tf.keras.layers.Conv2D(filters=32, kernel_size=3, activation="relu", name='conv1'),
tf.keras.layers.Conv2D(filters=64, kernel_size=3, activation="relu", name='conv2'),
tf.keras.layers.MaxPooling2D(pool_size=2, name='maxpool1'),
tf.keras.layers.Conv2D(filters=128, kernel_size=3, activation="relu", name='conv3'),

tf.keras.layers.Flatten(),
tf.keras.layers.Dense(128, activation='relu', name='dense1'),
tf.keras.layers.Dense(1, activation='sigmoid', name='prediction')

], name='CNN_model')
< /code>
Da es eine Weile dauert, bis das Modell trainiert, sollte ich es speichern (über den Modellcheckpoint -Rückruf) und bei Bedarf wiederherstellen. < /p>
callbacks = [
tf.keras.callbacks.ModelCheckpoint("best_CNN.keras",
save_best_only=True),
]
< /code>
CNN_model = tf.keras.models.load_model("best_CNN.keras")
< /code>
Es ging in Ordnung, bis ich Grad-CAM implementiert habe (zur Entscheidungstransparenz). Ich werde den ersten Abschnitt von make_gradcam_heatmap [/code]:
einfügen[code]def make_gradcam_heatmap(img_array, model, last_conv_layer_name):

grad_model = tf.keras.models.Model(
model.inputs,
[model.get_layer(last_conv_layer_name).output, model.layers[-1].input]
)

with tf.GradientTape() as tape:
tape.watch(img_array)

last_conv_layer_output, last_layer_input = grad_model(img_array)

logits = tf.matmul(last_layer_input, model.layers[-1].kernel) + model.layers[-1].bias

grads = tape.gradient(logits, last_conv_layer_output)
[/code]
Beim Training des Modells und beim Erstellen von Heatmaps in derselben Sitzung gibt es kein Problem, aber wenn ich make_gradcam_heatmap  ein restauriertes Modell, Tape.gradient (Logits, last_conv_layer_output)  zurückgibt. Cnn_model.trainable  ist wahr.[code]for layer in CNN_model.layers:
layer.trainable = True
[/code]
Für den Fall, dass es hilfreich ist, verwende ich Datensatz 'Malaria' aus TensorFlow -Datensätzen

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie kann ich in einer Muai -Shell -App dem Navigationsleisten -Gradienten auf iOS & Android einen Gradienten hinzufügen?

Last post by Guest « 10 Feb 2025, 06:10
Posted in Android

by Guest » 10 Feb 2025, 06:10 » in Android

Ich versuche, der Navigationsleiste in einer .NET -Maui -Shell -basierte App einen Gradienten hinzuzufügen. Ich habe es versucht:

Mit einem benutzerdefinierten Handler.
Verwenden eines...

0 Replies

26 Views

Last post by Guest
10 Feb 2025, 06:10
Wie kann ich in einer Muai -Shell -App dem Navigationsleisten -Gradienten auf iOS & Android einen Gradienten hinzufügen?

Last post by Guest « 10 Feb 2025, 06:10
Posted in IOS

by Guest » 10 Feb 2025, 06:10 » in IOS

Ich versuche, der Navigationsleiste in einer .NET -Maui -Shell -basierte App einen Gradienten hinzuzufügen. Ich habe es versucht:

Mit einem benutzerdefinierten Handler.
Verwenden eines...

0 Replies

33 Views

Last post by Guest
10 Feb 2025, 06:10
Wie kann ich in einer Muai -Shell -App dem Navigationsleisten -Gradienten auf iOS & Android einen Gradienten hinzufügen?

Last post by Guest « 10 Feb 2025, 06:37
Posted in Android

by Guest » 10 Feb 2025, 06:37 » in Android

Ich versuche, der Navigationsleiste in einer .NET -Maui -Shell -basierte App einen Gradienten hinzuzufügen. Ich habe es versucht:

Mit einem benutzerdefinierten Handler.
Verwenden eines...

0 Replies

30 Views

Last post by Guest
10 Feb 2025, 06:37
Implementierung eines ML -Modells in eine Android -App mit TensorFlow Lite

Last post by Anonymous « 06 Feb 2025, 04:39
Posted in Android

by Anonymous » 06 Feb 2025, 04:39 » in Android

Ich bin also neu in der Domäne der Android -App -Entwicklung. Wenn ich die Schritte korrekt verstehe:
Auswahl 1:

Machen Sie das Modell im Tensorflow. Konvertieren Sie mit Tflite_Converter in...

0 Replies

18 Views

Last post by Anonymous
06 Feb 2025, 04:39
Problem beim Konvertieren des ONNX -Modells in den TensorFlow (Kompatibilitätsproblem)

Last post by Anonymous « 06 May 2025, 09:56
Posted in Python

by Anonymous » 06 May 2025, 09:56 » in Python

Ich arbeite an meinem Universitätsprojekt. Eine seiner Aufgaben ist es, Pytorch in Tensorflow und Tensorflow in TensorFlow Lite in Tensorflow umzuwandeln. Ich habe Pytorch erfolgreich mit Hilfe von...

0 Replies

12 Views

Last post by Anonymous
06 May 2025, 09:56

Return to “Python”