Löschen von tf.data.dataset aus dem GPU -Speicher

Löschen von tf.data.dataset aus dem GPU -Speicher ⇐ Python

1 post • Page 1 of 1

Guest

Löschen von tf.data.dataset aus dem GPU -Speicher

Report
Quote

Post by Guest » 07 Feb 2025, 13:02

Ich bin in ein Problem, wenn ich eine Trainingsschleife implementieren kann, die ein tf.data.dataset als Eingabe für ein Keras -Modell verwendet. Mein Datensatz verfügt über ein Element-Spezifikum im folgenden Format: < /p>

Code: Select all

({'data': TensorSpec(shape=(15000, 1), dtype=tf.float32), 'index': TensorSpec(shape=(2,), dtype=tf.int64)}, TensorSpec(shape=(1,), dtype=tf.int32))

im Grunde genommen ist jede Probe als Tupel (x, y) strukturiert, in dem x die Struktur eines Dikters hat, das zwei Tensoren enthält, eines von Daten mit Form (15000, 1) und der andere ein Formindex (2,) (der Index wird während des Trainings nicht verwendet) und Y ist eine einzelne Etikett. < /p>
Die tf.data.dataset wird mit dataset = tf.data.dataset.from_tensor_slices ((x, y)) erstellt, wobei x ist ein Diktat von zwei Schlüssel: < /p>

Code: Select all
```
data
```
: Ein NP -Array von Form (200K, 1500, 1) , index mit
Code: Select all
```
index
```
: Ein NP -Array von Form (200K, 2)

Und Y ist ein einzelnes Array von Form `(200K, 1) < /p>
Mein Datensatz enthält ungefähr 200K -Trainingsmuster (nach Ausführung von Unterabtastungen) und 200K -Validierungsmuster. data.dataset.from_tensor_slices Ich habe einen Spike in der GPU -Speicherverwendung bemerkt, wobei etwa 16 GB nach dem Erstellen des Trainings tf.dataset und mehr als 16 GB nach dem Erstellen der Validierung tf.dataset besetzt sind.
Nach dem Erstellen des Tf.Dataset führen ich einige Operationen aus (z. B. Shuffle, Batching und Vorabstieg) und Call model.fit . Mein Modell verfügt über etwa 500K trainierbare Parameter. Ich muss in einigen zusätzlichen Daten Schlussfolgerungen ausführen, damit ich mit diesen Daten einen neuen tf.dataset erstelle, wobei ich erneut tf.dataset.from_tensor_slices verwendete. Ich bemerkte jedoch, dass das Training und die Validierung tf.dataset sich weiterhin im GPU -Speicher befinden, was dazu führt, dass mein Skript mit einem aus dem Speicherproblem für das neuen tf.dataset Ich möchte Inferenz ausführen.
Ich habe versucht, Del auf den beiden tf.dataset anzurufen und anschließend gc.collect () aufzurufen, aber ich glaube, das wird nur gelöscht RAM, nicht GPU -Speicher. Außerdem habe ich versucht, einige Operationen zu deaktivieren, die ich bewerbe, wie z. Zwei tf.dataset von gpu ohne einen Anruf bei keras.backend.clear_Session () , da dies auch das Modell von GPU entfernen würde? Oder ist meine einzige Option, Clear_Session aufzurufen und das Modell für Inferenz von der Festplatte neu zu laden?

1738929732

Guest

Ich bin in ein Problem, wenn ich eine Trainingsschleife implementieren kann, die ein tf.data.dataset  als Eingabe für ein Keras -Modell verwendet. Mein Datensatz verfügt über ein Element-Spezifikum im folgenden Format: < /p>
[code]({'data': TensorSpec(shape=(15000, 1), dtype=tf.float32), 'index': TensorSpec(shape=(2,), dtype=tf.int64)}, TensorSpec(shape=(1,), dtype=tf.int32))
[/code]
im Grunde genommen ist jede Probe als Tupel (x, y)  strukturiert, in dem x  die Struktur eines Dikters hat, das zwei Tensoren enthält, eines von Daten mit Form (15000, 1)  und der andere ein Formindex (2,)  (der Index wird während des Trainings nicht verwendet) und Y  ist eine einzelne Etikett. < /p>
Die tf.data.dataset  wird mit dataset = tf.data.dataset.from_tensor_slices ((x, y))  erstellt, wobei x  ist ein Diktat von zwei Schlüssel: < /p>
[list]
[*][code]data[/code]: Ein NP -Array von Form (200K, 1500, 1) , index  mit
[*][code]index[/code]: Ein NP -Array von Form (200K, 2) 
[/list]
Und Y  ist ein einzelnes Array von Form `(200K, 1) < /p>
Mein Datensatz enthält ungefähr 200K -Trainingsmuster (nach Ausführung von Unterabtastungen) und 200K -Validierungsmuster. data.dataset.from_tensor_slices  Ich habe einen Spike in der GPU -Speicherverwendung bemerkt, wobei etwa 16 GB nach dem Erstellen des Trainings tf.dataset  und mehr als 16 GB nach dem Erstellen der Validierung tf.dataset  besetzt sind.
Nach dem Erstellen des Tf.Dataset  führen ich einige Operationen aus (z. B. Shuffle, Batching und Vorabstieg) und Call model.fit . Mein Modell verfügt über etwa 500K trainierbare Parameter. Ich muss in einigen zusätzlichen Daten Schlussfolgerungen ausführen, damit ich mit diesen Daten einen neuen tf.dataset  erstelle, wobei ich erneut tf.dataset.from_tensor_slices  verwendete. Ich bemerkte jedoch, dass das Training und die Validierung tf.dataset  sich weiterhin im GPU -Speicher befinden, was dazu führt, dass mein Skript mit einem aus dem Speicherproblem für das neuen tf.dataset  Ich möchte Inferenz ausführen. 
Ich habe versucht, Del  auf den beiden tf.dataset  anzurufen und anschließend gc.collect ()  aufzurufen, aber ich glaube, das wird nur gelöscht RAM, nicht GPU -Speicher. Außerdem habe ich versucht, einige Operationen zu deaktivieren, die ich bewerbe, wie z. Zwei tf.dataset  von gpu ohne einen Anruf bei keras.backend.clear_Session () , da dies auch das Modell von GPU entfernen würde? Oder ist meine einzige Option, Clear_Session  aufzurufen und das Modell für Inferenz von der Festplatte neu zu laden?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Löschen von tf.data.dataset aus dem GPU -Speicher

Last post by Anonymous « 10 Feb 2025, 12:50
Posted in Python

by Anonymous » 10 Feb 2025, 12:50 » in Python

Ich bin in ein Problem, wenn ich eine Trainingsschleife implementieren kann, die ein tf.data.dataset als Eingabe für ein Keras -Modell verwendet. Mein Datensatz verfügt über ein Element-Spezifikum im...

0 Replies

32 Views

Last post by Anonymous
10 Feb 2025, 12:50
Aktionsereignisse aus der Datenbank nicht löschen "löschen" kann nicht löschen

Last post by Anonymous « 12 Mar 2025, 13:06
Posted in Java

by Anonymous » 12 Mar 2025, 13:06 » in Java

Das ist mein Code, um alle Ereignisse aus der Audit -Tabelle zu löschen. Das funktioniert. Dies sollte auch gelöscht werden. Es löschte jedoch nicht alle Löschen von Aktionsereignissen. Warum?...

0 Replies

55 Views

Last post by Anonymous
12 Mar 2025, 13:06
Erweitern Sie ein tf.data.Dataset um ein Bild und eine Maske. Beides muss erweitert werden

Last post by Guest « 03 Jan 2025, 10:38
Posted in Python

by Guest » 03 Jan 2025, 10:38 » in Python

Ich habe einen tf.data.Dataset mit Bildpfaden und Masken
# Creating list of image and mask path
all_val_img = np.array(sorted( ))
all_val_mask = np.array(sorted( ))

# doing tf.data.Dataset
val_data...

0 Replies

40 Views

Last post by Guest
03 Jan 2025, 10:38
Verwenden Sie einen tf.data.dataset zu einem jax.numpy iterator

Last post by Anonymous « 02 Feb 2025, 18:44
Posted in Python

by Anonymous » 02 Feb 2025, 18:44 » in Python

Ich interessiere mich für die Schulung eines neuronalen Netzwerks mit JAX. Ich habe mir tf.data.dataset gesehen, aber es liefert ausschließlich TF -Tensoren. Ich suchte nach einer Möglichkeit, den...

0 Replies

47 Views

Last post by Anonymous
02 Feb 2025, 18:44
Warum erhöht sich die Fragmentierung von Vulkan GPU -Gerätespeicher im Vergleich zum lokalen Speicher des Hosts dramatis

Last post by Anonymous « 13 Apr 2025, 00:21
Posted in C++

by Anonymous » 13 Apr 2025, 00:21 » in C++

(GPU) Gerätespeicher
Verwenden Sie Vulkan -Grafik -API -Zuordnung von Gerätespeicher:
Dies ist mein Teil Vulkan -Testcode:
VertexBuffer vertex_buffer;

VkMemoryAllocateInfo memAlloc{};...

0 Replies

28 Views

Last post by Anonymous
13 Apr 2025, 00:21

Return to “Python”