NaN vermeiden, weil die Optax -BFGS -Implementierung implementiert ist? - Programmiererforum

NaN vermeiden, weil die Optax -BFGS -Implementierung implementiert ist? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Guest

NaN vermeiden, weil die Optax -BFGS -Implementierung implementiert ist?

Post by Guest » 22 Feb 2025, 13:32

Ich bin ziemlich neu in Optax. Es gibt diese Zeile in scale_by_lbfgs , die die Gewichtsberechnung in optax/optax/_src/Transformation durchführt.

Code: Select all

def scale_by_lbfgs(
...
def update_fn(
...
weight = jnp.where(
vdot_diff_params_updates == 0.0, 0.0, 1.0 / vdot_diff_params_updates
)

Dies gibt nan , wenn vdot_diff_params_updates klein ist, aber ungleich Null. Gibt es eine gute Möglichkeit, dies zu vermeiden, z. B. Bearbeiten von Zuständen oder Gradientenkappen?

1740227523

Guest

Ich bin ziemlich neu in Optax. Es gibt diese Zeile in scale_by_lbfgs , die die Gewichtsberechnung in optax/optax/_src/Transformation durchführt.[code]def scale_by_lbfgs(
...
def update_fn(
...
weight = jnp.where(
vdot_diff_params_updates == 0.0, 0.0, 1.0 / vdot_diff_params_updates
)
[/code]
Dies gibt nan , wenn vdot_diff_params_updates  klein ist, aber ungleich Null. Gibt es eine gute Möglichkeit, dies zu vermeiden, z. B. Bearbeiten von Zuständen oder Gradientenkappen?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Problem mit Nan in Python (Pandas): Das Programm kann das Nan nicht erkennen

Last post by Anonymous « 23 Dec 2024, 18:45
Posted in Python

by Anonymous » 23 Dec 2024, 18:45 » in Python

Ich befinde mich in einer seltsamen Situation
Ich habe einen Datenrahmen, einige der Werte sind Nullen
Wenn ich versuche, die Null zu ändern, d. h Ich kann es nicht tun, aus irgendeinem Grund erkennt...

0 Replies

20 Views

Last post by Anonymous
23 Dec 2024, 18:45
Wie kann man Numpy-Vergleiche mit NaN durchführen, um NaN anstelle von False zurückzugeben?

Last post by Guest « 13 Jan 2025, 20:18
Posted in Python

by Guest » 13 Jan 2025, 20:18 » in Python

Ich führe Vergleiche (Gleichheit) einiger Reihen durch, die einige NaN-Elemente und numerische Elemente enthalten. Ich möchte, dass jeder Vergleich mit einem NaN NaN anstelle von False zurückgibt –...

0 Replies

17 Views

Last post by Guest
13 Jan 2025, 20:18
So skalieren Sie die Lernraten pro Parameter mit Penzai und Optax

Last post by Anonymous « 16 Mar 2025, 17:03
Posted in Python

by Anonymous » 16 Mar 2025, 17:03 » in Python

Ich möchte ein einfaches Vorwärts -Neuralnetz ausbilden, das ich in Penzai eingebaut habe, aber ich möchte für jede Parametergruppe unterschiedliche Lernraten verwenden. Ich speichere den Lernrate...

0 Replies

4 Views

Last post by Anonymous
16 Mar 2025, 17:03
Wie kann in meinem Vulkan -Programm die Synchronisation implementiert werden, um zu vermeiden, dass das Bild in falscher

Last post by Anonymous « 23 Feb 2025, 18:03
Posted in C++

by Anonymous » 23 Feb 2025, 18:03 » in C++

Ich schreibe ein Vulkan -Programm.
Ich habe ein Problem damit, dass das Bild manchmal in falscher Reihenfolge angezeigt wird. Ich habe 2 Frames im Flug (max_frames_in_flight) und 3 Bilder...

0 Replies

7 Views

Last post by Anonymous
23 Feb 2025, 18:03
C++-Implementierung einer einfachen Karte langsamer als die entsprechende Implementierung in Java: Code-/Benchmark-Probl

Last post by Guest « 13 Jan 2025, 14:45
Posted in Java

by Guest » 13 Jan 2025, 14:45 » in Java

Ziel dieser Forschung ist es, die Leistungsunterschiede zwischen JIT- (Just-in-Time-Kompilierung) und AOT-Strategien (Ahead-of-Time-Kompilierung) zu untersuchen und ihre jeweiligen Vor- und Nachteile...

0 Replies

24 Views

Last post by Guest
13 Jan 2025, 14:45

Return to “Python”