state, lr_schedule = init_train_state(model, params['params'], learning_rate, weight_decay, beta1, beta2, decay_lr, warmup_iters,
lr_decay_iters, min_lr) # Here state is the initialied state variable with type Train_state.
state = checkpoint_manager.restore(checkpoint_manager.latest_step(), items={'state': state})
< /code>
Aber wenn ich versuche, den wiederhergestellten Status in der Trainingsschleife zu verwenden, habe ich diesen Fehler erhalten: < /p>
---------------------------------------------------------------------------
KeyError Traceback (most recent call last)
File /opt/conda/envs/py_3.10/lib/python3.10/site-packages/jax/_src/api_util.py:584, in shaped_abstractify(x)
583 try:
--> 584 return _shaped_abstractify_handlers[type(x)](x)
585 except KeyError:
KeyError:
During handling of the above exception, another exception occurred:
TypeError Traceback (most recent call last)
Cell In[40], line 37
34 if iter_num == 0 and eval_only:
35 break
---> 37 state, loss = train_step(state, get_batch('train'))
39 # timing and logging
40 t1 = time.time()
[... skipping hidden 6 frame]
File /opt/conda/envs/py_3.10/lib/python3.10/site-packages/jax/_src/api_util.py:575, in _shaped_abstractify_slow(x)
573 dtype = dtypes.canonicalize_dtype(x.dtype, allow_extended_dtype=True)
574 else:
--> 575 raise TypeError(
576 f"Cannot interpret value of type {type(x)} as an abstract array; it "
577 "does not have a dtype attribute")
578 return core.ShapedArray(np.shape(x), dtype, weak_type=weak_type,
579 named_shape=named_shape)
TypeError: Cannot interpret value of type as an abstract array; it does not have a dtype attribute
Wie soll ich den Status Checkpoint korrekt wiederherstellen und in der Trainingsschleife verwenden?
Danke!
Ich habe einen Orbax -Checkpoint mit dem folgenden Code gespeichert: < /p> [code]check_options = ocp.CheckpointManagerOptions(max_to_keep=5, create=True) check_path = Path(os.getcwd(), out_dir, 'checkpoint') checkpoint_manager = ocp.CheckpointManager(check_path, options=check_options, item_names=('state', 'metadata')) checkpoint_manager.save( step=iter_num, args=ocp.args.Composite( state=ocp.args.StandardSave(state), metadata=ocp.args.JsonSave((model_args, iter_num, best_val_loss, losses['val'].item(), config)))) [/code] Wenn ich versuche, von den gespeicherten Checkpoints wieder aufzunehmen, habe ich den folgenden Code verwendet, um den Status Variable zu erhalten: [code]state, lr_schedule = init_train_state(model, params['params'], learning_rate, weight_decay, beta1, beta2, decay_lr, warmup_iters, lr_decay_iters, min_lr) # Here state is the initialied state variable with type Train_state. state = checkpoint_manager.restore(checkpoint_manager.latest_step(), items={'state': state}) < /code> Aber wenn ich versuche, den wiederhergestellten Status in der Trainingsschleife zu verwenden, habe ich diesen Fehler erhalten: < /p> --------------------------------------------------------------------------- KeyError Traceback (most recent call last) File /opt/conda/envs/py_3.10/lib/python3.10/site-packages/jax/_src/api_util.py:584, in shaped_abstractify(x) 583 try: --> 584 return _shaped_abstractify_handlers[type(x)](x) 585 except KeyError:
KeyError:
During handling of the above exception, another exception occurred:
TypeError Traceback (most recent call last) Cell In[40], line 37 34 if iter_num == 0 and eval_only: 35 break ---> 37 state, loss = train_step(state, get_batch('train')) 39 # timing and logging 40 t1 = time.time()
[... skipping hidden 6 frame]
File /opt/conda/envs/py_3.10/lib/python3.10/site-packages/jax/_src/api_util.py:575, in _shaped_abstractify_slow(x) 573 dtype = dtypes.canonicalize_dtype(x.dtype, allow_extended_dtype=True) 574 else: --> 575 raise TypeError( 576 f"Cannot interpret value of type {type(x)} as an abstract array; it " 577 "does not have a dtype attribute") 578 return core.ShapedArray(np.shape(x), dtype, weak_type=weak_type, 579 named_shape=named_shape)
TypeError: Cannot interpret value of type as an abstract array; it does not have a dtype attribute [/code] Wie soll ich den Status Checkpoint korrekt wiederherstellen und in der Trainingsschleife verwenden? Danke!
Ich versuche herauszufinden, wie man nnx.split_rngs verwendet. Kann jemand eine Version des folgenden Codes geben, der nnx.split_rngs mit jax.tree.map verwendetimport jax
from flax import nnx
from...
Ich bin ein Jax -Anfänger und jemand mit Jax hat mir gesagt, dass wenn wir wiederholt Anrufe zu einem Scan / for Loop (z. B. wenn diese selbst für Loop selbst eingewickelt werden), könnte es besser...
Ich versuche, eine Sicherung meiner SQLite -Datenbank zu erstellen, und ich möchte zuerst den Inhalt der Wal -Datei in der DB spülen. public class MyDBHelper extends SQLiteOpenHelper {
Ich habe ein VPN -Produkt für macOS. Bei Aktivierung erstellt es eine virtuelle Schnittstelle, die den gesamten ausgehenden Verkehr für das VPN erfasst. Das VPN verschlüsselt es und sendet es an das...
Ich interessiere mich für die Schulung eines neuronalen Netzwerks mit JAX. Ich habe mir tf.data.dataset gesehen, aber es liefert ausschließlich TF -Tensoren. Ich suchte nach einer Möglichkeit, den...