Keras - Die Zwischenschicht im Funktionsmodell ersetzen

Keras - Die Zwischenschicht im Funktionsmodell ersetzen ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Keras - Die Zwischenschicht im Funktionsmodell ersetzen

Post by Anonymous » 13 Apr 2025, 00:57

Ich versuche, eine benutzerdefinierte Implementierung von LORA für Keras zu erstellen, und ich stoße in Schwierigkeiten, meinen Ansatz zur Arbeit zu erlangen. Ich verwende Keras 3.4.1 in Google Collaby. Ich versuche jedoch, eine Lösung zu finden, die für Funktionsmodelle funktioniert, nicht nur für sequentielle Modelle wie VGG16. Zunächst erstelle ich das Modell ohne die letzte Schicht, deaktiviere das Training und drucke seine Zusammenfassung aus: < /p>

Code: Select all

vgg16_lora  = tf.keras.applications.vgg16.VGG16(weights="imagenet", input_shape=(224, 224, 3))
vgg16_lora.trainable = False

lora_model = tf.keras.Model(inputs=vgg16_lora.inputs, outputs=vgg16_lora.layers[-2].output)
lora_model.summary()

Ausgabe:

Dann versuche ich die LORA-Schicht wie folgt hinzuzufügen:
import math

class LoraLayer(tf.keras.Layer):
def __init__(self, original_layer, rank=8, trainable=False, **kwargs):
original_layer_config = original_layer.get_config()
name = original_layer_config["name"]
kwargs.pop('name', None)

super().__init__(name=name, trainable=trainable, **kwargs)

self.original_layer = original_layer
self.original_layer.trainable = False

self.A = tf.keras.layers.Dense(units=rank, use_bias=False, kernel_initializer=tf.keras.initializers.VarianceScaling(scale=math.sqrt(5), mode="fan_in", distribution="uniform"), trainable=trainable, name="lora_A")
self.B = tf.keras.layers.Dense(units=original_layer.output.shape[-1], kernel_initializer="zeros", trainable=trainable, name="lora_B")

def call(self, inputs):
original_outputs = self.original_layer(inputs)
lora_outputs = self.B(self.A(inputs))
return original_outputs + lora_outputs

lora_model._tracker.unlock()
lora_model.layers[-2] = LoraLayer(lora_model.layers[-2], rank=8, trainable=False)
lora_model._tracker.lock()
lora_model.summary()
< /code>
Meine Absicht mit diesem Code ist es, die vorletzte Schicht durch selbst zu ersetzen. Gemäß der Zusammenfassung des Modells geschieht dies jedoch nicht:

Falsch in meiner Implementierung? Vielleicht hat es etwas mit dem zu tun, was in diesem Problem erklärt wird, und es ist grundsätzlich unmöglich in Keras zu tun, oder gibt es einen Zwischenschritt, den ich fehlt, damit dies funktioniert?>

1744498631

Anonymous

Ich versuche, eine benutzerdefinierte Implementierung von LORA für Keras zu erstellen, und ich stoße in Schwierigkeiten, meinen Ansatz zur Arbeit zu erlangen. Ich verwende Keras 3.4.1 in Google Collaby. Ich versuche jedoch, eine Lösung zu finden, die für Funktionsmodelle funktioniert, nicht nur für sequentielle Modelle wie VGG16. Zunächst erstelle ich das Modell ohne die letzte Schicht, deaktiviere das Training und drucke seine Zusammenfassung aus: < /p>
[code]vgg16_lora  = tf.keras.applications.vgg16.VGG16(weights="imagenet", input_shape=(224, 224, 3))
vgg16_lora.trainable = False

lora_model = tf.keras.Model(inputs=vgg16_lora.inputs, outputs=vgg16_lora.layers[-2].output)
lora_model.summary()
[/code]
Ausgabe:

Dann versuche ich die LORA-Schicht wie folgt hinzuzufügen: 
import math

class LoraLayer(tf.keras.Layer):
def __init__(self, original_layer, rank=8, trainable=False, **kwargs):
original_layer_config = original_layer.get_config()
name = original_layer_config["name"]
kwargs.pop('name', None)

super().__init__(name=name, trainable=trainable, **kwargs)

self.original_layer = original_layer
self.original_layer.trainable = False

self.A = tf.keras.layers.Dense(units=rank, use_bias=False, kernel_initializer=tf.keras.initializers.VarianceScaling(scale=math.sqrt(5), mode="fan_in", distribution="uniform"), trainable=trainable, name="lora_A")
self.B = tf.keras.layers.Dense(units=original_layer.output.shape[-1], kernel_initializer="zeros", trainable=trainable, name="lora_B")

def call(self, inputs):
original_outputs = self.original_layer(inputs)
lora_outputs = self.B(self.A(inputs))
return original_outputs + lora_outputs

lora_model._tracker.unlock()
lora_model.layers[-2] = LoraLayer(lora_model.layers[-2], rank=8, trainable=False)
lora_model._tracker.lock()
lora_model.summary()
< /code>
Meine Absicht mit diesem Code ist es, die vorletzte Schicht durch selbst zu ersetzen. Gemäß der Zusammenfassung des Modells geschieht dies jedoch nicht:

Falsch in meiner Implementierung? Vielleicht hat es etwas mit dem zu tun, was in diesem [url=viewtopic.php?t=20324]Problem[/url] erklärt wird, und es ist grundsätzlich unmöglich in Keras zu tun, oder gibt es einen Zwischenschritt, den ich fehlt, damit dies funktioniert?>

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Die Keras-Aufmerksamkeitsschicht gibt keine Aufmerksamkeitswerte zurück

Last post by Guest « 24 Dec 2024, 11:08
Posted in Python

by Guest » 24 Dec 2024, 11:08 » in Python

Ich verwende keras=3.7.0 und versuche, einen benutzerdefinierten TCAN-Block (Temporal Convolutional Attention Network) zu implementieren. Während die Aufmerksamkeitsschicht in einem eigenständigen...

0 Replies

6 Views

Last post by Guest
24 Dec 2024, 11:08
Was ist die Keras 3-Version dieser Numpy-Funktion dieser IEEE754-zu-Unsigned-Integer-8-Normalisierung?

Last post by Guest « 05 Jan 2025, 14:10
Posted in Python

by Guest » 05 Jan 2025, 14:10 » in Python

Was ist die Keras 3-Version dieser Normalisierungsfunktion unter Verwendung der Keras 3-Ops-API?
def ieee754_to_uint8(x, axis=-1):

Normalize a tensor using IEEE 754 logic and map it to uint8...

0 Replies

27 Views

Last post by Guest
05 Jan 2025, 14:10
Wie drucke ich die Tensorwerte zwischen den Schichten in Keras 3 aus?

Last post by Guest « 27 Jan 2025, 07:20
Posted in Python

by Guest » 27 Jan 2025, 07:20 » in Python

Ich verwende Keras 3 mit dem PyTorch-Backend (ich konnte das TF-Backend aus irgendeinem Grund nicht zum Laufen bringen und ich habe JAX nie verwendet).
Ich' Ich versuche, ein von jemand anderem...

0 Replies

29 Views

Last post by Guest
27 Jan 2025, 07:20
Die keras benutzerdefinierte Verlustfunktion unter Verwendung anderer Argumente als y_pred und y_true

Last post by Anonymous « 28 Feb 2025, 07:01
Posted in Python

by Anonymous » 28 Feb 2025, 07:01 » in Python

Ich dachte an die Idee, ein wahrnehmungsartiges neuronales Netzwerk zu verwenden, um mein Problem zu lösen. Ich habe einen Datensatz, der zum Einfachheit halber so aussieht:

id entryWoodLength...

0 Replies

8 Views

Last post by Anonymous
28 Feb 2025, 07:01
Was ist die Regel zu wissen, wie viele LSTM -Zellen und wie viele Einheiten in jeder LSTM -Zelle in Keras Sie benötigen?

Last post by Anonymous « 07 Apr 2025, 22:32
Posted in Python

by Anonymous » 07 Apr 2025, 22:32 » in Python

Ich weiß, dass eine LSTM -Zelle eine Reihe von Anns im Inneren hat.

Aber bei der Definition der versteckten Schicht für dasselbe Problem habe ich einige Personen gesehen, die nur 1 LSTM -Zelle...

0 Replies

21 Views

Last post by Anonymous
07 Apr 2025, 22:32

Return to “Python”