Das Ollama -Modell behalten Sie den Gedächtnis und verhindern Sie das Entladen zwischen Anforderungen (Keep_alive?)

Das Ollama -Modell behalten Sie den Gedächtnis und verhindern Sie das Entladen zwischen Anforderungen (Keep_alive?) ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Das Ollama -Modell behalten Sie den Gedächtnis und verhindern Sie das Entladen zwischen Anforderungen (Keep_alive?)

Post by Anonymous » 18 Mar 2025, 18:51

Egal was ich vom Terminal oder im Code tue, der Agent -Anfragen an Ollama -Modelle dauert jedes Mal 15–25 Sekunden auf meinem lokalen M2 MacBook Pro. /> Meine Schlussfolgerung, dass das Modell jedes Mal aus dem Speicher entlädt und eine neue Anforderung lädt. Und es kann sich ändern, wenn sie aus CLI auslaufen, aber ich konnte keine Dokumente darüber finden, wie man es in Python verwendet, obwohl es anscheinend Fehler beim Hinzufügen dieser Funktion gibt.

1742320270

Anonymous

Egal was ich vom Terminal oder im Code tue, der Agent -Anfragen an Ollama -Modelle dauert jedes Mal 15–25 Sekunden auf meinem lokalen M2 MacBook Pro. />  Meine Schlussfolgerung, dass das Modell jedes Mal aus dem Speicher entlädt und eine neue Anforderung lädt. Und es kann sich ändern, wenn sie aus CLI auslaufen, aber ich konnte keine Dokumente darüber finden, wie man es in Python verwendet, obwohl es anscheinend Fehler beim Hinzufügen dieser Funktion gibt.

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Replit, Discord BOT – Keep Alive

Last post by Guest « 25 Jan 2025, 13:31
Posted in Python

by Guest » 25 Jan 2025, 13:31 » in Python

Ich verwende replit und uptimerobot, um am Leben zu bleiben.
Ich erstelle einen Bot für meinen Discord-Kanal, aber nach einiger Zeit schalte replit alles aus ;/
Es muss rund um die Uhr eingeschaltet...

0 Replies

7 Views

Last post by Guest
25 Jan 2025, 13:31
Offenlegung des 11434-Ports im Docker-Container für den Zugriff auf das lokale Ollama-Modell

Last post by Guest « 27 Dec 2024, 09:59
Posted in Python

by Guest » 27 Dec 2024, 09:59 » in Python

Ich versuche, das lokale Ollama 2-Modell, das Port 11434 auf meinem lokalen Computer verwendet, mit meinem Docker-Container zu verbinden, auf dem Linux Ubuntu 22.04 ausgeführt wird. Ich kann...

0 Replies

23 Views

Last post by Guest
27 Dec 2024, 09:59
Tempdata.keep () in ASP.NET Core Returning Localhost ist derzeit nicht in der Lage, diese Anfrage zu bearbeiten. HTTP -F

Last post by Anonymous « 20 Mar 2025, 20:32
Posted in C#

by Anonymous » 20 Mar 2025, 20:32 » in C#

Bei der Verwendung von tempdata.keep () in ASP.NET CORE erhalte ich Localhost ist derzeit nicht in der Lage, diese Anfrage zu bearbeiten. HTTP -Fehler 500 . Wenn ich Tempdata entfernen () keine...

0 Replies

9 Views

Last post by Anonymous
20 Mar 2025, 20:32
Entladen von Kivy Builder Regeln mehr als einmal, um GUI-Elemente aus Dateien neu zu importieren

Last post by Anonymous « 03 Apr 2025, 10:06
Posted in Python

by Anonymous » 03 Apr 2025, 10:06 » in Python

Ich möchte optionale GUI -Elemente importieren, die in separaten Mod1.py /definiert sind Mod2.py /etc Dateien und fügen Sie diese dynamisch von der Haupt -GUI hinzu. Die separaten Dateien, die diese...

0 Replies

9 Views

Last post by Anonymous
03 Apr 2025, 10:06
C# Hangfire Job verursacht das Haufen des Haufens Gedächtnis Gen2 Wachstum, das GC.Collect nicht reinigt

Last post by Anonymous « 06 Feb 2025, 08:06
Posted in C#

by Anonymous » 06 Feb 2025, 08:06 » in C#

Ich verwende C# und Hangfire, um 8.000 SMS -Nachrichten über einen Hintergrundjob zu senden. Wenn ich dies jedoch in einem einzigen Job ausführe, nimmt Heap Memory (GEN2) die Verwendung erheblich zu,...

0 Replies

14 Views

Last post by Anonymous
06 Feb 2025, 08:06

Return to “Python”