Sellerie-Speicherverlust in Django – der Arbeitsspeicher nimmt ständig zu und wird nach Abschluss der Aufgaben nicht fre

Sellerie-Speicherverlust in Django – der Arbeitsspeicher nimmt ständig zu und wird nach Abschluss der Aufgaben nicht fre ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Sellerie-Speicherverlust in Django – der Arbeitsspeicher nimmt ständig zu und wird nach Abschluss der Aufgaben nicht fre

Report
Quote

Post by Anonymous » 15 Nov 2025, 23:45

Ich verwende Django + Celery für Daten-Crawling-Aufgaben, aber die Speichernutzung des Celery-Workers steigt mit der Zeit immer weiter an und sinkt nie, nachdem jede Aufgabe abgeschlossen ist.
Ich verwende:

Code: Select all

    celery==5.5.3
Django==5.2.6

Hier ist meine Celery-Konfiguration:

Code: Select all

# ---------- Broker/Backend ----------
app.conf.broker_url = "sqs://"
app.conf.result_backend = "rpc://"
app.conf.task_ignore_result = True

# \---------- Queue (FIFO) ----------

QUEUE_NAME = env("AWS_SQS_CELERY_NAME")
app.conf.task_default_queue = QUEUE_NAME
app.conf.task_queues = (Queue(QUEUE_NAME),)

# \---------- SQS transport ----------

app.conf.broker_transport_options = {
"region": env.str("AWS_REGION"),
"predefined_queues": {
QUEUE_NAME: {
"url": env.str("AWS_CELERY_SQS_URL"),
"access_key_id": env.str("AWS_ACCESS_KEY_ID"),
"secret_access_key": env.str("AWS_SECRET_ACCESS_KEY"),
},
},
# long-poll
"wait_time_seconds": int(env("SQS_WAIT_TIME_SECONDS", default=10)),
"polling_interval": float(env("SQS_POLLING_INTERVAL", default=0)),
"visibility_timeout": int(env("SQS_VISIBILITY_TIMEOUT", default=900)),
"create_missing_queues": False, # do not create queue automatically
}

# \---------- Worker behavior ----------

app.conf.worker_prefetch_multiplier = 1   # process one job at a time
app.conf.task_acks_late = True            # ack after task completion
app.conf.task_time_limit = int(env("CELERY_HARD_TIME_LIMIT", default=900))
app.conf.task_soft_time_limit = int(env("CELERY_SOFT_TIME_LIMIT", default=600))
app.conf.worker_send_task_events = False
app.conf.task_send_sent_event = False
app.autodiscover_tasks()

Problem:
Nach Abschluss jeder Crawling-Aufgabe fällt der Worker-Speicher nicht zurück, sondern erhöht sich nur schrittweise.
Durch den Neustart des Celery-Workers wird Speicher freigegeben, daher glaube ich, dass es sich um ein Leck oder ein Bereinigungsproblem handelt.
Was Ich habe versucht:

Task_ignore_result=True setzen
Option --max-tasks-per-child=200 hinzufügen

1763246701

Anonymous

Ich verwende Django + Celery für Daten-Crawling-Aufgaben, aber die Speichernutzung des Celery-Workers steigt mit der Zeit immer weiter an und sinkt nie, nachdem jede Aufgabe abgeschlossen ist.
Ich verwende:
[code]    celery==5.5.3
Django==5.2.6
[/code]
Hier ist meine Celery-Konfiguration:
[code]# ---------- Broker/Backend ----------
app.conf.broker_url = "sqs://"
app.conf.result_backend = "rpc://"
app.conf.task_ignore_result = True

# \---------- Queue (FIFO) ----------

QUEUE_NAME = env("AWS_SQS_CELERY_NAME")
app.conf.task_default_queue = QUEUE_NAME
app.conf.task_queues = (Queue(QUEUE_NAME),)

# \---------- SQS transport ----------

app.conf.broker_transport_options = {
"region": env.str("AWS_REGION"),
"predefined_queues": {
QUEUE_NAME: {
"url": env.str("AWS_CELERY_SQS_URL"),
"access_key_id": env.str("AWS_ACCESS_KEY_ID"),
"secret_access_key": env.str("AWS_SECRET_ACCESS_KEY"),
},
},
# long-poll
"wait_time_seconds": int(env("SQS_WAIT_TIME_SECONDS", default=10)),
"polling_interval": float(env("SQS_POLLING_INTERVAL", default=0)),
"visibility_timeout": int(env("SQS_VISIBILITY_TIMEOUT", default=900)),
"create_missing_queues": False, # do not create queue automatically
}

# \---------- Worker behavior ----------

app.conf.worker_prefetch_multiplier = 1   # process one job at a time
app.conf.task_acks_late = True            # ack after task completion
app.conf.task_time_limit = int(env("CELERY_HARD_TIME_LIMIT", default=900))
app.conf.task_soft_time_limit = int(env("CELERY_SOFT_TIME_LIMIT", default=600))
app.conf.worker_send_task_events = False
app.conf.task_send_sent_event = False
app.autodiscover_tasks()
[/code]
[img]https://i.sstatic.net/O9Fwg3K1.png[/img]
Problem:
Nach Abschluss jeder Crawling-Aufgabe fällt der Worker-Speicher nicht zurück, sondern erhöht sich nur schrittweise.
Durch den Neustart des Celery-Workers wird Speicher freigegeben, daher glaube ich, dass es sich um ein Leck oder ein Bereinigungsproblem handelt.
Was Ich habe versucht:
[list]
[*]Task_ignore_result=True setzen
[*]Option --max-tasks-per-child=200 hinzufügen
[/list]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Nachdem Sellerie Delay () angerufen wurde, dauert es fast 5 bis 10 Sekunden, bis die Aufgaben mit der Ausführung im Arbe

Last post by Anonymous « 10 Apr 2025, 01:03
Posted in Python

by Anonymous » 10 Apr 2025, 01:03 » in Python

Ich arbeite derzeit an einer App mit der folgenden Konfiguration:

Django 1,8

Python 2.7

Strong> celery 3.1.x (Amazon SQS as Borker as Borcer as Borcer as Borcer as Borcer...

0 Replies

36 Views

Last post by Anonymous
10 Apr 2025, 01:03
Vorgegebene Aufgaben und Programmierer lösen die Aufgaben in kürzerer Zeit

Last post by Guest « 23 Jan 2025, 04:52
Posted in Java

by Guest » 23 Jan 2025, 04:52 » in Java

Ich habe eine Liste von Aufgaben der Größe n und die zur Verarbeitung benötigte Zeit wird als Aufgaben dargestellt, wobei i der Index für die Aufgabe ist.
Verarbeitungsschritt: Diese Aufgaben...

0 Replies

37 Views

Last post by Guest
23 Jan 2025, 04:52
Wie kann ich auf die Aufzählung von Aufgaben warten und anhalten, wenn eine Reihe von Aufgaben erledigt sind?

Last post by Anonymous « 11 Apr 2025, 19:23
Posted in C#

by Anonymous » 11 Apr 2025, 19:23 » in C#

Ich habe eine Reihe von Aufgaben, die identische Jobs ausführen, aber verschiedene Parameter auf verschiedenen Servern verwenden. Es könnte auftreten, dass einer der Server nicht mehr...

0 Replies

44 Views

Last post by Anonymous
11 Apr 2025, 19:23
Beim Verarbeiten von Excel-Dateien, die aus einem Verzeichnis gelesen werden, ist nicht mehr genügend Arbeitsspeicher vo

Last post by Guest « 30 Dec 2024, 16:29
Posted in Php

by Guest » 30 Dec 2024, 16:29 » in Php

Mein Skript liest Excel-Dateien, die über Nacht aus einem Verzeichnis hochgeladen werden. Für jede Datei öffnet es die Datei, liest die Daten in eine MYSQL-Tabelle und schließt dann die Datei.
$dir...

0 Replies

38 Views

Last post by Guest
30 Dec 2024, 16:29
Schützen Sie vertrauliche Daten im Arbeitsspeicher mit C#

Last post by Anonymous « 29 Dec 2024, 11:43
Posted in C#

by Anonymous » 29 Dec 2024, 11:43 » in C#

Ich habe eine C#-Anwendung, die einige Variablen mit vertraulichen Daten initialisiert. Es handelt sich nicht um Passwörter, wir halten sie jedoch für vertraulich. Die Variablenwerte, die ich...

0 Replies

41 Views

Last post by Anonymous
29 Dec 2024, 11:43

Return to “Python”