Bezüglich der 503 fehlerhaften Antwortfehler haben wir die Fehlerbehebungsdokumentation von Google konsultiert und Speicherprobleme und Zeitüberschreitungen auf Anwendungsebene ausgeschlossen. Trotz unserer Untersuchung haben wir keine Downstream-Netzwerkengpässe festgestellt und unsere Anfragerate bleibt mit durchschnittlich 15 Anfragen pro Sekunde deutlich unter den von Google festgelegten Grenzwerten.
Bei den 504-Gateway-Timeout-Fehlern zeigt die Meldung an, dass die Anfrage das maximale Anfrage-Timeout erreicht hat, es scheint jedoch, dass diese Anfragen nie tatsächlich die Instanz erreichen, da sie keine Protokolle erzeugen, die auf die Ausführung hinweisen.
Unten finden Sie einige entsprechende Screenshots.


Um diese Probleme zu beheben, haben wir Es wurden mehrere Schritte unternommen:
- Konfigurierte Bereitschafts- und Lebendigkeitsprüfungen, um den Instanzzustand zu bestimmen, die im Allgemeinen gut funktioniert haben. In einer „fehlerhaften“ Instanz erkannte die Liveness-Prüfung nach einer Stunde ein Problem, was zur Beendigung dieser Instanz führte.
- Überwachte CPU- und Speicherauslastung, die beide in Ordnung zu sein scheinen, wobei die CPU konstant unter 50 % lag und keine Fehler aufgrund von nicht genügend Arbeitsspeicher auftraten.
- Sichergestellte ordnungsgemäße Schließung von Ressourcen, wie Google Cloud-Dateispeicher und Redis-Client-Verbindungen, um Ressourcenlecks zu verhindern.
- Bestätigte Compliance Mit Google Cloud API-Kontingenten stellen wir sicher, dass wir keine Grenzen erreichen.
Code: Select all
CPU allocation: CPU is always allocated.
Startup CPU boost: Enabled
Concurrency: 80
Request timeout: 1800 seconds
Execution environment: Second generation
Autoscaling: Enabled
Min instances: 12
Max instances: 100
CPU Limit: 4
Memory Limit: 8GB
Session Affinity: Enabled
HTTP2: Disabled
Wir würden uns sehr über Ihre Erkenntnisse zu den möglichen Ursachen dieser Probleme freuen.
Mit freundlichen Grüßen.
Mobile version