Best Practices für den Umgang mit Login-CAPTCHA in Python RPA für die Migration älterer Daten (keine API)Python

Python-Programme
Anonymous
 Best Practices für den Umgang mit Login-CAPTCHA in Python RPA für die Migration älterer Daten (keine API)

Post by Anonymous »

Ich arbeite derzeit an einem Datenmigration-Projekt mit einem Altsystem.
Wir müssen eine große Datenmenge extrahieren, um sie in eine neue Datenbank zu migrieren. Leider bietet dieses Legacy-System keine API oder direkten Datenbankzugriff. Daher besteht unsere einzige Möglichkeit darin, die Daten über die Weboberfläche mithilfe eines Python-Automatisierungsskripts (RPA) zu extrahieren.
Ich habe die Navigations- und Datenextraktionslogik mit Selenium/Python abgebildet, aber die Anmeldeseite ist durch ein CAPTCHA geschützt. Da es sich um einen automatisierten Migrationsprozess handelt, bleibt das Skript beim Authentifizierungsschritt hängen.
Meine Einschränkungen:
  • Ich kann das CAPTCHA auf der Serverseite nicht deaktivieren (Einschränkungen älterer Software).
  • Die Automatisierung muss stabil laufen, um Tausende von Datensätzen zu extrahieren.
Da ich die Sicherheit nicht rein per Code umgehen kann, was sind die Standardarchitekturmuster für dieses Szenario?
  • Sitzungswiederverwendung: Ist es möglich, sich einmal manuell anzumelden, die Cookies/Sitzung zu exportieren und sie für nachfolgende Ausführungen in den Python-Treiber einzufügen?
  • Human-in-the-Loop: Gibt es eine saubere Möglichkeit zum Anhalten das Selenium-Skript, einem Menschen erlauben, das CAPTCHA manuell im geöffneten Browserfenster zu lösen und dann die Automatisierung fortzusetzen?
Jeder Codeausschnitt oder Bibliotheksempfehlungen (z. B. zum Umgang mit Cookie-Persistenz in Selenium) wäre sehr dankbar.
Vielen Dank!

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post