Ich wurde gebeten, eine ETL-Art zu beantragen, die Informationen aus überträgt aus eine Datenquelle zum anderen. Im Moment habe ich beschlossen, eine dreischichtige Architektur zu verwenden, aber ich möchte mehr über die Best Practices sowie den auf dieser Wikipedia-Seite beschriebenen Lebenszyklus erfahren: < /p>
http://en.wikipedia.org/wiki/extract ,_transform ,_LOAD
Vier-Layered-Ansatz für ETL Architecture Design
[*] Funktionsschicht : Kernfunktional ETL -Verarbeitung (Extrakt, Transformation und Last). -stream-Definition und -management, Parameter, Planung, Überwachung, Kommunikation und Alarmierung. und Steuerelemente, Ablehnungen und Fehlerhandling, Codes-Management. /ul>
ETL-Zyklus des realen Lebens < /p>
Der typische ETL-Zyklus real im Leben besteht aus den folgenden Ausführungsschritten: < /p>
- Zyklusinitiation < /li>
Referenzdaten erstellen < /li>
extrahieren (aus Quellen) < /li>
Validieren Sie < /li>
Transformation (Reinigen Sie die Geschäftsregeln, prüfen Sie die Datenintegrität, erstellen Sie Aggregate oder Disaggregate) < /li>
Stufe (in Staging -Tabellen laden, wenn verwendet) < /li>
Prüfungsberichte (z. B. zur Einhaltung der Geschäftsregeln. Außerdem hilft es beim Ausfall bei der Diagnose/Reparatur) - Veröffentlichung (an Zieltabellen)
- Archiv
- Reinigen