Kerncomponenten van IBM InfoSphere - HenryN-DEN21DS/CV_STUFF GitHub Wiki
IBM InfoSphere is een suite van data integration- en data governance-producten. Het is modulair opgebouwd: je kunt losse componenten gebruiken of een geïntegreerd platform. De belangrijkste componenten zijn:
🔑 Kerncomponenten van IBM InfoSphere
InfoSphere Information Server
Centraal platform voor data integration.
Bevat o.a.:
-
DataStage → ETL (Extract, Transform, Load).
-
QualityStage → datakwaliteit en opschoning.
-
Information Analyzer → profiling & datakwaliteit monitoren.
-
Business Glossary → metadata- en begrippenbeheer.
-
FastTrack → vertaling van business rules naar ETL-flows.
InfoSphere Data Architect
- Tool voor data modellering en integratie met metadata repositories.
InfoSphere Optim
Data lifecycle management: archivering, test data management, privacy (masking).
InfoSphere Guardium (soms apart gelabeld)
Data security en compliance: auditing, monitoring, bescherming van gevoelige data.
InfoSphere Information Governance Catalog (IGC)
Metadata- en governance repository, vaak gebruikt voor lineage en impactanalyse.
InfoSphere MDM (Master Data Management)
- Beheer van kerngegevens (klant, product, leverancier, etc.).
InfoSphere Streams
- (tegenwoordig in IBM Cloud Pak for Data geïntegreerd)
Realtime analytics op streaming data.
InfoSphere Federation Server
Virtuele data-integratie: query’s uitvoeren over meerdere databronnen alsof het één is.
🔄 Tegenwoordig
Veel van deze componenten zijn opgenomen in IBM Cloud Pak for Data (op Kubernetes/Red Hat OpenShift). Daarin zijn InfoSphere-functionaliteiten hernoemd of geïntegreerd, maar de kernmodules (DataStage, QualityStage, IGC, MDM) zijn nog steeds de basis.