Kerncomponenten van IBM InfoSphere - HenryN-DEN21DS/CV_STUFF GitHub Wiki

IBM InfoSphere is een suite van data integration- en data governance-producten. Het is modulair opgebouwd: je kunt losse componenten gebruiken of een geïntegreerd platform. De belangrijkste componenten zijn:

🔑 Kerncomponenten van IBM InfoSphere

InfoSphere Information Server

Centraal platform voor data integration.

Bevat o.a.:

  • DataStage → ETL (Extract, Transform, Load).

  • QualityStage → datakwaliteit en opschoning.

  • Information Analyzer → profiling & datakwaliteit monitoren.

  • Business Glossary → metadata- en begrippenbeheer.

  • FastTrack → vertaling van business rules naar ETL-flows.

InfoSphere Data Architect

  • Tool voor data modellering en integratie met metadata repositories.

InfoSphere Optim

Data lifecycle management: archivering, test data management, privacy (masking).

InfoSphere Guardium (soms apart gelabeld)

Data security en compliance: auditing, monitoring, bescherming van gevoelige data.

InfoSphere Information Governance Catalog (IGC)

Metadata- en governance repository, vaak gebruikt voor lineage en impactanalyse.

InfoSphere MDM (Master Data Management)

  • Beheer van kerngegevens (klant, product, leverancier, etc.).

InfoSphere Streams

  • (tegenwoordig in IBM Cloud Pak for Data geïntegreerd)

Realtime analytics op streaming data.

InfoSphere Federation Server

Virtuele data-integratie: query’s uitvoeren over meerdere databronnen alsof het één is.

🔄 Tegenwoordig

Veel van deze componenten zijn opgenomen in IBM Cloud Pak for Data (op Kubernetes/Red Hat OpenShift). Daarin zijn InfoSphere-functionaliteiten hernoemd of geïntegreerd, maar de kernmodules (DataStage, QualityStage, IGC, MDM) zijn nog steeds de basis.