‘One version of the truth’ bestaat niet! ‘One version of the facts’ wel…

Binnen de wereld van datamodellering lijkt één versie van de waarheid op het eerste gezicht aantrekkelijk. Maar onmogelijk als je er langer over nadenkt. Dan kom je namelijk tot de conclusie dat iedereen zijn of haar eigen waarheden heeft. Wat voor de ene persoon rood is, kan door de ander als paars beoordeeld worden of voor diegene gewoon niet relevant zijn. Het goede nieuws is dat er wel iets anders bestaat: ‘One version of the facts’.

Eén versie van de feiten

Daar heeft elk bedrijf een datahub voor nodig; een platform voor het organiseren, beheren, delen, samenwerken en verwerken van geregistreerde brongegevens. De data hub is eenvoudig te realiseren, want er hoeft niet te worden nagedacht over datamodellering, de data wordt namelijk ‘as is’ ingeladen. In de Datahub wordt ieder type data als tabellen, losse tekst, foto, audio en video ingeladen in een schaalbaar database management systeem. Daarnaast wordt optioneel ook de veranderingen van deze data in de tijd opgeslagen. De datahub is in feite dus een videoband van alle datatransacties van je organisatie in de tijd. De datahub fungeert als het startpunt van datawarehousing, data science en applicatie-integratie.

De datahub biedt een aantal voordelen voor uw organisatie. Ten eerste worden bronsystemen ontlast van meerdere data ontsluitingen naar meerdere afnemers voor dezelfde data. Migraties van verouderde bronsystemen worden hierdoor eenvoudiger, omdat slechts een uitgaande datastroom moet worden vervangen en omdat de initiële historische lading vanuit de datahub kan worden uitgevoerd. Ook zal het migreren van meerdere data warehouses naar een centraal organisatiebreed datawarehouse beginnen met een datahub. Ten tweede zal een ieder die iets met data wil alleen hoeven aan te kloppen bij de datahub om vervolgens die gegevens af te nemen die voor zijn of haar rol toegankelijk zijn.

Controle over data

Ten derde, iedere data afnemer heeft de data beschikbaar op hetzelfde tijdstip. Zo kan het verschil tussen meerdere omzetrapporten van analisten op verschillende afdelingen eenvoudigweg worden uitgelegd door het hanteren van verschillende regels op dezelfde data. En niet omdat de brondata op een andere manier en een ander tijdstip beschikbaar is gesteld. Ten vierde is de controle over wie welke brongegevens kan en mag zien, en wie welke brongegevens kan combineren, eenvoudiger te beheersen middels een centrale datahub. Tenslotte is de datahub ook te gebruiken als een applicatie-integratieservice indien de data in realtime wordt ontsloten. Kortom de datahub zoals hier beschreven, kan worden beschouwd als de one version of facts.

In onze volgende blog leggen we uit hoe je tot één versie van de feiten komt.

Op de hoogte blijven? Meld je dan onderaan deze pagina aan voor onze nieuwsbrief!