Wat is het nut van een datawarehouse?
Steeds meer organisaties vragen zich hardop af wat het nut is van een datawarehouse en of het de investering wel waard is. Ook willen ze weten welke alternatieven er zijn. Want een groeiend aantal IT-leveranciers en enkele zogenaamde “experts” beweren dat het einde van het datawarehouse in zicht is. Bij leveranciers moet je overigens denken aan leveranciers van datawarehouse-appliances, data-virtualisatie tools en data discovery tools. Wij hebben echter een andere overtuiging. Het datawarehouse is volgens ons nog steeds hét kloppende hart van elke intelligente, datagedreven organisatie. Het datawarehouse vervult een aantal vitale functies.
1. Verbeteren van de integratie
Een organisatie registreert gegevens in verschillende systemen. Die ondersteunen de verschillende bedrijfsprocessen. Om een integraal beeld van de bedrijfsvoering, klanten en leveranciers te kunnen creëren, moet je gegevens op één plek laten samenkomen en compatibel maken. Zo creëer je ook één versie van de waarheid. Zowel externe data (uit de omgeving) als interne data (van ERP, CRM en financiële systemen) laat je samenvloeien in je datawarehouse. Vervolgens ga je de data netjes groeperen. Met als doel dat jouw eindgebruikers gegevens uit verschillende databronnen moeiteloos kunnen combineren en analyseren.
2. Versnellen van de responstijden
De bronsystemen zijn volledig geoptimaliseerd om veel kleine transacties in korte tijd te verwerken. Denk dan aan het toevoegen van orders, aanvragen of meldingen. Wil je managementinformatie over de prestaties van de organisatie maken, dan stuur je slechts een paar grote “transacties” naar je databronnen. Denk dan aan de omzetcijfers over de afgelopen twaalf maanden waarbij je miljoenen records moet afgaan. Je wilt feitelijk heel veel gegevens met één druk op knop verzamelen, aggregeren en weergeven. De structuur van een datawarehouse is speciaal ontworpen om zulke grote hoeveelheden data snel op te halen en te analyseren.
De ETL & Data Integratie Guide™ De ETL & Data Integratie Guide™ geeft je ongelimiteerde toegang tot grote hoeveelheden onderzoeksmateriaal (leveranciers, video's, nieuws, termen, ratings en de markt) op het gebied van data-integratie, ETL, datawarehousing, big data en analytics. Selecteer hiermee de meest geschikte data integratie-leverancier en til je data integratie-kennis snel naar een hoger niveau.
3. Sneller en flexibeler rapporteren & analyseren
De structuur van een datawarehouse stelt eindgebruikers in staat om op snelle en flexibele wijze te rapporteren. En met de juiste datatools kunnen ze ook interactieve analyses uitvoeren vanuit verschillende vooraf gedefinieerde invalshoeken. Dit noemen we dimensies. Gebruikers kunnen bijvoorbeeld met een enkele muisklik springen van jaar naar kwartaal en naar maand. En ze kunnen snel schakelen tussen de klant- en productdimensie. Daarbij wil de gebruiker vooralsnog dezelfde indicator weergeven. Op deze wijze kunnen zij daadwerkelijk jongleren met de data. En zo dus heel snel waardevolle kennis opdoen over de bedrijfsvoering, klanten en de scores op prestatie-indicatoren monitoren.
4. Wijzigingen vastleggen en opbouwen historie
Veel bronsystemen houden meestal niet goed de historie van cruciale records vast. Bijvoorbeeld, als een klant verhuist of wanneer de productmanager een product overhevelt naar een andere productgroep. Waarschijnlijk overschrijft het systeem gewoon de (oude) waarden. En die ben je dan kwijt. Hierdoor verdwijnt ‘het geheugen’ van het bronsysteem, althans ze is nog zeer moeilijk te traceren.
Om betrouwbare informatie te genereren, heb je deze oude waarden nodig. Zodat je gebruikers kunnen terugkijken in de tijd. Met andere woorden: gebruikers moeten in staat zijn om te kijken naar de prestaties van de organisatie vanuit een historisch perspectief. Dat wil zeggen in overeenstemming met de organisatiestructuur, klantlocaties en de productclassificaties uit die tijd. Als ze alleen de gegevens kunnen bekijken en analyseren vanuit de huidige context, dan missen ze cruciale informatie.
Een datawarehouse zorgt er automatisch voor dat het de wijzigingen in je databronnen vasthoudt. Dat maakt historische analyses zeer eenvoudig.
5. Het verhogen van de kwaliteit van gegevens
Organisaties overschatten nogal eens de kwaliteit van de gegevens in hun bronsystemen. Totdat ze in de data gaan grasduinen en met eigen ogen zien dat nog veel gegevens niet kloppen of incompleet zijn. Wanneer organisaties gebruikmaken van een datawarehouse, kunnen ze de kwaliteit van de gegevens stap voor stap en structureel verbeteren. Fouten werken ze weg. Hetzij door de gegevens automatisch te corrigeren tijdens het laden. Of door slimme detectie en vervolgens het aanpakken van het kwaliteitsprobleem aan de bron.
6. Ontlasten van de operationele systemen
Door de overdracht van gegevens naar een aparte omgeving – het datawarehouse – ontlasten organisaties de operationele systemen die bij omvangrijke of complexere analyses onderuit zouden kunnen gaan. Door een datawarehouse kan het bronsysteem haar primaire rol te allen tijde goed blijven vervullen. Je operaties kunnen ongestoord verder gaan, terwijl gebruikers de meest complexe analyses fabriceren. De historische en geïntegreerde analyse-omgeving kan je helemaal optimaliseren voor haar taak. Het operationele systeem heeft daar geen last van.
7. Ontzorgen van de IT-afdeling
Een datawarehouse en gebruiksvriendelijke Business Intelligence tools stellen medewerkers binnen de organisatie in staat om zelfstandig rapporten te maken en analyses uit te voeren. Een organisatie zal wel eerst moeten investeren in het opzetten van de vereiste infrastructuur voor het datawarehouse en de BI-tools. Hierbij geldt: hoe beter je de architectuur opzet en ontwikkelt, hoe eenvoudiger gebruikers complexe rapporten en analyses onafhankelijk van IT kunnen vervaardigen.
De opleiding Datawarehouse & Data Governance Tijdens de unieke opleiding Datawarehouse & Data Governance maak je in 3 inspirerende dagen kennis met het begrip datawarehouse en het nut ervan, de beginselen van ETL, het bouwen en beheren van een datawarehouse, het verbeteren van de datakwaliteit, het nut van data lakes en welke Data Governance jouw situatie vereist.
Uiteraard hebben eindgebruikers eerst voldoende training en ondersteuning nodig. In de praktijk blijkt dan toch vaak nog dat de BI-afdeling veel van de complexere rapporten zelf maakt. Dit is te wijten aan het feit dat het gebruikers ontbreekt aan tijd of kennis van het proces. Of de structuur van de databronnen is te complex, of ze vinden de tool te moeilijk in gebruik. Een andere reden kan zijn dat de organisatie zich onvoldoende heeft ingespannen om de juiste architectuur te ontwikkelen.
8. Het vergroten van de herkenbaarheid
Indicatoren ga je zoveel mogelijk “voorbakken” in het datawarehouse, ook de complexere, onvervalste KPI’s. Dit stelt gebruikers in staat om complexere rapporten in een paar eenvoudige stappen te vervaardigen. Denk bijvoorbeeld aan een rapport met het rendement op klantniveau uitgesplitst naar maand, klantgroep en land. In het bronsysteem kan je deze informatie pas maken wanneer je handmatig een groot aantal acties en berekeningen uitvoert. En je moet gegevens uit andere bronnen er bij gaan halen.
Een datawarehouse verhoogt dus de herkenbaarheid van de informatie die beslissers nodig hebben voor het (be)sturen van de organisatie. Uiteraard gaat dit alleen op wanneer het datawarehouse is opgezet met de business als vertrekpunt en een “spiegel” vormt van de bedrijfsprocessen.
9. Het verhogen van de vindbaarheid
Het opzetten van een datawarehouse zorgt ervoor dat gebruikers ook snel toegang hebben tot de betekenis en het ontstaan van gegevens (metadata). In veel bronsystemen (zeker in de cloud of van specifieke leveranciers) zijn deze betekenissen niet altijd even gemakkelijk te achterhalen. Soms zijn ze zelfs zeer slecht toegankelijk. Met een datawarehouse kunnen je gebruikers sneller de juiste gegevens vinden en die opwerken tot bruikbare informatie, inzichten en kennis.
Alternatieven kunnen nooit tippen aan een datawarehouse
Dit zijn de negen belangrijkste redenen waarom je een datawarehouse zou moeten bouwen. Alternatieven zoals appliances of data-virtualisatie kunnen weliswaar een deeloplossing vormen, maar kunnen nooit tippen aan de totaaloplossing die een datawarehouse biedt.
Reacties op dit artikel
Ik proef in je betoog een beetje te ‘moeten kiezen’ tussen een datawarehouse en door jou genoemde alternatieven.
Een interessante invalshoek die ik meer en meer tegenkom, is die van de ‘data architectuur’, bv zoals beschreven in het 4-kwadrantenmodel van Ronald Damhof op http://www.slideshare.net/rdamhof/idq-summit2014-ronald-damhof-its-all-about-the-data?next_slideshow=1
Daarin hebben zowel een dwh als bv een ad-hoc, opportunity en innovatie gedreven analyse omgeving beide een plaats, en beide hun waarde voor de business.
Rein, ik ben een groot voorstander om bij de opbouw van een datawarehouse te kijken naar minimale inspanning en maximale oprbrengst (pragmatisch dus) en in die zin zie ik ook het nut van tijdelijke data ‘architecturen’ en self-service business intelligence oplossingen die geen of gedeeltelijk gebruik maken van de data uit het datawarehouse. Waar ik echt moeite mee heb is dat er gezegd wordt dat bijvoorbeeld data virtualisatie het datawarehouse overbodig maakt en dat is mijns inziens niet zo want hoe kun je goed historie bijhouden met data virtualisatie? En hoe garandeer je snelle responstijden? Zeggen dat Data virtualisatie een compleet alternatief is voor een datawarehouse is mijns inziens hetzelfde als zeggen dat email in 1x alle post overbodig maakt, of dat je met advanced analytics geen reporting meer nodig hebt. Het is niet of-of, maar en-en. Er is een verschuiving gaande.
Rein, Leuk de damhof quadrantjes in herhaling.
De push gedreven vanuit IT “wij leveren en de klant moet maar slikken” en de pull “wij als klant vragen om … te leveren door IT” is de klassieke IT/Busisness kloof wat je echt niet met een tool gaat oplossen.
Je kunt je ook als leverancier opstellen dat je een tool aanlevert waarbij geen ICT betrokkenheid nodig is, je zou het als gebruiker zelf allemaal wel kunnen doen. Daarmee ga snel tegen aanwezige data-governance policies en allerelei andere richtlijen (controlerende instanties met richtlijnen (ISO-27k NEN7510) in. Dat is geen handige positie. Jammer als je weet dat er zo veel mogelijk is om het wel goed te doen.
Het datawarehouse heeft een slechte naam gekregen door al dat voortborduren (Kimball, Inmon) en lastige structuren (Lindsted). Het DWH als een “data-lake” data-meer (nee niet dat product) is de nieuwe hype. Met handige selfservice tools moet dat veel effectiever worden. Daar had ik verwacht dat je in memory oplossingen genoemd zou hebben zoals SAS-VA (presenteerde je toch laatst). Er zijn er natuurlijk meer. Gewoon dat langdurige data-marts en OLAP cubes bouwen zien te vermijden.
De 9 punten van Daan zijn valide argumenten, dat waren ooit de redenen om met een DWH te beginnen.