Is je datakwaliteit goed? Dan haal je veel meer uit je organisatie en je investeringen. Zoals die in CRM, Analytics, KPI’s of een datawarehouse. Alles staat of valt met de kwaliteit van je data (bekijk de 6 criteria). Maar, hoe verhoog je de kwaliteit van reguliere data en big data? En welke tools, methodes en maatregelen zijn het meest effectief? Welke doelen kun je formuleren om je datakwaliteit te verbeteren. Het is zo bekend: ‘garbage in, garbage uit’. Toch blijkt het moeilijk om de kwaliteit van de data op een hoger plan te brengen. Dat komt niet alleen maar door gebrekkige IT. Het gedrag van mensen speelt een evenzo belangrijke rol. Passionned Group, expert in datakwaliteit en data science, begrijpt dat en helpt je graag verder.
Datakwaliteit kun je meten. Dat is complex, maar zeker niet onmogelijk. De volgende aspecten worden gebruikt als criteria om datakwaliteit te kunnen meten:
Accuraat: gegevens moeten 100% kloppen. Denk bijvoorbeeld aan verouderde adressen, spelfouten in namen of aan een verhuurde woning zonder puntentelling (woningcorporaties).
Compleet: zijn alle gegevens compleet en goed ingevuld. Denk bijvoorbeeld aan een postcode waar de vier cijfers wel zijn gevuld maar de letters niet. Je primaire proces vaart hier ook wel bij.
Formaat: voldoet de data aan de regels die van toepassing zijn in jouw land of regio? Denk aan het formaat van een datum, telefoonnummer of bankrekening.
Consistent: klopt de data onderling? Is een adres bijvoorbeeld in het boekhoudpakket gelijk aan die in het CRM-systeem? En welk record is dan het meest betrouwbaar?
Dubbel: klant- en productgegevens komen vaak meerdere keren voor in bestanden. Meestal is de informatie in de diverse records anders.
Integer: dit gaat om data die niet goed te koppelen valt. Denk bijvoorbeeld aan orders die “zweven” in het systeem en geen klant kennen.
Figuur 1: Start met je datakwaliteit meten, zodat je kan weten waar je die kunt verbeteren.
Investeer in goede klantdata. Toets je data daarom regelmatig op deze aspecten. Daarvoor zijn al veel externe bronnen en tools beschikbaar. Denk bijvoorbeeld aan tabellen met postcodes of systemen om namen van klanten te controleren. Of denk aan ETL data profiling tools: hier vind je een uitgebreid overzicht.
Ga van meten naar verbeteren
Meten is de eerste stap. Maar dan ben je er natuurlijk nog niet. In stap twee moet je je data gaan verbeteren. En daar heb je dan een goede aanpak voor nodig. Onze aanpak helpt jou en je team met het ontwikkelen van nieuwe vaardigheden. Daarmee kun je de kwaliteit van gegevens continu verbeteren. En we helpen je met de juiste KPI’s en tools. Zodat je als individu en als team betere resultaten bereikt.
Elk moment kun je zien wat je datakwaliteit is, en vooral hoe en waar je die kan verbeteren. Of het nu gaat om klantgegevens of allerlei product- en procesgegevens. Wij bieden je alvast een gratis tool aan: de bekende cirkel van Deming: plan do check act. Hiermee kun je periodiek je datakwaliteit verbeteren vanuit een plan.
Formuleer doelen voor je datakwaliteit
In dat plan formuleer je de doelen voor de gewenste datakwaliteit. Dit gebeurt SMART zodat je het kunt meten. Dan stel je key performance indicators (KPI’s) vast en plaats je die op een dashboard. Vervolgens ga je de KPI’s normeren, je stelt je een doel. Je wilt bijvoorbeeld dat 98% van de contactgegevens van je klanten juist is.
In de stap ‘do’ ga je analyses maken. Je kijkt welke data fout is en hoe je die kan corrigeren. Ter plekke of door het systeem aan te passen. In de stap ‘check’ van de PDCA-cirkel vergelijk je de norm met de resultaten. En die bespreek je met elkaar. In de laatste stap stel je je doelen en KPI’s bij, of je maakt meer middelen vrij voor de uitvoering.
Datakwaliteit kent een aantal belangrijke aspecten. Die moet je altijd meenemen in je aanpak. Zie je deze aspecten over het hoofd, dan kan het je reputatie schaden. En dan lopen je klanten weg. Data heeft een zeer goede bescherming nodig. Neem daarom altijd de volgende drie aspecten mee in je data-strategie.
Privacy is een belangrijk aspect. Je klanten vertrouwen hun gegevens aan jouw organisatie toe. Ze gaan ervan uit dat je hier verstandig mee omgaat. Dit ging bijvoorbeeld fout toen enkele grote banken klantdata aan derden wilden verkopen. Ze zagen het voornamelijk als extra inkomstenbron. Hier was heel veel ophef over.
Security is een ander zeer belangrijk aspect. Elke dag is het wel in het nieuws: een datalek of een hack waarbij klantdata is gestolen uit een (online) database. De reputatieschade voor het bedrijf is enorm. Het kan zelfs het voortbestaan van je bedrijf in gevaar brengen.
Transparantie wordt steeds belangrijker. Welke klantdata sla je op en welke data deel je met derden? Facebook is wel het bekendste voorbeeld. Dat bedrijf verzamelt zeer veel data over klanten. En is het onduidelijk welke gegevens zij precies opslaan, wat ze daar dan mee doen en met wie ze die delen.
Deze bovengenoemde aspecten worden steeds belangrijker. Ze staan dan ook voortdurend op de agenda van alle directies en raden van bestuur van organisaties.
Data kent veel verschijningsvormen. Het is net een regenboog. Het enige verschil is dat een regenboog weer snel verdwijnt. Data daarentegen blijft persisteren in je organisatie. De meest bekende vorm is big data. Dit zijn heel veel gegevens of data die erg complex zijn. Ze passen niet meer in een normale database met kolommen en rijen. Daarnaast moet je zeker ook letten op open data en zero data.
Big data: is een zeer belangrijke trend. In onze datagedreven economie geeft big data snel nieuwe inzichten in het gedrag van klanten en apparaten. Big data zoekt figuurlijk naar de speld in de hooiberg. Werk je met big data, dan heb je waarschijnlijk grote problemen met datakwaliteit. Zeker als het gaat om data die mensen plaatsen op sociale media.
Open data: is vrij beschikbare data. Je kunt het tegenwoordig overal vandaan trekken. Overheden en kennisinstituten produceren die aan de lopende band. Denk aan de data van het CBS of die van het RDW. Het doel van open data is hergebruik. Door die te koppelen met bedrijfsdata, kun je je klantdata enorm verrijken. En krijg je veel meer inzichten in je klant of probleem. Bekijk ook alle open data van de overheid.
Zero data: veel organisaties richten zich alleen maar op big data, want dat is de trend. Ze vergeten dat heel veel informatie ook intern beschikbaar is. Bijvoorbeeld door specifiek te kijken naar data die niet in de database zit. Dit noemen we zero data. Deze data geeft bijvoorbeeld aan wat jouw klanten niet kochten.
Er zijn verschillende valkuilen die je moet zien te vermijden. Leer van de fouten die anderen eerder al maakten. Hieronder presenteren we de drie meest voorkomende misverstanden die leven over datakwaliteit.
Datakwaliteit is een eenmalige exercitie en geen continu verbeterproces. Wanneer de acute noodzaak van goede data verwatert, verdwijnt het van de agenda. En dan blijft het alsnog dweilen met de kraan open.
Data is geen strategische asset. Dan is er misschien ad hoc aandacht voor, maar nooit structureel. Door je datakwaliteit continu te monitoren en hierover te rapporteren, ga je dat veranderen.
Datakwaliteit is iets wat IT moet regelen. De verantwoordelijkheid is dan niet goed belegd. Het verbeteren van je datakwaliteit komt dan nooit echt goed van de grond.
Verhoog de datakwaliteit in jouw bedrijf
Je ziet dat datakwaliteit een onderwerp is dat leeft. En het onderwerp wint steeds meer aan belang. Wil je ook meters maken in het verbeteren van je datakwaliteit? Dan kunnen onze praktijkgerichte experts jou zeker helpen. Neem hier contact met ons op voor een vrijblijvend gesprek of offerte.
Over Passionned Group
Wij zijn Passionned Group: specialist in datakwaliteit, data science en big data. Onze ervaren experts helpen jou bij de kanteling naar een intelligente, datagedreven organisatie. Met passie en plezier. Om het jaar organiseert Passionned Group de Dutch BI & Data Science Award™, de verkiezing van de Slimste organisatie van Nederland.
Pouw, D. (2024), Wat is datakwaliteit: de handleiding om datakwaliteit te meten, weten en te verbeteren. Geraadpleegd op [voeg hier de datum in], van https://www.passionned.nl/datakwaliteit/
Wil je linken naar dit artikel? Dat kan als volgt: