Kwaliteit gaat boven kwantiteit
Data analytics is hot. In de media struikel je over verhalen van wat er allemaal mogelijk is met data en de analyse van data. Denk maar aan bedrijven die hun operationele processen hebben geoptimaliseerd of preventief onderhoud plegen op hun machinerie. Andere bedrijven realiseren een betere dienstverlening naar klanten of ontwikkelen een compleet nieuw businessmodel op basis van data-analyse. Als bedrijf of professional kan je dan gemakkelijk het gevoel bekruipen dat je ook iets met data analytics moet. Je wilt tenslotte niet de boot missen. Met het oog op de concurrentie is snel handelen bovendien vereist. Daarom wordt er analyse–tooling aangeschaft. Maar niet zelden blijven de resultaten achter bij de verwachtingen. De kwaliteit van de data, of liever gezegd de gebrekkige kwaliteit van de data is hier dikwijls debet aan.
Veel bedrijven hebben data verzameld, met hun ERP- of CRM-systeem, en gaan ervan uit dat, als ze maar voldoende gegevens hebben verzameld, ze hier waardevolle inzichten uit kunnen halen. Dit is een veelgehoorde misvatting, want misschien nog wel meer dan de kwantiteit is de kwaliteit hiervoor de bepalende factor. Of anders gezegd, “garbage in is garbage out”. Analysesoftware kan namelijk alleen maar zinnige informatie leveren wanneer ze met goede data wordt gevoed.
Datakwaliteit
Datakwaliteit is de mate waarin data geschikt is voor het doel waarvoor ze gebruikt wordt. De gegevens moeten geschikt zijn als informatiebron waarop allerhande beslissingsprocessen kunnen worden gebaseerd. Bij datakwaliteit gaat het om veel meer dan de afwezigheid van fouten. Om een waarheidsgetrouw beeld te scheppen, moeten de gegevens bijvoorbeeld ook actueel, volledig en accuraat zijn. En de meest waardevolle data is data die uniek is. En dan is er ook nog zoiets als de systeemtechnische kwaliteit van data. Hierbij gaat het om zaken als beschikbaarheid en toegankelijkheid. Ook integriteit en performance zijn onder deze noemer te scharen. Verder dient data onderhoudbaar en controleerbaar te zijn.
Gegevensbeheer
Om een goede kwaliteit van data te realiseren, is structureel gegevensbeheer nodig. Hieronder valt onder meer het actueel houden van datamodellen en de procedures en richtlijnen voor het gebruik en beheer van de data. Het gaat om vragen als welke gegevens moeten worden opgeslagen en welke niet en op welke wijze data wordt geselecteerd en gestructureerd. Maar bijvoorbeeld ook hoe de dataprivacy wordt gewaarborgd en wie de data mag inzien en gebruiken.
Verantwoordelijkheid
Bij veel bedrijven en organisaties is echter niemand specifiek verantwoordelijk voor het gegevensbeheer. En wat krijg je dan in het beste geval? Iedereen gaat naar eer en geweten met data om, maar wel op zijn eigen manier. Hierdoor treedt er vervuiling van data op. Gegevens worden in eigen lijstjes opgeslagen, met fragmentatie en dubbele data als gevolg. En bovenal wordt data vaak niet onderhouden als er niemand écht verantwoordelijk is.
Kansen
Data analytics begint daarom met het aanstellen van iemand die verantwoordelijk is voor het gegevensbeheer en de kwaliteit van data. Wat dat betreft vind ik het super om te zien dat, afgaande op de vele data-managmentvacatures, ook steeds meer bedrijven ervan doordrongen lijken. Een snelle zoekopdracht leert dat onder meer een bedrijf zoals Elsevier zo’n soort functie uit hebben staan. Een bedrijf hoeft overigens niet per se zelf een datamanager in dienst te nemen. Ze kunnen ook kwalitatieve data inkopen bij en laten beheren door een gespecialiseerde partij. Maar welke keuze er ook wordt gemaakt, kwaliteit moet altijd boven kwantiteit gaan. Zeker als een bedrijf met data-analyse begint, geldt wat mij betreft liever wat minder data, maar wel van goede kwaliteit dan een enorme hoeveelheid data, maar van gebrekkige kwaliteit. Want de kwaliteit van je data bepaalt in belangrijke mate hoe goed je beslissingen zijn.
Deze blog is eerder verschenen op Twinkle|Digital Commerce.