Datakwaliteit: bottleneck of bruggenbouwer?

Iedereen heeft inmiddels de mond vol van Big Data. Met de dag groeit het besef van de waarde van data. De nieuwe olie voor organisaties. Of anders gezegd een belangrijke asset die organisaties enorm veel kansen biedt.

Tot zover niets nieuws onder de zon. Parallel aan deze ontwikkeling groeit ook het besef dat de waarde van data wordt bepaald door de kwaliteit ervan. Kortom, ook datakwaliteit staat weer hoog op de agenda. En toch moeten we helaas constateren dat talrijke initiatieven om de kwaliteit van gegevens te verbeteren, stranden. Sterker nog, datakwaliteit blijkt veelal een bottleneck te zijn voor effectieve inzet van data voor organisatiesucces. Hoe datakwaliteit als bottleneck te transformeren naar een bruggenbouwer tussen business en IT? Het hulpmiddel is voorhanden.

Samenwerking tussen business en ICT

We weten dat samenwerking tussen business en ICT nog altijd een uitdaging is. Verschillende belangen, andere taal en een andere cultuur zijn herkenbare verklaringen. Het ontbreken van een adequate ICT-governance is veelal de bepalende factor voor het gebrek aan effectieve samenwerking. Wie is verantwoordelijk voor wat? En wie kun je daar vervolgens op aanspreken? Zo wordt de verantwoordelijkheid voor het beheer van datakwaliteit veelal geïnitieerd vanuit een ICT-perspectief. Dat is vaak gedoemd te mislukken. Juist nu wanneer data nieuwe, grote kansen biedt, worden de effecten van deze problematiek uitvergroot. Een eenvoudig model helpt niet alleen te bepalen wat de gewenste datakwaliteit moet zijn, maar kan ook business en ICT bij elkaar brengen:

Het bovenstaande model onderscheidt vier aspecten van data. Afhankelijk van de situatie kan hiermee het gewenste kwaliteitsniveau worden bepaald:

  • Definitie heeft betrekking op de beschrijving van een gegeven: technisch en functioneel. Naast attribuuttype en –lengte is een eenduidige beschrijving van de  functie van desbetreffend attribuut van belang;
  • Inhoud verwijst naar de gegevens zelf, de daadwerkelijke bouwstenen voor informatie;
  • Presentatie betreft de weergave van gegevens en de middelen voor deze weergave, zoals tooling voor rapportage;
  • Logistiek is van toepassing op het transport van gegevens en hun beschikbaarheid; ook de middelen die hiervoor worden ingezet vallen onder ‘Logistiek’, zoals de technische infrastructuur.

Meer gedetailleerde specificaties per aspect maken de kwaliteitsdefinities nog specifieker.

Mate van flexibiliteit

Afhankelijk van type proces en organisatie, kan voor elk aspect het vereiste kwaliteitsniveau in kaart worden gebracht. Per aspect kun je het niveau bepalen aan de hand van kenmerken zoals consistentie, compleetheid en correctheid, etc.

De mate van flexibiliteit wordt bepaald door de hoeveelheid kenmerken, combinaties daarvan of het toekennen van bedrijfsspecifieke aspecten. De definitie van ‘goed’ en ‘kwaliteit’ kan dus per situatie verschillen. Dat is erg afhankelijk van de functie die gegevens hebben of moeten krijgen in een organisatie. Gegevens zijn van goede kwaliteit als ze voldoend aan gestelde requirements.

Taken, bevoegdheden en verantwoordelijkheden

Wie heeft nu welke taak, bevoegheid en verantwoordelijkheid bij het op orde brengen van de datakwaliteit? Twee voorbeelden op een rij:

  • De business is primair verantwoordelijk voor de definitie en de inhoud van gegevens.

De business zorgt voor een eenduidige definitie die door de gehele organisatie gedragen wordt. En consequent en consistent wordt toegepast. Daarnaast zorgt de business voor de juiste inhoud, in overeenstemming met de requirements. 

  • Logistiek en presentatie is de primaire verantwoordelijkheid van ICT

De ICT-afdeling kan worden aangesproken op het tijdige transport, beschikbaarheid en toegankelijkheid van data. Ook de (rapportage)vorm waarin gegevens beschikbaar komen, is voor rekening van ICT. Een ‘ETL-straat’zorgt voor een veilig en foutloos transport van gegevens, zodat deze tijdig op de juiste plaats beschikbaar zijn. Ook de fysieke beveiliging van de infrastructuur en in het bijzonder van de diverse gegevensdragers is voor ICT een essentieel onderdeel van hun verantwoordelijkheden.

Dit zijn slechts een paar voorbeelden. Gezien de vele mogelijkheden die het model biedt, zijn legio andere situaties denkbaar. Zoals het beveiligings- en autorisatievraagstuk. Het model is een uitgangspunt ofwel een referentiekader. En kan als katalysator het bewustwordingsproces in gang zetten.

Dit proces moet uiteindelijk resulteren in een bedrijfsbreed gewortelde ‘mindset’. Daarmee wordt het streven naar optimale gegevenskwaliteit iets vanzelfsprekends. Volledig ingebed in de dagelijkse handel en wandel van de verschillende organisatiedisciplines.

Datakwaliteit de bruggenbouwer van de organisatie

Uiteraard is er veel meer nodig dan een model. Dat begint bij de onderkenning van het probleem. En het commitment van zowel de business als ICT om gezamenlijk tot een oplossing te komen. Als data wordt ervaren als strategische asset, zou dat commitment geen enkele discussie mogen zijn. Dan is het prettig om bovengenoemde methodiek toe te passen die samenwerking tussen business en ICT verder optimaliseert. Datakwaliteit is dan niet langer meer een bottleneck voor business en ICT maar een belangrijke bruggenbouwer voor het succes van de samenwerking. En belangrijker nog, een alles bepalende succesfactor voor de effectieve inzet van data!

Wil je meer weten? Stuur dan een mail naar naar Chris Vlaanderen