rik-meter-data-specialist-sogeti

Navigeren door de uitdagingen van Metadata Management

Rik Meter is data management consultant. In dit artikel behandelt hij vier voorkomende uitdagingen die je kunt tegenkomen bij het implementeren van metadatabeheer. Lees het artikel of bekijk de Data vacatures.

Naar Data

Metadata. We hebben er allemaal van gehoord. En we weten allemaal dat het belangrijk is. Toch blijft het een uitdaging om onze metadata goed te beheren. Om jou beter te helpen met de vele uitdagingen van metadatabeheer, zal dit artikel vier veelvoorkomende uitdagingen behandelen die je kunt tegenkomen bij het implementeren van metadatabeheer. Ook biedt het een aantal common practices die kunnen helpen bij het oplossen of omzeilen van de belangrijkste obstakels.

Metadata 101

Hoewel de literatuur over metadata gemakkelijk een boekenkast kan vullen, worden we vaak nog niet veel wijzer over metadata. Tot op heden blijft metadata één van de meest vage en obscure onderwerpen uit datamanagement. Wanneer je naar metadata vraagt, wordt je meestal getrakteerd op de ultieme dooddoener: "het is data over data [...stupid]".
Hoewel deze definitie het prima doet in verkooppraatjes, biedt het eigenlijk geen enkele zinvolle uitleg. Zelf denk ik daarom dat we metadata het beste kunnen uitleggen als alle mogelijke vormen van beschrijvende data, die we gebruiken om ons begrip en de toepasnaarheid van data te verbeteren.

metadata-rik-meter-sogeti

Op hoofdlijnen kunnen we drie types van metadata onderscheiden:
Business Metadata, die de context beschrijft waarin gegevens worden gebruikt, zoals termen en definities, business rules of beleidsregels;
Operationele metadata
, die het operationele gebruik van data beschrijft, zoals access logs, job execution logs of auditrapportages;
Technische metadata, die de feitelijke (verwerking van) fysieke gegevens beschrijven, zoals datasets en -attributen, regels voor gegevenskwaliteit of gegevenstransformatie.

Typische toepassingen van metadata zijn onder meer:

  • om jouw data-assets of dataproducten te catalogiseren
  • om de uitwisseling en distributie van data te vereenvoudigen
  • om gegevensverwerking te analyseren of te auditen.

Dus, wat maakt metadata zo belangrijk?

Nu we scherp hebben wat metadata is en wat het voor ons kan betekenen, zullen onze metadata-inspanningen nu eindelijk richting de eindstreep sprinten, toch? Nou, niet helemaal... Het erkennen van het belang van metadata is een eerste stap, maar het implementeren van metadatabeheer is voor de meeste organisaties nog een grote uitdaging. En dat is een probleem aangezien metadata in hoog tempo een van de belangrijkste enablers van digitale innovatie aan het worden is. 

Metadata is inmiddels een noodzakelijk onderdeel van bijna elk datagerelateerd project. Of het nu gaat om data democratization, naleving van wet- en regelgeving, of data-automation; alles is sterk afhankelijk van toegankelijke en betrouwbare metadata. Organisaties zullen metadatabeheer daarom goed onder de knie moeten krijgen voor ze echt datagedreven kunnen worden. In dit artikel zoom ik in op vier van de grootste uitdagingen rondom metadatabeheer, namelijk: scope, kwaliteit, governance en distributie.

Scope, scope en nog eens scope...

Met stipt op één staat scope: de behoefte aan metadata komt vaak voort uit de wens van het management om meer controle te hebben over data-assets en datagebruik. Immers, hoe kun je ooit grip hebben op data, als je niet eens weet welke data er binnen jouw organisatie gebruikt wordt? Het management zal daarom vaak inzetten op een data-inventarisatie, maar helaas vaak zonder vooraf prioriteiten te bepalen ('laat me gewoon alle data zien'). Hoewel een data-inventarisatie een noodzakelijke stap is voor metadatabeheer, kan een gebrek aan focus en prioritering er al snel toe leiden dat dit omslaat naar een grote inspanning en beperkte opbrengsten. Richt je daarom op het identificeren en categoriseren van de voornaamste data-assets. Dit zijn bijvoorbeeld master- en referentiedata, vertrouwelijke- of persoonsgebonden gegevens of veelgebruikte dataproducten. 

Definieer metadatakwaliteit

Ervan uitgaande dat je de belangrijkste data-assets hebt kunnen identificeren, kun je beginnen om deze assets te metadateren. Het belangrijkste doel hierbij is om ervoor te zorgen dat de metadata aansluit bij het beoogde gebruik (fit-for-purpose). De metadata moet dus antwoord geven op de belangrijkste vragen die uw datagebruikers hebben, bijvoorbeeld:

  • Wie heeft deze gegevens geproduceerd?
  • Is het toegestaan dat om deze gegevens te gebruiken?
  • Hoe moet ik de gegevens interpreteren?

Om deze vragen te beantwoorden, zul je mogelijk verschillende metadatabronnen moeten consolideren of de metadata misschien zelfs opnieuw moeten vastleggen. Het metadateren van grote hoeveelheden gegevens kan daardoor een behoorlijke klus zijn. Zorg er daarom voor dat je de data-eigenaren en dataproducteigenaren de juiste motivatie, ondersteuning en richtlijnen geeft om de metadata op de juiste wijze te ontwikkelen. 

Wanneer je dit niet doet dan krijg je op zijn best een bestand met onvolledige metadata. Waarschijnlijker is dat je metadata produceert die kant noch wal raakt. Een voorbeeld uit de praktijk: een metadatabestand voor de dataset KLANTEN, met de beschrijving “data over klanten”. Je zult begrijpen: hier wordt niemand wijzer van.
Gegevens kunnen beter worden beschreven door uitleg te geven over het beoogde gebruik. Of beter nog, koppel de metadata aan jouw glossary of taxonomie, om de definitie van gegevens beter aan een gebruiker te communiceren. Door je te richten je op het beschrijven van het gebruik en de eigenschappen van gegevens, zal jouw metadata significant meer waarde gaan leveren.

Géén data governance betekent géén metadata

Bij metadatabeheer wordt het woord 'beheer' vaak vergeten. Bedrijven hebben de neiging om zoveel tijd en moeite te investeren in data discovery en metadatering, dat er weinig wordt nagedacht over wat er daarna komt. Wanneer geen gezamenlijke inspanning wordt geleverd om de metadata te beheren, zal de kwaliteit van de metadata snel verslechteren. Uiteraard zullen de gebruikers, wanneer zij ontdekken dat de metadata verouderd of onnauwkeurig is, deze snel verwerpen om in plaats daarvan zelf op zoek te gaan naar de juiste informatie. 

Kortom, metadata is een data-asset op zichzelf en moet net als alle andere data-assets goed worden beheerd. Idealiter vormt metadatabeheer een logisch en integraal onderdeel van andere datamanagementprocessen. Gangbare praktijken zijn bijvoorbeeld het koppelen van het eigenaarschap van metadata aan die van fysieke data-assets en de actieve deelname van gebruikersgroepen aan de evaluatie en verfijning van de metadata. Laat gebruikers de (meta)data bijvoorbeeld beoordelen op basis van juistheid en bruikbaarheid. De waardering van de metadata kan vervolgens als KPI fungeren voor de data-eigenaren, om hun metadata-inspanningen bij te sturen. Data en/of metadata met een lage waardering zullen worden verworpen, waardoor de inspanningen steeds meer zullen bijdragen aan het afstemmen van vraag en aanbod. Metadatabeheer zal daardoor rechtstreeks bijdragen aan het gebruik van data en het vertrouwen in data.

'Vertrouwelijke' metadata bestaat niet

Tot slot wil je het delen van metadata zoveel mogelijk ondersteunen. Vaak wordt metadata nog decentraal beheerd door data-architecten, applicatiebeheerders of data-ontwikkelaars. Verantwoordelijke partijen kunnen zelfs proberen om de toegang tot de metadata te beperken. Bijvoorbeeld wanneer de achterliggende data van een persoonsgebonden of vertrouwelijke aard is. Het gevolg hiervan is echter dat metadata slecht toegankelijk wordt voor veel van de potentiele gebruikers. 'Verborgen' metadata maakt dat data-assets beperkt nuttig zijn buiten een kleine groep van stakeholders. Gebruikers zullen immers niet om data-assets vragen waarvan ze geen enkele weet hebben. 

Het niet delen van metadata is daarom een trefzekere manier om datasilo's te bevorderen. Wanneer we de kwaliteit en ROI van data willen verbeteren, dan spreekt het voor zich dat we ervoor moeten zorgen dat metadata gedeeld wordt met alle potentiële huidige en toekomstige gebruikers. Dit vereist minimaal een platform dat gebruikt kan worden voor het verspreiden en raadplegen van metadata. Waar dit vroeger vooral gebeurde met een BI-portaal of zelfs een eenvoudig Excel-bestand, zijn moderne oplossingen als een Data Catalog of Data Marketplace uitermate geschikt voor het verspreiden van metadata en het bevorderen van samenwerking.

Verder met Metadata

Ik hoop dat ik met dit artikel inzicht heb kunnen geven in enkele van de vele toepassingen voor metadatabeheer. Meer weten? Neem gerust contact op, ik vertel je er graag meer over. Wil jij iedere dag leren en kunnen sparren met vakgenoten? Bekijk dan de vacatures.

Naar vacatures

 


 

Kan ik je helpen?

Sogeti Maaike Somers Recruiter
Phone number: +31625755508