Alle IT-kennis onder één wereldwijd dak
Werken bij de beste IT dienstverlener van Nederland?
Resultaat door passie voor IT
Start trefwoorden te typen om de site te doorzoeken. Druk enter om te verzenden.
Generative AI
Cloud
Testing
Artificial intelligence
Security
September 10, 2020
Overal om ons heen zien we de behoefte ontstaan om AI en Machine Learning in te zetten om efficiënter te zijn en/of betere en snellere beslissingen te maken. Toch zien wij vaak dat de doorlooptijden lang zijn voordat de gave AI oplossingen, waaraan hard is gewerkt, in productie worden genomen. Of sterker nog, ze worden uiteindelijk helemaal nooit in productie genomen! Tegelijkertijd, een model die het wel tot productie heeft weten te schoppen blijkt al sinds lange tijd voorspellingen te maken die niet het rendement hebben als voorheen. Dit heeft niet alleen een negatieve impact op de business maar schaadt ook het vertrouwen in AI. Of wat te denken van werknemers die betrokken zijn bij het ontwikkelen van een AI oplossing. Die krijgen het gevoel dat ze meer met randzaken bezig zijn dan met hetgeen waar ze goed in zijn en energie van krijgen. Eeuwig zonde! Helaas moeten we dus concluderen dat het in productie nemen én houden van ML modellen vaak nog niet zonder slag of stoot gaat.
Veelgenoemde oorzaken van bovenstaande pijnpunten zijn een toenemende mate van complexiteit op het gebied van modeleren, de vele frameworks die voorhanden zijn, computationele uitdagingen, team samenstellingen, enzovoort. En dit is nu precies waar MLOps bij helpt. Het biedt je namelijk de structuur die nodig is om succesvol te zijn in de uitvoering van je data missie en visie waarin AI een zeer belangrijke rol speelt.
MLOps is het standaardiseren en stroomlijnen van de machine learning (ML) lifecycle management, waarbij we onder andere gebruik maken van traditionele DevOps processen in de context van data en Machine Learning.
Er is echter een aantal fundamentele verschillen tussen de lifecycle management van een Machine Learning model en traditionele software. Afhankelijkheid is hierin een belangrijk aspect; niet alleen veranderd de data steeds, maar ook de wensen vanuit het business perspectief verschuiven continu. Dit heeft gevolgen voor de manier waarop je test en de prestaties monitort. Het feit dat je de ML lifecycle met mensen van verschillende disciplines doorloopt, biedt een volgende uitdaging. Data engineers, domein/business experts, data scientists, IT teams, geen van allen gebruiken dezelfde tools of bezitten dezelfde skills. Zo zijn de meeste data scientists bijvoorbeeld geen software engineers en ligt hun specialiteit in het bouwen en evalueren van een model, niet zozeer in het bouwen van een applicatie. Hiermee hangt ook samen dat MLOps veel experimenteler is van geest. Data scientists proberen verschillende features, parameters en modellen waarbij zij gedurende al deze iteraties hun code base moeten managen en zorgen voor reproduceerbare resultaten.
Voor het beantwoorden van bovenstaande vraag is het belangrijk na te gaan waar je tegenaan loopt op het moment dat er geen goede MLOps structuur staat. Je zult al snel merken, en zeker in deze onvoorspelbare, ongekende en steeds veranderende tijden, dat er problemen ontstaan bij de model kwaliteit en continuïteit. Hierdoor riskeer je dat een het model ‘biased’ voorspellingen gaat geven die op hun beurt een negatieve business impact leveren. Daarnaast brengt het in productie nemen van Machine Learning modellen je mogelijk ernstig in conflict met de GDPR en AVG regulaties of andere compliancy overeenstemmingen die zijn bedoeld om jouw klanten te beschermen tegen onrechtmatig gebruik van data. Een goede MLOps uitvoering bevat de juiste middelen en functionaliteit om er verzekerd van te zijn dat dit op de juiste manier gelogd en uitlegbaar is op het moment van een audit.
Het onderstaand schema geeft je een globaal overzicht waaraan een MLOps uitvoering in minimale vorm moet voldoen. In de realiteit zullen hier nog een aantal extra dimensies bijkomen. In de volgende blogs werk ik deze verder uit voor je.
Wanneer je je als organisatie beweegt naar een ML gedreven organisatie, dan adviseer ik met deze onderdelen minimaal te starten. Zij dragen direct bij aan de MLOps strategie en zijn tool- en framework-agnostisch. Afhankelijk van de organisatie en de gradatie van volwassenheid in het proces, kan het zijn dat je niet alle MLOps aspecten, zoals CI/CD, direct in een geautomatiseerde vorm nodig hebt. Onderstaande architectuur moet groeien en in de praktijk, zeker voor een eerste modelontwikkeling, zullen de stappen uit een CI/CD pijplijn merendeels via een handmatig proces verlopen. Of het kan zijn dat je juist al een CI/CD pijplijn hebt en dit proces wil standaardiseren over alle teams. Hoe de situatie ook is, het modulaire design biedt de mogelijkheid voor een gefaseerde uitrol van de verschillende modules. Het uitvoeren van een gap analyse helpt om de roadmap uit te stippelen om van de huidige situatie naar de gewenste doelarchitectuur te bewegen.
Elk van de onderdelen heeft een functie in het proces. Ik geef je hierover graag meer verdieping in opeenvolgende blogs.
Geïnteresseerd in een demo of wil je een gesprek over onze visie op een succesvolle implementatie van MLOps? Ga naar onze Data & Business Analytics services of neem direct contact op met ons.