De kernvraag bij het bepalen van een ai-strategie is niet langer: moeten we een ai-platform kopen of zelf ontwikkelen? In plaats van de afweging ‘buy versus build’, gaat het om de vraag: schaffen we een end-to-end-platform aan of verbinden we de beste tools op elk onderdeel met elkaar? Hoewel de wedstrijd nog loopt en er misschien een verlenging volgt, staan hieronder alvast de voor- en nadelen én risico’s op een rij.
Om de nieuwe keuze tussen end-to-end en best-of-breed goed te begrijpen, is het handig eerst een stapje terug te doen. Wat is er gebeurd met build vs buy? De meeste organisaties hebben de plannen om een eigen ai-platform te bouwen voor langere tijd in de ijskast gezet. Een van de redenen hiervoor is de zogeheten ‘technical debt’ in machine learning-systemen, die door Google is geïdentificeerd. Er is zoveel technologische lijm nodig om alle functies die buiten de core-functionaliteit van een machine learning-model vallen bij elkaar te houden, dat het schier onmogelijk wordt om een ai-platform op te zetten dat goed functioneert en schaalbaar is.
Zoals in deze afbeelding van Google te zien is, bestaat maar een klein deel van het volledige machine learning-systeem uit machine learning-code. Dit is het kleine zwarte blokje in het midden; de rest van de infrastructuur is omvangrijk en complex.
End-to-end of best-of-breed
Het bouwen van een modern ai-platform, en daarmee het opzetten van een schaalbare ai-strategie voor de gehele organisatie, komt grofweg neer op de volgende twee opties:
-
De aanschaf van een end-to-end-platform voor datawetenschap, machine learning en ai voor de hele levenscyclus. Dus van de invoer van onbewerkte data tot etl (extraction, transformation and load), het bouwen van modellen tot het operationaliseren van deze modellen en ai-systemen, en de monitoring en governance van deze systemen.
-
De beste tools kopen voor elk afzonderlijk onderdeel van de levenscyclus en deze met elkaar verbinden. Zo ontwikkelt de organisatie een maatwerkplatform dat het best past bij de behoeften.
Vaak is de tweede optie net wat ingewikkelder. De keuze om zelf tools aan elkaar te knopen, wordt eerder gedreven door bestaande investeringen dan door de expliciete keuze om nieuwe investeringen te doen in tools die precies passen bij de behoefte van de organisatie. Met andere woorden: we hebben al tools voor x, y en z. Wat kunnen we toevoegen om onze stack compleet te maken en wat hebben we nodig om alles met elkaar te verbinden?
Iedereen tevreden
Hoewel het aantrekkelijk klinkt om voor elke discipline de beste tool te kiezen – zo houd je immers iedereen tevreden – is het geen gemakkelijke klus om consensus te vinden binnen de organisatie. Bovendien is het ook niet eenvoudig om alle verschillende onderdelen met elkaar te verbinden. Het is misschien niet half zo ingewikkeld als alles zelf ontwikkelen, maar alsnog een enorme uitdaging. Naast het samenbrengen van de verschillende tools zijn er nog een aantal andere kwesties om rekening mee te houden bij de best-of-breed-optie:
-
Data lineage (letterlijk: data-oorsprong) is niet gemakkelijk te herleiden bij gebruik van verschillende tools. Dit is een probleem voor vrijwel alle organisaties, omdat zichtbaarheid en uitlegbaarheid in ai-processen cruciaal is voor het opbouwen van vertrouwen – zowel in- als extern. Voor bedrijven in sterk gereguleerde branches, zoals de financiële sector of de farmaceutische industrie, is het zelfs wettelijk vastgelegd.
-
Het samenbrengen van tools kan zorgen voor complexe overdracht tussen teams en vertragingen. Door projecten van tool naar tool te verplaatsen kan belangrijke informatie verloren gaan. Bovendien duurt de overdracht tussen teams waarschijnlijk langer en zorgt dit voor een langzamer proces van data-naar-inzicht.
-
De langzamere overdracht tussen systemen en disciplines zorgt voor meer complexiteit van goedkeuringsprocessen. Hoe kan een bedrijf de risico’s verkleinen bij de overdracht van AI-projecten van de ene naar de andere tool en hierbij belangrijke zaken zoals model bias en data privacy niet uit het oog verliezen?
-
Kansen voor automatisering tussen verschillende stappen in de levenscyclus worden niet gepakt. Denk hierbij aan het triggeren van automatische acties als een onderliggend datamodel wordt aangepast.
-
Onoverzichtelijk versiebeheer ligt op de loer. Met verschillende tools is het logischerwijs ingewikkelder om een goed overzicht te behouden. Is er bijvoorbeeld voldoende zicht op dat de data pipeline in tool A overeenkomt met de model version in tool B, zodat het hele systeem werkt zoals het is bedoeld?
De energie die een organisatie steekt in het bouwen van een modern AI-platform zou niet moeten wegsijpelen door het continu bij elkaar zoeken van de juiste puzzelstukjes. De kans op weinig waardevolle output, een gebrek aan inzicht over de volledige data pipeline en langzame processen neemt dan zienderogen toe.
End-to-end-oplossing: voordelen en risico’s
Tegenover best-of-breed staat het aanschaffen van een end-to-end-oplossing. Er zijn drie grote voordelen bij een end-to-end-platform. Ten eerste levert het een kostenbesparing op, omdat de hele ai-pijplijn inzichtelijk is en de data zo door de hele organisatie zijn te hergebruiken.
Om een voorbeeld te noemen: data die al zijn opgeschoond en voorbereid door analisten kan door datawetenschappers in andere bedrijfsonderdelen direct worden gebruikt. Dit voorkomt repetitief werk en zorgt voor een betere rendement van de ai-inversteringen. Ten tweede dienen end-to-end-platformen als een gecentraliseerde abstractielaag, waardoor it- en architectuurteams zich kunnen richten op de snelle ontwikkeling van onderliggende technologieën, zonder zich zorgen te hoeven maken over het samenbrengen van tientallen verschillende tools.
Tenslotte is monitoring en governance een stuk eenvoudiger bij een end-to-end-oplossing. Voor veel organisaties is governance een veel breder thema dan enkel ‘data governance’, het behelst alle processen die een bedrijf inricht om de risico’s te verkleinen en om aan geldende wet- en regelgeving te voldoen. Een tool waar iedereen binnen de organisaties gebruik van maakt, verkleint de risico’s die gepaard gaan met het toenemende gebruik van ai en maakt het voor een organisatie gemakkelijker om zich aan de regelgeving op het gebied van dataprivacy te houden.
Nadelen
Natuurlijk kleven er ook nadelen aan een end-to-end-oplossing, waarvan de meest voor de hand liggende de vendor lock-in is. Een serieus risico, omdat de organisatie afhankelijk is van de grillen van een enkele leverancier.
Stel dat de organisatie op zoek is naar een nieuwe functie, maar die staat niet op de roadmap van de leverancier, dan is het nog niet zo gemakkelijk om hier toch aan te komen. Het is daarom raadzaam om te investeren in een end-to-end-oplossing die open en flexibel is, waardoor organisaties gebruik kunnen maken van onderliggende data-architectuur en investeren in bepaalde onderdelen zoals storage, compute power, algoritmes en frameworks.
Een laatste tip is om bij het selecteren van een ai-platform niet alleen te kijken naar het vermogen om te integreren met bestaande technologieën (zoals programmeertalen, machine learning model libaries, en data-storagesystemen), maar ook onderzoek te doen naar de visie van de leverancier. Een leverancier die baanbrekend wil zijn, zal voldoende ruimte bieden om nu en in de toekomst het platform open te stellen voor nieuwe technologieën als daarom wordt gevraagd.