Weinig profielen zijn binnen de it-sector op dit moment zo gegeerd als die van data scientist. Data scientists zoeken de spreekwoordelijke naald in de hooiberg. De hooiberg is in dit geval de massa aan data die een bepaald bedrijf verzamelt. Een data scientist gaat in die hoop aan gegevens op zoek naar de waardevolle en relevante data. En die hooiberg wordt steeds groter. Zo groot zelfs dat er niet genoeg gespecialiseerde profielen zijn om het tempo bij te houden. En het ziet er niet naar uit dat dit een trend is die snel zal keren.
Bedrijven hopen met behulp van die groeiende hoeveelheid data in real time relevante communicatie uit te kunnen sturen, doelgerichte en gepersonaliseerde marketingstrategieën te ontwikkelen, en het verloop van klanten te verkleinen. Maar de kans dat data scientists dit alleen verwerkt krijgen, is klein. Bijgevolg wordt het werk van data scientists in toenemende mate beïnvloed door machines.
70/30?
Tot op heden was de verhouding data-wetenschappers ten opzichte van machines 70/30, maar doordat het datavolume groeit, worden de rollen nu omgedraaid naar 30 procent voor de wetenschappers en 70 procent voor machines, omdat machines veel meer werk kunnen verrichten in kortere tijd.
Dit lijkt op het eerste zicht misschien een zorgwekkende evolutie, maar dat hoeft het niet te zijn. Data-wetenschappers zullen natuurlijk altijd nodig zijn om inzichten te verkrijgen en die te vertalen naar de behoeften van de markt, maar het is het realtime executie gedeelte dat ontbreekt. En waarom zou de mens daar tijd aan verspillen als een machine het eens zo snel kan. Data-wetenschappers kunnen die vrijgekomen tijd veel efficiënter investeren in het verkrijgen van inzichten.
Machine learning optimaliseren
De rol van data scientist zal dus veranderen. Data-wetenschappers zullen evolueren naar een meer programmerende rol om machine learning te optimaliseren. En in toenemende mate zullen ze ook een meer strategische rol moeten opnemen. Zij zullen naar het grotere plaatje moeten kijken, veeleer dan het puur vertalen van data en zo op een hoger level mee de richting bepalen die een bedrijf moet uitgaan. En net daar ligt de meerwaarde van de data scientist.