Vanaf 24 april zal GitHub interacties met zijn codeerassistent Copilot gebruiken om de onderliggende ai-modellen verder te trainen. De nieuwe voorwaarden gelden voor gebruikers van Copilot Free, Pro en Pro+.
Dat maakte Mario Rodriguez, chief product officer bij GitHub, bekend via een blogpost. Wie niet wil dat zijn data wordt ingezet voor modeltraining, kan zich afmelden via de privacy-instellingen. Wie eerder al had aangegeven niet te willen meewerken aan productverbetering, behoudt automatisch die keuze.
Concreet gaat het om een breed spectrum aan interactiedata: ingevoerde prompts, gegenereerde outputs, geaccepteerde of aangepaste codesuggesties, bestandsnamen, repositorystructuur en feedback op suggesties. ‘Real-world data leiden tot slimmere modellen’, zo vat Rodriguez de redenering samen.
GitHub haalt daarbij zijn ervaringen aan met het trainen op interactiedata van Microsoft-medewerkers, waarbij het, volgens Mario Rodriguez, hogere acceptatiegraden noteerde voor meerdere programmeertalen. Copilot Business- en Enterprise-gebruikers vallen buiten de nieuwe regeling.
Markt van drie
Het inzetten van gebruikersdata om modellen te verbeteren is een gangbare praktijk in de sector, maar roept bij sommige ontwikkelaars vragen op over privacy en controle over hun code. GitHub benadrukt dat de data niet wordt gedeeld met externe ai-leveranciers, wel mogelijk met zusterbedrijven binnen de Microsoft-groep.
Intussen heeft GitHub Copilot, ooit de onbetwiste marktleider in ai-ondersteund coderen, wel steeds meer af te rekenen met concurrentie. Volgens recente cijfers van CB Insights heeft Copilot zowat 25 procent van de ai-codeermarkt in handen, al volgen Cursor en Code Claude op korte achterstand.
