Aan de hand van verschillende soorten voorbeelden leert het systeem patronen herkennen, zoals stemmen, teksten of plaatjes. Als alle voorbeelden te veel op elkaar lijken, werkt het systeem alleen goed voor die situatie en minder goed voor andere groepen mensen.

Spraakherkenningssystemen krijgen bijvoorbeeld duizenden uren aan stemmen en accenten als oefenmateriaal. Als de data te eenzijdig zijn – bijvoorbeeld alleen volwassen stemmen – dan kan het systeem kinderen of dialecten minder goed begrijpen. Daarom is het belangrijk dat trainingsdata breed en gevarieerd zijn, zodat de resultaten eerlijk en betrouwbaar worden.

Zie ook:

LLM

kunstmatig neuraal netwerk