Vorige keer in Smartlockr - A.I.: een vernuftige pop-up redde miljoenen euro's, terwijl mensen wereldwijd aan de haal gingen met gevaarlijk eenvoudige wachtwoorden en ons met de vraag achterlieten: wanneer leren we van Machine Learning?
Als dat meer leest als de trailer van een TV-serie dan als blog voor een IT-bedrijf, dan is dat omdat je meteen doorhad dat er iets anders was. Goed gedaan! Een computer had veel meer data nodig gehad om tot eenzelfde conclusie te komen, data en Supervised Machine Learning om precies te zijn.
Maar, wat zijn Supervised en Unsupervised Machine Learning eigenlijk, en wat hebben ze te maken met het beschermen van je privacy?
Alles wat je moet weten over hoe je met AI en ML je data kan beschermen: "Good cop, bot cop - De stand van zaken rondom A.I., Machine Learning en je Privacy"
Zoals je misschien al weet is Machine Learning een discipline binnen het vakgebied van Kunstmatige Intelligentie (AI). Machine Learning zelf kan je weer opdelen in Supervised Machine Learning en Unsupervised Machine Learning.
Er zijn talloze manieren om van A naar B te gaan. Als je weet dat A en B begin- en eindpunt zijn, dan ligt de focus automatisch op alles wat er onderweg gebeurt. Bij Supervised Machine Learning zijn zowel de input als output variabele bekend en gebruik je een algoritme om te zien hoe je van A naar B gaat.
Zowel A en B zijn in dit geval zogeheten labelled data sets. Het vergt mensenwerk om een computer te vertellen wat elke variabele precies betekent en hoe deze invloed heeft. Zo kunnen we Supervised Machine Learning bijvoorbeeld gebruiken om te voorspellen hoe lang een vliegtuig onderweg zal zijn op basis van factoren zoals het weer, aantal passagiers, of de hoeveelheid brandstof aan boord. Je kan net zoveel variablen toevoegen als je wil, zolang je het algoritme maar traint in hoe ze de uitkomst veranderen.
Supervised Machine Learning kan je kort samenvatten als A >< B. Unsupervised Machine Learning daarentegen ziet er als volgt uit: A >> ?. The input variabele is bekend, maar de output variabele niet.
Bij Supervised Machine Learning staat de uitkomst altijd vast en zijn het de variabelen onderweg die van belang zijn. Het doel van Supervised Machine Learning is om verregaande inzichten te krijgen in hoe je van A naar B gaat en wat er onderweg allemaal kan gebeuren. We noemen het Supervised, omdat we de computer blijven vertellen wat het goede antwoord of eindpunt is (B). We blijven het nieuwe data geven, net zolang totdat het zelfstandig van A naar B kan gaan. Vanwege deze zogenaamde supervisie zal het algoritme altijd corrigeren naar hetzelfde eindpunt.
Bij Unsupervised Machine Learning ligt de focus niet op wat er onderweg naar een bepaald eindpunt allemaal kan gebeuren, maar wordt er meer gekeken naar waar de data ons heenbrengt. We noemen het Unsupervised Machine Learning omdat we de computer niet vertellen wat het goede antwoord of eindpunt is.
Je komt een heel bekend voorbeeld van Unsupervised Machine Learning tegen wanneer je online iets bestelt: klanten die dit kochten, kochten ook... is in feite een vertaling van "A >> ...".
Binnen cybersecurity wordt Supervised Machine Learning het meest toegepast. De eerste alinea van deze blog was geschreven in een andere stijl dan de rest. Geef je een algoritme voldoende data, dan zou het met Supervised Machine Learning uiteindelijk eenzelfde onderscheid kunnen maken.
Supervised Machine Learning wordt daarom ook veel gebruikt voor het herkennen van spam, phishing e-mails en zelfs malware.
Zoals hierboven al werd uitgelegd is Unsupervised Machine Learning meer geschikt om data te interpreteren dan te sturen. Hiermee is Unsupervised Machine Learning erg geschikt om onregelmatigheden te spotten, iets wat veel gebruikt wordt om fraude bijtijds op te sporen. Ook kan deze technologie gebruikt worden om verdachte gedragingen van bijvoorbeeld personeelsleden te spotten. Dit is met name belangrijk op plekken waar werknemers de faciliteiten van hun organisatie voor hun eigen doeleinden zouden kunnen misbruiken.
Zowel Supervised als Unsupervised Machine Learning zijn belangrijke tools in de wereld van cybersecurity. Ze maken het hackers moeilijk en zorgen ervoor dat ze eerder of zelfs op tijd ontdekt worden.
Het verandert natuurlijk niets aan het feit dat online veiligheid uiteindelijk mensenwerk blijft. Eenvoudige best practices zijn nog altijd het meest effectief in het voorkomen van datalekken. Technologie bestaat om ons daarbij te helpen, en niet andersom.
Wil je weten hoe je moderne technologie kan gebruiken om mensenwerk te optimaliseren? Download via de link hieronder gratis onze whitepaper: "Good cop, bot cop - De stand van zaken rondom A.I., Machine Learning en je Privacy"!