Je hebt sinds de opkomst van ChatGPT vast al wel eens gehoord van de term machine learning. Dat klinkt ingewikkeld, maar eigenlijk zegt de naam het al; machine learning is een manier om computers (machines) te laten leren. Machine learning is een vorm van AI, Artificiële intelligentie. En om een machine iets te kunnen laten leren heb je software nodig die dat mogelijk maakt. Natuurlijk wordt de basis van die software in gemaakt door een mens. Maar het eindresultaat is superslimme software die zichzelf steeds slimmer en beter maakt. Uiteindelijk werkt dit soort software veel sneller en nauwkeuriger dan een mens.
Sterker nog, hoe meer ervaring de software heeft, hoe beter en preciezer die zijn werk kan doen! Daarmee is Machine Learning ideaal om bijvoorbeeld phishing te slim af te zijn en je cyberveiligheid naar een hoger niveau te tillen. We leggen je graag uit hoe machine learning werkt en hoe het jouw leven makkelijker maakt.
Om te begrijpen hoe machine learning werkt hoef je alleen maar te kijken naar hoe jij als kind woorden hebt geleerd. Het woord ‘hond’ bijvoorbeeld. Je kreeg de plaatjes te zien van een aantal hondenrassen. Een Labrador, een Engelse Cocker Spaniël, een Deense Dog, noem maar op. Van veel hondenrassen had je na verloop van tijd wel een plaatje gezien. En bij allemaal leerde je dat het plaatjes waren van een hond. Onbewust ging je patronen herkennen. Vier poten, een vacht, vrij grote en dunne oren die allerlei vormen kunnen hebben, zelfs de verschillende vormen die een hondenkop kon hebben wist je na een tijdje te herkennen.
Je weet misschien niet dat dit een Hongaarse Vizsla is, maar je bent er wel zeker van dat het om een hond gaat. En dat allemaal dankzij de labels die je als kind hebt geleerd.
Op een gegeven moment had je voldoende verschillende honden gezien dat je ook van hondenrassen die nieuw voor je waren wist dat het hond waren. Een Hongaarse Vizsla, Ierse Wolfshond, Finse Spits? Nooit gezien, maar 100 % zeker een hond! En zo leert machine learning ook. Door veel data aan te leveren herkent machine learning zelf patronen en kan die software zelf bepalen wat iets is, ook al is iets helemaal nieuw! Enige eis is dat er bij het aanleren ruim voldoende data is om van te leren en dat je weet wat die data is.
Zoals je hierboven hebt kunnen lezen is het belangrijk om zoveel mogelijk input of data te geven als je software slim wilt maken. Hoe meer data, hoe beter. Die data wordt gebruikt om de software te laten leren. Dat doe je natuurlijk niet met zomaar wat gegevens.
Weet jij wat er precies in welk potje zit? Als je het niet weet en nog moet leren wat iets is, zijn die labels onmisbaar!
Die data die je hiervoor gebruikt is erg goed gecontroleerd en je weet dus precies wat voor soort data het is. Aan elke stukje data wordt namelijk een soort label gehangen dat aangeeft wat voor data het is. Dat is een virtueel naamkaartje dat aan elk stukje data hangt. In het voorbeeld over hoe jij als kind hebt geleerd honden te herkennen is het label ‘hond’. Bij Smartlockr wordt dat label gebruikt voor persoonsgegevens, zoals een telefoonnummer, adres, patiëntnummer of een BSN. Alles kan. Dankzij het label weet de slimme software wat voor soort data het is en kan het daarvan leren, als er maar genoeg voorbeelden zijn.
Met alleen een tabelletje vol data met een label ben je er nog niet. Je hebt namelijk veel meer gegevens nodig dan een simpele tabel uit excel. Met tien verschillende adressen kan de software namelijk nooit leren om alle soorten adressen te herkennen. Als de software straks zelf een adres moet herkennen zonder dat adres ooit gezien te hebben, dan lukt dat niet goed als je hem niet goed hebt aangeleerd wat een adres is.
Machine learning heeft data nodig. Heel veel data.
Hoe meer data je dan invoert, hoe beter de software leert wat een adres is. We hebben het dan over tienduizenden voorbeeldadressen alleen al om het begrip adres aan te leren. Dat lijkt veel werk, maar als er eenmaal genoeg data is ingevoerd, dan kan de software een begrip als adressen uiteindelijk veel beter herkennen en verwerken dan een mens. Maar machine learning is meer dan alleen een grote lijst met gegevens in de software gooien. Je hebt een programmeur nodig die alles checkt, bijstuurt en in goede banen leidt.
Allereerst schrijft de programmeur natuurlijk de software die zelf alles aan moet kunnen leren. Maar daarna zit het werk er voor de programmeur nog lang niet op. Die doet namelijk een heleboel meer dan alleen even wat data invoeren om vervolgens lekker uitgestrekt op de bank te gaan Netflixxen terwijl het systeem het werk doet.
Ook bij machine learning blijft de programmeur essentieel om de software ook echt slim te maken.
De programmeur kijkt vanaf het eerste moment heel precies mee hoe het systeem de data verwerkt en waar het wel of niet goed gaat. Tijdens het leren maakt Machine Learning namelijk ook fouten. Fouten horen nu eenmaal bij het leerproces, ook bij machine learning en net als de fouten die je als kind zelf maakte.
Maar je wil de fouten wel op tijd spotten. De programmeur kan dan aan de juiste knoppen draaien om foutjes te herstellen. En bij elke draai wordt de software steeds beter en worden de resultaten dus ook preciezer. Totdat de software geen fouten meer maakt.
Het eindresultaat van dit hele proces is een systeem dat begrijpt wat de informatie die je aanlevert betekent en wat het ermee kan doen. Het belangrijkste is dat machine learning ook nieuwe, onbekende data verwerkt en er het goede label aan geeft. “Ja, dat kan ik ook!”, horen we je denken. Dat klopt. Maar machine learning kan twee dingen veel en veel beter dan de mens.
Allereerst werkt machine learning supersnel. De data die jij in je eentje in een week kan verwerken is een lachertje voor systemen die werken op basis van machine learning. Dit soort systemen doet het werk waar jij een week mee bezig zou zijn in luttele seconden, hooguit. Machine learning is dus erg geschikt om de steeds groter wordende stroom aan data te verwerken die dagelijkse overal ter wereldwijd gemaakt wordt.
Een foutje is zo gemaakt, zelfs de oude Grieken hadden er last van. Gelukkig kun jij tegenwoordig vertrouwen op de voordelen van machine learning.
Ten tweede maakt machine learning geen (of nauwelijks) fouten. Hoe precies iemand ook is en hoe zorgvuldig die ook probeert te werken, fouten horen er nu eenmaal bij. Bedenk maar hoe snel je bent afgeleid op het werk. Of die keren dat je even op de verkeerde knop drukte. Machine learning heeft daar geen last van. Je kunt met machine learning de menselijke fout zo goed als elimineren!
En, ook handig; machine learning wordt nooit moe! Terwijl jij op maandagochtend nog even bijkletst met je collega’s over het weekend werkt de slimme software het hele weekend gewoon door. Foutloos en supersnel.
Bij Smartlockr maken we dankbaar gebruik van machine learning. Daarmee kan ons systeem nog beter (persoons)gegevens herkennen en weet het meteen wat ermee moet gebeuren. Jij kunt met een gerust hart een mailtje versturen, machine learning houdt een oogje in het zeil en vertelt je wanneer iets beveiligd of versleuteld moet worden of dat je nog onbevoegde ontvangers in de cc hebt. Zo wordt jouw dagelijkse mailverkeer dus nog efficiënter!
Ook handig is dat we machine learning inzetten om phishing te herkennen. En dat is wel nodig. Want er wereldwijd gaan elke dag miljarden (!) phishing-mails rond. Sommige herken je zo, maar ze worden door technieken als spear phishing steeds beter. En omdat het voor de gebruiker steeds moeilijker wordt om phishing makkelijk en snel te herkennen, is het belangrijk om daar ook het beste high-tech middel voor in te zetten. Je raadt het al; machine learning! Machine learning herkent zelfs de allernieuwste phishing-technieken en waarschuwt je direct voor mogelijke gevaren. Zo kun je zelfs niet per ongeluk op een fout linkje klikken.
Het is een open deur als je deze hele blog al hebt gelezen, maar machine learning maakt jouw werkende leven een heel stuk fijner. Je hoeft je geen zorgen te maken over veilig mailen in wat voor vorm dan ook. Het systeem van Smartlockr versleutelt je mails en bijlages als dat nodig is en is altijd alert op phishing. Zo ben jij er zeker van dat jij niet de oorzaak bent van een datalek!
Meer weten over machine learning en wat dat voor jouw organisatie kan betekenen? Lees dan de machine learning-blog voor CISO's waarin we meer vertellen over hoe Smartlockr machine learning inzet. En klik hier als jij op managementniveau werkt en je wil weten wat de voordelen zijn van machine learning.