FDEC
Fraudedetectie

Fraude in grote datastromen

Bedrijven en overheden krijgen niet alleen veel data, ze genereren er zelf ook enorm veel. Maar ook consumenten creëren enorme hoeveelheden data onder andere door steeds meer diensten via internet af te nemen: van kopen tot bellen, van informatie opvragen tot zoekslagen, van geld overmaken tot portefeuillebeheer. Het wordt steeds ingewikkelder om goed toezicht te houden op deze grote datastromen.

Datamining en wiskunde helpen bij het opsporen van onregelmatigheden in de datastromen. Het vinden van onregelmatigheden (anomalies) wordt door de omvang en de dynamiek van de data sterk bemoeilijkt. Wil men die anomalies vinden dat zal men moeten beschikken over hoogwaardige kennis over datamining en wiskunde, over een grote vaardigheid in het omgaan met zeer grote bestanden (Terabytes), over een alerte en nieuwsgierige houding ("catch-the-thief-houding") en over kennis van het betreffende gebied (verzekeringen, betalingsverkeer, credit cards, sociale zekerheid, witwaspraktijken, etc.).

Onderdeel van schadelast

In onze benadering staat centraal dat fraudedetectie de eerste stap is in het verbeteren van het bedrijfsresultaat: de gevonden cases en patronen moeten door de opdrachtgever worden opgevolgd en (eventueel) worden vertaald in de eigen bedrijfsprocessen om herhaling te voorkomen. Daarom is de feedback van de opdrachtgever een essentiële voorwaarde voor succes. Wij gebruiken een nauwgezette werkwijze om gevonden, afwijkende cases te monitoren op opvolging bij de opdrachtgever/klant. Dit zogenaamde Book of Anomalies (BOA) is een leadhandling systeem dat helpt bij het succesvol behandelen van de constateerde anomalies.

Fraudedetectie leidt tot een lagere schadelast omdat verdachte cases worden gevonden en uitgezocht. Vaak leidt dit tot terugvordering en verrekening. Daarnaast draagt fraudedetectie bij tot imagoversterking van de onderneming én tot het voorkomen van nieuwe vormen van fraude. Het stelt ondernemingen in staat om een afschrikwekkende werking te introduceren en daardoor alleen al, de schadelast te verminderen. Het gezegde "voorkomen is beter dan genezen" geldt ook voor fraude. Maar belangrijker: dit soort verdachte transacties wordt uit de transactiestromen geweerd waardoor ook efficiencywinst in de processen wordt geboekt.

Op grond van onze ervaring, en bevestigd door externe bronnen, bedraagt de geschatte omvang van fraude circa één promille van de totale omzet aan transacties in bedrijven. Deze vuistregel kan natuurlijk verschillen tussen de betreffende datastromen: transacties in het betalingsverkeer verschillen van declaraties bij schadeverzekeraars, credit cards verschillen van declaraties bij zorgverzekeraars. Maar grosso modo is deze vuistregel valide en helpt deze bij het berekenen of fraudedetectie en fraudepreventie bij kunnen dragen aan het bedrijfsresultaat.

Methoden en technieken

De mogelijkheden om afwijkende patronen in transacties te kunnen detecteren neemt door stijgende computerkracht en slimme, intelligente methoden steeds verder toe. Daarbij is één van de lessen dat het vinden van een juiste combinatie van domeinspecifieke heuristieken en generieke zoek- en datamining-algoritmen de sleutel van succes vormt. Daarom is de bundeling van de expertise op dit terrein belangrijk.

Medewerkers van de Vrije Universiteit Amsterdam zijn al meer dan tien jaar betrokken bij het opsporen van fraude bij verschillende organisaties, zoals electronic payment processors, banken, verzekeringsbedrijven, etc. Bovendien is binnen het DIANA-project ("Data Interception and ANAlysis"), onderzoek verricht naar technieken en methoden voor het real-time monitoren/detecteren van anomalies (afwijkingen) in grote datastromen die gegenereerd zijn door internet payment platforms, intranets, webshops, etc.

Tot de technieken en theorieën die worden onderzocht, ontwikkeld én toegepast bevinden zich methoden uit de statistiek, data mining, machine learning, kunstmatige intelligentie, neurale netwerken en evolutionary computing. Wij zijn vooral geïnteresseerd in de "productiviteit van de methoden" (hoe succesvol zijn ze in de praktijk) en op welke terreinen ze snel succes boeken en op welke terreinen niet. Technieken die op één terrein succesvol zijn, blijken soms onbruikbaar op een ander terrein. Bij het FDEC bevindt zich de kennis en ervaring over welke methoden op welke gebieden kansrijk zijn. Ook weten wij waar succes concreet gebleken is.

Veel van de theorie en technieken zijn ook toepasbaar op andere terreinen, in het bijzonder marketing en bedrijfseconomie. Event-driven marketing en het verkopen van het juiste product aan de juiste klant op het juiste moment tegen de juiste prijs zijn slechts mogelijk door een goed gebruik van datamining technieken. De toepassing van technieken uit het fraudedetectiedomein op andere terreinen kan leiden tot nieuwe inzichten. Deze spin-off activiteiten zullen echter slechts een beperkt deel van onze tijd kosten.

Houding en snelheid

Voor een succesvolle monitoring en detectie zijn drie competenties nodig én een goede catch-the-thief attitude. Dit laatste is een conditio non sine est.

De drie competenties zijn:

  • De competentie om te kunnen komen tot goede leads (on the fly en in real time)
  • De competentie om snel en goed te kunnen omgaan met grote databestanden
  • De competentie om het domeingebied, in dit geval openbaar vervoer, goed te begrijpen
 

Wanneer een van deze competenties wegvalt is een goede, alerte en effectieve fraudedetectie niet mogelijk.



HomeFraudeFraudedetectieDatastromenOnderzoekConsultancyCursussenArtikelenOver ons