• No results found

Värde för hur reglernas ranking ska viktas, se ekvation 1

För att justera algoritmens parametrar och tröskelvärden måste en grundin-ställning att utgå ifrån sättas. En grundingrundin-ställning för dessa variabler skulle kunna antas vara de värden som experten bidrar med. För att undersöka att om det finns någon kombination av värden, inte närliggande expertens, som kan producera ett avsevärt bättre resultat gjordes en totalsökning över kom-binationer. Då variablerna kan anta en oändlig mängd värden begränsades mängden de kan anta för att totalsökningen skulle kunna göras inom arbe-tets tidsram. Modellens 10 olika inställningsbara variabler följer nedan:

1. Andel av data avsatt för att beräkna poäng för träningshistorik.

2. Tröskelvärde för skillnaden mellan poäng för transaktionshistorik och analyserat intervalls poäng.

3. Längd på intervall, antal veckor.

4. Tröskelvärde för regel 1.

5. Beloppets tröskelvärde för regel 2.

6. Antal insättningar för regel 2.

7. Beloppets tröskelvärde för regel 3.

8. Antal uttag för regel 3.

9. Beloppets tröskelvärde för regel 4.

10. Värde för hur reglernas ranking ska viktas, se ekvation 1.

4.2 Validering

4.2.1 Resultat totalsökning

Reglernas framsökta tröskelvärden är optimerade för just den specifika till-handahållna datamängden och just den specifika nisch av finansiell institut-ion datamängden kommer ifrån. Detta gör att värdena skulle kunna se an-norlunda ut för en annan typ av finansiell institution med andra typer av pengaflöden. En parameter som kan antas vara mer generell, jämfört med tröskelvärden för regler, för de flesta typer av finansiella institutioner är hur stort varje tidsmässigt intervall för transaktioner som modellen analyserar åt

22 | RESULTAT

gången. Detta värde visade sig inte påverka slutresultat nämnvärt. Efter test-körning med olika intervall i storleksordningen en till åtta veckor höll sig re-sultatet på liknande nivåer vad gäller antal funna planterade penningtvätts-fall och antal ytterligare funna potentiella penningtvättspenningtvätts-fall. Fortsättningsvis skrivs resultat på formen Y (X), där funna planterade penningtvättsfall re-presenteras av Y och ytterligare funna potentiella penningtvättsfall represen-teras av X.

En annan förmodat mer generell parameter är tröskelvärdet för hur stor skillnaden mellan ett analyserat intervalls Bayesianska poäng och transakt-ionshistorikens poäng får vara. Denna parameter visade sig dock påverka slutresultatet något mer då den efter en viss punkt gav betydligt sämre resul-tat, från som bäst 10 (20) till 6 (3) funna fall.

Mer påverkan på slutresultatet hade dock parametern för hur stor del av en NFI:s kunds datamängd som ska avsättas till att skapa en uppfattning om en dennes transaktionshistorik. Nedan visar tabell 4.1 olika resultat utefter hur stor del av datat som avsätts till att analysera en användares transaktionshi-storik. I tabell 4.1 representerar ratio variabel 1 från avsnitt 4.1.

Tabell 4.1. Resultat för olika stor andel data avsatt för att skapa en uppfattning om en användares transaktionshistorik. Talet inom parentes motsvarar ytterligare fall funna.

Ratio 10% 20% 30% 40% 50% 60% 70% 80% 90%

Resultat 10(67) 10 (55) 10 (43) 10 (32) 10 (20) 7 (15) 4 (9) 2 (4) 0 (1)

Sammanfattningsvis kunde flera intressanta resultat uppnås med hjälp av funna värden från genomförd totalsökning över parameter- och tröskelvär-den. Det resultat med flest planterade penningtvättsfall funna, true positives, var det när 10 av 11 hittades samtidigt som ytterligare 20 användare flagga-des för misstänkt transaktionsmönster. Utav flagga-dessa ytterligare 20 fall visade sig 11 vara aktuella för vidare granskning, alltså true positives, och 9 kunde avfärdas som false positives av en AML-expert. Bortser en från de planterade fallen betyder det att 45% av de funna fallen kan anses vara false positives i detta resultat.

23 | RESULTAT

Figur 4.1. Diagram över de fem bästa resultaten utifrån funna planterade fall. Resultat 1-5 motsvarar modellens utfall med olika tröskel- och variabelvärden.

Figur 4.1 visar att med olika inställningar av parametrar och tröskelvärden kan den utvecklade modellen hitta olika mängd av de planterade fallen, utef-ter premissen i 3.1.6. Figuren visar de resultat som funnit flest planutef-terade användare samtidigt som lägst antal ytterligare användare funnits. Samban-det är tydligt mellan att ju fler av de planterade fallen modellen hittar, hittas också desto fler ytterligare fall av potentiell pengatvätt. De ytterligare fallen som hittas kan delas upp i två relativt lika stora delar, false positives och true positives, med knapp övervikt för true positives. Fler genererade fall av po-tentiell penningtvätt betyder också mer behandling av och arbete med dessa fall, medan att fler fall som inte hittas kan drabba samhället negativt. Mer om hur en NFI kan se på detta i 5.1 och 5.2.

4.2.2 AML-expertens resultat

Efter att en totalsökning gjorts enligt ovan gjordes även en totalsökning över alla parametrar bortsett från tröskelvärdena för regel 2, 3 och rankning av regler. Rankingen av reglerna läts definieras av en AML-expert utefter erfa-renhet av hur effektiva reglerna i sig är på att indikera fall av penningtvätt.

Denna söknings bästa resultat, enligt premissen i 3.1.6, resulterade i 9 (20) användare funna. De 9 funna planterade användarna var samma som vid

re-24 | RESULTAT

sultatet baserat på totalsökningen under 4.2.1 och av de 20 ytterligare an-vändarna, var 18 samma som vid föregående resultat. När de två användarna som skiljde från totalsökningen under 4.2.1 lämnades över för manuell ana-lys av AML-expert ansågs båda dessa vara false positives.

Detta betyder för expertens resultat att 55% av de ytterligare funna använ-darna kan anses vara false positives medan motsvarande siffra i resultatet i 4.2.1 var 45%. Både resultatet baserat på totalsökningen och expertens resul-tat gav snarlika resulresul-tat om än med en viss förbättring via totalsökningen. De funna optimala värdena för variablerna 1, 2, 3, 4 och 10 var samma, se 4.1. De funna planterade användarna av de båda körningarna var samma. Körningen med expert-värden resulterade dock i en mindre hittad av dessa.

25 | ANALYS OCH DISKUSSION

Related documents