• No results found

Verification and Discovery - Hypothesis and Knowledge Discovery

4.3 Tekniska Lösningsförslag

Då det gäller de olika problemområden Volvia och Volvokort har måste man angripa dem med olika metoder för data mining. För att Volvia ska kunna följa upp kampanjer passar en modell som utgår från verifikations-metoden, vilket innebär att man testar en hypotes. Då det gäller att förbättra kundrelationen behöver Volvia en discovery- metod där man söker samband som inte tidigare var kända. Volvokort behöver metoder för att kunna strukturera sin datamängd och lösa de problem som påverkas av att de har ostrukturerad data. Vi ger här ett lösningsförlag för vilka tekniker bolagen kan använda, hur de ska använda teknikerna och på vilket sätt Enterprise Miner kan vara till hjälp.

4.3.1 Klustertekniken

För att veta vad som identifierar de poster som finns i olika kluster bör man i modellen för kluster specificera vilka variabler som ska påverka grupperingen. Variablerna skall känneteckna posterna som skall ingå i de olika klustren. När tekniken är använd finns det en övergripande struktur över kundtyperna.

Volvia: Klustertekniken är något som Volvia kan använda sig av för gruppering av de olika kundtyperna. Medlemmarna i de olika klustren har fler associationer med varandra än poster i andra kluster. Tekniken underlättar för andra data mining tekniker vid analys av data.

Volvokort: För att lösa problemet med att Volvokort har stora mängder ostrukturad data, som gör det svårt att utvinna nyttig information, kan de använda sig av klustertekniken. Med kluster kan bolaget gruppera sin data, där det är mest intressant för Volvokort, liksom för Volvia, att i första hand gruppera de olika kundtyperna.

Enterprise Miner

För att underlätta för klustertekniken bör man behandla den totala datamängden först, bland annat för att få bort avvikande värden som inte kommer att påverka resultaten. I Enterprise Miner kan man behandla data på flera olika sätt, förutom att ta bort avvikande värden, kan man göra ett urval av den totala mängden poster och om det finns ett behov går det att standardisera variabler.

I produkten finns det en nod som heter ”clustering node”. Vid användandet av den här noden kan man i dess dialogruta specificera de val som ska gälla vid grupperingen och även bestämma totala antalet kluster som ska existera.

I en annan dialogruta ”seeds dialog page” specificeras kännetecknen för klustren, hur de ska uppdateras och kontrollera att rätt antal kluster skapas och att det inte blir fler än angivet. Resultaten visas i form av tabeller och diagram. Ett diagram visar de unika kännetecknen för varje enskilda kluster, ett annat visar storleken av varje kluster och förhållandet mellan olika grupper (se figur 4.2). Det finns även en grafisk presentation över indata variablerna till de olika grupperna samt statistisk information om varje kluster. Den här tekniken är en bra utgångspunkt för fortsatt analys med data mining.

Figur 4.2. Exempel på hur ett diagram som visar kluster kan se ut i Enterprise Miner. Bilden visar förhållandet mellan olika kluster.

4.3.2 Beslutsträd

Med beslutsträd kan företag analysera trender från historisk data för att sedan kunna förutsäga framtida trender, till exempel analysera de mest lönsamma kunderna från tidigare år för att kunna förutsäga vilka kunder som är lönsamma i framtiden. Det viktiga är att formulera reglerna i trädet på ett sätt som leder till rätt kategorisering av kunderna.

Volvia: De kan använda beslutsträd för att identifiera de kunder som är positiva till Volvias försäkringskampanjer och vilka som svarar på deras kampanjer.

Volvokort: Bolaget analyserar inte vilka kunder de tjänar pengar på. För att informationen ska vara till nytta är det bättre att analysera kundgrupper istället för enskilda kunder, vilket är viktigt för större företag med dålig översikt av sina kunder. Klassificering av olika kundtyper med beslutsträd kan leda till att resultatet redovisar vilka kunder som är mest lönsamma.

Enterprise Miner

I Enterprise Miner kan beslutsträd användas för tre olika saker, det första är klassificering av observationer, förutsäga resultat för intervall och förutsäga det bästa alternativet av flera olika beslutsalternativ.

Det första man skall göra i Enterprise Miner är att definiera den modell som ska forma reglerna som genereras från beslutsträdet och modellen kan sedan användas för klassificering av nya poster. I en dialogruta väljer användaren vilka variabler som ska användas i modellen för att utforma reglerna och klassificeringen. Det finns tre olika algoritmer som kan användas för att bygga ett beslutsträd och de är CART, CHAID eller C4.5. Efter att en algoritm har valts kan

användaren bestämma vilken struktur det producerade trädet ska ha, till exempel ska trädet producera så många löv som möjligt eller så kan användaren bestämma det maximala antalet löv som ska finnas i beslutsträdet. Modellen för beslutsträd presenterar regler och logiska påståenden med if-then satser och reglerna används till förutsägelser om nya datamängder. Resultaten visas, förutom som beslutsträd, även i form av statistiska tabeller och andra grafer. I figur 4.3 visar vi ett exempel för hur ett beslutsträd kan se ut, där klassificeras kunderna efter om de bor i villa, vilket kön de har och hur gamla de är.

4.3.3 Sekvensbaserad analys

Med sekvensbaserad analys kan företag identifiera vilka saker som sker samtidigt i en given händelse eller post. Analysen visar information om vad kunderna handlar för att ge en insyn till vilka kunderna är och varför de agerar som de gör.

Volvia: Företaget kan använda sig av sekvensbaserad analys för att få reda på vilka försäljningskampanjer som är lyckade och vilka som fick ett sämre resultat. Från sekvensbaserad analys presenteras resultaten i form av associationsregler som är formulerade som if-then-satser. Med resultatet från analysen kan Volvia få reda på vilka produkter och tjänster som är relaterade till varandra och vilka kunder som köper vad.

Enterprise Miner

I Enterprise Miner kallas tekniken association och används vid identifiering av saker som sker samtidigt i en given händelse. Ett exempel för hur en regel kan se ut:

if en volvobil köps hos en säljare för Volvohandeln then sker även köp av en Volvia-försäkring

vid X procent av tillfällen

Procentsatsen beskriver sannolikheten att A och B inträffar samtidigt och definieras som sannolikhetsfaktor (confidence factor) i Enterprise Miner.

Skriver man regeln generellt ser den ut så här: if A then B

där B en konsekvens av A.

4.3.4 Neurala nätverk

Både Volvokort och Volvia kan använda sig av neurala nätverk för att kunna placera in okända poster i de redan kända och klassificerade kategorierna. Nackdelen med neurala nätverk är att man bör ha kunskap om tekniken för att kunna tolka och förstå resultaten. För att kunna förbättra resultatet bör man förstå de specifika detaljer som finns inne i nätverket och som leder till resultatet. Ytterligare en nackdel är att man inte vet hur nätverket har kommit fram till resultatet. Det finns en modell som tekniken använder, men som användare kan man inte veta vilken det är, eftersom modellen fungerar som en ”black box”. Enterprise Miner stödjer användning av neurala nätverk, men eftersom tekniken kräver mycket av de personer som ska analysera resultatet har vi valt att inte beskriva neurala nätverk i Enterprise Miner utan återkommer till det i diskussionsdelen.

4.3.5 Minnesbaserat resonemang

Volvia vill kunna ”sikta bättre” vid kampanjurval för att ta reda på vilka kunder som ska få ett erbjudande. Det finns en teknik som heter minnesbaserat resonemang som, enligt Berry och Linoff (1997) ska användas just för kampanjurval. Nackdelen är att den här tekniken inte är representerad i Enterprise Miner. För att kunna analysera sina kampanjer bör de istället används sig av beslutsträd eller neurala nätverk.

Sammanfattning av de tekniska lösningsförslagen

För att göra en enkel bild över vilka tekniker vi har kommit fram till att de två bolagen kan använda har vi sammanställt en tabell. I tabellen visas vilka tekniker som kan tillämpas för data mining och i kolumnerna för Volvia och Volvokort förklarar vi hur de kan använda teknikerna (se tabell 4.1).

Anledningen till att vi inte tar med genetiska algoritmer och länkanalyser som tekniska lösningsförslag är vi anser att de inte är tillräckligt utvecklade för att användas för Volvia och Volvokorts räkning.

Tekniker Volvia Volvokort SAS Enterprise

Miner Kluster Använda kluster för

gruppering av kundtyper.

Gruppera sin data för att få struktur över den.

Hanterar den här tekniken och presenterar resultatet i form av diagram och statistisk information. Sekvensbaserad analys För att identifiera vilka

händelser som sker samtidigt kan Volvia använda analysen. Produkten använder associationsregler för att visa resultaten. Minnesbaserat resonemang

Volvia kan använda tekniken för att analysera sina kampanjer.

Enterprise Miner stödjer inte den här tekniken. Länkanalys

Beslutsträd Med regler i beslutsträd kan Volvia bland annat identifiera vilka kundtyper som är intresserade av Volvias försäkringar.

För att få en bättre översikt av sina kunder kan Volvokort använda beslutsträd för

formulering av regler.

Produkten stödjer den här tekniken och kan med hjälp av tre olika algoritmer (CART, CHAID och C4.5) presentera resultaten. Neurala nätverk Kan använda tekniken för

att identifiera okända poster.

Volvokort kan också använda tekniken för att dela in okända poster i rätt kategori..

Enterprise Miner hanterar tekniken, men en nackdel är att man måste ha bra kunskap om hur neurala nätverk fungerar för att kunna tolka resultaten. Genetiska algoritmer

4.4 Organisatoriska lösningsförslag

Related documents