• No results found

Tekniker som användes i projektet

A. Agaton Sjöberg Big data och nyttan med dess tekniker

A.3.3 Tekniker som användes i projektet

Ett flertal tekniker användes under utvecklandet av produkten och i detta avsnitt ska de behandlas. Samtliga tekniker har redan tagits upp under kapitel 3 i rapporten vilket innebär att detta avsnitt kommer fokusera på den teori hos varje teknik som är viktig för att kunna svara på frågeställningen.

A.3.3.1 Apache Ignite

Ignite har många användningsområden och användes för att lagra data i projektet. För en mer generell genomgång av mjukvaran hänvisas läsaren till avsnitt 3.4 i rapporten. Hädanefter kommer endast de delar av Ignite som kan underlätta svaren på frågeställningen behandlas.

I projektet konfigurerades Ignite på ett särskilt sätt i hopp om att nå upp till de krav som kunden ställde på slutprodukten. En av egenskaperna som fokus las på var att systemet skulle vara ​ACID ​(se avsnitt 3.2),

genom att fördela uppgifter på de olika enheterna i klustret gör beräkningar och analyser snabbare vilket passar bra vid hantering av stora datamängder [27]. Ytterligare en fördel med Ignite är hur användaren med enkelhet kan utöka klustret och på så sätt öppna upp för ännu mer datalagring. Genom att

konfigurera ett fåtal inställningar, installera Ignite mjukvaran samt koppla samman den nya enheten med klustret ordnas resten av systemet själv och kräver inte ens en omstart.

A.3.3.2 Apache NiFi

Under avsnitt 3.1 i rapporten finnes en beskrivning av NiFi dit läsarna hänvisas för en mer övergripande genomgång av mjukvaran. NiFi hanterade dataflödet i projektet vilket även är dess huvudsakliga

användningsområden. Enligt NiFi:s egen hemsida är några av mjukvarans fördelar följande [28]. NiFi kan hantera flöden där data inte får förloras och kan dessutom göra så på ett mycket snabbt sätt. Vidare är mjukvaran förhållandevis enkel att använda tack vare de inbyggda processerna samt dess användarvänliga gränssnitt. Samtliga steg i dataflödet är krypterad vilket medför en hög säkerhet. NiFi är dessutom lätt att anpassa efter ett förändrat flöde då man med enkelhet kan lägga till en extra enhet med NiFi i ens system. Slutligen är det även lätt att anpassa i den mån att användaren kan bygga egna processorer från grunden och på så sätt anpassa mjukvaran helt efter dess behov.

A.3.3.3 CesiumJS

Ett bibliotek till JavaScript som lämpar sig väl vid visualisering av 2D- eller 3D-objekt är CesiumJS som tillhandahåller användaren en jordglob där en kan visualisera godtyckliga objekt [29].

A.4 Metod

För att besvara frågeställningen krävdes en mängd information om ​big data​ och de tekniker som använts i projektet. Informationen erhölls genom en litteraturstudie via internet. Underlaget hämtades med hjälp av sökningar i Google där nyckelord som ​big data, distributed databases, use cases big data ​samt

advantages big data har använts. I den mån vetenskapliga artiklar hittats har de använts men eftersom det inte alltid var möjligt har en del av informationen hämtats från mindre seriösa källor där informationen hållit en god kvalité. Vidare har erfarenheter samt lärdomar som hämtats från projektet ligga till grund för en del av de slutsater som dragits.

A.5 Resultat

I detta avsnitt presenteras de resultat som litteraturstudien resulterat i.

A.5.1 Big data tekniker

Det saknas en explicit definition av ​big data, ​vilket kunde ses i teoridelen där två olika definitioner togs upp. Genom att använda de olika definitionerna och relatera dem till Ignite, NiFi samt CesiumJS har det beslutats huruvida de olika teknikerna går under begreppet ​big data​ eller inte.

A.5.1.1 Doug Laneys definition

De tre V:na eller ​Volume, Velocity och Variety ​är de nyckelord som Doug Laney anser bäst beskriver ​big data. Om teknikerna som använts i projektet är anpassade för att hantera någon eller några av Laneys V:n anses tekniken på så sätt vara ​big data​ tekniker.

A.5.1.1.1 Apache Ignite

I teoridelen av denna rapport beskrivs några bra egenskaper som en databas skapad med Ignite har. En av de var att ett sådant system kan hantera analys av stora datamängder effektivt. Detta kan relateras till Volume och ​Velocity ​eftersom man alltså kan hantera stora volymer av data och klara av att analysera data som kommer in med hög hastighet. Enligt denna definition är alltså Ignite en teknik som kan relateras till big data.

A.5.1.1.2 Apache NiFi

NiFi har flera olika fördelar där två av de som behandlats är dess snabbhet vid hantering av indataflöden samt möjligheten att själv anpassa tekniken efter ens egna ändamål. Snabbheten hos tekniken kan direkt relateras till ​Velocity ​eftersom NiFi är anpassat för att ta emot data med hög hastighet men även ​Variety eftersom oavsett format av data kan processerna i mjukvaran justeras efter godtycklig indata. Därav anses NiFi vara en ​big data​ teknik.

A.5.1.1.3 CesiumJS

Den tredje teknik som använts i projektet var CesiumJS. Det finns inget med CesiumJS som är särskilt anpassat för någon av de V:n som definierar ​big data​. Dess syfte är att visualisera data men inget med programvaran är särskilt utformat för att hantera stor volym, hög hastighet eller varierad data.

A.5.1.2 Cambridge lexikons definition

Denna definition är inte lika enkel att använda för att bestämma om en teknik relaterar till ​big data​ eller inte eftersom definitionen är mer abstrakt. Första delen av definitionen talar om stora datamängder vilket kan relateras till Laneys ​Volume. ​Andra delen menar att datat ska produceras av människor som använder internet, de tekniker som använts i projektet tar inte någon hänsyn till var datan kommer ifrån. Sista delen tar upp att datan endast kan lagras, förstås samt användas med hjälp av särskilda verktyg och metoder. Vad det är för särskilda metoder som de hänvisar till är oklart. Definitionen är alltså delvis lik Laneys samtidigt som den även är otydlig och därmed används främst Laneys för att bestämma vilka tekniker som relaterar till ​big data​.

Related documents