• No results found

Využití Self Service nástroj pro analýzu dat

N/A
N/A
Protected

Academic year: 2022

Share "Využití Self Service nástroj pro analýzu dat"

Copied!
71
0
0

Loading.... (view fulltext now)

Full text

(1)

Využití Self Service nástroj pro analýzu dat

Bakalá ská práce

Studijní program: B6209 – Systémové inženýrství a informatika Studijní obor: 6209R021 – Manažerská informatika

Autor práce: Ond ej Šeps

Vedoucí práce: Ing. Vladimíra Zádová, Ph.D.

Liberec 2017

(2)

Utilization Self Service Tools Business Intelligence for Data Analysis

Bachelor thesis

Study programme: B6209 – System Engineering and Informatics Study branch: 6209R021 – Managerial Informatics

Author: Ond ej Šeps

Supervisor: Ing. Vladimíra Zádová, Ph.D.

(3)
(4)
(5)

Prohlášení

Byl jsem seznámen s tím, že na mou bakalá skou práci se pln vzta- huje zákon . 121/2000 Sb., o právu autorském, zejména § 60 – školní dílo.

Beru na v domí, že Technická univerzita v Liberci (TUL) nezasahuje do mých autorských práv užitím mé bakalá ské práce pro vnit ní pot ebu TUL.

Užiji-li bakalá skou práci nebo poskytnu-li licenci k jejímu využití, jsem si v dom povinnosti informovat o této skute nosti TUL; v tomto p í- pad má TUL právo ode mne požadovat úhradu náklad , které vyna- ložila na vytvo ení díla, až do jejich skute né výše.

Bakalá skou práci jsem vypracoval samostatn s použitím uvedené literatury a na základ konzultací s vedoucím mé bakalá ské práce a konzultantem.

Sou asn estn prohlašuji, že tišt ná verze práce se shoduje s elek- tronickou verzí, vloženou do IS STAG.

Datum:

Podpis:

(6)

Pod kování

Tímto bych rád pod koval paní Ing. Vladimí e Zádové, Ph.D., vedoucí mé bakalá ské práce, za pomoc a rady p i tvorb této práce. Dále bych rád pod koval společnosti Trask Solutions, a.s. ,která mi poskytla zázemí, pot ebné nástroje a licence. Speciáln pak panu Ing. Št pánu ůubrechtovi, který mi poskytl pot ebné materiály pro pochopení dané problematiky.

(7)

Anotace

Tato bakalá ská práce se zam uje na současný trend v oblasti Business Intelligence, čímž je p ístup Self Service Business Intelligence neboli samoobslužné Business Intelligence.

Hlavním cílem je porovnat vybrané Self Service nástroje a nahlížet na n z n kolika hledisek. Teoretická část obsahuje historický vývoj Business Inteligence, jeho charakteristiku z hlediska klasického, tak i Self Service p ístupu a jeho výhody. Praktická část je zam ena na tvorbu report a p ehled na základ fiktivní databáze AdwentureWorks 2012. Tato bakalá ská práce porovnává možnosti integrace dat, práci s datovými zdroji, datovými typy, hierarchiemi, dimenzemi, možnosti sdílení výstup a vizualizace, ve vybraných nástrojích.

Klíčová slova

Business Intelligence, Self Service Business Intelligence, Excel, PowerPivot, PowerView, SAP Lumira, reporting, vizualizace.

(8)

Annotation

This thesis is focused on the current trend in the field of Business Intelligence, which is Self Service approach. The main goal is to compare selected Self Service tools and explore them in several aspects. The theoretical part contains the historical development of Business Intelligence, its characteristics in terms of classical as well as Self Service approach and its benefits. The practical part is focused on creating reports and surveys on the basis of fictitious database AdwentureWorks 2012. This thesis explores data integration, working with data sources, visualization, sharing options, working with data types, hierarchy and dimensions in the selected tools.

Key Words

Business Intelligence, Self Service Business Intelligence, Excel, PowerPivot, PowerView, SAP Lumira, reporting, visualization.

(9)

7

Obsah

Seznam zkratek ... 10

Seznam tabulek ... 12

Seznam obrázk ... 13

Úvod ... 14

1. Zhodnocení současného stavu včetn literárních rešerší ... 16

1.1 Současný stav ... 16

1.2 Literární rešerše ... 16

2. Postavení BI v podnikovém prost edí... 18

2.1 Historický vývoj BI ... 18

2.1.1 Vznik a vývoj do roku 1ř5Ř ... 18

2.1.2 Pokrok a evoluce do roku 1980 ... 18

2.1.3 D ležité body v letech 1řŘ0 až 1řř0 ... 19

2.1.4 Business Inteligence 1.0 ... 19

2.1.5 Business Intelligence 2.0 ... 20

2.2 Základní principy BI ... 20

2.2.1 Podstata BI... 21

2.2.2 Výb r a organizace dat ... 21

2.2.3 Dimenze a granularita dat ... 21

2.2.4 Multidimenzionalita uložení a práce s daty ... 22

2.3 Hlavní komponenty BI ... 23

2.3.1 Produkční systémy ... 23

2.3.2 Extraction, Transformation and Loading ... 24

2.3.3 DWH ... 24

2.3.4 Datové tržišt ... 25

2.3.5 Dočasné uložišt dat ... 25

2.3.6 Data mining ... 25

2.3.7 Reporting ... 26

2.4 Trendy BI ... 27

2.4.1 Mobilní BI ... 27

2.4.2 Self Service BI ... 27

2.4.3 Big Data ... 28

2.4.4 Cloud BI ... 28

(10)

3. Self Service nástroje ... 29

3.1 Charakteristika Self Service nástroj ... 29

3.1.1 Prost edí SS BI ... 29

3.1.2 Snadný p ístup k datovým zdroj m ... 30

3.1.3 BI nástroje, implementace a správa datového skladu ... 30

3.2 D vody pro zavedení SS BI ... 31

Stále se m nící obchodní pot eby ... 32

Dodávání BI výstup v nereálném čase ... 32

Data driven ... 32

Pomalé a neaktuální informace ... 32

Nespokojenost s IT odd lením ... 32

P íliš složité nástroje ... 33

Snížení nákladu pro IT ... 33

Nedostatek znalostí ... 33

3.3 Typy uživatel v prost edí SS BI ... 33

3.3.1 Informační producent ... 33

3.3.2 Informační konzument ... 34

3.3.3 Informační koláborátor ... 34

3.4 Proces a úlohy SS BI ... 34

4. Porovnání Self Service nástroj ... 36

4.1 Platformy Self Service nástroj ... 36

4.1.1 P ehled Self Service nástroj ... 38

4.2 Zadání kritérií ... 42

4.3 Očekávané výstupy ... 43

5. Zpracování dat, tvorba report ... 44

5.1 Zdrojová data ... 44

5.2 Datové typy ... 45

5.3 Popis pracovního prost edí ... 46

5.4 Vytvo ení sloupcového grafu s použitím hierarchie produktu ... 48

5.5 Práce s geografickými údaji ... 50

5.6 Práce s časovými záznamy ... 54

5.7 Ukázka dalších vizualizačních prvk ... 56

5.8 Porovnání ... 59

5.9 Vyhodnocení ... 62

5.10 Zhodnocení p ínosu ešení ... 63

(11)

9

Záv r ... 65 Seznam použité literatury ... 67

(12)

Seznam zkratek

BI Business Intelligence

SS BI Self Service Business Intelligence

DSS Systém pro podporu rozhodování (Data Staging Area)

EIS Informační systém pro podporu ízení (Exekutivní informační systémy) OLAP Online Analytical Processing

ETL Datová pumpa (Extract, Transform and Load) IT Informační technologie

MOLAP Multidimensional online analytical processing

ROLAP Relational online analytical processing

HOLAP Hybrid online analytical processing

ERP Plánování podnikových zdroj (Enterprise Resource Planning)

SCM Systém pro ízení dodavatelských et zc (Supply Chain Management) CRM ízení vztah se zákazníky (Customer relationship management) DWH Datový sklad (Data Warehouse)

DSA Data Staging Area

SQL Structured Query Language

SaaS Software as a Service

DaaS Data as a Service

(13)

11 DAX Data Analysis Expressions

(14)

Seznam tabulek

Tabulka 1 P ehled SS BI ... 39 Tabulka 2 Výsledky porovnání... 62

(15)

13

Seznam obrázk

Obrázek 1 D vody pro zavedení SS BI (Imhoff) ... 31

Obrázek 2 Dodavatelé BI (Gartner 2016)... 37

Obrázek 3 Dodavatelé BI (Gartner 2017)... 38

Obrázek 4 Schéma datového zdroje (vlastní) ... 44

Obrázek 5 Uzp sobený datový zdroj (vlastní) ... 46

Obrázek 6 Celkové výnosy (vlastní) ... 49

Obrázek 7 Celkové výnosy (vlastní) ... 50

Obrázek Ř Mapa zobrazující počty objednávek (vlastní) ... 51

Obrázek ř Mapa zobrazující počet objednávek (vlastní) ... 52

Obrázek 10 3D koláčový graf zobrazující výnosy (vlastní) ... 53

Obrázek 11 Koláčový graf zobrazující výnosy (vlastní) ... 54

Obrázek 12 P ehled Výnos za dané období (vlastní) ... 55

Obrázek 13 Výnosy podle času (vlastní) ... 56

Obrázek 14 Využití metod dopravy (vlastní) ... 57

Obrázek 15 P ehled výnos (vlastní)... 57

Obrázek 16 Využití metod dopravy (vlastní) ... 58

Obrázek 17 Lineární graf s vyobrazenými výnosy (vlastní) ... 59

(16)

Úvod

Díky současné situaci na trhu, kde dochází k obrovské expanzi dat za krátký časový úsek, p esn ji ř0 % dat bylo vytvo eno za poslední dva roky, jsou vytvo eny obchodní p íležitosti pro společnosti z hlediska získávání informací o všech aspektech podnikání.

Tyto informace za využití správných analýz a vyt žování dat mohou do podnikání p inést zásadní skutečnosti a znalosti. [1]

Predikce podle p ední společnosti poskytující technologie pro byznys CSC, ukazuje, že v roce 2020 by se množství dat v “digitálním vesmíru“ m lo pohybovat kolem 35 Zettabyt z čehož jedna t etina bude uložená na cloudu a toto množství dat by m li vytvo it ze 70 % jednotlivci a 80 % dat by m lo být v držení společností, které by se m ly starat o ukládání, bezpečnost a správu dat. [2]

Současný stav je však takový, že existují stále společnosti, které své rozhodování ídí na základ intuicí a domn nek. Pravým opakem jsou pak společnosti, které se rozhodují na základ informací, které byly n jakým zp sobem vyhodnoceny systémy pro manažerské rozhodování.

Tyto systémy se souhrnn označují jako Business Intelligence zkrácen „BI“. BI má pak hlavní cíle definovány jako vyt žovaní, zpracování a analýzu dat za účelem získání nových informací, znalostí a skutečností o svém podnikání a konkurence schopnosti. Tyto systémy však donedávna byly časov i finančn velmi nákladné. Proto se současným trendem stal pojem Self Service BI (SS BI), který je definován jako další z p ístup pro tvorbu ešení BI. Tento p ístup dovoluje ne-IT uživatel m zpracovávat a analyzovat data. ů oproti klasickému komplexnímu BI p ístupu je flexibiln jší, rychlejší, jednoduší a zárove i náklady na vývoj jsou nižší.

Podle jedné z českých společností zabývající se BI, v roce 2015, 92 % velkých českých společností projevilo zájem o Self Service ešení. Další predikce ukazuje, že v roce 2016, ve v tšin společností, bude zaveden nástroj Self Service. V současné dob 55 % podnik používá Self Service nástroje, 16 % plánuje zavedení b hem 12 m síc a 10 % plánuje zavedení v rozmezí delšího časového horizontu. [3] [4] [6]

(17)

15

Jak už vyplývá ze současného stavu i z budoucích predikcí je zapot ebí se flexibiln p izp sobovat neustále se m nicím požadavk m od zákazník , ale i chování trhu jako takového. P ístup Self Service díky svým vlastnostem zašti uje tyto požadavky a stává se tak nedílnou součástí úsp šného podnikání.

Jelikož je to velmi mladý pojem z hlediska IT tak vývoj nástroj pro Self Service ješt zdaleka neskončil. Na trhu se stále objevují další s novými funkcemi a vlastnostmi.

Hlavním cílem této bakalá ské práce je porovnat vybrané nástroje na základ stanovených kritérií a porovnat je na vzorku fiktivních dat.

Dílčí cíle se zam ují na vytvo ení p ehledu o současných Self Service nástrojích. Dále pak na vymezení pojmu Self Service jako jednoho z p ístup ešení pro BI.

(18)

1. Zhodnocení současného stavu včetn literárních rešerší

1.1 Současný stav

Tato bakalá ská práce se v nuje oblasti SS BI, jeho výhodám oproti klasickému BI ešení a jeho využití v oblasti vizualizace dat. Ve vyhledaných zdrojích v českém jazyce byly zastoupeny pouze knižní publikace, které se v nují klasickým BI ešením. Oblasti Self Service se v nují pouze zahraniční auto i, kte í své znalosti z této oblasti publikují v podob odborných článk , v deckých výzkum či literatury zam ené na konkrétní nástroj. Byly také nalezeny diplomové práce zabývající se problematikou Self Service BI.

1.2 Li terární rešerše

Z oblasti klasického BI byly využity publikace Business Intelligence v podnikové praxi, od Jana Poura, Miloše Maryšky a Oty Novotného dále pak Business Intelligence: jak využít bohatství ve vašich datech, od Oty Novotného, Jana Poura a Davida Slánského. Tyto knihy popisují BI jako moderní zp sob využití informačních technologií p i analýzách, plánování a rozhodování firmy. ůuto i vysv tlují pojmy a principy BI, ukazují postupy a p íklady navrhování, realizace a úsp šného nasazení BI aplikací od strategického ízení až po oblasti financí, obchodu a logistiky.

Od zahraničních autor jsou dostupné publikace: The Data Watehouse Lifecycle Toolkit od Ralpha Kimballa. Tato kniha p edstavuje komplexní popis celého procesu implementace datového skladu a BI ešení a základní popis všech komponent. Dále pak Datové sklady ůgilní metody a business intelligence od Roberta Laberge,William Inmon publikoval titul s názvem DW 2.0, který jde za hranice klasického chápání datových sklad a zam uje se na oblasti jako analýza nestrukturovaných dat, práci s metadaty, archivaci a obecn se snaží obor posunout o kousek dále.

Dále byly využity diplomové práce Využití moderní SS BI technologie v praxi, od Agiimay Buyankhishig, SS BI u MVNO GoMobil od Františka eho e a Integrace Business Intelligence do portálu od Jana Schumy. Tyto diplomové práce se zabývají

(19)

17

stručnou charakteristikou Self Service BI, jeho výhodami a d vody pro zavedení Self Service nástroje do společnosti.

(20)

2. Postavení BI v podnikovém prost edí

Tato kapitola vymezuje historický vývoj až do podoby SS BI, základní charakteristiku BI, současné trendy a hlavní komponenty týkající se BI.

2.1 Historický vývoj BI

V první ad je nutno vymezit n kolik historických milník , které stály za současnou podobou BI.

2.1.1 Vznik a vývoj do roku 1ř5Ř

První zmínka o BI se objevila s vydáním článku, který publikoval počítačový v dec pracující pro společnost IBM Hans Petr Luhn. V tomto článku byl prvn rozpoznán smysl BI. V tomto článku, který nesl název "Business Intelligence System" Luhn popsal automatický systém vyvinutý pro ší ení informací do r zných částí jakékoliv pr myslové, v decké nebo vládní organizace. Hans Petr Luhn je považován za otce BI. [7]

2.1.2 Pokrok a evoluce do roku 1980

S p íchodem počítač do obchodního sv ta se začalo upoušt t od papírových záznam a vznikl tak nový zp sob ukládání dat.

Vynález Hard disku v roce 1ř56 byl revolučním mezníkem pro ukládání dat. Floppy disky, Laserové disky a další ukládací technologie znamenaly, že se začaly hromadit data, které bylo zapot ebí fyzicky uložit.

To bylo p íčinou pro vytvo ení prvních databázových systém . Souhrnn označovaných jako systémy pro podporu rozhodování (DSS). [8] [3]

(21)

19 2.1.3 D ležité body v letech 1řŘ0 až 1řř0

V roce 1989 analytik, p sobící ve společnosti Gartner, Howard Dresner zavedl pojem Business Intelligence a tímto termínem pokryl ukládání a analýzu dat, výkonný informační systém EIS a DSS.

V tomto období se na trhu objevily desítky prodejc t chto aplikací. Konkurence rostla a tím se i zlepšovala technologie. Novým nástrojem se stal datový sklad (DWH), který výrazn zlepšil datový tok. Datové sklady výrazn snížily čas p ístupu k dat m. Nyní byla data pro požadovanou analýzu uložena na jednom míst .

Spolu s tímto vývojem p išlo n kolik dopl k k datovým sklad m, které jsou d ležitým prvkem i v dnešní dob . Jednalo se o Extract, Trasnform and Load (ETL) nástroje a Online Analytical Processing (OLAP) software.

V pozd jších letech se tato fáze vývoje označovala jako Business Intelligence 1.0.

2.1.4 Business Inteligence 1.0

B hem tohoto období existovaly dv hlavní funkce BI, a to produkovat data a reporty, organizovat a vizualizovat data v p ehledné form .

P esto tu stále zbyly dva zásadní problémy, čímž byly složitost vývoje a p íliš dlouhá doba jak zpracování dat, tak i vývoje samotného.

P íliš mnoho projekt bylo tvo eno pouze na IT odd lení, což znamenalo, že b žní uživatelé nemohli BI aplikace využívat sami.

Pouze zkušení techničtí odborníci byli schopni využívat a provozovat systém a d lat pokročilé analýzy dat, které pak poskytovali managementu.

(22)

2.1.5 Business Intelligence 2.0

Na počátku 21. prvního století byly vyvinuty nové technologie, které odstranily problémy se složitostí vývoje a rychlostí zpracování dat.

Business Intelligence 2.0 už zahrnovala nové technologie jako zpracování dat v reálném čase, což umož ovalo společnostem d lat správná rozhodnutí ve správný čas.

Byly vyvinuty Self Service nástroje, kde již nebylo nutné, aby se do projektu zapojil IT specialista.

BI se stalo jedním ze základních kamen pro úsp šné podnikání.

Tento pojem také souvisí s Web 2.0, což je označení etapy vývoje webu, kde byl uživatel vtažen do tvorby obsahu webu a sdílel informace, které bylo možné opakovan využívat.

Tento fakt zap íčinil nár st dat v digitálním prostoru.

Business Intelligence 2.0 vychází z Datového skladu a jeho etapy DW 2.0, kde Bill H.

Inmon popisuje novou architekturu datového skladu. Tato architektura rozpoznává životní cyklus dat v rámci datového skladu, pot ebu pro implementaci textových údaj v datovém skladu a p edevším, že metadata jsou podstatnou složkou prost edí datového skladu. Nov umož uje zpracování semistrukturovaných a nestrukturovaných dat.

[9] [10]

2.2 Základní principy BI

V této podkapitole jsou uvedeny základní principy, které jsou nezbytn nutné pro fungování BI ešení.

(23)

21 2.2.1 Podstata BI.

Aplikace se d lí na aplikace transakčního charakteru a na aplikace BI.

Pod pojmem transakční aplikace si lze p edstavit aplikace, které zajiš ují vysokou rychlost p ístupu k detailním dat m, efektivní provedení výpočt , aktualizují data a vytvá ejí nová data.

Naproti tomu aplikace BI se dají charakterizovat jako aplikace, které hodnotí vybrané ekonomické ukazatele, analyzují je podle r zných dimenzí a jejich nejr zn jších kombinací, podporují rozhodovaní pracovník společnosti a snaží se analyzovat vývoj podnikových ukazatel v čase.

Transakční aplikace na rozdíl od aplikací BI vytvá ejí nové datové záznamy, opravují (aktualizují) je, pop ípad mažou (ruší). Aplikace BI pak pracují s databázemi, které vytvo ili transakční aplikace, modifikují je pro analytické a plánovací úlohy.

Pojem Business Intelligence lze definovat podle [3, s. 24] „BI je sada proces , know-how, aplikací a technologií, jejichž cílem je účinn a účeln podporovat ídící aktivity ve firm . Podporují analytické, plánovací a rozhodovací činnosti organizace na všech úrovních a ve všech oblastech podnikového ízení. “ [3] [14]

2.2.2 Výb r a organizace dat

Jak už bylo zmín no v p edchozí podkapitole, databáze tvo eny z transakčních aplikací slouží pro aplikace typu BI jako zdroj. Mezi zdrojovou databází a analytickou databází musí prob hnout transformace, aby výsledná databáze m la určitý tvar, který bude obsahovat spojitosti mezi hodnotami ukazatel a analytickými hledisky neboli dimenzemi.

2.2.3 Dimenze a granularita dat

Dimenze je analytický pohled pro sledování stanovených ekonomických ukazatel . Atributy dimenzí jsou uspo ádány v hierarchické struktu e. Hodnoty jsou ukládány do

(24)

analytických databází na nejvyšší úrovni detailu (v nejvyšší granularit ). Zárove se i do t chto tak zvaných OLůP databází ukládají agregované a jiné vypočtené hodnoty.

Tato metoda má obrovskou výhodu v urychlení odezvy systému na analytické požadavky.

Hierarchie agregovaných dat umožní uživateli flexibiln se p esouvat mezi jednotlivými úrovn mi hierarchie, aniž by bylo nutné vždy nov požadované agregace počítat. [3] [14]

2.2.4 Multidimenzionalita uložení a práce s daty

Multidemenzionalita se rozd luje na multidimenzionalitu vyjád enou v relačních databázích a multidimenzionalitu dat realizovanou pomocí OLůP technologie.

Základem je specifická organizace dat v databázi. Správná organizace dat umožní pohled na data z jiných pohled , dimenzí. Kombinace pohled p es dimenze je základem pro

ešení principu multidimenzionality uložení a práce s daty.

Multidimenzionalita dat v prost edí relační databáze má dv podoby, a to schéma hv zdy a schéma sn hové vločky. Základem t chto schémat jsou tabulky fakt a tabulky dimenzí.

Ve st edu schématu vždy stojí tabulka fakt a okolo ní jsou p ipojeny tabulky dimenzí.

Ve schématu hv zdy je uložená celá hierarchická struktura. To však zp sobuje to, že vyšší stupn hierarchie se stále v této tabulce opakují, což není ideální stav.

Ve schématu sn hové vločky jsou obsaženy tabulky dimenzí a jsou rozd leny do více tabulek, kde každá tabulka odpovídá jedné hierarchické úrovni dimenze.

Databáze pro DWH, či datové tržišt však není tvo ena pouze jedním z t chto typ schémat. V tšinou se používá kombinace. Základní princip spočívá ve sledování ukazatel , které se d lí do tabulek fakt podle logické p íbuznosti. Takto vytvo ené schéma využívá sdílené dimenze a zárove je jimi propojeno.

Využití technologie OLůP má p ednosti v rychlosti, zpracování a efektivní analýzy multidimenzionálních dat.

(25)

23

Pojem OLAP definuje [3, s. 26] jako „informační technologii, založenou p edevším na koncepci multidimenzionálních databází. Jejím hlavním principem je n kolikadimenzionální tabulka umož ující rychle a pružn m nit jednotlivé dimenze a m nit tak pohledy uživatele na modelovanou ekonomickou realitu. “

Obsahem dimenzí jsou prvky dimenzí. Pokud se obsah dimenzí promítne do jednoho bodu, získá se prvek OLůP kostky. Jedna nebo více OLůP kostek pak tvo í OLůP databáze.

Existuje n kolik variant OLůP technologií. Základní varianty jsou MOLůP, ROLůP, HOLAP. MOLůP ukládá data do multidimenzionálních – binárních OLůP kostek.

ROLůP využívá relační databáze a s jejich pomocí eší multidimenzionalitu. Kombinace p edchozích variant se nazývá HOLůP, kde detailní data jsou uložena v relačních databázích a v binárních OLůP kostkách jsou uloženy agregované hodnoty. [3] [14]

2.3 Hlavní komponenty BI

V BI existuje n kolik komponent, které se využívají pro realizaci ešení. Komponenty jsou poskládány na základ pot eb zákazníka nebo podniku. V praxi pak tyto komponenty mohou nabývat r zných transformací a technologických variant.

2.3.1 Produkční systémy

Produkční systémy, neboli zdrojové systémy jsou v tšinou transakční aplikace viz výše.

Mezi produkční systémy pat í aplikace ERP, SCM, CRM, které mohou být realizovány na databázových systémech typu ORACLE, MS SQL a dalších. Dalšími vnitropodnikovými zdroji mohou být menší databáze typu Microsoft Access. Tabulky z Microsoft Excel nebo textové soubory (flat files), které mají zachovány určitou strukturu, mohou být také zahrnuty mezi zdroji pro BI aplikace. Externí zdroje pak p edstavují databáze analytických společností, výstupy statistických ú ad a on-line datové uložišt . Produkční systémy nepat í mezi komponenty BI, ale slouží jako zdroj dat pro proces ETL.

(26)

2.3.2 Extraction, Transformation and Loading

Jednou z nejd ležit jších komponent BI je Extract, Transform and Load. Tento pojem je b žn označován jako datová pumpa. Tato komponenta má za úkol t i procesy.

Vybrat data z produkčních (zdrojových) systému (Extract). Vhodným zp sobem data upravit do požadované formy a p edem navržené struktury (Transform) a dále pak nahrát data do datových schémat datového skladu nebo tržiš (Load).

ETL nástroje pracují v určitých časových intervalech, nap . denních a týdenních. Což znamená, že data nejsou do aplikací typu BI nahrávána po každé zm n v transakčních aplikacích, ale až po zvolených intervalech.

Pro ETL nástroje je nezbytné, aby byla vybraná pouze data, která jsou d ležitá pro analytické, rozhodovací a plánovací aktivity. Jak už bylo zmín no, data jsou nahrávána z r zných datových zdroj , což m že znamenat, že n která data mohou existovat ve více zdrojích. Tento fakt pak vede k duplicit dat. V transformační vrstv musí proto dojít k takzvané konsolidaci dat. Samoz ejm krom duplicity dat se musejí vyloučit i další chybná data, aby byla zajišt na dostatečná kvalita dat.

Tato část p edstavuje nejnáročn jší část ešení BI, bez kvalitního provedení ETL není možné efektivn pokračovat v dalších fázích vývoje, proto tedy na realizaci této komponenty je v nován v tší d raz, který odpovídá vyšší časové, finanční i pracovní náročnosti.

2.3.3 DWH

DWH je specifický typ relační databáze, který umož uje ešit analytické úlohy.

[3, s. 36] „Datový sklad je integrovaný, konsolidovaný, subjektov orientovaný, stálý a časov rozlišený souhrn dat, uspo ádaný pro podporu pot eb managementu.

- Subjektov orientovaný

Data jsou rozd lena podle jejich typ , ne podle aplikacích, ve kterých vznikala.

(27)

25 - Konsolidovaný

Data jsou konsolidována z r zných zdroj , struktur a forem do jedné výsledné formy.

- Integrovaný

Data jsou ukládána v rámci celého podniku a ne pouze v rámci jednotlivých útvar . - Stálý

Datové sklady jsou koncipovány p evážn jako pouze pro čtení, až na výjimky se zde žádná nová data nevytvá ejí ani neaktualizují.

- Časov rozlišený

Do datového skladu je uložena i historie dat, tedy obsahují dimenzi času. “

V datovém skladu jsou data člen na do schémat. Tabulky fakt obsahují analyzovaná data (p esn ji ekonomické ukazatele, dimenze obsahují subjekty podnikání), naproti tomu tabulky dimenzí obsahují data, za jejichž pomoci lze data v tabulkách fakt kategorizovat a t ídit.

2.3.4 Datové tržišt

Technologie datových tržiš je tém totožná s technologií datových sklad . Datová tržišt jsou určena pouze pro konkrétní okruh podniku. Datová tržišt jsou tedy rozd lené datové sklady do menších celk .

2.3.5 Dočasné uložišt dat

Dočasné uložišt dat (Data Staging ůrea, DSů) slouží pro zachycení nekonzistentních, detailních dat, které jsou bez časové dimenze. Tato data jsou zachycena za účelem jejich p ípravy pro pot ebnou kvalitu p ed načtením do datového skladu.

2.3.6 Data mining

Podle obecné definice: „Data mining je proces výb ru, prohledávání a modelování ve velkých objemech dat, sloužící k odhalení d íve neznámých vztah mezi daty za účelem

(28)

získání obchodní výhody” [10, s. 1] Slouží k zjiš ování skrytých a užitečných informací k obchodnímu rozhodování. Nap íklad je hojn využíván v obchodních et zcích, ve finančním sektoru a u mobilních operátor . S jeho využitím lze zkoumat chování zákazník a na základ toho p izp sobit obchodní jednání. Dále se využívá p i monitorování aktivit na internetu nebo ve v d .

Dnes užívanými metodami dolování dat jsou nap íklad [12, s. 2]

 regresní metody (lineární regresní analýza, nelineární regresní analýza, neuronové sít )

 klasifikace (diskriminační analýza, logistická regresní analýza, rozhodovací stromy, neuronové sít ),

 segmentace - shlukování (shluková analýza, genetické algoritmy, neuronové shlukování - Kohonenovy mapy)

 analýza vztah (asociační algoritmus pro odvozování pravidel typu „ if X then Y“)

 predikce v časových adách (korelační metody, neuronové sít , autoregresní modely, ARIMA)

 detekce odchylek

2.3.7 Reporting

Reporting lze definovat jako sb r a analýzu dat, které jsou p em n ny do takové formy vizualizace, která je dob e pochopitelná pro koncového uživatele.

Existují dv základní formy reportingu a to standartní reporting, kdy je vytvo en SQL dotaz na relační databázi, která se periodicky opakuje. Další formou je ad-hoc reporting, kde uživatel sv j dotaz formuluje sám a je v tšinou jednorázový.

(29)

27

P ehledný, interaktivní a p izp sobitelný reporting je jedním z hlavních rys Self Service nástroj .

S pojmem reporting také souvisí dashboarding, což je datový vizualizační nástroj, který zobrazuje aktuální stavy metrik a klíčových ukazatel výkonnosti (KPI) pro podnik.

Dashboardy uspo ádávají čísla a metriky na jedné obrazovce. Mohou být p izp sobeny pro určitou roli a zobrazit metriky zam ené na jeden pohled nebo odd lení. Mezi základními rysy BI dashboardu pat í p izp sobitelné rozhraní a schopnost zobrazit real-time data z r zných zdroj .

[3] [13] [14] [11]

2.4 Trendy BI

Mezi současné trendy BI jsou označovány oblasti Self Service, Mobilní BI, Big Data a Cloud BI.

2.4.1 Mobilní BI

S trendem chytrých mobilních telefon roste současn i mobilní BI. Mobilní BI umož uje sledovat vizualizaci a p ístup k aktuálním dat m skrze chytré mobilní telefony. Výhodou je pak skutečnost, že odpov dní pracovníci společnosti mohou okamžit a odkudkoliv reagovat na zm ny spojené s chodem společnosti nebo na nov vzniklé trendy.

2.4.2 Self Service BI

Významnými vlastnostmi t chto nástroj jsou jednoduchost, rychlost, intuitivnost, vizualizace a aktivní činnost uživatele. Jedná se o pokročilejší formu ad-hoc analýzy.

Všichni poskytovatelé BI ešení se snaží v současné dob zahrnout do svého portfolia Self Service nástroje, které jsou už vylepšeny o funkce enterprise reportingu. Což znamená, že uživatelé, kte í mají vliv na obchodní složku podniku, jako manaže i, analytici a p ední

(30)

pracovníci mají okamžitý p ístup k st žejním informacím, které pot ebují, aby produktivn plnili svoje pracovní povinnosti. [15]

2.4.3 Big Data

Big Data lze označit jako nejv tší trend současné doby. Jedná se o obrovské množství strukturovaných, nestrukturovaných a semistrukturovaných dat, které je t eba v reálném čase zpracovat a zárove zabezpečit jejich kvalitu.

2.4.4 Cloud BI

Prodejci se snažili zrychlit a zlevnit BI ešení. Jediným ešením, jak tohoto dosáhnout je vytvo ení cloudového ešení.

Trendem pro Cloud BI je koncepce, kde se celé ešení BI p esune do cloudu. Prozatím se v cloudovém prost edí pronajímá datový prostor a infrastruktura. Výhodami tohoto ešení pak jsou jednoduchost, flexibilita, snížení administrace a spolehlivost ešení. [16]

(31)

29

3. Self Service nástroje

V současné dob je zapot ebí realizace BI ešení v obchodním prost edí tak, aby společnosti dostávaly rychleji informace, na základ kterých se rozhodují. Tyto informace musejí být p esné, kvalitní, aktuální, pravdivé a srozumitelné. SS BI ešení dodá společnostem konkurenční výhody a dokáže jim pomoci s objevováním nových obchodních p íležitostí.

K vy ešení současného problému, který se týká p edevším nedostatku IT specialist v oblasti BI. Byl vytvo en p ístup, kde zam stnanci, kte í pracují s informacemi, mohou vytvá et sady report , dotazy a analytiku s minimálním zásahem IT odd lení. Tento p ístup se nazývá SS BI.

3.1 Charakteristika Self Service nástroj

SS BI je definováno jako p ístup BI, který dovoluje BI uživatel m stát se více sob stačnými a mén závislými na IT organizační struktu e. Tyto nástroje se specializují na čty i hlavní cíle:

 snadný p ístup k zdrojovým dat m za účelem reportovaní a analýzy

 jednoduché použití BI nástroj

 jednoduché a p izp sobitelné prost edí pro koncového uživatele

 rychle implementovatelné a snadno spravovatelné možnosti datového skladu.

3.1.1 Prost edí SS BI

Pro obchodní prost edí je nejd ležit jším cílem Self Service nástroj prezentovat data tak, aby koncový uživatel v d l, co znamenají a dokázal s nimi pracovat. SS BI musí být prost edí, ve kterém je snadné sdílet, objevovat a mít p ístup k dat m, report m a analytice. Zam stnanci, kte í pracují s daty, musejí mít pot ebu pro personalizaci dashboard pro rozdílné situace, které mohou v podniku nastat. SS BI musí být také

(32)

uzp sobeno k snadnému použití a k doručení výsledk do za ízení a rozhraní, které uživatel požaduje.

Pro vstup do BI je nutno definovat striktn obchodní strategii podniku. Dále pak tento systém zachycuje, objevuje a sleduje osv dčené postupy, které vedou k zefektivn ní organizace.

Díky tomu, že si odpov dní zam stnanci tvo í výstupy dat sami, zlepšují tím znalosti celé organizaci. Tento fakt je zap íčin n díky zp tné vazb analytických výstup , model a jiných BI výsledk . P idávají obchodní kontext k určitým situacím, a rozpoznávají související informace jako externí linky, kterými mohou být informace, které určitým zp sobem ovliv ují chování ekonomického subjektu.

3.1.2 Snadný p ístup k datovým zdroj m

SS BI nástroj musí obsahovat datové zdroje, které jsou dostupné koncovým uživatel m bez asistence IT odd lení včetn externích a operačních zdroj . K tomu je samoz ejm nezbytn nutné, aby m la společnost dob e nastavenou strukturu pro sdílení dat ve společnosti. Datové zdroje obsahují všechny typy dat, ne pouze strukturované, nap íklad komentá e, e-maily nebo sociální média. SS BI nástroj má mechanismy pro sjednocení a integraci t chto dat do datového skladu. Samoz ejm zabezpečení dat a nastavení jejich oprávn ní jsou nedílnou součástí.

3.1.3 BI nástroje, implementace a správa datového skladu

Významným znakem pro kvalitní SS BI nástroj je nejenom snadné porozum ní výsledk m, ale také jednoduché využití BI nástroj .

SS BI obsahuje alternativní zavád cí mechanismy, které vedou ke snížení náklad , času a podporu obrovského množství zpracovávaných dat. Flexibilní metodologie software jako servis (SaaS) a služby typu cloud p ispívají k t mto mechanism m.

(33)

31

Vysoká výkonnost a škálovatelnost, která zašti uje tvorbu od jednoduchých analýz až po složité analýzy s obrovským objemem dat, jsou klíčovými komponenty.

Díky zp ístupn ní BI se naskytnou možnosti pro tvorbu nových, na míru šitých, zdrojových aplikací, které mohou vést k zefektivn ní proces a k uspokojení zákazníka.

[17] [18] [19]

3.2 D vody pro zavedení SS BI

Z pr zkumu, který byl proveden v roce 2011, mezi 557 podniky po celém sv t , vzešly hlavní d vody pro zavád ní technologií a p ístup SS BI v organizacích. Z výzkumu vzešly informace, že 36 % dotázaných již má ve své společnosti zaveden SS BI, 26 % jej práv zavádí a 2ř % chce mít ve své společnosti SS BI do jednoho roku. Obrázek 1 uvádí hlavní d vody pro zavedení SS BI. Tento výzkum lze porovnat s pr zkumem z roku 2017, kde 55 % dotázaných již má zaveden SS BI, 16 % jej plánuje zavést b hem 12 m síc a 10% zvažuje zavedení z dlouhodobého hlediska. [6]

Obrázek 1 D vody pro zavedení SS BI (Imhoff)

Zdroj: http://www.sas.com/resources/asset/TDWI_BestPractices.pdf

(34)

Stále se m nící obchodní pot eby

Turbulentní tržní prost edí, neustále se m nící požadavky a nové otázky business uživatel jsou hlavním d vodem pro nepostradatelnost zavedení určité formy SS BI v podniku. SS BI pak umož uje jednotlivým uživatel m na základ jejich aktuálních pot eb rychle a jednoduše provád t pot ebné vlastní analýzy dat a získat tak odpov di na otázky p esn tehdy, kdy jsou pot eba.

Dodávání BI výstup v nereálném čase

Je jen otázka času, kdy IT odd lení nebude schopné kapacitn plnit požadavky od ne-IT uživatel . Pokud se tak již nestalo, požadavky na nové sady dat a reporty jsou vy izovány s nižší prioritou, což p ináší dlouhé čekací doby na požadavky.

Data driven

Vedení organizací by se nem lo rozhodovat pouze na základ intuicí manažer nebo jejich domn nkách. Je zapot ebí zp ístupnit data pro pov ené osoby, aby mohli samy analyzovat a p em ovat data na informace. Nalezení jakéhosi souladu mezi kvalitní informací a vlastními zkušenostmi odpov dného pracovníka vede k pot ebné situaci v podniku.

Pomalé a neaktuální informace

Zavedení SS BI zamezí čekacím dobám mezi analytickým a IT odd lením. Data budou analyzována okamžit a rozhodnutí budou p icházet ve správný čas.

Nespokojenost s IT odd lením

Jsou-li dodávky dat dlouhotrvající, roste nespokojenost s IT odd lením celopodnikov .

(35)

33 P íliš složité nástroje

Klasické BI nástroje jsou velmi složité, co se technologického hlediska týče. To znemož uje business uživatel m pracovat samostatn .

Snížení nákladu pro IT

Jedna z nejefektivn jších možností, jak snížit náklady na IT odd lení je práv zavedení SS BI.

Nedostatek znalostí

Zavedení datového skladu, infrastruktury a BI technologii vyžaduje mnoho specialist , času i financí. Pro malé a st ední podniky, které nepot ebují tak komplexní a složité ešení se zdá být vhodným ešením SS BI. [17] [18] [20]

3.3 Typy uživatel v prost edí SS BI

Imhoff rozd luje uživatele do t ech skupin, na informační producenty, konzumenty a kolaborátory. Ve spojitosti se SS BI je nutno uvést jejich stručné charakteristiky.

Tyto charakteristiky však jsou pouze orientační. Uživatele SS BI nelze rozd lit p esn do níže uvedených kategorii. Tyto role se spíše prolínají v závislosti na každém individuálním zam stnanci.

3.3.1 Informační producent

Neboli „power business user“ stojí za vznikem výstup , které pak zpracovávají konzumenti a kolaboráto i. Tito producenti mají za cíl zpracovat data, které pak v určité form p edávají dál. P esn ji jde o zpracování report , integraci dat, ETL proces, vytvá eních datových model , data minnig, analýzu nestrukturovaných dat a statistické operace.

(36)

3.3.2 Informační konzument

Informační konzumenti jsou lidé, kte í p ijímají výstupy analýz za účelem d lat správná rozhodnutí. Jsou to lidé, kte í jsou orientováni do obchodního sektoru a pot ebují mít data v co nejsnáze pochopitelné form . Jen z ídka kdy d lají své vlastní analýzy. Lze je tedy za adit i mezi koncové uživatele SS BI. Jako p íklad lze označit obchodní zástupce, management, zam stnance zákaznické podpory, dodavatele, zákazníky aj.

3.3.3 Informační koláborátor

Nejnov jším typem uživatele SS BI je informační kolaborátor. Jeho hlavním úkolem je p idat obchodní kontext v tšinou s použitím social-computing nástroj , což pomáhá k lepšímu pochopení výstup a k lepším rozhodnutím. Jedná se o r zné komentá e, hodnocení, ranking, značky, zp tnou vazbu aj. [17] [18] [19]

3.4 Proces a úlohy SS BI

Technologická část SS BI se skládá z n kolika úloh, které vedou od zavedení zdrojových dat až po rozhodování samotné.

Získání dat (Access)

Získání datového zdroje je prvním a nezbytným krokem pro každé BI ešení. Data se vyskytují v datovém skladu, v relační databázi nebo v jiném datovém zdroji v n nebo uvnit podniku.

Integrace dat & ízení (Integration & Manage)

ízení a integritu dat má na starosti p edevším IT odd lení, které spravuje nakládání s daty. Jedná se o určitou transformaci z datového zdroje, aby data byla validní, p ehledná a p ipravena pro budoucí použití.

Analýza dat (Analyze)

(37)

35

Tuto část vývoje mají na starosti informační producenti, kte í mají za úkol, jak už bylo zmín no výše, p edevším analyzovat data.

Publikování výsledk (Publish)

Publikování výstup od informačních producent probíhá p edevším p es elektronické komunikace jako nap . e-maily, podnikové sociální sít aj.

Vylepšení BI výstup (Enhance)

Informační kolaboráto i obohacují výstupy od informačních producent o další informace.

Což vede k tomu, že konzumenti dané výstupy lépe chápou a jsou je schopni snáze použít.

Jedná se o odkazy na další informace, hodnocení a komentá e.

Nalezení pot ených informací (Discover)

V této fázi konzumenti mezi sebou diskutují o nových skutečnostech, hodnotí je a jsou p ipraveni začít d lat konečná rozhodnutí.

Rozhodování (Decide)

Na základ shromážd ných dat, jejich analýz, vytvo ení BI komponent, dopln ní o další business kontext, zhodnocení výstup ze strany informačních konzument jsou p ijímána business rozhodnutí. [17] [18] [20]

(38)

4. Porovnání Self Service nástroj

Současný trh nabízí k výb ru n kolik dodavatel pro SS BI, je proto vhodné, uvést jejich p ehled a zobrazit vývoj z hlediska kvality poskytovaných služeb. Je uveden obecný p ehled SS BI nástroj a výb r dvou nástroj pro detailn jší porovnání.

4.1 Platformy Self Service nástroj

Podle výzkum , které provedla v letech 2016 a 2017 společnost Gartner, lze rozlišit dodavatele SS BI do n kolika kvadrant . Jedná se pak o vyzyvatele, lídry, stálé hráče a vizioná e. Jak lze vid t na obrázku 2 a 3 mezi lídry se stále drží společnosti Qlik, Microsoft a Tableau avšak Microsoft a Tableau značn posílili. Vedoucí pozici mezi vizioná i má SAP následovaný společnostmi TIBCO Software, IBM a SůS. V kvadrantu stálých hráču se mezi rokem 2016 a 2017 nic zásadního neudálo.

(39)

37 Obrázek 2 Dodavatelé BI (Gartner 2016)

(40)

Obrázek 3 Dodavatelé BI (Gartner 2017)

4.1.1 P ehled Self Service nástroj

Následující p ehled Self Service nástroj popisuje podle nejznám jší a v současné dob nejlépe hodnocené nástroje pro správu a analýzu dat. Cílem tohoto p ehledu je obecn charakterizovat nástroje, uvést jeho cenu a popsat výhody a nevýhody.

(41)

39 Tabulka 1 P ehled SS BI

SSBI N C K V N

Zoho Reports 1 250

- Jedn

- P

- Pouze jeden z Z

- P

Microsoft Power BI Zdarma

- V

- P

- Cload verze

desktop verze

Tableau Desktop 24 975

- I

- M

- N

po

funkcionality - Cena

Looker 75 000

- S

v SQL

- P G

- Cena

Domo 50 000

- Velmi d

- V

- N

Qlik Sense Enterprise Server 37 500

- V

- P - Cena

Information Builders

WebFocus 750 000 - J - D

- Cena

Tibco SpotFire 16 250 - V

- Cload verze

desktop verze

Chartio 50 000 - O SQL

- E

- Nep

- N

SAP Lumira 4 440

- V

- E

- V

- M

- Jeden z mnoha SAP

- V

(42)

Datazen Zdarma - J - Design

- V

Zdroj: PC MAG

Zoho Reports

Vyznačuje se nízkou cenou a zárove snadným použitím. Je vhodný pro malé podniky, které začínají s analýzou dat. Jádrem Zoho Reports je p edvídatelný pohled na data.

Tabulky dat mohou být shromaž ovány v pracovním prostoru a spojeny dohromady, čímž tvo í datový zdroj pro p ehledy a vizualizace dat.

Microsoft Power BI

Microsoft Power BI obsahuje analytické a reportingové nástroje pro zpracování v tšího objemu dat jako nap íklad: 3D vyobrazení analytických výstup nad mapovými podklady, automaticky vytvá ené reporty na základ dotaz kladených v b žném jazyce (angličtin ) či interaktivní animované grafy zobrazující vývoj v čase.

Tableau Desktop

Výchozí produkt pro firemní analytiky či kohokoliv, kdo se pot ebuje napojit na data a vytvá et reporty, workbooky či dashboardy. Tableau nadále drží vedoucí postavení na trhu BI díky své široké škále vizualizací, rozsáhlé škále podporovaných datových typ a skv lému uživatelskému prost edí.

Looker

Self Service nástroj, který díky své cen a funkcionalit nalezne uplatn ní p edevším ve v tších společnostech. Využívá pro modelování dat SQL kód. Dokáže sjednotit velké množství dat nap íč celou organizací.

Domo

(43)

41

Domo je nástroj, který nabízí kvalitní podporu spojení. Dodává jedinečnou sadu nástroj pro spolupráci se sociálními sít mi.

Qlik Sense Enterprise Server

Poskytuje nejlepší kolekci uživatelských p ístupových rolí a také ukazuje slibný začátek na cest k integraci Data-as-a-Service (DaaS).

Information Builders WebFocus

WebFOCUS je strategický SS BI nástroj a platforma pro analýzu, která umož uje jakékoliv pozici v organizaci, i mimo ni, vytvá et chyt ejší rozhodování na základ dob e zabezpečených a d v ryhodných dat. Tato platforma obsahuje funkce, které poskytují organizaci vše, co pot ebuje pro vhled do dat a analýzu dopadu.

Tibco SpotFire

Tibco Spotfire je jedním z nejjednodušších nástroj pro účely obchodního odd lení. To platí zejména pro verzi cloud, která b ží v prohlížeči. Snadno p ístupný dashboard m že být vyexportován v podob CSV nebo Microsoft Excel dat.

Chartio

Spojuje zpracování dat a vizualizace s intuitivním uživatelským rozhraním. Lze načíst data z libovolné relační databáze pomocí drag and drop ovládání a manipulovat s nimi.

Umož uje počítat metriky, které jsou pot eba pro další analýzy.

SAP Lumira

Nabízí tvorbu zajímavých interaktivních map, graf a infografiky. Umož uje integraci dat z mnoha datových zdroj . ůnalýzu dat potom uživatel m že provád t pomocí interaktivních dashboard . Veškeré výstupy pak lze bezpečn a snadno sdílet v pracovním týmu

Datazen

(44)

Funguje na t ech r zných platformách a to desktop, tablet a mobilní telefon. Datazen má t i části. Server, Publisher aplikaci a Viewer aplikaci. Dovoluje uživateli využívat r zné datové zdroje a dovoluje jak interní tak externí p ístup k datovým zdroj m za využití služby active directory. [21] [22] [23] [24]

Z t chto uvedených nástroj byly pro hlubší porovnání vybrány pouze nástroje SůP Lumira a Microsoft Power BI a to z d vodu jejich kladného hodnocení, poskytnutých bezplatných licencí a schopnosti využívat r zné datové zdroje. Z hlubšího porovnání vypadl nástroj Datazen, jelikož nebyl optimalizovaný na velikost dat vybraných pro porovnávání.

4.2 Zadání kritérií

Jelikož jsou k dispozici data týkající se prodeje, bylo rozhodnuto vytvo it reporty a dashboardy tak, aby m ly dobrou vypovídající hodnotu o smyšleném podniku. Jedná se nap íklad o vizualizaci výnos , metod dopravy a objednaného množství. Tato kritéria autor práce zapracuje v každém z vybraných nástroj . Kritéria pro hodnocení nástroj jsou pak následující:

 Cena

 Hardwarové požadavky

 Instalace

 Datové zdroje

 Práce s datovými zdroji

 Práce s datovými typy

 Možnosti vizualizace

 Práce s hierarchiemi

 Sdílení výsledk

(45)

43

4.3 Očekávané výstupy

Pro objektivní porovnání funkcionality vybraných nástroj byly vytvo eny následující očekávané výstupy:

1) Datové typy

 Formát datových typu

 Práce s datovými typy

2) Popis pracovního prost edí

 Základní možnosti pracovního prost edí

3) Vytvo ení sloupcového grafu s použitím hierarchie produktu a zobrazení výnos na jednotlivých úrovních hierarchie.

4) Práce s geografickými údaji. Cílem je tedy vytvo it celosv tovou mapu zobrazující kde a kolik objednávek prob hlo b hem p sobení podniku na trhu.

5) Klasický koláčový graf s využitím hierarchie produktu.

6) Práce s časovými záznamy. Výstupem je vytvo ení p ehledu o výnosech za dané časové období.

7) Ukázka dalších vizualizačních prvk .

(46)

5. Zpracování dat, tvorba report

V této praktické části se popisují u každého nástroje kroky, které jsou zapot ebí splnit k dosažení zadaných kritérií a očekávaných výstup souvisejících s praktickou tvorbou report .

5.1 Zdrojová data

Jako datový zdroj byla zvolená databáze od společnosti Microsoft ůdwentureWorks 2012.

V této databázi jsou uložena data spojená s prodejem sportovního vybavení a oblečení.

Tato databáze obsahuje mnoho tabulek, ale pro bakalá skou práci byly vybrány pouze n které tabulky, které jsou pot ebné pro vizualizaci dat v jednotlivých nástrojích viz.

obrázek 3.

Obrázek 4 Schéma datového zdroje (vlastní)

Jelikož tato databáze byla ve formátu .mdf, který nepodporují všechny vybrané nástroje, bylo rozhodnuto jí pomocí SQL Management studia exportovat do formátu .xlsx, který

(47)

45

podporují všechny nástroje. Po úsp šném exportu dat byl vytvo en soubor DataSource.xlsx o n kolika listech, kde na každém list byla uložena jedna databázová tabulka.

5.2 Datové typy

SAP Lumira

SůP Lumira nabízí k výb ru n kolik typ datových zdroj vedle typu Microsoft Excel lze zvolit typ Text, stáhnout nebo p ipojit data z produktu SůP HůNů, p ipojit k jinému serveru, p ipojení k produktu SůP Hadoop a další. V našem p ípad je zvolen datový zdroj typu Microsoft Excel.

Po vybrání typu datového zdroje je zapot ebí zvolit cestu k souboru ve formátu .xlsx, který nese název DataSource. Soubor má n kolik list , kde každý list p edstavuje jednu databázovou tabulku. Nejsou tedy vybrány všechny listy, ale jsou postupn načítany podle pot eb vizualizace.

V tomto kroku je možné vid t náhled vybraného listu a p ípadn odstranit nepot ebné sloupce, aby se zbytečn nezahlcoval systém. V rozší ených možnostech se m že upravit rozsah souboru a další možnosti.

Microsoft Power BI

Datový zdroj je nutno upravit, a to do takové podoby, aby z každého listu, který obsahuje databázové tabulky, se staly excelovské tabulky. Dále byl vytvo en databázový model, který obsahoval jednotlivé tabulky a byl vytvo en v prost edí PowerPivot, kde se následn vytvo ily relace mezi tabulkami viz. obrázek 10.

(48)

Obrázek 5 Uzp sobený datový zdroj (vlastní)

Bylo zjišt no, že v tomto prost edí nelze propojovat tabulky podle unikátních klíč sloupce z rozdílných tabulek, což povede k chyb jící hierarchii produktu. Bylo nutno využít funkce Power Query, která umož uje práci s tabulkami a p edevším jejich slučovaní. Byly načteny tabulky Product, ProductSubCategory a ProductCategory, kde se p i adily sloupce ProductSubCategoryName, ProductCategoryID, ProductSubCategoryName do tabulky Product.

Díky tomuto sloučení již databázový model neobsahoval tabulky ProductSubCategory a ProductCategory, ale pouze Product. V tabulce Product byla vytvo ena hierarchie produktu o t ech úrovních. Dále se musel datový zdroj obohatit o sloupec m síc a rok, jelikož v prost edí PowerPivot tato funkce neexistuje. Tento krok umožnil vytvo ení časové hierarchie o dvou úrovních.

5.3 Popis pracovního prost edí

SAP Lumira

(49)

47

Hlavní prost edí je rozd leno do 3 částí. Prepare, Visualize a Compose. Nejprve je nutno v novat se části Prepare. V tomto prost edí je p ehled nad vybraným datovým zdrojem, je možno nastavit správné datové typy daných atribut , duplikovat, p idávat kalkulované m ítka a p evád t data na čísla nebo na text. Visualize nabízí prost edí, které slouží pro tvorbu vizualizaci. Je zde pracovní plocha, na které se jednotlivé komponenty skládají dále pak nabídka dimenzí, kalkulovaná m ítka a nabídka graf , která se skládá z 10 základních typ graf , jako jsou čárové a sloupcové grafy, ádkové grafy, koláčové grafy, geografické grafy, bodové grafy, mapové grafy, tabulky, samostatná čísla, grafy časových ad a dopl ující grafy. Tyto jednotlivé typy graf nabízí další podnabídku. Nechybí 3D grafy apod. Compose pak p edstavuje prost edí, kde uživatel sestavuje vybrané vizualizace do p ehled . Dodává text, obrázky, nastavuje barvy, p idává možnosti ke vstupu od koncového uživatele.

Compose nabízí hned ze začátku p edp ipravené šablony Prázdný, P ehled, Standartní, Detailní a Prezentace. Po výb ru šablony se zobrazí pracovní plocha, ve které m žeme p idávat již vytvo ené vizualizace a uspo ádat, dopl ovat je o další prvky pot ebné k vytvo ení p ehledného reportu. Lze zde doplnit filtry, kterých pak m že uživatel využít, aby si daný graf lépe p izp sobil. K tomuto slouží nejlépe vytvo ené hierarchie, kde uživatel m že prozkoumávat data na r zných úrovních hiearchie. Toto prost edí je primárn určeno k posledním úpravám barev, font , velikosti písma atd. V sekci Preview se nechají simulovat možnosti, jak dané vizualizace budou vypadat v prost edí stolního počítače, tabletu nebo mobilního telefonu.

Microsoft Power BI

Pro zavedení Power BI balíčku je zapot ebí p ipravit prost edí v Microsoft Excelu 2013.

Jedná se o instalaci ůdd-in balíčku a to p esn ji COM ůdd-in Microsoft Office PowerPivot for Excel 2013, Microsoft Power Query for Excel 2013, Inquire a PowerView.

Pro add-in PowerView je zapot ebí instalace pluginu Microsoft Silverlight.

PoverPivot je prost edí, které umož uje práci s datovým modelem tedy správu relací, vytvá ení hierarchií, správu datových typ jednotlivých atribut a vytvá ení kalkulovaných jednotek. Kalkulované jednotky se vytvá ejí pomocí funkcí jazyku DůX.

(50)

PowerView je pak prost edí, které slouží k vizualizaci dat pomocí r zných vizualizačních prost edk . P esn ji se jedná o vizualizaci vertikálních a horizontálních sloupcových graf , ostatních graf a map. Dále je možno využít vizualizace v podob matrix tabulky nebo karty. Horizontální a vertikální sloupcové grafy se pak ješt d lí do podskupin.

Prost edí PowerView pak nabízí další možnosti pro vylepšení vizualizací. Nechybí zde možnost p idaní obrázku, nastavení pozadí, výb r šablon, nastavení font a barev, vložení popisku a další. D ležitá vlastnost, kterou tento nástroj obsahuje, je tvorba automatických filtr . Každá vizualizace má vytvo ený filtr, který obsahuje všechny atributy a možnost jejich roz azení. V rozší ených možnostech pak m žeme aplikovat r zné podmínky filtrování.

5.4 Vytvo ení sloupcového grafu s použitím hierarchie produktu

SAP Lumira

Nejprve bylo nutno p ipravit datový set. Data o prodeji jsou uložena na listu SalesOrderDetail, k n muž se musely pomocí p íkazu Merge spojit další listy a to Product, ProductSubCategory a ProductCategory, z nichž se p ipojily jména daných produkt , subkategorií a kategorií produkt pro vytvo ení hierarchie. Tato spojení se provád la pomocí unikátních klíč a p es typ spojení vn jší. Dalším krokem bylo vypočítat celkové výnosy. P íkaz k tomuto účelu sloužící se nazývá Create Calculated Measure kde se pomocí jednoduché formule vybral atribut OrderQty * UnitPrice. Díky p edchozímu spojení dat se mohla vytvo it hiearchie produktu pomocí p íkazu Create a custom hierarchy. Jako typ grafu se vybral sloupcový graf a prost edí SůP Lumiry nabídlo pole, do kterých se vybraly kalkulované jednotky a dimenze. Na ose x se aplikovala kalkulovaná jednotka Výnosy a na osu x vytvo ená hierarchie produktu. Pro lepší vizuální hodnotu se do pole Color zvolil atribut CategoryName, aby byl graf lépe čitelný a odvoditelný.

(51)

49 Obrázek 6 Celkové výnosy (vlastní)

Microsoft Power BI

Vytvo ení sloupcového grafu zobrazující celkové výnosy s využitím hierarchie produktu se nepoda ilo vytvo it, jelikož osa X nelze být napln na celou hierarchií, ale pouze jednotlivými úrovn mi produktu. Pro p iblížení vizualizační hodnoty byl zvolen graf typu Vertikální sloupcový graf a to p esn ji typ skupinový. Tento graf pak zobrazuje celkové výnosy dle kategorií a jednotlivé sloupce kategorií jsou rozd leny do subkategorií.

(52)

Obrázek 7 Celkové výnosy (vlastní)

5.5 Práce s geografickými údaji

SAP Lumira

Vychází se ze stejného datového setu, aby se využila již vytvo ená hierarchie produktu.

Geografické údaje jsou uloženy v list ůddress, která ale nemá společný klíč s listem SalesOrderDetail. Tento list se musí p ipojit p es list SalesOrderHeader. Toto p ipojení umožní využívat atribut City, ve kterém jsou uložena data obsahující názvy m st, ze kterých prob hly objednávky. Tento atribut se musí p evést do Geografické hierarchie o jedné úrovni. Tento proces prob hl s výsledkem 1Ř2 názv m st vy ešeno, 100 pot eba manuáln určit a 252 názv m st nenalezeno. Manuální úprava probíhá tak, že nástroj nabídne nejpravd podobn jší shody názv m st se zobrazenými procenty a uživatel pak vybere jednu možnost nebo zvolí, že název m sta neexistuje. Po této úprav se dostal finální výsledek 232 vy ešeno 307 nenalezeno. Typem grafu je koláčový geografický graf.

Velikost bubliny je závislá na počtu objednávek, který z daného m sta prob hl. ů geografické umíst ní na námi vytvo ené hierarchii. Pole Color je napln no atributem ProductCategory Name, aby graf zobrazoval, jaký typ objednávky prob hl. Pro p idanou hodnotu mapa zobrazí, co p esn bylo objednáno dle kategorií produkt .

(53)

51 Obrázek 8 Mapa zobrazující počty objednávek (vlastní)

ůby podnik m l p ehled o své cílové skupin zákazník , a to p esn ji z geografického hlediska, je pro n j ideální vizualizace pomocí mapy, která zobrazuje z jakého m sta objednávka prob hla a do jaké kategorie se adí. Nechybí ani možnost filtrování dle kategorií produkt viz obrázek 7.

Microsoft Power BI

Druhé kritérium bylo spln no. Byla vytvo ena mapa zobrazující m sta, z kterých byly provedeny objednávky. Toto zobrazení bylo vizualizováno v podob koláčových graf u každého m sta. Velikost grafu je závislá na počtu objednávek a jednotlivé grafy jsou rozd leny na kategorie produktu. Bohužel zde nelze aplikovat geografická hierarchie, protože tento nástroj si sám nedohledá regiony, sub regiony a zem .

(54)

Obrázek 9 Mapa zobrazující počet objednávek (vlastní) SAP Lumira

Klasický koláčový graf je jednou z dalších možností jak využít vytvo enou hierarchii produkt . Nástroj SůP Lumira umož uje tento graf povýšit o další úrove . Stává se tedy z tohoto jednoduchého vizualizačního prost edku 3D graf. Tento graf využije kalkulované jednotky Výnosy a zobrází tak kolik firma utržila za jednotlivé kategorie. Výšku pak p edstavuje celkový počet objednaných kus a za barevnou škálou stojí hierarchie produkt .

(55)

53 Obrázek 10 3D koláčový graf zobrazující výnosy (vlastní)

Po kliknutí na danou subkategorii tento nástroj zobrazí detailní informace viz obrázek Ř.

Microsoft Power BI

Koláčový graf je jediný vizualizační nástroj, ve kterém je možná aplikace celé hierarchie.

Nejprve je zobrazena nejvyšší úrove kategorie produktu po poklepání na vybranou kategorii se zobrazí její subkategorie a po poklepání na vybranou subkategorie se zobrazí názvy jednotlivých produkt , které jí obsahují. Pro p echod do vyšší úrovn se používá tlačítko drill-up.

(56)

Obrázek 11 Koláčový graf zobrazující výnosy (vlastní)

Lineárn zam ený graf ukazující celkové výnosy v závislosti na letech viz obrázek 15.

5.6 Práce s časovými záznamy

SAP Lumira

Čtvrté kritérium je zam eno na práci s časovými údaji. Pro toto kritérium se využije Bublinkový graf pro časové linie. Vychází se op t ze stejného datového setu s p idáním atributu ShipDate z listu SalesOrderHeader. Tento atribut se musí p evést do správného formátu. Tento formát pak lze dosadit do časové dimenze grafu. Osa Y je napln na Výnosy stejn tak jako velikost. Op t zde byly rozlišeny výnosy podle kategorií produkt . Pro ukázku byl dopln n lineární graf s časovou dimenzí, ve kterém si uživatel m že zobrazit výnosy na úrovních časové dimenze.

References

Related documents

mateřiáů fespektive s jejich vlastDostmj fyzikálníni' meclranickýn'ri a chemick]inri' navlhnout výIobu nádob z geopolyrrrerních nateriálů, které budou slouŽit

Členka komise vyzvala studentku, aby se vyjádřila k posudkům vedoucí a oponentky diplomové práce.. Studentka se pokusila formulovat cíl diplomové práce a zhodnotit

Klientská část systému poskytuje rozhraní pro filtrování dopravních nehod, které jsou následně přehledně zobrazené v mapě. Z těchto vyfiltrovaných dat si uživatel

Zkoumání událostí při změně délky jednotlivých intervalů bylo jedním z cílů bakalářské práce.. Pro snadnější porovnání jednotlivých intervalů byly

Dílo je ve všech ohledech (včetně výběru zadání) dalším dokladem úporné snahy člověka přehodnotit svou vlastní existenci, znovu se zorientovat v již jednou

Toto pootočení výsledného obrazu se ukázalo jak u vzorků umístěných před začátkem snímání v uchycovacím zařízení po směru rentgenových paprsků, tak kolmo k

Proto byla část programu obsluhující navazování bezdrátové komunikace psána jako oddělená knihovna, která je rozdělena do jednotlivých částí podle vrstev, které

Konfigurátor je řešen velice podobně jako u Volkswagenu, všechny volitelné položky jsou detailně popsány a uživatel má přehled o tom, co která položka znamená, lze