• No results found

Proces tvorby ekonometrick´eho modelu

3.2 Formulace modelu

Poˇc´ateˇcn´ı f´az´ı procesu je formulace modelu. V t´eto f´azi urˇc´ıme, jak´y pˇredmˇet chceme zkoumat, jak´e promˇenn´e obsahuje a matematicky ho definujeme[9]. Formulace modelu se skl´ad´a z nˇekolika f´az´ı.

Prvn´ı f´az´ı je vytvoˇren´ı ekonomick´eho modelu. V´ysledkem b´yv´a model, kter´y pod´av´a informaci o moˇzn´em vztahu mezi veliˇcinami. Jedn´ım z pˇr´ıklad˚u m˚uˇze b´yt napˇr´ıklad spotˇrebn´ı funkce. Jedn´a se o z´avislost re´aln´e spotˇreby na re´aln´em d˚uchodu.

Do t´eto f´aze m˚uˇzeme zaˇradit:

• v´ybˇer zkouman´eho pˇredmˇetu,

• posuzov´an´ı ekonomick´ych veliˇcin,

• popis vazeb a vztah˚u mezi veliˇcinami,

• formulace z´akladn´ıho tvrzen´ı o chov´an´ı ekonomick´ych veliˇcin.

Ekonomick´y model je z hlediska dalˇs´ıch f´az´ı velice d˚uleˇzit´y a jeho zanedb´an´ı, ˇci chybn´a interpretace, vede k z´avaˇzn´ym chyb´am.

Po t´eto f´azi n´asleduje formulace matematick´eho modelu.

Zde:

• vymez´ıme typy a rozsahy promˇenn´ych,

• ekonomick´y model transformujeme do analytick´eho pˇredpisu napˇr. line´arn´ı, neline´arn´ı,

• nalezneme dalˇs´ı oˇcek´avan´e vztahy, at’ negativn´ı nebo pozitivn´ı a jin´a omezen´ı pro parametry.

V´ysledkem t´eto f´aze m˚uˇze b´yt napˇr´ıklad stanoven´ı jednoduch´eho line´arn´ıho regresn´ıho modelu (viz rovnice 2.15).

Z´avˇereˇcnou f´az´ı je vytvoˇren´ı ekonometrick´eho modelu. Spoˇc´ıv´a zaveden´ı n´ahodn´e sloˇzky ui do matematick´eho modelu, kterou budou stanoveny hypot´ezy o charakteru rozloˇzen´ı t´eto chyby. T´ımto z deterministick´eho modelu z´ısk´ame sto-chastick´y model. V´ysledkem t´eto f´aze je napˇr´ıklad rovnice 2.16.

3.3 Z´ısk´ an´ı a anal´ yza dat

Sbˇer dat a jejich anal´yza je velice n´aroˇcnou ˇc´ast´ı ekonometrick´eho modelov´an´ı.

V prvn´ım ˇradˇe je tˇreba naj´ıt vhodn´e informaˇcn´ı zdroje a datab´aze. V tˇechto f´az´ıch jsou velice potˇrebn´e znalosti a dovednosti z ekonomick´e statistiky. Mezi vhodn´e informaˇcn´ı zdroje patˇr´ı:

• datab´aze Eurostatu,

• webov´y server Kaggle [8],

• ˇCesk´y statistick´y ´uˇrad [5],

• a dalˇs´ı datab´aze.

Pˇri anal´yze dat pracujeme obvykle s v´ybˇerov´ym souborem, nikoli ze z´akladn´ım, protoˇze jeho z´ısk´an´ı nen´ı v mnoha pˇr´ıpadech moˇzn´e. Prostˇrednictv´ım tohoto vzorku dat se snaˇz´ıme zjistit informace o z´akladn´ım souboru. Vybran´y v´ybˇerov´y datov´y soubor pot´e analyzujeme a upravujeme do podoby vhodn´e pro pouˇzit´ı v dalˇs´ıch ˇc´ast´ı ekonometrick´eho procesu. Mezi nˇe patˇr´ı napˇr´ıklad ˇcasov´e, prostorov´e a obsahov´e vymezen´ı, odstranˇen´ı chybˇej´ıc´ıch dat a eliminace odlehl´ych pozorov´an´ı[9].

3.4 Odhady parametr˚ u modelu

Tato ˇc´ast procesu se zab´yv´a v´ybˇerem vhodn´e a dostupn´e metody odhadov´an´ı pa-rametr˚u. Selekce se prov´ad´ı podle vlastnost´ı dat, sloˇzitosti modelovan´eho syst´emu, dostupnosti technick´eho a softwarov´eho vybaven´ı a v neposledn´ı ˇradˇe tak´e podle znalost´ı a zkuˇsenost´ı v´yzkumn´eho pracovn´ıka resp. v´yzkumn´eho t´ymu[9].

Metody odhadu m˚uˇzeme rozdˇelit do nˇekolika z´akladn´ıch skupin:

• metoda nejmenˇs´ıch ˇctverc˚u,

• metoda moment˚u,

• metoda maxim´aln´ı vˇerohodnosti.

3.5 Ovˇ eˇ ren´ı platnosti modelu

V t´eto f´azi ovˇeˇrujeme spr´avnost a validitu vytvoˇren´eho modelu. Toto ovˇeˇren´ı prob´ıh´a na tˇrech ´urovn´ıch:

• statistick´e ovˇeˇren´ı,

• ekonometrick´e ovˇeˇren´ı,

• ekonomick´e ovˇeˇren´ı.

V pˇr´ıpadˇe, ˇze v jak´ekoli z tˇechto tˇr´ı ´urovn´ı zjist´ıme chybu, tak se vrac´ıme zpˇet do pˇredchoz´ıch ˇc´ast´ı modelov´an´ı a podle pˇr´ıˇciny chyby prov´ad´ıme korekci modelu.

3.6 Aplikace odhadnut´ eho modelu

Za pˇredpokladu bezchybn´eho ovˇeˇren´ı modelu n´asleduje jeho aplikace.

M˚uˇzeme ji rozdˇelit do tˇr´ı skupin:

• predikce budouc´ıho v´yvoje,

• anal´yza v´yvoje nebo chov´an´ı,

• vyuˇzit´ı odhadnut´eho modelu k optim´aln´ımu ˇr´ızen´ı hospod´aˇrsk´e politiky (simu-lace sc´en´aˇr˚u a jejich dopad˚u).

3.7 Pˇ r´ıklady aplikac´ı ekonometrick´ eho modelov´ an´ı

Mezi pˇr´ıpady ekonometrick´eho modelov´an´ı se ˇrad´ı nesˇcetnˇe typov´ych ´uloh.

Struˇcn´ym pˇr´ıkladem ekonometrick´e modelov´an´ı m˚uˇze b´yt napˇr´ıklad jednoduch´a spotˇrebn´ı funkce keynesi´ansk´eho typu3 pro ˇcesk´e dom´acnosti, kde se predikuje v´yvoj spotˇreby dom´acnosti s urˇcit´ym mˇes´ıˇcn´ım pˇr´ıjmem. Prvn´ı ˇc´ast´ı procesu podle kapitoly 3.2 m´a b´yt formulace a popis ekonomick´eho modelu spotˇrebn´ı funkce. Tedy stanoven´ı pˇredmˇetu zkoum´an´ı, t´ım jednoduch´a spotˇrebn´ı funkce. Klasifikov´an´ı ekonomick´ych veliˇcin - Ci (re´aln´a spotˇreba i-t´e dom´acnosti) a Yi (pˇr´ıjem i-t´e dom´acnosti). D´ale popis vztahu mezi veliˇcinami. Zde se jedn´a o pˇr´ımou z´avislost spotˇreby na pˇr´ıjmu.

A v posledn´ı ˇradˇe formulace z´akladn´ıho tvrzen´ı o chov´an´ı ekonomick´ych veliˇcin - tj. spotˇreba roste pomaleji neˇz d˚uchod. N´asleduje formulace matematick´e modelu.

Zde vymez´ıme kl´ıˇcov´e promˇenn´e pouˇzit´e v modelu - Ci spotˇreba i-t´e dom´acnosti (v Kˇc/rok), Yi - re´aln´y pˇr´ıjem (v Kˇc/rok) a provedeme transformaci ekonomick´eho

modelu do analytick´e formy funkˇcn´ıho pˇredpisu[9]:

Ci = β1+ β2Yi, i= 1, 2, . . . , n. (3.1) Posledn´ı f´az´ı je formulace ekonometrick´eho modelu spotˇrebn´ı funkce, kter´a pˇredpokl´ad´a zaveden´ı n´ahodn´e sloˇzky ui do rovnice 3.1:

Ci = β1+ β2Yi+ ui, i= 1, 2, . . . , n. (3.2) N´asleduj´ıc´ı krok by spoˇc´ıval v z´ısk´an´ı a anal´yze dat, se kter´ymi se bude pracovat.

K tomuto ´uˇcelu se mohou pouˇz´ıt zdroje uveden´e v 3.3. Dalˇs´ı ˇc´ast´ı procesu by byl v´ybˇer metody odhadu regresn´ıch parametr˚u modelu a jejich vypoˇcten´ı. Pot´e by n´asledovalo otestov´an´ı modelu. Za pˇredpokladu ´uspˇeˇsn´eho otestov´an´ı by n´asledovalo vyuˇzit´ı odhadnut´eho a verifikovan´eho modelu pro predikci, nebo bliˇzˇs´ı anal´yzu zkouman´eho probl´emu.

3Keynes, J. M.: The general theory of employment, interest and money. Kissim-mee,USA:Singnalman Publishing, 2009, ISBN 978-0-9840614-0-2, 264 s.

4 Praktick´ a ˇ c´ ast

4.1 Zkuˇ senosti s MOOC kurzem na port´ ale Coursera

Minul´y rok (2016) jsem v r´amci pˇredmˇetu Dataming absolvoval online kurz Ma-chine Learning (Strojov´e uˇcen´ı) na MOOC port´ale Coursera[4]. Jednalo se o mou prvn´ı zkuˇsenost s MOOC kurzem. Tento kurz trval pˇresnˇe jeden´act t´ydn˚u a po jeho sloˇzen´ı sliboval certifik´at, kter´y dokazuje znalost prob´ıran´ych okruh˚u. V´yuka byla pˇredkl´ad´ana formou pˇredn´aˇsek a cviˇcen´ı. Pˇredn´aˇsky byly ve formˇe komento-van´ych vide´ı s pauzami pro testy zamˇeˇren´e na aktu´aln´ı prob´ıran´e t´ema. Kaˇzd´a video trvalo pr˚umˇernˇe 10 aˇz 15 minut. Cviˇcen´ı byla vˇzdy na konci probran´eho t´ematu a spoˇc´ıvaly v naprogramov´an´ı zadan´ych t´emat v programu Octave. Pro vˇsechny ´ulohy byli vytvoˇreny unit testy, kter´e provedly kontrolu v´ysledk˚u. Pˇredmˇet byl vyuˇcov´an v angliˇctinˇe a k dispozici byli dalˇs´ı ˇctyˇri jazyky (ˇceˇstina mezi nimi nebyla). ˇCasov´a n´aroˇcnost kaˇzd´e lekce byla okolo 5-7 hodin t´ydnˇe.

Mezi probran´e okruhy patˇrily:

• regresn´ı modely (line´arn´ı, logistick´y a v´ıcerozmˇern´y),

• neuronov´e s´ıtˇe,

• support Vector Machines,

• uˇcen´ı bez uˇcitele (clustering),

• pr´ace s obs´ahl´ymi daty,

• praktick´e pˇr´ıklady nasazen´ı.

Po ´uspˇeˇsn´em absolvovan´ı vˇsech test˚u a cviˇcen´ı my byl nab´ıdnut certifik´at. Jeho hodnota byla 49 $. V dobˇe platby tato ˇc´astka odpov´ıdala 1 201 Kˇc. Po zaplacen´ı ˇc´astky jsem obdrˇzel nab´ızen´y certifik´at (viz pˇr´ıloha B).

Forma pˇredkl´ad´an´ı informac´ı byla na velmi dobr´e ´urovni a z tˇechto d˚uvod˚u mˇe kurz velice bavil. Nemohu jinak neˇz tento kurz doporuˇcit. Nav´ıc informace poskytnut´e v kurzu jsou k dispozici i po jeho absolvov´an´ı, a tedy jsou v´yborn´ym informaˇcn´ım zdrojem, za kter´eho ˇcerp´am i v t´eto pr´aci.

4.2 Kurz na ALS port´ ale

V r´amci t´eto kapitoly jsem vytvoˇril v´ykladovou studii do kurzu Datamaning na ALS port´ale. Zpracoval jsem kapitoly jednoduch´eho, logistick´eho, v´ıcerozmˇern´eho regresn´ıho modelov´an´ı a t´ema ekonometrie do nˇekolika v´yukov´ych materi´al˚u a vloˇzil do kurzu. Tyto materi´aly budou r´amci kurzu ke staˇzen´ı. D´ale jsem do kurzu pˇriloˇzil tak´e moji zpracovanou pˇr´ıpadu studii o odhadu ceny nemovitost´ı vˇcetnˇe m´eho proudu vytvoˇren´eho v programu Modeler, pouˇzit´ych dat a jejich popisu. V´yslednou strukturu kurzu zobrazuje obr´azek 4.1.

Related documents