• No results found

5.6.7.1. Testy shody s exponenciálním rozdělením

Pro tento vzorek nelze použít pro testování shody rozdělení dat s exponenciálním rozdělením pravděpodobnosti test dobré shody, protože data nesplňují jeden ze základních požadavků pro úspěšné provedení testu. Proto je tedy proveden pouze K - S test, který lze i na souboru s malým počtem pozorování použít. Výsledky jsou zaznamenány v tabulce č. 13.

Byla testována shoda 14 zjištěných period mezi vadami s exponenciálním rozdělením s parametrem λ=50 632.

H0 : data pocházej z exponenciáln ho rozd len s parametrem λ = 50 632.

H1 : non H0.

Tabulka 13: Tabulka výsledků K-S testu, vzorek A

Exponenciální rozdělění

DPLUS 0,072

DMINUS 0,193

DN 0,193

P-hodnota 0,675

V řádku „DPLUS“ je nejvyšší zjištěná „plusová“ odchylka, v řádku „DMINUS“

je nejvyšší zjištěná „minusová“ odchylka, v řádku „DN“ je nejvyšší zjištěná absolutní odchylka a v posledním je spočtená p-hodnota. Tato p-hodnota bude použita pro vyhodnocení testu.

0 1 2 3 4 5 6

1 2 3

Četnost ídy

Číslo třídy

Vzorek A

59 a následně budou představeny i výsledky K - S testu pro ověření shody s rozdělením.

Nejprve byla data uspořádána do tříd, byly vytvořeny 4 třídy s šířkou třídy 10 000 pixelů. Uspořádání a další informace o datech jsou v následující tabulce č. 14 a grafu č. 8:

Tabulka 14: Výchozí tabulka, vzorek B

Číslo

Graf 8: Histogram četností, vzorek B 0

60

5.6.8.1. Testy shody s exponenciálním rozdělením

Tabulka 15: Test dobré shody, vzorek B

Číslo třídy Četnost Pravděpodobnost obsazení Statgraphics, je uveden v tabulce č. 16:

Byla testována shoda 40 zjištěných period mezi vadami s exponenciálním rozdělením s parametrem λ = 17 272.

H0 : data pocházej z exponenciáln ho rozd len s parametrem λ = 17 272.

H1 : non H0.

Tabulka 16: Tabulka výsledků K-S testu, vzorek B

Exponenciální

61 vadami. Vzhledem k zachování předpokladů pro provedení chí-kvadrát testu byla data rozdělena do 3 tříd, s šířkou třídy 30 000 pixelů. Shoda rozdělení pravděpodobnosti dat s exponenciálním rozdělením pravděpodobnosti je ověřena pomocí K - S testu.

Data jsou zpracována v tabulce č. 17 a zobrazena grafem č. 9:

Tabulka 17: Výchozí tabulka, vzorek C

Číslo

Graf 9: Histogram četností, vzorek C 0

62

5.6.9.1. Testy shody s exponenciálním rozdělením

Jelikož je u tohoto vzorku situace obdobná jako u vzorku A, nelze tedy použít test dobré shody z důvodu malého rozsahu souboru. Proto byl proveden pouze K - S test, který exponenciální rozdělení pravděpodobnosti bezpečně potvrdil.

Byla testována shoda 13 zjištěných period mezi vadami s exponenciálním rozdělením s parametrem λ = 45 307.

H0 : data pocházej z exponenciáln ho rozd len s parametrem λ = 45 307.

H1 : non H0.

Výsledek testu, jenž byl získán pomocí programu Statgraphics, je uveden v následující tabulce č. 18:

Tabulka 18: Tabulka výsledků K-S testu, vzorek C

Exponenciální rozdělení

DPLUS 0,126

DMINUS 0,247

DN 0,247

P-hodnota 0,409

V řádku „DPLUS“ je nejvyšší zjištěná „plusová“ odchylka, v řádku „DMINUS“

je nejvyšší zjištěná „minusová“ odchylka, v řádku „DN“ je nejvyšší zjištěná absolutní odchylka a v posledním je spočtená p-hodnota. Tato p-hodnota bude použita pro vyhodnocení testu.

Pak nelze zamítnout H0, že zkoumaná data pocházejí z exponenciálního rozdělení s parametrem λ=45 307.

5.6.10. Vzorek D

Na vzorku D bylo zjištěno 521 vad a bylo vypočteno 421 period vad. U tohoto vzorku nejsou postihnuty periody, které byly přerušeny z důvodu upevnění příze, protože nelze zaručit, že se některé vady nevyskytly na úsecích příze použitých k upevnění. Pokud by byla použita stejná metoda jako u ostatních vzorků, kde byl pozorováním výskyt těchto vad vyloučen, došlo by k výraznému zkreslení výsledků vlivem přidání velkého množství dlouhých period a tedy

63

k nereprezentativnosti dat. Data byla roztříděna do 8 tříd, šířka třídy je 500 pixelů. Počet a šířka tříd byly zvoleny s ohledem na splnění požadavků pro provedení chí-kvadrát testu dobré shody. Podrobnější informace o datech jsou v následující tabulce č. 19 a grafu č. 10:

Tabulka 19: Výchozí tabulka, vzorek D

Číslo

Graf 10: Histogram četností, vzorek D 0

64

5.6.10.1. Testy shody s exponenciálním rozdělením

Tabulka 20: Test dobré shody, vzorek D

Číslo hypotéza, že tato data pochází z exponenciálního rozdělení pravděpodobnosti s parametrem λ = 802. Pomocí programu Stagraphics byla zjištěna i p-hodnota, jejíž hodnota je rovna 0,771, tudíž H0 lze akceptovat.

Zároveň byl také proveden K - S test pro ověření shody rozdělení dat s exponenciálním rozdělením. Výsledek testu, jenž byl získán pomocí programu Statgraphics, je uveden v tabulce č. 21:

Byla testována shoda 421 zjištěných period mezi vadami s exponenciálním rozdělením s parametrem λ = 802.

H0 : data pocházej z exponenciáln ho rozd len s parametrem λ = 802.

H1 : non H0.

Tabulka 21: Tabulka výsledků K-S testu, vzorek D

Exponenciální

65

odchylka a v posledním je spočtená p-hodnota. Tato p-hodnota bude použita pro vyhodnocení testu.

Pak nelze zamítnout H0, že zkoumaná data pocházejí z exponenciálního rozdělení s parametrem λ = 802.

5.6.11. Shrnutí výsledků

Celkem byly provedeny 2 druhy testů na 4 vzorcích. Z důvodu malého rozsahu dat některých vzorků nebylo možné použít test dobré shody, protože data nesplnila jedno z nutných pravidel pro provedení testu. Proto bylo rozhodnuto o provedení K - S testu pro všechny vzorky, protože tento test je vhodný i pro velmi malé výběry.

Výsledné hodnoty byly spočítány pomocí programu Statgraphics. Na základě výsledků K - S testu lze přijmout hypotézy, že se data period mezi vadami všech 4 vzorků řídí exponenciálním rozdělením pravděpodobnosti. Shrnutí testů je v tabulce č. 22:

Tabulka 22: Shrnutí výsledků testů, exponenciální rozdělení

Test dobré shody K - S test

Vzorek A Nelze aplikovat Shoda

Vzorek B Shoda Shoda

Vzorek C Nelze aplikovat Shoda

Vzorek D Shoda Shoda

5.7. Samotný návrh optimalizace sledování neshod na přízi

Hlavním principem samotného finále celé práce je navržení optimalizace sledování neshod na přízi. Základní úvahou je, že se parametr exponenciálního rozdělení, které charakterizuje průměrnou velikost period mezi vadami, v čase mění. Byly uvažovány dvě situace. První situací je lineární trend změny parametru λ v čase, druhou úvahou je exponenciální chování parametru λ v čase. Optimalizace spočívá v tabulce výsledků, z níž lze odečíst pravděpodobnost, že na úseku o délce l a v čase t se vyskytne neshoda.

V tabulce je zaneseno velké množství různých délek, ať už v primárních jednotkách pixelech, nebo v centimetrech. Tyto pravděpodobnosti byly počítány pomocí jednoduchého skriptu v programu Matlab. Skript je uveden v příloze B.

66

Principem skriptu je výpočet pravděpodobností z distribuční funkce exponenciálního rozdělení s parametrem λ v čase t na úseku o délce l. Pro srovnání obou trendů jsou k dispozici i grafy, jeden pro každou dvojici vzorků.

5.7.1. Výpočet parametru λ exponenciálního rozdělení s lineárním trendem Parametr byl počítán na základě dvou praktických sledování. P rvní sledování bylo provedeno v čase t = 0, v tomto případě reprezentováno vzorky A a C. Druhé sledování bylo provedeno v čase t = 23, tedy o 23 hodin později, reprezentováno vzorky B a D.

Pomocí metody nejmenších čtverců byl spočten předpis přímky, který má ilustrovat průběh změny parametru rozdělení. Celkem bylo počítáno s 24 různými parametry.

Na následujících řádcích je popsána metoda nejmenších čtverců, pomocí níž byl proveden výpočet předpisu přímky a následuje samotný výpočet parametrů těchto přímek.

5.7.1.1. Metoda nejmenších čtverců a lineární regrese

Jedná se o metodu aproximace, kde je cílem proložení bodů funkcí tak, aby součet druhých mocnin všech odchylek jednotlivých bodů od přímky byl minimální. Proto se tato metoda nazývá metoda nejmenších čtverců (MNČ). Funkce může být libovolná, od přímky až po složitý polynom x - tého stupně. Tato numerická metoda je používána pro relativně snadný výpočet a aplikaci.

Jelikož všechny předpisy budou mít tvar přímky, jsou zde nejprve provedeny teoretické úpravy a vyjádření obecných rovnic, do nichž jsou následně dosazeny hodnoty jednotlivých druhů příze.

Obecná rovnice přímky:

Nejmenší odchylky od této přímky:

Derivace podle a0:

67 exponenciálního rozdělení pravděpodobnosti. Znak n je počet sledování.

5.7.1.2. Vzorek A a vzorek B

68 Vyjádření a0 z první rovnice:

Dosazení vyjádřeného výrazu do druhé rovnice:

Výpočet a1 z druhé rovnice:

Výpočet a0 po dosazení vypočtené hodnoty a1 do první rovnice:

Výsledná rovnice přímky tedy je . 5.7.1.3. Vzorek C a vzorek D

V tabulce č. 24 jsou uvedena všechna potřebná data pro výpočet. Pod neznámou x je veden čas, pod neznámou y je zaznamenán parametr λ exponenciálního rozdělení pravděpodobnosti.

Tabulka 24: MNČ pro vzorky C a D

n 2

∑xi 23

∑xi*yi 18423

∑yi 46108

∑xi2 529 Předpis přímky:

Vyjádření a0 z první rovnice:

69 Dosazení vyjádřeného výrazu do druhé rovnice:

Výpočet a1 z druhé rovnice:

Výpočet a0 po dosazení vypočtené hodnoty a1 do první rovnice:

Výsledná rovnice přímky tedy je .

5.7.2. Výpočet parametru λ exponenciálního rozdělení s exponenciálním trendem

Předpoklady pro výpočet jsou totožné s předpoklady výpočtu předpisu rovnice s lineárním trendem. Předpis byl počítán ze vztahu:

kde y je hodnota parametru λ v čase x, c značí koeficient, který zapříčiňuje pokles hodnoty parametru λ v čase. Za proměnnou λ je dosazena hodnota parametru λ v čase t=

0. Pomocí této rovnice je vypočten koeficient c, který snižuje hodnotu λ s rostoucím časem.

5.7.2.1. Vzorky A a B

Do rovnice byly dosazeny naměřené hodnoty z času x = 23, y = 17272, λ = 50632.

Cílem je získání hodnoty neznámé c z rovnice.

Pro výpočet neznámé c je nutné rovnici zlogaritmovat přirozeným logaritmem:

70 Výsledná rovnice má tedy tvar:

Z této rovnice je možné vypočítat parametr λ exponenciálního rozdělení pravděpodobnosti v jednotlivých časech. Hodnota času v hodinách se dosazuje za neznámou x.

5.7.2.2. Vzorky C a D

Do rovnice byly dosazeny naměřené hodnoty z času x = 23, y = 801, λ = 45307.

Cílem je získání hodnoty neznámé c z rovnice.

Pro výpočet neznámé c je nutné rovnici zlogaritmovat přirozeným logaritmem:

Výsledná rovnice má tedy tvar:

Z této rovnice je možné spočíst parametr λ exponenciálního rozdělení pravděpodobnosti v jednotlivých časech. Hodnota času v hodinách se dosazuje za neznámou x.

5.8. Tabulky závěrečných výsledků

Následují tabulky výsledků se spočtenými pravděpodobnostmi. Pro každou dvojici vzorků jsou k dispozici dvě tabulky, tabulky č. 25 a 27 obsahují hodnoty pravděpodobností, kdy má parametr lineární trend a tabulky č. 26 a 28 ukazují pravděpodobnosti, kdy má parametr exponenciálního rozdělení pravděpodobnosti exponenciální trend, což bude více odpovídat skutečnosti. Předpokladem pro tyto výpočty je fakt, že se parametr chová stacionárně, vždy v daném časovém úseku.

Z vypočtených rovnic lze spočítat parametr pro libovolně zvolený čas. Ve výsledcích jsou zahrnuty pouze některé časy. V prvním sloupci je délka zkoumaného úseku v centimetrech, ve druhém stejný údaj v pixelech. V dalších sloupcích jsou jednotlivé pravděpodobnosti v závislosti na čase a délce zkoumaného úseku.

71 5.8.1. Vzorky A a B

První tabulka, č. 25, obsahuje hodnoty pravděpodobností detekce vady při předpokladu lineárního trendu změny parametru exponenciálního rozdělení pravděpodobnosti. Druhá tabulka, č. 26, udává hodnoty pravděpodobnosti pro předpoklad exponenciálního trendu parametru exponenciálního rozdělení pravděpodobnosti. Skutečné chování parametru bude blíže trendu exponenciálnímu, lineární trend je uveden pro srovnání. V tabulkách jsou napočítány hodnoty vždy po 3 hodinách, pro 8 různých délek zkoumaného úseku příze. Zároveň je připojen i graf č. 11, který porovnává oba trendy, s nimiž je zde pracováno.

Tabulka 25: Výsledné pravděpodobnosti pro vzorky A a B, lineární trend

Čas 0 3 6 9 12 15 18 21 23

λ 50632 46270 41921 37537 33225 28877 24528 20180 17272

cm pixely

10 2300 0,044 0,048 0,053 0,059 0,067 0,077 0,090 0,108 0,125

50 11500 0,203 0,220 0,240 0,264 0,293 0,328 0,374 0,434 0,486

100 23000 0,365 0,392 0,422 0,458 0,500 0,549 0,608 0,680 0,736

200 46000 0,597 0,630 0,666 0,706 0,750 0,797 0,847 0,898 0,930

300 69000 0,620 0,653 0,689 0,729 0,771 0,817 0,864 0,912 0,941

400 92000 0,837 0,863 0,889 0,914 0,937 0,959 0,976 0,990 0,995

500 115000 0,897 0,917 0,936 0,953 0,969 0,981 0,991 0,997 0,999

1000 230000 0,989 0,993 0,996 0,998 0,999 1,000 1,000 1,000 1,000

72

Tabulka 26: Výsledné pravděpodobnosti pro vzorky A a B, exponenciální trend

Čas 0 3 6 9 12 15 18 21 23

λ 50632 43973 38190 33168 28806 25018 21728 18870 17177

cm pixely

10 2300 0,044 0,051 0,058 0,067 0,077 0,088 0,100 0,115 0,125

50 11500 0,203 0,230 0,260 0,293 0,329 0,369 0,411 0,456 0,488

100 23000 0,365 0,407 0,452 0,500 0,550 0,601 0,653 0,704 0,738

200 46000 0,597 0,649 0,700 0,750 0,797 0,841 0,880 0,913 0,931

300 69000 0,620 0,672 0,723 0,772 0,818 0,859 0,895 0,925 0,942

400 92000 0,837 0,877 0,910 0,938 0,959 0,975 0,986 0,992 0,995

500 115000 0,897 0,927 0,951 0,969 0,982 0,990 0,995 0,998 0,999

1000 230000 0,989 0,995 0,998 0,999 1,000 1,000 1,000 1,000 1,000

Graf 11: Srovnání lineárního a exponenciálního trendu 0

10000 20000 30000 40000 50000 60000

0 5 10 15 20 25

λ

Čas

Vzorky A a B

Expon. (Vzorek A - B) Lineární (Vzorek A - B)