• No results found

6.2 Kodning och brusreducering

6.2.2 Autentisk data

I en bild genererad med en vanlig kamera kommer ljusstyrkan f¨or en given punkt eller pixel vara proportionell mot antalet fotoner som tr¨affar motsvarande sensor- element. Detta antal kommer p˚a grund av fotonernas slumpm¨assiga natur alltid ge upphov till en viss grad av brus i bilden. Detta brus ¨ar vanligtvis f¨orsumbart, men ¨ar bilden tagen med kort slutartid och i d˚aligt ljusf¨orh˚allande kommer antalet fotoner vara mycket l˚agt och dess varians d¨arf¨or h¨og i f¨orh˚allande till dess v¨antev¨arde. Detta i sin tur kommer oundvikligen ge upphov till brusniv˚aer som ¨ar s˚a h¨oga att de inte l¨angre kan f¨orsummas. I f¨oljande avsnitt j¨amf¨ors en vektorkvantiserares och

46 Resultat

128

256

512

(a) (b)

Figur 6.9.Vektorkvantisering av bild brusreducerad genom tr¨oskling i waveletdom¨anen. Kolumn (a) och (b) nyttjar blockstorlek 4 × 4 resp. 4 × 4 × 2. Kodboksstorlek uppifr˚an och ner: 128, 256, 512.

en MPEG-4-kodares prestanda f¨or bilddata av denna typ.

Den anv¨anda bildsekvensen ¨ar inspelad nattetid med hj¨alp av en bildf¨orst¨arkare. Vektorkvantiseringstekniken beskriven i avsnitt 6.2.1 ¨ar avsedd f¨or brus med me- delv¨arde noll och bildsekvensen m˚aste d¨arf¨or genomg˚a ett par f¨orbehandlingssteg innan den kvantiseras. Den obehandlade bilden kan ses i fig. 6.11a. Som synes finns h¨ar brus i form av ett f˚atal pixlar stora fl¨ackar som ¨ar mycket starkare ¨an sin om-

6.2 Kodning och brusreducering 47

128

256

512

Figur 6.10.Vektorkvantisering av bild brusreducerad genom tr¨oskling i waveletdom¨anen. Blockstorlek 4 × 4 × 3. Kodboksstorlek uppifr˚an och ner: 128, 256, 512.

givning. F¨or att eliminera dessa har medianv¨ardet i varje lokal 5× 5-omgivning ber¨aknats. D˚a centrumpixeln ¨overskrider detta v¨arde med mer ¨an en given tr¨oskel antas den best˚a av brus och dess v¨arde s¨atts till medianv¨ardet. I fig 6.11b ses en bild d¨ar brus av denna typ eliminerats. Bilden har d¨arefter f¨orst¨arkts s˚a att sekvensens maxv¨arde f˚ar beloppet 255 (vitt).

En ytterligare st¨orning som kan p˚averka kodningen negativt blir nu tydlig; bilden tycks inneh˚alla ett horisontellt linjem¨onster som f¨ormodligen uppkommit p˚a grund av brister i elektroniken. I detta fall kan problemet korrigeras genom

48 Resultat

antagandet att en radvis summering av bilden kommer variera kontinuerligt. I fig. 6.11c ses ett diagram ¨over summans variation ¨over bilden. Genom att l˚agpassfiltrera denna funktion s˚a att den i figuren tydliga h¨ogfrekventa sv¨angningen f¨orsvinner, kan den ¨onskade variationen best¨ammas och d¨arefter uppn˚as genom att addera ett l¨ampligt v¨arde f¨or alla pixlar i en rad. I fig. 6.11c och d kan summan efter korrigering resp. bildens slutliga utseendet ses.

(a) (b) 0 50 100 150 200 250 300 1.5 1.6 1.7 1.8 1.9 2 2.1 2.2 2.3 2.4 2.5x 10 4 (c ) (d)

Figur 6.11.(a) Den ursprungliga obehandlade bilden (b) F¨orst¨arkt bild med salt- och pepparbrus borttaget. (c) Radvis summering av bild. Tunn och streckad linje visar f¨ore resp. efter behandling (d) F¨ardigbehandlad bild.

F¨or MPEG-4-kodning anv¨ands en implementation fr˚an MoMuSys (se [22]). Kvantiseringsniv˚aer har valts s˚a att en slutlig bittakt p˚a ca 0.5 bit/pixel uppn˚as. F¨or vektorkvantisering har endast metoden i avsnitt 6.2.1 anv¨ants. Detta d˚a NLIVQ kr¨aver par av rena och brusiga bilder vilket inte ¨ar m¨ojligt i detta fall. Wavelet- metoden bed¨oms utifr˚an tidigare resultat som mindre intressant. Block- och kod- boksstorlek har valts till 4× 4 × 2 resp. 256 f¨or att uppn˚a bittakten 0.5 bit/pixel. D˚a inget brusfritt tr¨aningsmaterial som p˚aminner om den sekvens som skall kodas ¨

ar tillg¨angligt har samma tr¨aningsdata som i f¨oreg˚aende avsnitt utnyttjats. I fig. 6.12 kan resultatet efter kodning ses. Det blir h¨ar tydligt att MPEG-

6.2 Kodning och brusreducering 49

4-kodaren har problem att hantera bruset. Detta yttrar sig fr¨amst som block med falska h¨ogfrekventa komponenter. Speciellt tydligt blir detta i sekvensens f¨orsta bild som kodats helt frist˚aende. I senare bildrutor utnyttjar MPEG-kodaren r¨orelseprediktering vilket medf¨or en viss d¨ampning av bruset. Vektorkvantisera- ren lider inte av dessa problem i samma utsstr¨ackning och trycker b¨attre ner det h¨ogfrekventa bruset, utan f¨or den skull f¨orlora sin f¨orm˚aga att hantera kanter (vil- ket i denna sekvens tydligast kan ses p˚a den m¨orka stenen i n¨arheten av bildens centrum). I den vektorkvantiserade sekvensen kan dock andra blockartefakter ses. M˚anga block inneh˚aller exempelvis kantstrukturer som inte f¨orekommer i original- bilden. D˚a sekvensen studeras i r¨orelse blir skillnaderna mellan de olika kodnings- metoderna mindre tydlig. Trots detta kan den vektorkvantiserade sekvensen anses som den fr¨amsta p˚a grund av det p˚atagliga h¨ogfrekventa flimmer som f¨orekommer i den MPEG-kodade sekvensen.

50 Resultat

(a) (b)

(c ) (d)

(e) (f)

(g) (h)

Figur 6.12. Sekvensens f¨orsta bild (a) vektorkvantiserad, 0.5 bit/pixel. (b) MPEG4- kodad (I-frame), 0.78 bit/pixel. Sekvensens andra bild (c) vektorkvantiserad, 0.5 bit/pixel. (d) MPEG-4-kodad (P-frame), 0.5 bit/pixel. Detalj ur sekvensen (e) okomprimerad, (f) vektorkvantiserad, (g) MPEG-4-kodad (I-frame), (h) MPEG-4-kodad (P-frame).

Kapitel 7

Slutsatser

Resultaten i f¨oreg˚aende kapitel visar att en v¨al anv¨and vektorkvantiserare ¨ar ett bra alternativ vid kompression av brusig bilddata. Skillnaden mellan de olika tekniker som beskrivits ¨ar dock stor.

Givet dess f¨oruts¨attningar ¨ar det inte ov¨antat att waveletmetoden ¨ar den teknik som ger s¨amst resultat. Dels utnyttjar metoden inte n˚agon temporal information utan brusreduceringen sker f¨or varje enskild bildruta. Dessutom tr¨anas vektorkvan- tiseraren p˚a den data som d¨arefter skall kvantiseras och ingen kunskap om hur typiska brusfria bilder ser ut utnyttjas d¨arf¨or. M¨ojligen kan ett b¨attre resultat uppn˚as om en mer avancerad tr¨oskel anv¨ands, men n˚agra stora skillnader kan ej v¨antas. D˚a metoden ¨ar en av de f˚a metoder f¨or kompression av brusig data be- skrivna i litteraturen, d¨ar vektorkvantisering har en grundl¨aggande funktion, har det varit naturligt att utv¨ardera denna. Det finns dock anledning att ifr˚agas¨atta anv¨andningen av vektorkvantisering i detta fall. En egenskap hos waveletuppelning- en ¨ar att det finns en korrelation mellan de olika stegen. Detta utnyttjas exempelvis i kodningstekniken EZW (Embedded Zerotree Coder, se [26]) och det vore d¨arf¨or naturligt att se vad en kodare av denna typ ger f¨or prestanda.

Ett b¨attre resultat f˚as genom NLIVQ. Metoden utnyttjar dels kunskap om ren data, men ¨aven hur motsvarande brusiga data ser ut. Mycket riktigt ¨ar ocks˚a metoden den som b¨ast undertrycker bruset, vilket b˚ade SNR och visuella utseendet vittnar om. Tyv¨arr medf¨or detta tydliga blockartefakter och d˚alig hantering av r¨orelse. Ytterligare problem uppst˚ar d˚a metoden skall till¨ampas i praktiken. F¨or att kunna generera en kodbok kr¨avs parvisa brusiga resp. brusfria bilder, vilka kan vara mycket sv˚ara att ta fram. Ett alternativ kan vara att med n˚agon passande teknik brusreducera en typisk sekvens och l˚ata denna utg¨ora brusfri tr¨aningsdata. I detta fall ¨ar det mindre viktigt om brusreduceringen ¨ar ber¨akningstung, d˚a utf¨orandet sker endast en g˚ang.

I m˚anga fall kan den enklaste metoden, som best˚ar av vanlig vektorkvantisering d¨ar kodboken genererats utifr˚an brusfria bilder, betraktas som den fr¨amsta. Brus- niv˚an kan anses t¨amligen h¨og, men ¨and˚a avsev¨art reducerad. Kanter och linjer ¨

ar vanligtvis bevarade och de blockartefakter som uppkommer ¨ar mindre fram- 51

52 Slutsatser

tr¨adande ¨an i NLIVQ-fallet. ¨Aven r¨orelse kan hanteras bra d˚a tr¨aningsdata med liknande r¨orelser anv¨ants. Sett till SNR-v¨arde ¨ar dock denna metod s¨amre ¨an b˚ade NLIVQ- och waveletmetoden. Att hitta ett l¨ampligt felm˚att ¨ar alltid ett problem inom bildkodning, men d˚a brusig data anv¨ands blir detta ¨an mer tydligt. Brusre- ducering inverkar mycket kraftigt p˚a SNR-v¨ardet och det uppst˚ar d¨arf¨or en d˚alig balans mellan brusniv˚an och bevarandet av viktiga bildstrukturer.

En j¨amf¨orelse med MPEG-4 visar att den enkla vektorkvantiseraren har klara f¨ordelar vid h¨oga brusniv˚aer. Bruset blir signifikant reducerat och de blockarte- fakter som uppkommer ¨ar mindre framtr¨adande ¨an de f¨or MPEG-kodaren. Vidare hanteras tydliga kanter och linjer i allm¨anhet b¨attre av vektorkvantiseraren j¨amf¨ort med MPEG-4-kodaren d¨ar dylika strukturer i allm¨anhet f˚ar ett suddigt utseende. Ytterligare en f¨ordel ¨ar fixl¨angdskodningen som ger en robust datastr¨om mindre k¨anslig mot st¨orningar.

7.1

F¨orslag till framtida f¨orb¨attringar

Ett problem vid generering av kodbok ¨ar att tr¨aningsm¨angden b¨or ha liknande egenskaper som den data som d¨arefter skall kodas. En naturlig utveckling vore d¨arf¨or att skapa en tr¨aningsupps¨attning som ger upphov till en generell kodbok. Vad som kr¨avs ¨ar bildsekvenser som inneh˚aller linjer, kanter, toningar och andra strukturer vid alla m¨ojliga vinklar och r¨orelser. Detta kr¨aver en del arbete, men vore f¨ormodligen fullt m¨ojligt.

Vidare vore en ¨okning av blockstorlek ¨onskv¨ard. I resultaten ses att block av storlek 8× 8 ger mycket svagt resultat. M¨ojligen skulle en st¨orre tr¨aningsm¨angd och kodbok m¨ojligg¨ora block av ¨aven denna storlek. I [30] studeras vektorkvanti- sering med block av denna storlek med goda resultat som f¨oljd. H¨ar anv¨ands dock sekvenserna som skall kodas ¨aven som tr¨aningsdata, vilket naturligvis underl¨attar problemet avsev¨art.

Litteraturf¨orteckning

[1] C. Bei and R. M. Gray. An improvement of the minimum distortion encoding algorithm for vector quantization. IEEE Transactions on Communications, COM-33(10):1132–1133, Oct. 1985.

[2] S. G. Chang, B. Yu, and M. Vetterli. Image denoising via lossy compression and wavelet thresholding. IEEE International Conference on Image Processing, 1:604–607, Nov. 1997.

[3] S. G. Chang, B. Yu, and M. Vetterli. Adaptive wavelet thresholdning for image denoising and compression. IEEE Transactions on Image Processing, 9(9):1532–1546, Sep. 2000.

[4] J. A. Corral, M. Guerrero, and P. J. Zufiria. Image compression via optimal vector quantization: a comparision between SOM, LBG and k-means algo- rithms. IEEE International Conference on Neural Networks, 6:4113–4118, 1994.

[5] P. C. Cosman, K. L. Oehler, E. A. Riskin, and R.M. Gray. Using vector quantization for image processing. Proceedings of the IEEE, 81(9):1326–41, Sep. 1993.

[6] D. L. Donoho and I. M. Johnstone. Ideal spatial adaptation by wavelet shrin- kage. Biometrika, 81:425–455, 1994.

[7] Y. Ephraim and R. M. Gray. A unified approach for encoding clean and noisy sources by means of waveform and autoregressive model vector quantization. IEEE Transactions on Information Theory, 34(4), Jul. 1988.

[8] C. Foucher, D. Le Guennec, and G. Vaucher. Fast image vector quantization with self-organizing maps. In VIIP 2002, IASTED International Conference Visualization, Imaging and Image Processing, 2002.

[9] A. Gersho. Optimal nonlinear interpolative vector quantization. IEEE Trans- actions on Communications, 38(9):1285–87, Sep. 1990.

[10] A. Gersho and R. M. Gray. Vector Quantization and Signal Compression. Kluwer Academic Publishers, 1992.

54 LITTERATURF ¨ORTECKNING

[11] M. Gra˜na and I. Echave. VQ based Bayesian image filtering. In Proceedings. International Conference on Image Processing, 2000.

[12] R. M. Gray and D. L. Neuhoff. Quantization. IEEE Transactions on Infor- mation theory, 44(6), Oct. 1998.

[13] S. Haykin. Neural networks: a comprehensive foundation. Prentice-Hall, 2nd edition, 1999.

[14] N. B. Karayiannis and P. Pai. Fuzzy vector quantization algorithms and their application in image compression. IEEE Transactions on Image Processing, 4(9), Sep. 1995.

[15] T. Kohonen. Self-organized formation of topologically correct feature maps. Biological Cybernetics, 43:59–69, 1982.

[16] T. Kohonen. The self-organizing map. Proceedings of the IEEE, 78(9), 1990. [17] T. Kohonen. Self-Organizing Maps. Springer-Verlag, 2nd edition, 1997. [18] C. Lee and L. Chen. A fast search algoritm for vector quantization using mean

pyramids of codewords. IEEE Transactions on Communications, 43(234), 1995.

[19] Y. Linde, A. Buzo, and R. M. Gray. An algorithm for vector quantizer design. IEEE Transactions on Communications, COM-28(1):84–95, Jan. 1980. [20] S.P. Lloyd. Least squares quantization in PCM. IEEE Transactions on Infor-

mation theory, IT-28:127–135, Mar. 1982.

[21] N. M. Nasrabadi and R. A. King. Image coding using vector quantization: A review. IEEE Transactions on Communication, 36(8), Aug. 1988.

[22] International Standards Organization. ISO/IEC 14496-5:2000 Information te- chnology - coding of audio/visual objects - part 5:Reference software, 2000. [23] K. Panchapakesan, A. Bilgin, D. G. Sheppard, B. R. Hunt, and M. W. Mar-

cellin. Simultaneous compression and denoising of imagery using non-linear interpolative vector quantization. In Proceedings of eighth IEEE Digital Signal Processing Workshop, Aug. 1998.

[24] K. Rose. Vector quantization by deterministic annealing. IEEE Transactions on Communications, 38(4):1249–1257, 1992.

[25] K. Rose. Deterministic annealing for clustering, compression, classification, regression, and related optimization problems. Proceedings of the IEEE, 86(11), Nov. 1998.

[26] J.M. Shapiro. Embedded image coding using zerotrees of wavelet coefficients. IEEE Transactions on Signal Processing, 41:3445–3462, Dec. 1993.

LITTERATURF ¨ORTECKNING 55

[27] D. G. Sheppard, A. Bilgin, M. S. Nadar, B. R. Hunt, and M. W. Marcel- lin. A vector quantizer for image restoration. IEEE Transactions on Image Processing, 7(1):119–124, Jan. 1998.

[28] G. Strang and T. Nguyen. Wavelets and filter banks. Wellesley-Cambridge Press, 1996.

[29] L. Torres and J. Huguet. An improvement on codebook search for vector quantization. IEEE Transactions on Communications, 42(234):208–210, 1994. [30] J. W. Woods and Z. Zhong. Large block VQ for image sequences. Image

Processing and its Applications, 465, 1999.

[31] L. Yibing, J. Tao, and Lou Zhe. A novel coding method based on triangular fuzzy vector quantization. Proceedings of SPIE, 4551, 1998.

På svenska

Detta dokument hålls tillgängligt på Internet – eller dess framtida ersättare –

under en längre tid från publiceringsdatum under förutsättning att inga extra-

ordinära omständigheter uppstår.

Tillgång till dokumentet innebär tillstånd för var och en att läsa, ladda ner,

skriva ut enstaka kopior för enskilt bruk och att använda det oförändrat för

ickekommersiell forskning och för undervisning. Överföring av upphovsrätten

vid en senare tidpunkt kan inte upphäva detta tillstånd. All annan användning av

dokumentet kräver upphovsmannens medgivande. För att garantera äktheten,

säkerheten och tillgängligheten finns det lösningar av teknisk och administrativ

art.

Upphovsmannens ideella rätt innefattar rätt att bli nämnd som upphovsman i

den omfattning som god sed kräver vid användning av dokumentet på ovan

beskrivna sätt samt skydd mot att dokumentet ändras eller presenteras i sådan

form eller i sådant sammanhang som är kränkande för upphovsmannens litterära

eller konstnärliga anseende eller egenart.

För ytterligare information om Linköping University Electronic Press se

förlagets hemsida http://www.ep.liu.se/

In English

The publishers will keep this document online on the Internet - or its possible

replacement - for a considerable time from the date of publication barring

exceptional circumstances.

The online availability of the document implies a permanent permission for

anyone to read, to download, to print out single copies for your own use and to

use it unchanged for any non-commercial research and educational purpose.

Subsequent transfers of copyright cannot revoke this permission. All other uses

of the document are conditional on the consent of the copyright owner. The

publisher has taken technical and administrative measures to assure authenticity,

security and accessibility.

According to intellectual property law the author has the right to be

mentioned when his/her work is accessed as described above and to be protected

against infringement.

For additional information about the Linköping University Electronic Press

and its procedures for publication and for assurance of document integrity,

please refer to its WWW home page: http://www.ep.liu.se/

Related documents