Autentisk data

6.2 Kodning och brusreducering

6.2.2 Autentisk data

I en bild genererad med en vanlig kamera kommer ljusstyrkan för en given punkt eller pixel vara proportionell mot antalet fotoner som träffar motsvarande sensor- element. Detta antal kommer p˚a grund av fotonernas slumpmässiga natur alltid ge upphov till en viss grad av brus i bilden. Detta brus är vanligtvis försumbart, men är bilden tagen med kort slutartid och i d˚aligt ljusförh˚allande kommer antalet fotoner vara mycket l˚agt och dess varians därför hög i förh˚allande till dess väntevärde. Detta i sin tur kommer oundvikligen ge upphov till brusniv˚aer som är s˚a höga att de inte längre kan försummas. I följande avsnitt jämförs en vektorkvantiserares och

46 Resultat

128

256

512

(a) (b)

Figur 6.9.Vektorkvantisering av bild brusreducerad genom tr¨oskling i waveletdom¨anen. Kolumn (a) och (b) nyttjar blockstorlek 4 × 4 resp. 4 × 4 × 2. Kodboksstorlek uppifr˚an och ner: 128, 256, 512.

en MPEG-4-kodares prestanda f¨or bilddata av denna typ.

Den använda bildsekvensen är inspelad nattetid med hjälp av en bildförstärkare. Vektorkvantiseringstekniken beskriven i avsnitt 6.2.1 är avsedd för brus med me- delvärde noll och bildsekvensen m˚aste därför genomg˚a ett par förbehandlingssteg innan den kvantiseras. Den obehandlade bilden kan ses i fig. 6.11a. Som synes finns här brus i form av ett f˚atal pixlar stora fläckar som är mycket starkare än sin om-

6.2 Kodning och brusreducering 47

128

256

512

Figur 6.10.Vektorkvantisering av bild brusreducerad genom tr¨oskling i waveletdom¨anen. Blockstorlek 4 × 4 × 3. Kodboksstorlek uppifr˚an och ner: 128, 256, 512.

givning. För att eliminera dessa har medianvärdet i varje lokal 5× 5-omgivning beräknats. D˚a centrumpixeln överskrider detta värde med mer än en given tröskel antas den best˚a av brus och dess värde sätts till medianvärdet. I fig 6.11b ses en bild där brus av denna typ eliminerats. Bilden har därefter förstärkts s˚a att sekvensens maxvärde f˚ar beloppet 255 (vitt).

En ytterligare störning som kan p˚averka kodningen negativt blir nu tydlig; bilden tycks inneh˚alla ett horisontellt linjemönster som förmodligen uppkommit p˚a grund av brister i elektroniken. I detta fall kan problemet korrigeras genom

48 Resultat

antagandet att en radvis summering av bilden kommer variera kontinuerligt. I fig. 6.11c ses ett diagram över summans variation över bilden. Genom att l˚agpassfiltrera denna funktion s˚a att den i figuren tydliga högfrekventa svängningen försvinner, kan den önskade variationen bestämmas och därefter uppn˚as genom att addera ett lämpligt värde för alla pixlar i en rad. I fig. 6.11c och d kan summan efter korrigering resp. bildens slutliga utseendet ses.

(a) (b) 0 50 100 150 200 250 300 1.5 1.6 1.7 1.8 1.9 2 2.1 2.2 2.3 2.4 2.5x 10 4 (c ) (d)

Figur 6.11.(a) Den ursprungliga obehandlade bilden (b) Förstärkt bild med salt- och pepparbrus borttaget. (c) Radvis summering av bild. Tunn och streckad linje visar före resp. efter behandling (d) Färdigbehandlad bild.

För MPEG-4-kodning används en implementation fr˚an MoMuSys (se [22]). Kvantiseringsniv˚aer har valts s˚a att en slutlig bittakt p˚a ca 0.5 bit/pixel uppn˚as. För vektorkvantisering har endast metoden i avsnitt 6.2.1 använts. Detta d˚a NLIVQ kräver par av rena och brusiga bilder vilket inte är möjligt i detta fall. Wavelet- metoden bedöms utifr˚an tidigare resultat som mindre intressant. Block- och kodboksstorlek har valts till 4× 4 × 2 resp. 256 för att uppn˚a bittakten 0.5 bit/pixel. D˚a inget brusfritt träningsmaterial som p˚aminner om den sekvens som skall kodas ¨

ar tillgängligt har samma träningsdata som i föreg˚aende avsnitt utnyttjats. I fig. 6.12 kan resultatet efter kodning ses. Det blir här tydligt att MPEG-

6.2 Kodning och brusreducering 49

4-kodaren har problem att hantera bruset. Detta yttrar sig främst som block med falska högfrekventa komponenter. Speciellt tydligt blir detta i sekvensens första bild som kodats helt frist˚aende. I senare bildrutor utnyttjar MPEG-kodaren rörelseprediktering vilket medför en viss dämpning av bruset. Vektorkvantisera- ren lider inte av dessa problem i samma utssträckning och trycker bättre ner det högfrekventa bruset, utan för den skull förlora sin förm˚aga att hantera kanter (vilket i denna sekvens tydligast kan ses p˚a den mörka stenen i närheten av bildens centrum). I den vektorkvantiserade sekvensen kan dock andra blockartefakter ses. M˚anga block inneh˚aller exempelvis kantstrukturer som inte förekommer i original- bilden. D˚a sekvensen studeras i rörelse blir skillnaderna mellan de olika kodnings- metoderna mindre tydlig. Trots detta kan den vektorkvantiserade sekvensen anses som den främsta p˚a grund av det p˚atagliga högfrekventa flimmer som förekommer i den MPEG-kodade sekvensen.

50 Resultat

(a) (b)

(c ) (d)

(e) (f)

(g) (h)

Figur 6.12. Sekvensens f¨orsta bild (a) vektorkvantiserad, 0.5 bit/pixel. (b) MPEG4- kodad (I-frame), 0.78 bit/pixel. Sekvensens andra bild (c) vektorkvantiserad, 0.5 bit/pixel. (d) MPEG-4-kodad (P-frame), 0.5 bit/pixel. Detalj ur sekvensen (e) okomprimerad, (f) vektorkvantiserad, (g) MPEG-4-kodad (I-frame), (h) MPEG-4-kodad (P-frame).

Kapitel 7

Slutsatser

Resultaten i föreg˚aende kapitel visar att en väl använd vektorkvantiserare är ett bra alternativ vid kompression av brusig bilddata. Skillnaden mellan de olika tekniker som beskrivits är dock stor.

Givet dess förutsättningar är det inte oväntat att waveletmetoden är den teknik som ger sämst resultat. Dels utnyttjar metoden inte n˚agon temporal information utan brusreduceringen sker för varje enskild bildruta. Dessutom tränas vektorkvantiseraren p˚a den data som därefter skall kvantiseras och ingen kunskap om hur typiska brusfria bilder ser ut utnyttjas därför. Möjligen kan ett bättre resultat uppn˚as om en mer avancerad tröskel används, men n˚agra stora skillnader kan ej väntas. D˚a metoden är en av de f˚a metoder för kompression av brusig data beskrivna i litteraturen, där vektorkvantisering har en grundläggande funktion, har det varit naturligt att utvärdera denna. Det finns dock anledning att ifr˚agasätta användningen av vektorkvantisering i detta fall. En egenskap hos waveletuppelning- en är att det finns en korrelation mellan de olika stegen. Detta utnyttjas exempelvis i kodningstekniken EZW (Embedded Zerotree Coder, se [26]) och det vore därför naturligt att se vad en kodare av denna typ ger för prestanda.

Ett bättre resultat f˚as genom NLIVQ. Metoden utnyttjar dels kunskap om ren data, men även hur motsvarande brusiga data ser ut. Mycket riktigt är ocks˚a metoden den som bäst undertrycker bruset, vilket b˚ade SNR och visuella utseendet vittnar om. Tyvärr medför detta tydliga blockartefakter och d˚alig hantering av rörelse. Ytterligare problem uppst˚ar d˚a metoden skall tillämpas i praktiken. För att kunna generera en kodbok krävs parvisa brusiga resp. brusfria bilder, vilka kan vara mycket sv˚ara att ta fram. Ett alternativ kan vara att med n˚agon passande teknik brusreducera en typisk sekvens och l˚ata denna utgöra brusfri träningsdata. I detta fall är det mindre viktigt om brusreduceringen är beräkningstung, d˚a utförandet sker endast en g˚ang.

I m˚anga fall kan den enklaste metoden, som best˚ar av vanlig vektorkvantisering där kodboken genererats utifr˚an brusfria bilder, betraktas som den främsta. Brus- niv˚an kan anses tämligen hög, men änd˚a avsevärt reducerad. Kanter och linjer ¨

ar vanligtvis bevarade och de blockartefakter som uppkommer ¨ar mindre fram- 51

52 Slutsatser

trädande än i NLIVQ-fallet. Även rörelse kan hanteras bra d˚a träningsdata med liknande rörelser använts. Sett till SNR-värde är dock denna metod sämre än b˚ade NLIVQ- och waveletmetoden. Att hitta ett lämpligt felm˚att är alltid ett problem inom bildkodning, men d˚a brusig data används blir detta än mer tydligt. Brusre- ducering inverkar mycket kraftigt p˚a SNR-värdet och det uppst˚ar därför en d˚alig balans mellan brusniv˚an och bevarandet av viktiga bildstrukturer.

En jämförelse med MPEG-4 visar att den enkla vektorkvantiseraren har klara fördelar vid höga brusniv˚aer. Bruset blir signifikant reducerat och de blockartefakter som uppkommer är mindre framträdande än de för MPEG-kodaren. Vidare hanteras tydliga kanter och linjer i allmänhet bättre av vektorkvantiseraren jämfört med MPEG-4-kodaren där dylika strukturer i allmänhet f˚ar ett suddigt utseende. Ytterligare en fördel är fixlängdskodningen som ger en robust dataström mindre känslig mot störningar.

7.1 Förslag till framtida förbättringar

Ett problem vid generering av kodbok är att träningsmängden bör ha liknande egenskaper som den data som därefter skall kodas. En naturlig utveckling vore därför att skapa en träningsuppsättning som ger upphov till en generell kodbok. Vad som krävs är bildsekvenser som inneh˚aller linjer, kanter, toningar och andra strukturer vid alla möjliga vinklar och rörelser. Detta kräver en del arbete, men vore förmodligen fullt möjligt.

Vidare vore en ökning av blockstorlek önskvärd. I resultaten ses att block av storlek 8× 8 ger mycket svagt resultat. Möjligen skulle en större träningsmängd och kodbok möjliggöra block av även denna storlek. I [30] studeras vektorkvantisering med block av denna storlek med goda resultat som följd. Här används dock sekvenserna som skall kodas även som träningsdata, vilket naturligvis underlättar problemet avsevärt.

Litteraturf¨orteckning

[1] C. Bei and R. M. Gray. An improvement of the minimum distortion encoding algorithm for vector quantization. IEEE Transactions on Communications, COM-33(10):1132–1133, Oct. 1985.

[2] S. G. Chang, B. Yu, and M. Vetterli. Image denoising via lossy compression and wavelet thresholding. IEEE International Conference on Image Processing, 1:604–607, Nov. 1997.

[3] S. G. Chang, B. Yu, and M. Vetterli. Adaptive wavelet thresholdning for image denoising and compression. IEEE Transactions on Image Processing, 9(9):1532–1546, Sep. 2000.

[4] J. A. Corral, M. Guerrero, and P. J. Zufiria. Image compression via optimal vector quantization: a comparision between SOM, LBG and k-means algorithms. IEEE International Conference on Neural Networks, 6:4113–4118, 1994.

[5] P. C. Cosman, K. L. Oehler, E. A. Riskin, and R.M. Gray. Using vector quantization for image processing. Proceedings of the IEEE, 81(9):1326–41, Sep. 1993.

[6] D. L. Donoho and I. M. Johnstone. Ideal spatial adaptation by wavelet shrin- kage. Biometrika, 81:425–455, 1994.

[7] Y. Ephraim and R. M. Gray. A unified approach for encoding clean and noisy sources by means of waveform and autoregressive model vector quantization. IEEE Transactions on Information Theory, 34(4), Jul. 1988.

[8] C. Foucher, D. Le Guennec, and G. Vaucher. Fast image vector quantization with self-organizing maps. In VIIP 2002, IASTED International Conference Visualization, Imaging and Image Processing, 2002.

[9] A. Gersho. Optimal nonlinear interpolative vector quantization. IEEE Trans- actions on Communications, 38(9):1285–87, Sep. 1990.

[10] A. Gersho and R. M. Gray. Vector Quantization and Signal Compression. Kluwer Academic Publishers, 1992.

54 LITTERATURF ¨ORTECKNING

[11] M. Gra˜na and I. Echave. VQ based Bayesian image filtering. In Proceedings. International Conference on Image Processing, 2000.

[12] R. M. Gray and D. L. Neuhoff. Quantization. IEEE Transactions on Infor- mation theory, 44(6), Oct. 1998.

[13] S. Haykin. Neural networks: a comprehensive foundation. Prentice-Hall, 2nd edition, 1999.

[14] N. B. Karayiannis and P. Pai. Fuzzy vector quantization algorithms and their application in image compression. IEEE Transactions on Image Processing, 4(9), Sep. 1995.

[15] T. Kohonen. Self-organized formation of topologically correct feature maps. Biological Cybernetics, 43:59–69, 1982.

[16] T. Kohonen. The self-organizing map. Proceedings of the IEEE, 78(9), 1990. [17] T. Kohonen. Self-Organizing Maps. Springer-Verlag, 2nd edition, 1997. [18] C. Lee and L. Chen. A fast search algoritm for vector quantization using mean

pyramids of codewords. IEEE Transactions on Communications, 43(234), 1995.

[19] Y. Linde, A. Buzo, and R. M. Gray. An algorithm for vector quantizer design. IEEE Transactions on Communications, COM-28(1):84–95, Jan. 1980. [20] S.P. Lloyd. Least squares quantization in PCM. IEEE Transactions on Infor-

mation theory, IT-28:127–135, Mar. 1982.

[21] N. M. Nasrabadi and R. A. King. Image coding using vector quantization: A review. IEEE Transactions on Communication, 36(8), Aug. 1988.

[22] International Standards Organization. ISO/IEC 14496-5:2000 Information te- chnology - coding of audio/visual objects - part 5:Reference software, 2000. [23] K. Panchapakesan, A. Bilgin, D. G. Sheppard, B. R. Hunt, and M. W. Mar-

cellin. Simultaneous compression and denoising of imagery using non-linear interpolative vector quantization. In Proceedings of eighth IEEE Digital Signal Processing Workshop, Aug. 1998.

[24] K. Rose. Vector quantization by deterministic annealing. IEEE Transactions on Communications, 38(4):1249–1257, 1992.

[25] K. Rose. Deterministic annealing for clustering, compression, classification, regression, and related optimization problems. Proceedings of the IEEE, 86(11), Nov. 1998.

[26] J.M. Shapiro. Embedded image coding using zerotrees of wavelet coefficients. IEEE Transactions on Signal Processing, 41:3445–3462, Dec. 1993.

LITTERATURF ¨ORTECKNING 55

[27] D. G. Sheppard, A. Bilgin, M. S. Nadar, B. R. Hunt, and M. W. Marcel- lin. A vector quantizer for image restoration. IEEE Transactions on Image Processing, 7(1):119–124, Jan. 1998.

[28] G. Strang and T. Nguyen. Wavelets and filter banks. Wellesley-Cambridge Press, 1996.

[29] L. Torres and J. Huguet. An improvement on codebook search for vector quantization. IEEE Transactions on Communications, 42(234):208–210, 1994. [30] J. W. Woods and Z. Zhong. Large block VQ for image sequences. Image

Processing and its Applications, 465, 1999.

[31] L. Yibing, J. Tao, and Lou Zhe. A novel coding method based on triangular fuzzy vector quantization. Proceedings of SPIE, 4551, 1998.

6.2 Kodning och brusreducering

6.2.2 Autentisk data

Kapitel 7

Slutsatser

7.1

Förslag till framtida förbättringar

Litteraturf¨orteckning

På svenska

Detta dokument hålls tillgängligt på Internet – eller dess framtida ersättare –

under en längre tid från publiceringsdatum under förutsättning att inga extra-

ordinära omständigheter uppstår.

Tillgång till dokumentet innebär tillstånd för var och en att läsa, ladda ner,

skriva ut enstaka kopior för enskilt bruk och att använda det oförändrat för

ickekommersiell forskning och för undervisning. Överföring av upphovsrätten

vid en senare tidpunkt kan inte upphäva detta tillstånd. All annan användning av

dokumentet kräver upphovsmannens medgivande. För att garantera äktheten,

säkerheten och tillgängligheten finns det lösningar av teknisk och administrativ

art.

Upphovsmannens ideella rätt innefattar rätt att bli nämnd som upphovsman i

den omfattning som god sed kräver vid användning av dokumentet på ovan

beskrivna sätt samt skydd mot att dokumentet ändras eller presenteras i sådan

form eller i sådant sammanhang som är kränkande för upphovsmannens litterära

eller konstnärliga anseende eller egenart.

För ytterligare information om Linköping University Electronic Press se

förlagets hemsida http://www.ep.liu.se/

In English

The publishers will keep this document online on the Internet - or its possible

replacement - for a considerable time from the date of publication barring

exceptional circumstances.

The online availability of the document implies a permanent permission for

anyone to read, to download, to print out single copies for your own use and to

use it unchanged for any non-commercial research and educational purpose.

Subsequent transfers of copyright cannot revoke this permission. All other uses

of the document are conditional on the consent of the copyright owner. The

publisher has taken technical and administrative measures to assure authenticity,

security and accessibility.

According to intellectual property law the author has the right to be

mentioned when his/her work is accessed as described above and to be protected

against infringement.

For additional information about the Linköping University Electronic Press

and its procedures for publication and for assurance of document integrity,

please refer to its WWW home page: http://www.ep.liu.se/