Image Compression based on Perceptual Coding Techniques

dc.contributor
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.contributor.author
Casas Pla, Josep Ramon
dc.date.accessioned
2011-04-12T15:27:26Z
dc.date.available
2009-01-15
dc.date.issued
1996-03-29
dc.date.submitted
2009-01-15
dc.identifier.isbn
9788469213377
dc.identifier.uri
http://www.tdx.cat/TDX-0115109-100648
dc.identifier.uri
http://hdl.handle.net/10803/6920
dc.description.abstract
En aquesta tesi s'estudien els mètodes de codi&#64257;cació d'imatges i seqüències de vídeo des del punt de vista de la forma en què el sistema visual humà percep i entén la informació visual. La rellevància d'aquest estudi ve donada pel paper tan important que tenen els senyals d'imatge en la civilització actual i pel gran volum de dades que representen les fonts d'informació visual pels sistemes que les han de processar. <br/>S'han estudiat tres aproximacions per a la codi&#64257;cació de textures en un esquema avançat de compressió fonamentat en aspectes de percepció visual. La primera aproximació es basa en les transicions de la imatge i estudia la interpolació d'àrees suaus a partir de les esmentades transicions. La segona contempla l'extracció, selecció i codi&#64257;cació de detalls signi&#64257;catius per al sistema visual humà. <br/>Finalment, la tercera aproximació estudia la representació eficient de les textures fines i homogènies, que donen una aparença natural a les imatges sintetitzades aconseguint elevades tasses de compressió. Per a l'aplicació d'aquestes tècniques a la codi&#64257;cació d'imatge i vídeo, es proposa un model d'imatge de tres components adaptat a les característiques perceptuals de la visió humana.<br/>Les aproximacions de codi&#64257;cació objecte de l'estudi han portat al disseny de tècniques noves d'anàlisi i codi&#64257;cació d'imatge. A partir d'eines no lineals de tractament obtingudes de l'entorn de la Morfologia Matemàtica, s'han desenvolupat tres tècniques de codi&#64257;cació de textures. En concret,<br/><br/>- Un mètode d'interpolació "morfològica" orientat a la resolució del problema d'interpolació de senyals bidimensionals a partir de conjunts arbitraris de punts dispersos.<br/>- S'ha introduït de manera experimental un criteri subjectiu empíric per a la ordenació i selecció de detalls en les imatges, segons un criteri perceptual.<br/>- Finalment, s'ha investigat l'aplicació d'una tècnica clàssica, la codi&#64257;cació "subbanda", a l'interior de regions de forma arbitrària, resultant en un nou mètode de codi&#64257;cació de textures anomenat "Region-based subband coding".<br/><br/>Aquestes tècniques han estat innovadores en el camp de codi&#64257;cació d'imatge entre les anomenades tècniques orientades a objectes o de Segona Generació. Tanmateix, el model d'imatge estudiat, es troba en la línia de les últimes propostes en l'entorn de l'MPEG4, el futur estàndard per a comunicació d'imatge a baixa velocitat, que contempla la possibilitat de la manipulació de continguts.
cat
dc.description.abstract
This thesis studies image and video sequence coding methods from the point of view of the way the human visual system perceives and understands visual information. The relevance of such study is due, on the one hand, to the important role that visual signals have in our civilization and, on the other hand, to the problem of representing the large amount of data that image and video processing systems have to deal with.<br/>Three different approaches have been investigated for the coding of image textures in an advanced compression scheme relying in aspects of visual perception. The first approach is based on image transitions and the interpolation of smooth areas from such transitions. The second one, considers the extraction, selection and coding of meaningful image details.<br/>Finally, the third approach studies the efficient representation of homogeneous fine textures that give a natural appearance to the reconstructed images at high compression levels. In order to apply these techniques for still image and video coding, a three component model of the image, that matches the perceptual properties of the human vision, is put forward.<br/>The coding approaches subject of research have leaded to the design of three new image analysis and coding techniques. Using non-linear tools from the framework of Mathematical Morphology, three texture coding techniques are developed. In particular,<br/><br/>- A "morphological" image interpolation method aimed at the problem of scattered data interpolation.<br/>- An empirical subjective criterion for the ranking and selection of image details according to visual perception.<br/>- The application of a conventional image coding technique, subband coding, to the coding of arbitrarily shaped image regions (region-based subband coding).<br/><br/>These are new texture coding techniques in the field of object-oriented and Second Generation image and video coding schemes. Furthermore, the model of the image that has been investigated follows the line of the last proposals in the framework of MPEG4, the forthcoming coding standard for low bit-rate visual communications, which considers the possibility of content-based manipulation and coding of visual information.
eng
dc.format.mimetype
application/pdf
dc.language.iso
eng
dc.publisher
Universitat Politècnica de Catalunya
dc.rights.license
ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
textures
dc.subject
detalls
dc.subject
regions
dc.subject
codificació perceptual
dc.subject
vídeo
dc.subject
imatge
dc.title
Image Compression based on Perceptual Coding Techniques
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
621.3
cat
dc.contributor.authoremail
josep.ramon.casas@upc.edu
dc.contributor.director
Torres Urgell, Luis
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
cat
dc.identifier.dl
B.19339-2009


Documents

01JRc01de01.pdf

1.760Mb PDF

This item appears in the following Collection(s)