2024-03-28T17:41:43Zhttps://www.tdx.cat/oai/requestoai:www.tdx.cat:10803/6681692019-12-18T12:19:10Zcom_10803_337col_10803_291831
TDX (Tesis Doctorals en Xarxa)
author
Sánchez Abril, Daniel
authoremail
dsanchezab@uoc.edu
authoremailshow
true
director
Escalera Guerrero, Sergio
director
Baró Solé, Xavier
2019-12-18T11:26:08Z
2019-12-18T11:26:08Z
2019-10-09
http://hdl.handle.net/10803/668169
La segmentació de persones en imatges RGB ha estat un problema central en el camp de la visió per computador. En aquesta tesi abordem el problema mitjançant hand-crafted features en un pipeline de dues etapes tant per segmentació binària com múltiple segmentació de parts del cos. Eines tals com Adaboost, SVM, haar-like features, HOG i GraphCuts entre altres. A més, mirem les diferències entre cascade learning i stacked learning. Finalment, analitzem com combinar diferents tasques, de manera multimodal, per refinar i millorar les prediccions de la segmentació de parts del cos amb 2D, 3D estimació postura i profunditat. Aquesta part està feta utilitzant deep learning.La segmentación de personas en imágenes RGB ha sido un problema central en el campo de la visión por computador. En esta tesis abordamos el problema mediante hand-crafted features en un pipeline de dos etapas tanto para segmentación binaria como múltiple segmentación de partes del cuerpo. Herramientas tales como Adaboost, SVM, haar-like features, HOG y GraphCuts entre otros. Además, miramos las diferencias entre cascade learning and stacked learning. Finalmente, analizamos cómo combinar diferentes tareas, de modo multimodal, para refinar y mejorar las predicciones de la segmentación de partes del cuerpo con 2D, 3D estimación postura y profundidad. Esta parte está hecha utilizando deep learning.The segmentation of people in RGB images poses a key obstacle in the field of computer vision. In our thesis, we tackle this issue through hand-crafted features in a two-stage pipeline, targeting both binary and multiple body part segmentation. For our purposes, we employ tools such as AdaBoost, support vector machines, Haar-like features, histograms of oriented gradients and graphics. We also address the differences between cascade learning and stacked learning. Finally, we analyse a multimodal approach to combining different tasks, which allows us to improve and refine our predictions concerning the segmentation of body parts using 2D and 3D estimations of posture and depth, a feat made possible thanks to deep learning.
eng
segmentación
segmentació
segmentation
parts del cos
partes del cuerpo
body parts
stacked learning
stacked learning
stacked learning
multi-tasca
multi-tarea
multi-task
Human body parts segmentation via stacked and multi-task learning
info:eu-repo/semantics/doctoralThesis info:eu-repo/semantics/publishedVersion
URL
https://www.tdx.cat/bitstream/10803/668169/1/phd_thesis_dani-1.pdf
File
MD5
a6d138660a23a0a413d62b3cff8c5250
13533890
application/pdf
phd_thesis_dani-1.pdf