2024-03-29T00:41:23Zhttps://www.tdx.cat/oai/requestoai:www.tdx.cat:10803/30642017-09-23T08:28:42Zcom_10803_120col_10803_122
TDX (Tesis Doctorals en Xarxa)
author
Ramisa Ayats, Arnau
authoremail
aramisa@iiia.csic.es
authoremailshow
true
director
Toledo Morales, Ricardo
director
López de Mántaras, Ramon, 1952-
2011-04-12T14:12:05Z
2010-05-27
2009-06-29
9788469265130
http://www.tdx.cat/TDX-0527110-122909http://hdl.handle.net/10803/3064
B-46009-2009
Tot i que apareixen noves tècniques que equipen els robots amb capacitats cognitives avançades, encara s'ha dedicat poca feina a una qüestió essencial per aquestes tècniques: mètodes ràpids i robustos per a la percepció d'elements semànticament rellevants en entorns no estructurats. De fet, per un robot, ser capaç d'identificar la ubicació en que es troba i quins objectes té al voltant constitueix els fonaments sobre els quals s'aguanten la resta de processos de raonament d'alt nivell que ha de dur a terme. Amb l'objectiu de reduir una mica aquest problema, aquesta tesi se centra en els problemes de localització i reconeixement d'objectes per mitjà de tècniques de visió per computador. La primera contribució que presentem és una nova tècnica per construir signatures de llocs a partir de caracter ́ıstiques detectades en imatges panoràmiques per a ser usades com a nodes d'un mapa topològic, i un mètode de "homing" per viatjar entre els nodes del mapa. Ambdós mètodes han estat provats en diversos conjunts de proves amb resultats satisfactoris. El reconeixement d'objectes genèrics per robots mòbils és un tema d'importància cabdal de cara a afegir contingut a les representacions de l'entorn que els robots usaran en els seus processos de raonament. En conseqüència, les següents contribucions d'aquesta tesi es dirigeixen a aquest problema. Després de revisar detingudament literatura recent del camp de visió per computador, han estat seleccionats dos mètodes: el mètode de reconeixement d'objectes "SIFT" i el "Vocabulary Tree". Un cop avaluats els dos mètodes en conjunts de dades de test dif ́ıcils, centrades en els aspectes rellevants per als robots mòbils, es va concloure que, tot i que el mètode SIFT era més adeqüat per aquests, ambdós mètodes tenien propietats complementàries. Per aprofitar aquesta complementarietat, la contribució final d'aquesta tesi és un mètode d'aprenentatge per reforç per seleccionar, durant l'aplicació del procés de reconeixment d'objectes, quin dels dos mètodes és el més adequat basant-se únicament en caracter ́ıstiques de la imatge simples de calcular. Aquest mètode ha estat validat en un complex conjunt de proves de reconeixement d'objectes, fins i tot ha superat els resultats d'un expert humà en alguns casos.Although new approaches to enable robots with advanced cognitive capabilities are being developed, still few work is being devoted to a difficult problem in which all this techniques rely: fast and robust perception methods to detect semantically relevant elements in unstructured environments. Indeed, being able to identify the robot's location and what objects lie around constitute the foundations on which almost all high-level reasoning processes conducted by a robot will build up. In order to help reduce this gap, this work addresses the problems of vision-based global localization and object recognition. The first contributions presented are a new technique to construct signatures of places to be used as nodes of a topological map from constellations of features detected in panoramic images, and a homing method to travel between such nodes that does not rely in artificial landmarks. Both methods were tested with several datasets showing very good results. General object recognition in mobile robots is of primary importance in order to enhance the representation of the environment that robots will use for their reasoning processes. Therefore, the next contributions of the thesis address this problem. After carefully reviewing recent Computer Vision literature on this topic, two state of the art object recognition methods were selected: The SIFT object Recognition method and the Vocabulary Tree method. After evaluating both methods in challenging datasets, focusing on issues relevant to mobile robotics, it was found that, although the SIFT method was more suited for mobile robotics, both had complementary properties.To take advantage of this complementarity, the final contribution of this thesis is a Reinforcement Learning method to select online which object recognition method is best for an input image based on simple to compute image features. This method has been validated in a challenging object recognition experiment, even improving the performance of a human expert in some cases.<br/>Keywords: Mobile Robotics; Vision-based localization; Object recognition; Visual Feature Detectors; Visual Feature Descriptors; Reinforcement Learning; Visual Homing
eng
Robotics
Artificial intelligence
Computer vision
Localization and Object Recognition for Mobile Robots
info:eu-repo/semantics/doctoralThesis info:eu-repo/semantics/publishedVersion
URL
https://www.tdx.cat/bitstream/10803/3064/1/ara1de1.pdf
File
MD5
b15a4685db46d0b821749704f3451cd0
1356261
application/pdf
ara1de1.pdf
URL
https://www.tdx.cat/bitstream/10803/3064/2/ara1de1.pdf.txt
File
MD5
b3d1626e944b0c8c4f23e0f7ba86292f
255120
text/plain
ara1de1.pdf.txt