On building end-to-end driving models through imitation learning

dc.contributor
Universitat Autònoma de Barcelona. Departament de Ciències de la Computació
dc.contributor.author
Codevilla Moraes, Felipe
dc.date.accessioned
2019-07-17T11:40:34Z
dc.date.available
2020-05-20T02:00:11Z
dc.date.issued
2019-05-21
dc.identifier.isbn
9788449087226
en_US
dc.identifier.uri
http://hdl.handle.net/10803/667238
dc.description.abstract
Els vehicles autònoms es consideren ara com a actius assegurats en el futur. Literalment, tots els marcadors d’automòbils rellevants es troben en una cursa per produir vehicles totalment autònoms. Aquests fabricants de cotxes solen fer ús de canonades modulars per al disseny de vehicles autònoms. Aquesta estratègia descompon el problema en diverses tasques com la detecció i el reconeixement d’objectes, la segmentació semàntica i la instància, l’estimació de profunditat, el reconeixement de llocs i SLAM, així com la planificació i el control. Cada mòdul requereix un conjunt separat d’algoritmes experts, que són costosos especialment quant al treball humà i la necessitat d’etiquetatge de dades. Una alternativa que recentment té un interès significatiu és la conducció integral. En el paradigma de conducció de extrem a extrem, la percepció i el control s’obtenen simultàniament mitjançant una xarxa profunda. Els models de tesisensorotor s’obtenen normalment mitjançant l’aprenentatge de imitacions de les demostracions de humà. L’avantatge principal és que aquest enfocament pot aprendre directament de les grans flotes de vehicles dirigits per humans sense necessitat d’un ontologia fixa i d’una àmplia quantitat d’etiquetatge. No obstant això, els mètodes de extrem a extrem es van utilitzar habitualment per aprendre conductes simples com ara manteniment de carrils i el vehicle principal. En aquesta tesi, per tal d’aconseguir comportaments més complexos, abordemalguns problemes quan es crea un sistema de conducció de extrem a extrem mitjançant l’aprenentatge de la imitació. El primer d’aquests és la necessitat d’un entorn per a l’avaluació d’algorismes i la recopilació de demostracions d’administració. En aquest sentit, hem participat en la creació del simulador de Carla, una plataforma de codi obert construïda des de la base per a la validació i el prototipatge d’autònoms. Atès que l’enfocament de extrem a extrem és purament re-actiu, també hi ha la necessitat de proporcionar una interfície amb un sistema de planificació global. Amb això, proposem l’aprenentatge d’imitació condicional que condiciona les accions produïdes en algun comandament d’alt nivell. L’avaluació és també una qüestió i normalment es fa mitjançant la comparació de la sortida de la xarxa de cap a cap a un conjunt de dades de conducció que es recull. Demostrem que això és correlacionat sorprenentment debilitat amb la conducció real i proposa estratègies sobre com adquirir millor les dades i una estratègia de comparació millor. Finalment, confirmem problemes de generalització ben coneguts (deguts a biaixos i sobraccessos actuals), de nous (a causa d’objectes dinàmics i la manca de model acausal) i la inestabilitat de la formació; Els problemes que requereixen més investigacions abans de finalitzar la conducció a través de la imitació poden escalar a la conducció del món real.
en_US
dc.description.abstract
Autonomous vehicles are now considered as an assured asset in the future. Literally, all the relevant car-markers are now in a race to produce fully autonomous vehicles. These car-makers usually make use of modular pipelines for designing autonomous vehicles. This strategy decomposes the problemin a variety of tasks such as object detection and recognition, semantic and instance segmentation, depth estimation, SLAM and place recognition, as well as planning and control. Each module requires a separate set of expert algorithms, which are costly specially in the amount of human labor and necessity of data labelling. An alternative that recently has driven considerable interest is the end-to-end driving. In the end-to-end driving paradigm, perception and control are learned simultaneously using a deep network. These sensorimotor models are typically obtained by imitation learning from human demonstrations. The main advantage is that this approach can directly learn from large fleets of human-driven vehicles without requiring a fixed ontology and extensive amounts of labeling. However, scaling end-to-end driving methods to behaviors more complex than simple lane keeping or lead vehicle following remains an open problem. On this thesis, in order to achieve more complex behaviours, we address some issues when creating end-to-end driving system through imitation learning. The first of themis a necessity of an environment for algorithm evaluation and collection of driving demonstrations. On this matter, we participated on the creation of the CARLA simulator, an open source platformbuilt from ground up for autonomous driving validation and prototyping. Since the end-to-end approach is purely reactive, there is also the necessity to provide an interface with a global planning system. With this, we propose the conditional imitation learning that conditions the actions produced into some high level command. Evaluation is also a concern and is commonly performed by comparing the end-to-end network output to some pre-collected driving dataset. We show that this is surprisingly weakly correlated to the actual driving and propose strategies on how to better acquire data and a better comparison strategy. Finally, we confirmwell-known generalization issues (due to dataset bias and overfitting), new ones (due to dynamic objects and the lack of a causal model), and training instability; problems requiring further research before end-to-end driving through imitation can scale to real-world driving.
en_US
dc.format.extent
130 p.
en_US
dc.format.mimetype
application/pdf
dc.language.iso
eng
en_US
dc.publisher
Universitat Autònoma de Barcelona
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.uri
http://creativecommons.org/licenses/by-nc-nd/4.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Conducció autònoma
en_US
dc.subject
Conducción autónoma
en_US
dc.subject
Autonomous driving
en_US
dc.subject
Visió per computador
en_US
dc.subject
Visión por computador
en_US
dc.subject
Computer vision
en_US
dc.subject
Aprenentatge màquina
en_US
dc.subject
Aprendizaje máquina
en_US
dc.subject
Machine learning
en_US
dc.subject.other
Ciències Experimentals
en_US
dc.title
On building end-to-end driving models through imitation learning
en_US
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
62
en_US
dc.contributor.authoremail
fcodevilla@cvc.uab.cat
en_US
dc.contributor.director
López Peña, Antonio M. (Antonio Manuel)
dc.embargo.terms
12 mesos
en_US
dc.rights.accessLevel
info:eu-repo/semantics/openAccess


Documents

feco1de1.pdf

19.42Mb PDF

This item appears in the following Collection(s)