Entrenamiento Disciminativo de Modelos Ocultos de Markov de Unidad Subléxica para su Aplicación a Sistemas de Reconocimiento Automático del Habla Continua

dc.contributor
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.contributor.author
Nogueiras Rodríguez, Albino
dc.date.accessioned
2011-04-12T15:27:51Z
dc.date.available
2009-10-21
dc.date.issued
1999-11-22
dc.date.submitted
2009-07-22
dc.identifier.isbn
9788469271438
dc.identifier.uri
http://www.tdx.cat/TDX-0722109-100044
dc.identifier.uri
http://hdl.handle.net/10803/6935
dc.description.abstract
En esta tesis se aborda el entrenamiento discriminativo de unidades subléxicas utilizando bases de datos de propósito geneal. Las unidades subléxicas son la base de funcionamiento de los sistemas de reconocimiento de grandes vocabularios en habla continua, los cuales constituyen uno de los retos de máxima actualidad y la puerta de acceso a otras propuestas aún más ambiciosas como el dictado automático o los sistemas de diálogo.<br/><br/>Por su parte, el entrenamiento discriminativo ha demostrado ser una herramienta sumamente potente en el modelado acústico de sistemas de reconocimiento del habla. Su funcionamiento se basa en aumentar la probabilidad de que el sistema reconozca la frase correcta aplicando, más o menos, la misma regla de decisión empleada en condiciones reales de reconocimiento. Una limitación habitual de los sistemas de entrenamiento discriminativo propuestos hasta la fecha es la necesidad de bases de datos formadas por material específico de la tarea a reconocer.<br/><br/>En la primera parte de la tesis se presenta la propuesta propia de esta tesis para la aplicación de entrenamiento discriminativo a unidades subléxicas para su aplicación a tareas de reconocimiento del habla continua: el entrenamiento de mínima confusibilidad en segmentos acústicos de longitud limitada.<br/>Se proponen dos variantes. En la primera, el conocimiento del lenguaje de la tarea a reconocer es aprovechado para minimizar el número de errores de posible comisión en la tarea, utilizando segmentos acústicos extraídos de una base de datos de propósito general. A continuación, esta misma idea se extiende al caso en que la tarea es desconocida,obteniéndose modelos acústicos de propósito general. Se muestran resultados experimentales en el reconocimiento de las cadenas de dígitos en inglés TIDIGITS utilizando modelos de fonema y semifonema entrenados con TIMIT.
spa
dc.format.mimetype
application/pdf
dc.language.iso
spa
dc.publisher
Universitat Politècnica de Catalunya
dc.rights.license
ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
unidades subléxicas
dc.subject
habla continua
dc.subject
modelado acústico
dc.subject
entrenamiento discriminativo
dc.subject
reconocimiento automático del habla
dc.title
Entrenamiento Disciminativo de Modelos Ocultos de Markov de Unidad Subléxica para su Aplicación a Sistemas de Reconocimiento Automático del Habla Continua
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
621.3
cat
dc.contributor.director
Mariño Acebal, José B. (José Bernardo)
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.identifier.dl
B.45334-2009


Documents

TANR.pdf

2.494Mb PDF

This item appears in the following Collection(s)