<?xml version="1.0" encoding="UTF-8" ?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2013-05-24T00:44:09Z</responseDate><request identifier="oai:www.tdx.cat:10803/83906" metadataPrefix="marc" verb="GetRecord">http://www.tdx.cat/oai/request</request><GetRecord><record><header><identifier>oai:www.tdx.cat:10803/83906</identifier><datestamp>2012-08-28T06:51:49Z</datestamp><setSpec>hdl_10803_217</setSpec></header><metadata><record xmlns="http://www.loc.gov/MARC21/slim" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.loc.gov/MARC21/slim http://www.loc.gov/standards/marcxml/schema/MARC21slim.xsd"><leader>      am         3u     </leader><datafield ind2=" " ind1=" " tag="042"><subfield code="a">dc</subfield></datafield><datafield ind2=" " ind1=" " tag="260"><subfield code="c">2012-07-30T12:25:57Z</subfield></datafield><datafield ind2=" " ind1=" " tag="520"><subfield code="a">L'extracció d'informació és l'àrea del processament de llenguatge natural l'objectiu de la qual és l'obtenir dades&#xD;
estructurades a partir de la informació rellevant continguda en fragments textuals.&#xD;
L'extracció d'informació requereix una quantitat considerable de coneixement lingüístic. La especificitat d'aquest&#xD;
coneixement suposa un inconvenient de cara a la portabilitat dels sistemes, ja que un canvi d'idioma, domini o estil té un&#xD;
cost en termes d'esforç humà. Durant dècades, s'han aplicat tècniques d'aprenentatge automàtic per tal de superar aquest&#xD;
coll d'ampolla de portabilitat, reduint progressivament la supervisió humana involucrada. Tanmateix, a mida que augmenta&#xD;
la disponibilitat de grans col·leccions de documents, esdevenen necessàries aproximacions completament nosupervisades&#xD;
per tal d'explotar el coneixement que hi ha en elles.&#xD;
La proposta d'aquesta tesi és la d'incorporar tècniques de clustering a l'adquisició de patrons per a extracció d'informació,&#xD;
per tal de reduir encara més els elements de supervisió involucrats en el procés En particular, el treball se centra en el&#xD;
problema de la detecció de relacions. L'assoliment d'aquest objectiu final ha requerit, en primer lloc, el considerar les&#xD;
diferents estratègies en què aquesta combinació es podia dur a terme; en segon lloc, el desenvolupar o adaptar algorismes&#xD;
de clustering adequats a les nostres necessitats; i en tercer lloc, el disseny de procediments d'adquisició de patrons que&#xD;
incorporessin la informació de clustering.&#xD;
Al final d'aquesta tesi, havíem estat capaços de desenvolupar i implementar una aproximació per a l'aprenentatge de&#xD;
patrons per a detecció de relacions que, utilitzant tècniques de clustering i un mínim de supervisió humana, és competitiu i&#xD;
fins i tot supera altres aproximacions comparables en l'estat de l'art.</subfield></datafield><datafield ind2=" " ind1=" " tag="520"><subfield code="a">Information extraction is the natural language processing area whose goal is to obtain structured data from the relevant&#xD;
information contained in textual fragments.&#xD;
Information extraction requires a significant amount of linguistic knowledge. The specificity of such knowledge supposes a&#xD;
drawback on the portability of the systems, as a change of language, domain or style demands a costly human effort.&#xD;
Machine learning techniques have been applied for decades so as to overcome this portability bottleneck¿progressively&#xD;
reducing the amount of involved human supervision. However, as the availability of large document collections increases,&#xD;
completely unsupervised approaches become necessary in order to mine the knowledge contained in them.&#xD;
The proposal of this thesis is to incorporate clustering techniques into pattern learning for information extraction, in order to&#xD;
further reduce the elements of supervision involved in the process. In particular, the work focuses on the problem of relation&#xD;
detection. The achievement of this ultimate goal has required, first, considering the different strategies in which this&#xD;
combination could be carried out; second, developing or adapting clustering algorithms suitable to our needs; and third,&#xD;
devising pattern learning procedures which incorporated clustering information.&#xD;
By the end of this thesis, we had been able to develop and implement an approach for learning of relation detection patterns&#xD;
which, using clustering techniques and minimal human supervision, is competitive and even outperforms other comparable&#xD;
approaches in the state of the art.</subfield></datafield><datafield ind2=" " ind1=" " tag="856"><subfield code="q">application/pdf</subfield></datafield><datafield ind2=" " ind1="8" tag="024"><subfield code="a">http://hdl.handle.net/10803/83906</subfield></datafield><datafield ind2=" " ind1=" " tag="546"><subfield code="a">eng</subfield></datafield><datafield ind2=" " ind1=" " tag="653"><subfield code="a">processasment del llenguatge natural</subfield></datafield><datafield ind2=" " ind1=" " tag="653"><subfield code="a">natural language processing</subfield></datafield><datafield ind2=" " ind1=" " tag="653"><subfield code="a">extracció d'informació</subfield></datafield><datafield ind2=" " ind1=" " tag="653"><subfield code="a">information extraction</subfield></datafield><datafield ind2=" " ind1=" " tag="653"><subfield code="a">aprenentatge automàtic</subfield></datafield><datafield ind2=" " ind1=" " tag="653"><subfield code="a">machine learning</subfield></datafield><datafield ind2=" " ind1=" " tag="653"><subfield code="a">clustering de conjunts</subfield></datafield><datafield ind2=" " ind1=" " tag="653"><subfield code="a">ensemble clustering</subfield></datafield><datafield ind2=" " ind1=" " tag="653"><subfield code="a">clustering de minoria</subfield></datafield><datafield ind2=" " ind1=" " tag="653"><subfield code="a">minority clustering</subfield></datafield><datafield ind2=" " ind1=" " tag="653"><subfield code="a">004 - Informàtica</subfield></datafield><datafield ind2="0" ind1="0" tag="245"><subfield code="a">Unsupervised learning of relation detection patterns</subfield></datafield></record></metadata></record></GetRecord></OAI-PMH>