Anytime Case-Based Reasoning in Large-Scale Temporal Case Bases

Author

Mülâyim, Mehmet Oǧuz

Director

Arcos, Josep Lluís

Date of defense

2020-11-20

ISBN

9788449047867

Pages

107 p.



Doctorate programs

Universitat Autònoma de Barcelona. Programa de Doctorat en Informàtica

Abstract

L'enfocament de la metodologia Casi-Based Reasoning (CBR) per a la resolució de problemes que "problemes similars tenen solucions similars" ha demostrat ser bastant favorable per a moltes aplicacions d'intel·ligència artificial industrial. No obstant això, els mateixos avantatges de CBR dificulten el seu acompliment ja que les bases de casos (CB) creixen més que mides raonables. Cercar casos similars és costós. Aquest desavantatge sovint fa que CBR sigui menys atractiu per als entorns de dades abundants d'avui dia, mentre que, en realitat, cada vegada hi ha més raons per beneficiar-se d'aquesta metodologia eficaç. En conseqüència, l'enfocament tradicional de la comunitat CBR de controlar el creixement de la CB per mantenir el rendiment està canviant cap a la recerca de noves formes de tractar amb dades abundants. Com a contribució a aquests esforços, aquesta tesi té com a objectiu accelerar el CBR aprofitant tant els espais de problemes com els de solucions en els CB de gran escala que es componen de casos relacionats temporalment, com en l'exemple de les històries clíniques electròniques. Per a les ocasions en què l'acceleració que vam aconseguir per obtenir resultats exactes encara no sigui factible, dotem el sistema CBR amb capacitats d'algoritmes anytime per proporcionar resultats aproximats amb confiança en cas d'interrupció. Aprofitar la temporalitat dels casos ens permet assolir guanys superiors en el temps d'execució per als CB de milions de casos. Els experiments amb conjunts de dades del món real disponibles públicament fomenten l'ús continu de CBR en dominis en els quals CBR històricament sobresurt com l'atenció mèdica; i al seu torn, no patint, sinó gaudint del big data.


El enfoque de la metodología Case-Based Reasoning (CBR) para la resolución de problemas de que "problemas similares tienen soluciones similares" ha demostrado ser bastante favorable para muchas aplicaciones de inteligencia artificial industrial. Sin embargo, las mismas ventajas de CBR dificultan su desempeño ya que las bases de casos (CB) crecen más que tamaños razonables. Buscar casos similares es costoso. Esta desventaja a menudo hace que CBR sea menos atractivo para los entornos de datos abundantes de hoy en día, mientras que, en realidad, cada vez hay más razones para beneficiarse de esta metodología eficaz. En consecuencia, el enfoque tradicional de la comunidad CBR de controlar el crecimiento de la CB para mantener el rendimiento está cambiando hacia la búsqueda de nuevas formas de tratar con datos abundantes. Como contribución a estos esfuerzos, esta tesis tiene como objetivo acelerar el CBR aprovechando tanto los espacios de problemas como los de soluciones en los CB de gran escala que se componen de casos relacionados temporalmente, como en el ejemplo de las historias clínicas electrónicas. Para las ocasiones en las que la aceleración que logramos para obtener resultados exactos aún no sea factible, dotamos al sistema CBR con capacidades de algoritmos anytime para proporcionar resultados aproximados con confianza en caso de interrupción. Aprovechar la temporalidad de los casos nos permite alcanzar ganancias superiores en el tiempo de ejecución para los CB de millones de casos. Los experimentos con conjuntos de datos del mundo real disponibles públicamente fomentan el uso continuo de CBR en dominios en los que CBR históricamente sobresale como la atención médica; y a su vez, no sufriendo, sino disfrutando del big data.


Case-Based Reasoning (CBR) methodology's approach to problem-solving that "similar problems have similar solutions" has proved quite favorable for many industrial artificial intelligence applications. However, CBR's very advantages hinder its performance as case bases (CBs) grow larger than moderate sizes. Searching similar cases is expensive. This handicap often makes CBR less appealing for today's ubiquitous data environments while, actually, there is ever more reason to benefit from this effective methodology. Accordingly, CBR community's traditional approach of controlling CB growth to maintain performance is shifting towards finding new ways to deal with abundant data. As a contribution to these efforts, this thesis aims to speed up CBR by leveraging both problem and solution spaces in large-scale CBs that are composed of temporally related cases, as in the example of electronic health records. For the occasions when the speed-up we achieve for exact results may still not be feasible, we endow the CBR system with anytime algorithm capabilities to provide approximate results with confidence upon interruption. Exploiting the temporality of cases allows us to reach superior gains in execution time for CBs of millions of cases. Experiments with publicly available real-world datasets encourage the continued use of CBR in domains where it historically excels like healthcare; and this time, not suffering from, but enjoying big data.

Keywords

Raonament basat en casos; Razonamiento basado en casos; Case-based reasoning; Algorismes anytime; Anytime algorithms; Knn

Subjects

004 - Computer science and technology. Computing. Data processing

Knowledge Area

Tecnologies

Documents

mom1de1.pdf

4.865Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

This item appears in the following Collection(s)