An approach for model-driven data reengineering = Un enfoque de reingeniería de datos dirigido por modelos

Author

Bermúdez Ruiz, Francisco Javier

Director

García Molina, Jesús Joaquín

Díaz García, Óscar

Date of defense

2016-01-22

Pages

225 p.



Department/Institute

Universidad de Murcia. Departamento de Informática y Sistemas

Abstract

Objetivos Esta tesis se centra principalmente en la aplicación de técnicas MDE a un proceso de reingeniería de datos. En concreto, analizamos en que medida el uso de modelos facilita la implementación de una mejora de la calidad en los datos de un sistema legado mediante la conversión de esquemas, que es un escenario común de modernización. La conversión de esquemas implementada en nuestra solución aborda la inferencia de restricciones de integridad referencial (declaradas en base de datos como claves ajenas) junto con la comprobación y corrección de los niveles de normalización en un esquema de datos. Se deben proporcionar diferentes técnicas para el descubrimiento de claves ajenas para obtener resultados más fiables. Además, se ha proporcionado automatización al proceso de migración mediante una herramienta software que soporta la definición y ejecución de procesos de migración y que ha sido validada através tomando como caso de estudio nuestro proceso de reingeniería de datos. Por otro lado, las soluciones MDE requieren de la integración con herramientas de terceros, en nuestro caso para la automatización del proceso de normalización. Este requisito nos condujo a desarrollar una solución arquitectónica para facilitar la interoperabilidad de herramientas y poder así integrar otras herramientas en nuestro proceso MDE. Podemos identificar los siguientes objetivos para la tesis: • Una implementación de un proceso de reingeniería de datos mediante el uso de técnicas MDE. La herramienta soporta la comprobación automática del nivel de normalización de la base de datos y su corrección. • Uso de diferentes estrategias para la inferencia de claves ajenas en la etapa de restructuración del proceso de reingeniería. • La construcción de una herramienta capaz de automatizar el desarrollo de procesos de reingeniería basados en modelos. • Abordar la interoperabilidad basada en modelos mediante la construcción de un puente bidireccional entre herramientas. Metodología Se ha aplicado la metodología DSRM (Design Science Research Methodology) que consiste en 6 actividades: (1) identificación del problema y motivación, (2) definición de los objetivos de la solución, (3) diseño y desarrollo, (4) demostración, (5) evaluación y (6) conclusiones y comunicación. Resultados Describimos a continuación las contribuciones de la tesis organizadas según los objetivos identificados. Proceso de Reingeniería de Datos Hasta nuestro conocimiento, este trabajo es una de las primeras contribuciones proporcionando una valoración del uso de MDE in la reingeniería de datos. El enfoque es validado mediante un sistema legado real, ampliamente usado en la industria sanitaria en Canadá: OSCAR. Hemos contrastado además nuestro trabajo con enfoques tradicionales de reingeniería de datos, y hemos identificado algunos beneficios e inconvenientes de aplicar MDE, lo que nos permite dar una valoración de en qué medida MDE es aplicable en estos escenario Estrategias de Descubrimiento de Claves Ajenas Se ha abordado el problema de la inferencia de claves ajenas y la combinación de diferentes técnicas de reingeniería. Herramienta de Migración Encontramos tres contribuciones en la herramienta: (1) es la primera propuesta que ejecuta procesos basados en modelos mediante la generación de tareas automáticas y manuales que son integradas en un entorno de desarrollo; (2) es una de las primeras experiencias mostrando cómo una solución MDE puede ser usada para construir herramientas de soporte para la definición y ejecución de procesos, así como la gestión de tareas de migración; (3) se presenta una solución para el soporte de procesos de migración implementados con tecnologías MDE. Interoperabilidad de Herramientas Se ha abordado la implementación de una arquitectura MDE orientada a conectar herramientas. Se ha contribuido además a analizar y discutir a cerca como MDE es capaz de tratar diferentes escenarios de interoperabilidad.


Goals This thesis is mainly focused on applying MDE techniques to a data reengineering process. In particular, we analyse to what extent the use of models facilitates the implementation of the data quality improvement of a legacy system by means of a schema conversion, which is a common data modernisation scenario. The schema conversion implemented in our approach addresses the elicitation of implicit referential integrity constraints (declared in database by foreign keys) along with checking and fixing the appropriate normalisation level in a schema. Several techniques for discovering foreign keys should be combined in order to obtain more reliable results. Furthermore, an automation of migration processes is tackled. We have built a tool that supports the definition and enactment of migration processes, which have been validated for the data migration case study. In addition, MDE solutions normally require the integration with a third-party tool which allows an automatic normalisation step. This requirement leads us to develop an architectural solution to ease tool interoperability and then to integrate other useful tools (from the data engineering and requirement areas) to the migration process here proposed. Ee can therefore infer the following objectives of this thesis: • An implementation of a data reengineering process by using MDE techniques. An automatic checking of the database normalisation level in the relational schema is supported. • Using of different strategies in order to elicit foreign keys for the restructuring stage of the process. • Building a tool able to automate the development of model-driven reengineering processes. • To tackle the MDE-base tool interoperability through the building of some bidirectional bridge. Methodology We have followed the design science research methodology (DSRM) which consists of six activities: (1) problem identification and motivation, (2) define the objectives of a solution, (3) design and development, (4) demonstration, (5) evaluation and (6) conclusions and communication. Results We shall describe next the contributions of this thesis. They will be categorised according to the goals identified. Data Reengineering Process To the best of our knowledge, this work is one of the first contributions to provide an assessment of the use of MDE in data reengineering. The approach is showcased by means of an information system that is widely used in the healthcare industry in Canada: OSCAR. We have contrasted our work with the tasks usually performed in traditional approaches and have identified some benefits and drawbacks of applying MDE techniques, which could enable us to assess to what extent MDE could be applicable to other problems. Strategies of FK Discovering We devise a process for reengineering legacy information systems with respect to establishing referential integrity constraints and combining existing reengineering methods. Migration Tool There are three contributions in the tool proposed: (1) it is the first proposal that enacts process models by executing automated tasks and generates programming manual tasks which are integrated into a task management tool; (2) our work is one of the first experiences showing how an MDE approach can be used to build a tool supporting software development processes from the definition of software processes to the management of the tasks to be performed by managers and developers; (3) we present a solution to support migration processes that have been implemented with MDE technologies. Tool Interoperability We have devised a model-based architecture aims to bridge the gap between tools. The MDE techniques have proven useful to ease and extend the interoperability capabilities of DB-Main. We contribute to analyse and discuss through this case study how MDE can address several interoperability scenarios.

Keywords

Informática-Bases de datos

Subjects

004 - Computer science and technology. Computing. Data processing

Knowledge Area

Ingeniería

Documents

TFJMM.pdf

5.426Mb

 

Rights

ADVERTENCIA. El acceso a los contenidos de esta tesis doctoral y su utilización debe respetar los derechos de la persona autora. Puede ser utilizada para consulta o estudio personal, así como en actividades o materiales de investigación y docencia en los términos establecidos en el art. 32 del Texto Refundido de la Ley de Propiedad Intelectual (RDL 1/1996). Para otros usos se requiere la autorización previa y expresa de la persona autora. En cualquier caso, en la utilización de sus contenidos se deberá indicar de forma clara el nombre y apellidos de la persona autora y el título de la tesis doctoral. No se autoriza su reproducción u otras formas de explotación efectuadas con fines lucrativos ni su comunicación pública desde un sitio ajeno al servicio TDR. Tampoco se autoriza la presentación de su contenido en una ventana o marco ajeno a TDR (framing). Esta reserva de derechos afecta tanto al contenido de la tesis como a sus resúmenes e índices.

This item appears in the following Collection(s)