Metodología de predicción de rendimiento de aplicaciones MapReduce iterativas sobre una nube híbrida

Autor/a

Clemente Castelló, Fancisco José

Director/a

Fernández Fernández, Juan Carlos

Nicolae, Bogdan

Fecha de defensa

2017-06-15

Páginas

161 p.



Departamento/Instituto

Universitat Jaume I. Departament d'Enginyeria i Ciència dels Computadors

Resumen

El cloud-bursting (despliegue de nube híbrida que complementa temporalmente máquinas virtuales locales con máquinas vituales remotas) ha experimentado una rápida adopción entre los usuarios de análisis de big data. Sin embargo, conseguir un buen rendimiento en este tipo de despliegues supone un reto. Por una parte, Hadoop MapReduce está diseñado para planificar sus tareas cerca de los datos, por otra parte, existe una red de comunicación entre ambas nubes con un ancho de banda limitado. En esta tesis se abordan estos retos mediante la aportación de varias contribuciones que convergen a una solución holística. Concretamente, se aporta una herramienta de análisis que permite la posterior propuesta de estrategias de aprovechamiento eficiente de la localidad de los datos. Basándose en estas estrategias, que hacen factible el empleo de aplicaciones MapReduce iterativas, se contribuye con una metodología de predicción del tiempo de finalización, junto con un modelo de coste económico.


Cloud-bursting (complement on-premise virtual machines with temporary off-premise virtual machines) has seen a rapid adoption among big data analitycs users. However, in these type of deployments, performance is a challenge. On the one hand, Hadoop MapReduce is designed to schedule its tasks close to the data, on the other hand, there is a communication network between both clouds with a limited bandwidth. This thesis addresses these challenges through several contributions that converge towards a holistic solution. Specifically, this thesis provides an analysis tool that allows the subsequent proposal of strategies to efficiently use the locality of the data. Based on these strategies, which make feasible the use of iterative MapReduce applications, it contributes with a completion time prediction methodology, together with an economic cost model.

Palabras clave

Cloud bursting; Aplicaciones iterativas; MapReduce; Análisis de Big Data; Predicción de rendimiento; Localidad de datos; Big Data analitycs; Iterative applications

Materias

004 - Informática

Área de conocimiento

Tecnologies de la Informació i les Comunicacions (TIC)

Documentos

2017_Tesis_Clemente Castello_FJ.pdf

5.170Mb

 

Derechos

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-sa/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-sa/4.0/

Este ítem aparece en la(s) siguiente(s) colección(ones)