Modelos estadísticos para valores extremos y aplicaciones

Author

Serra Mochales, Isabel

Director

del Castillo Franquet, Joan

Date of defense

2013-12-19

ISBN

9788449041877

Legal Deposit

B-4440-2014

Pages

141 p.



Department/Institute

Universitat Autònoma de Barcelona. Departament de Matemàtiques

Abstract

Los valores extremos los hallamos en muchos ámbitos de las ciencias y su modelización se utiliza en varios campos tales como la hidrología, los seguros, las finanzas y la ciencia medio ambiental. La singularidad de los valores extremos hace que debamos tratarlos de un modo separado al resto de datos que observamos. El objeto que analiza los valores extremos desde un punto de vista estadístico son las colas de las distribuciones sobre un umbral (que simplemente llamaremos colas). Generalmente, las colas hacen referencia a aquello que puede suceder una vez de cada mil, en contraposición a la estadística habitual que se fija como mucho en lo que sucede una de cada 20 o 100 veces. La teoría de valores extremos (EVT) tomó importancia en los años 20 con problemas relacionados principalmente con la hidrología y dieron lugar al primer teorema fundamental en EVT de Fisher-Tippet (1928) y Gnedenko (1948) que caracteriza la distribución asintótica del máximo observado. Otro punto de vista surgió en los años 70 con el segundo teorema fundamental de EVT de Pickands (1975) y Balkema-de Haan (1974) cuando todo parecía resuelto. Este resultado caracteriza la distribución asintótica de las colas como una distribución de la familia Pareto generalizada (GPD). A partir de aquí, la teoría de valores extremos ha seguido evolucionando y a su vez, a menudo se aparta de las necesidades prácticas, de la modelización estadística, ver Diebold et al. (1998). Actualmente, los ámbitos que presentan más problemas relacionados con valores extremos se clasifican según dónde deriva el riesgo que producen: en el ámbito financiero, en el ámbito medio-ambiental o en el ámbito de la salud. En este trabajo trataremos aplicaciones prácticas en los dos primeros ámbitos. Enumeremos los retos principales de la modelización estadística de los valores extremos. En primer y segundo lugar, la estimación del índice de la cola así como la estimación del umbral óptimo donde enlazar con el modelo GPD. I en tercer lugar, hallar modelos alternativos a la GPD que den resultados satisfactorios. En Coles (2001), Embrechts et al. (1997), McNeil et al. (2005) y Beirlant et al. (2004), hallamos revisiones satisfactorias de estos puntos clave en modelización estadística, pero aún así y como veremos en este trabajo, todavía hay trabajo que hacer. Este trabajo está dividido en 5 Capítulos. El primero introduciremos algunos preliminares básicos. El Capítulo 2 revisaremos el estado de la modelización estadística de valores extremos de un modo crítico. En esta revisión vamos a mostrar que el problema de estimación de parámetros de la GPD es un obstáculo en el progreso de la modelización y por ello, trataremos este tema en el Capítulo 3 en el cual hallaremos un nuevo enfoque del modelo que resolverá esta cuestión. De esta forma y junto con el trabajo de Castillo et al. (2013) sobre el coeficiente de variación residual podremos concluir en el Capítulo 5 con un protocolo de estimación del umbral óptimo y del índice de la cola que es satisfactorio, manejable y más riguroso, desde un punto de vista teórico, que otros métodos que se usan habitualmente. El reto de hallar nuevos modelos para colas es iniciado en el Capítulo 4 dónde presentaremos un modelo analítico nuevo que nos permitirá fijar los criterios para decidir si un modelo es apto para modelar colas. Finalmente, en el Capítulo 5 hallaremos las conclusiones generales de este trabajo.


The extreme values are in many fields of science and modeling is used in several fields such as hydrology, insurance, finance and environmental science. The uniqueness of outliers makes that we must treat them in a separate mode to other observations. The main object in analyzing the extreme values, from a statistical viewpoint, is the left truncated distributions or the distributions above thresholds (which are known as tails). Generally, the tails do reference to what can happen once in thousand times, it is in contrast with the usual statistical who is more dedicated to what happen once in 20 or 100 times. The extreme value theory (EVT) became important in the '20s, from problems mainly related to hydrology and led to the first fundamental theorem in EVT by Fisher - Tippet (1928) and Gnedenko (1948) to characterizing the asymptotic distribution of the maximum in observed data. When everything seemed settled, another point of view emerged in the '70s with the second fundamental theorem in EVT by Pickands (1975) and Balkema -de Haan (1974). This result characterizes the asymptotic distribution of the tails as a distribution in the generalized Pareto family. From here, the extreme value theory has continued to evolve and in turn, to often has departs from the practical needs of the modeling statistics, see Diebold et al. (1998). Currently, the fields that they have more problems in extreme values are classified according to where the risk of occurrence is derived: in the financial field, in the environmental field or the field of health. We are going to discuss applications practices in the first two areas. Lately, tools, techniques and processes used in statistical modeling of extreme values are questioned, since from a practical point of view are limitations. Moreover, the fact that the GPD characterizes distribution of the tails has made this model is considered as the reference model, when in fact this model sometimes produces unsatisfactory results, Dutta and Perry (2006). We list the main challenges in statistical modeling of extreme values. First and second are the estimation of the tail index and the optimal threshold to bind to the GPD model. Third, find alternative models to the GPD with satisfactory results. In Coles (2001), Embrechts et al. (1997), McNeil et al. (2005) and Beirlant et al. (2004), we find a satisfactory review of these points in statistical modeling. This paper is divided into 5 Chapters. The first contains an introduction for some basic preliminaries. Chapter 2 will review the status of statistical modeling of extreme values in a critical way. In this review we will show that the problem of estimating GPD parameters is an obstacle in the progress of the modeling. Therefore in Chapter 3 we discuss and we find a new approach to solve this question. In this way and with the work of Castillo et al. (2013) on the residual coefficient of variation we conclude in Chapter 5 with a protocol to estimate the optimal threshold and the tail index, manageable and more rigorous, from a theoretic point of view than other commonly used methods. Moreover, the challenge of finding new models for tails is initiated in Chapter 4 where we present a new analytical model that will allow us establish the criteria for deciding whether a model is suitable for modeling tails. Finally, in Chapter 5 we find the conclusions general of this work.

Keywords

Valores extremos; Riesgo operacional; Pareto

Subjects

55 - Earth Sciences. Geological sciences

Knowledge Area

Ciències Experimentals

Documents

ism1de1.pdf

1.094Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)