Modelos para el análisis de supervivencia en tiempos discretos: aplicación en el área de veterinaria

Autor/a

Barroeta Rojo, Carolina

Director/a

Julià de Ferran, Olga

Espinal Berenguer, Anna

Fecha de defensa

2016-02-03

Páginas

139 p.



Departamento/Instituto

Universitat de Barcelona. Departament de Probabilitat, Lògica i Estadística

Resumen

En esta tesis se han estudiado y comparado métodos para abordar tiempos discretos en el análisis de supervivencia, con especial aplicación en datos reales en el ámbito de la veterinaria. En primer lugar, se introduce el modelo de Cox con tratamientos de empates (Efron, Breslow, Exact y Average), así como modelos para una variable respuesta binaria (logit y clog-log), con la finalidad de abordar un tiempo discreto en análisis de supervivencia. Estas metodologías han sido aplicadas a un estudio con de datos de caballos de carreras pura sangre y permitieron identificar los factores de riesgo asociados a un evento de in-terés, la lesión musculoesquelética catastrófica (CMI). Las covariables estadísticamente significativas fueron: si había una lesión anterior, el número de carreras donde parti-cipó el caballo y la longitud de la carrera. El género y la época, dado su interés desde el punto de vista veterinario, también fueron incluídas en los análisis. En este estudio se observó similitud entre las estimaciones obtenidas en el modelo de Cox con los diferentes tratamientos de empates y los modelos discretos logit y clog-log. Se establecieron tres grupos de resultados: (1) estimaciones proporcionadas por el método exact y el modelo discreto logit; (2) modelos proporcionados por el modelo de Cox con los métodos de tratamiento de empates Efron y Average, y el modelo discreto clog-log; (3) estimaciones proporcionadas por el modelo de Cox con tratamiento de empates Breslow. En la segunda parte de esta tesis se introdujeron y usaron los métodos para abordar mo-delos en tiempo discreto en presencia de heterogeneidad no observada, incluyendo uno o dos términos de frailty. Estos modelos se aplicaron a un conjunto de datos reales donde el objetivo fue caracterizar el tiempo (en número de lactancias) hasta el primer diagnóstico de mastitis en vacas de producción de leche. Se pudo constatar que entre las variables fijas el tipo de ordeño fue siempre estadísticamente significativa. Además, también se obtuvo un efecto rebaño, resumido en el término de frailty. Al considerar un segundo término de frailty correspondiente a la zona geográfica, también resultó estadísticamente significativo. En la tercera parte de esta tesis se ha realizado una comparación de tres software dis-ponibles (R, Stata y SAS) para abordar datos de análisis de supervivencia para tiempo discreto. Esta comparación se ha realizado con el estudio del diagnóstico de mastitis en vacas lecheras, y para modelos con uno o dos términos de frailty. Se establecieron tres grupos de resultados: (1) formado por el modelo de Cox con método de empates Average y el modelo discreto clog-log; (2) formado por el modelo de Cox con método de empates Exact y el modelo logit; (3) formado por el modelo de Cox con método de tratamiento de empates Breslow. Finalmente, cabe destacar que en esta tesis se pone de relieve la importancia de considerar la naturaleza discreta del tiempo, en estudios de análisis de la supervivencia. Además, se considera también la ventaja de recoger la influencia, mediante uno o más términos de frailty, de la heterogeneidad no observada cuando ésta es relevante.


In this work we have studied and compared methods to deal discrete times in survival analysis. The main focus has been in the analysis of real data from veterinary medicine. First, in order to deal with discrete time data, have been introduced the Cox model handling for ties (Efron, Breslow, Exact and Average) and models for a binary response variable (logit and clog-log). These methodologies have been applied for analysing a dataset of Thoroughbred racehorses. The results allowed identifying a set of risk factors associated with the event of interest, a catastrophic musculoskeletal injury (CMI). Sta-tistically significant covariates were: a dummy variable of previous injury, the number of races participated by the horse and the length of the race. The analysis were also controlled by gender and season, even though they didn't be statistically significant. In this study we got very close results between the Cox model with different methods for handling tics and the discrete-time models with links logit and clog-log. Three groups were established: (1) results obtained by the Cox model with the method Exact and the discrete logit model; (2) results obtained with methods Efron and Average, and clog-log discrete model; (3) results provided by the Cox model with method Breslow. In the se-cond part of this thesis have been introduced methods to deal with discrete-time models in presence of unobserved heterogeneity, including one or two terms of frailty. These models were applied to a real data set where the main goal was to characterize in dairy cows the time (in number of lactations) until the first diagnosis of mastitis. The milking type was always statistically significant, among the fixed covariates. In addition, a herd effect (summarized in the term of frailty) was also obtained. When considering a second term of frailty corresponding to the geographical arca, was also statistically significant In the third part of this thesis, were compared three available software (R, Stata and SAS), to deal with discrete time survival data. This comparison has been carried out for the data of the diagnosis of mastitis in dairy cows. Models with one or two terms of frailty have been considered. Three groups of results were established: (1) results from the Cox model with method Average and the discrete clog-log model; (2) results from the Cox model with method Exact and the logit model; (3) results from the Cox model with treatment of ties using the Breslow method. Finally, we emphasize that this thesis highlights how important is consider the discrete nature of time. Moreover, the use of specific models with frailty for taking into account possible unobserved heterogeneity.

Palabras clave

Anàlisi de regressió; Análisis de regresión; Regression analysis; Anàlisi multivariable; Análisis multivariante; Multivariate analysis; Anàlisi de supervivència (Biometria); Análisis de la supervivencia; Survival analysis (Biometry); Veterinària; Veterinaria; Veterinary medicine; Cavalls; Caballos; Horses; Vaques; Vacas; Cows

Materias

51 - Matemáticas

Área de conocimiento

Ciències Experimentals i Matemàtiques

Documentos

CBR_TESIS.pdf

867.2Kb

 

Derechos

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

Este ítem aparece en la(s) siguiente(s) colección(ones)