LOS MODELOS MULTINIVEL EN EL ANÁLISIS DE FACTORES DE RIESGO DE SIBILANCIAS RECURRENTES EN LACTANTES. ENFOQUES FRECUENTISTA Y BAYESIANO. TESIS DOCTORAL PARA LA OBTENCIÓN DEL GRADO DE DOCTOR POR LA UNIVERSIDAD DE MURCIA. Virginia Pérez Fernández, Licenciada en Ciencias y Técnicas Estadísticas DIRECTORES: Prof. Dr. Manuel Sánchez-Solís de Querol Profesor titular de Pediatría de la Facultad de Medicina de la Universidad de Murcia Prof. Dr. Domingo Pérez Flores Catedrático de Bioestadística de la Facultad de Medicina de la Universidad de Murcia Prof. Dr. Diego Salmerón Martínez Profesor asociado de Bioestadística de la Facultad de Medicina de la Universidad de Murcia     2  “Una vez que sabes que las jerarquías existen, tiendes a verlas por todas partes” Leeuw y Kim (1990) (1) Kreft, De     3  Agradecimientos Quiero agradecer al Prof. García-Marcos, al Prof. Bosch y al Prof, Sánchez-Solís su paciencia y a la vez su insistencia para que esta Tesis llegara a buen puerto. A mis compañeras Antonela y María, por haberme ayudado a superarme cuando lo que me apetecía era tirar la toalla. A mis padres y hermanos por estar siempre ahí y creer que puedo con todo. A mis amigas, Ana, Liliana, Mabel, Mari Carmen y Maribel por ser cada una mi “Pepito Grillo”. Y a mis directores de Tesis Domingo, Manolo y Diego, por su inestimable ayuda para realizar este trabajo.     4  INDICE INDICE 1. Introducción…………………………………………………………………… 8 1.1 Antecedentes…………………………………………………………. 11 1.2 Breve desarrollo histórico………………………………………… 15 1.2.1 Componentes de la varianza…………………………… 15 1.2.2 Análisis de la covarianza (ANCOVA)…………………. 16 1.2.3 Modelo de pendientes como resultado: (“slopes as outcomes”)……………………………………………………….. 16 1.2.4 Modelos de coeficientes aleatorios (MCA)…………… 17 1.3 Análisis multinivel: Conceptos y estructuras………………… 18 1. Estructura Jerárquica……………………………………… 19 2. Tipos de variables……………………………………………. 20 3. Correlación intraclase (ICC)…………………………….…. 21 4. “Fijos vs aleatorios”.…………………………………………. 24 1.4 Campos de aplicación del análisis multinivel………………... 25 1.5 Modelo básico de regresión multinivel: 2 niveles……………. 29 1.5.1 Del Modelo clásico al modelo multinivel……………. 29 1.5.2 Modelos que se derivan del modelo completamente aleatorizado………………………………………………………. 37 1.5.3 Asunciones en el análisis multinivel……………….. 41 1.5.4 Significación y ajuste de los modelos……………….. 42 1.5.5 Métodos de estimación de los parámetros………..... 46 1.5.6 Varianza…………………………………………………… 48     6  INDICE 1.5.7. Multinivel con diferentes variables respuesta y estructura…………………………………………………………. 54 1.5.8. Muestreo…………………..……………………………… 61 2. Justificación………………………………………………………………… 64 3. Objetivos…………………………………………………..………………… 66 4. Material y Métodos……………………………………………………….. 68 4.1 Datos y variables………………………………………………….… 69 4.2.1 Estudio ESCAPE…………………………………………. 69 4.2.2 Estudio EISL…………………………………..……….… 70 4.2 Metodología………………………………………….……………… 72 4.1.1 Modelo logístico multinivel de 2 niveles: Enfoque frecuentista……………………………………..………………… 73 4.1.2 Modelo logístico multinivel de 2 niveles: Enfoque bayesiano……………………………………………………..…… 80 5. Resultados…………..……………………………..………………………… 86 6. Discusión…………..……………………………..………..……………… 113 7. Conclusiones…………..……………………………..…………………… 125 8. Bibliografía…………..………………………..………………………….. 127 9. Anexos…………..……………………………..………………….………… 141       7  1. INTRODUCCIÓN INTRODUCCIÓN La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos (Estadística Descriptiva), siempre y cuando la variabilidad y la incertidumbre sean una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones (Inferencia estadística). Entre los desarrollos científicos más importantes del siglo 20, está el crecimiento explosivo del razonamiento estadístico y los métodos para aplicar a estudios de salud. Los ejemplos incluyen desarrollos en métodos de probabilidad para inferencia, estadística epidemiológica, pruebas clínicas, análisis de supervivencia y estadística genética. Los problemas en salud pública y la investigación biomédica han estimulado el desarrollo de estos métodos, que alternativamente han mejorado nuestra capacidad de hacer inferencias válidas de los datos. Este crecimiento ha sido posible gracias a los avances en técnicas computacionales y el desarrollo de paquetes de programas para implementar los procedimientos numéricos que han afectado a la práctica de la medicina y al uso de los métodos estadísticos que los investigadores usan. En la actualidad existen cerca de 40 paquetes o programas específicos, estadísticos gratuitos o de libre distribución y aproximadamente 60 programas o paquetes no gratuitos. R SAS SPSS SPAD Stata Statgraphics Redatam Minitab Matlab S-PLUS LISREL WinQSB Excel Tabla1. Paquetes estadísticos más utilizados Los más usados en el campo de la investigación son R, SPSS, STATA, SAS, SPLUS.     9  INTRODUCCIÓN Los modelos multinivel o también llamado Jerárquicos, son una respuesta a la necesidad de analizar la relación entre los individuos y el medio en el que se desenvuelven. Existe una diversidad de nombres que se utilizan en los textos y publicaciones relacionados con este tipo de análisis; y que en algún sentido podrían confundir al lector que tiene una primera aproximación con las técnicas. Dentro de estos nombres se encuentran: Análisis Multinivel o Modelos multinivel (Multilevel Analysis or Multilevel Models), Análisis Jerárquico o Modelos Jerárquicos (Hieralchical Analysis or Hieralchical Models), Análisis Contextual (Contextual Analysis), Análisis de Regresión de Efectos Aleatorios Multinivel (Multilevel Random Effects Regression Analysis, Modelos Lineales Jerárquicos (Hierarchical Lineal Models-HLM), Modelos de Efectos Mixtos (Mixed-Effects Models), Modelos de Coeficientes Aleatorios (Random Coeficient Models), etc., de todas estas denominaciones la más genérica es la de Modelos Multinivel, que refleja claramente la naturaleza jerárquica de los datos, pero no prejuzga la forma de las funciones que se utilizan (2), ni el tipo de jerarquía. El software más completo para el análisis multinivel es el MLwiN. Existen otros programas que se pueden usar para el análisis de datos con una estructura jerárquica aunque son más limitados (3;4), como: • • • HLM, http://www.ssicentral.com/hlm/ BMDP 5V, http://www.statistical-solutionssoftware.com/products-page/bmdp-statistical-software/ PROC MIXED (procedimiento de SAS), http://support.sas.com/documentation/cdl/en/statug/63033/H TML/default/viewer.htm#mixed_toc.htm • Para STATA, http://www.ats.ucla.edu/stat/stata/topics/MLM.htm una revisión más amplia consultar con http://www.bristol.ac.uk/cmm/learning/mmsoftware/     10  INTRODUCCIÓN 1.1 Antecedentes: Los modelos Multinivel trabajan con observaciones anidadas en grupos. Los datos sociales, del comportamiento, los económicos y los de las ciencias de la salud tienen a menudo una estructura jerárquica. Un ejemplo en el campo de las ciencias de la salud son pacientes agrupados en médicos, centros de atención primaria y estos agrupados a su vez en áreas de salud, etc. Estas agrupaciones hacen que los sujetos que pertenecen al mismo grupo reciban una serie de influencias comunes; por lo tanto, las observaciones dentro de un mismo grupo no son independientes entre sí y si se aplican los métodos de análisis de regresión se viola uno de los principios básicos de la estadística frecuentista, la independencia de los datos (3), lo que se traduce en la subestimación de los errores estándar de los coeficientes de regresión. Esto implica, que los intervalos de confianza serán demasiado estrechos y los p-valores demasiado pequeños, lo que nos puede llevar a inferir que un predictor tiene un efecto “real” sobre la variable respuesta cuando podríamos atribuir dicho efecto al azar, es decir, a un aumento del riesgo  o probabilidad de error tipo I. Tradicionalmente, se han usado modelos de regresión con parámetros lineales fijos para el análisis de este tipo de datos. Un estudio conocido e influyente llevado a cabo en 1970 en niños de primaria (5), concluyó que los niños expuestos a estilos llamados 'formales' de enseñar lectura, exhibieron un mayor progreso que aquellos que usaron otro método. Se analizaron los datos utilizando técnicas de regresión múltiples tradicionales, usaron como unidad de análisis a los niños de forma individual e ignoraron sus agrupaciones en profesores y en clases. Los resultados fueron estadísticamente significativos. Después Aitkin et al. (6), demostraron que cuando el análisis tuvo en cuenta correctamente la agrupación de los niños en clases, las diferencias significativas     11  INTRODUCCIÓN desaparecieron y no se podía concluir que los niños que usaron un método tradicional diferirían de los otros (3). Se pueden analizar variables de diferentes niveles, como si fueran de un único nivel común, usando la agregación o desagregación de los datos. Por ejemplo: una variable medida en un médico, tal como la edad, se puede agregar a nivel de centro de salud asignando a un centro la edad media de los médicos que allí trabajan. Una variable medible en el centro, tal como si es pequeño, mediano o grande, puede ser desagregada a nivel de médico asignando a cada medico el tamaño del centro donde trabaja. De esta forma se puede usar simplemente la correlación clásica o las técnicas de regresión, o al menos eso parece. Las consecuencias de la agregación y la desagregación no son triviales, y crean dos tipos de problemas. El primer problema es estadístico, la agregación de los datos, consiste en calcular el valor de la media en cada grupo en las variables a estudiar y a continuación realizar el análisis con las unidades de segundo orden, los grupos. Esto se traduce en una pérdida de información y de potencia estadística (aumento del riesgo β o probabilidad del error tipo II). Por otro lado si los datos están desagregados, es decir, si asignamos los valores de las variables de segundo orden o nivel a cada unidad individual, y a continuación se realiza el análisis en el nivel individual o primer nivel, nos encontramos con que no podemos considerar que los datos del primer nivel de un mismo grupo constituyan observaciones independientes. Si obviamos este hecho, y tratamos de estudiar diferencias entre grupos, aumentamos el riesgo de cometer un error de tipo I o riesgo , o por el contrario, ser demasiado conservador al estudiar las diferencias entre individuos (7). El segundo problema se plantea desde el punto de vista conceptual, y surge a la hora de interpretar los resultados. Si no se es muy cuidadoso en la interpretación de los resultados, se puede incurrir en “la falacia del nivel equivocado” que consiste en analizar los datos en un nivel y     12  INT TRODUCC CIÓN extr raer concl lusiones a otro nivel. El caso más conocido es el de la c o d “fala acia ecoló ógica” con nocida ta ambién por el 'efe p ecto de R Robinson' (8). Robinson en su invest tigación, m mostró da atos agreg gados que describía la e an relación entr el porc re centaje de negros y el nive de anal e el lfabetismo en o nuev region ve nes geog gráficas e en 1930. La cor . rrelación ecológica (la a corr relación e entre las variables agregada a nivel de reg as) gión fue 0.95, 0 pero la corre o elación individual e entre las variables absoluta en el nivel s as n individual er 0.20. Robinso ra on conclu uyó que en la p práctica una relación ec cológica e claram es mente disti inta a su correlació individ ón dual. corr Por lo tanto, realizar inferencia sobre un nivel al de la j as u lto jerarquía, con , resu ultados obtenidos del anál lisis reali izado a u nivel más bajo es un o enga añoso; es error e conoci ste es ido como “la falac atomis cia sta”. Alke (9) er cate egorizó est tipos d falacia ver tab tos de as, bla2. Tabla a2. Adapta ado de Diez-Roux AV Schwartz S, Susse V, z, er,E. Ecologic studies and s ecolo ogic variable in public health re es esearch (10) ) Un e error difer rente, es e conocid como 'l Paradoj de Sim el do la ja mpson' (11). La para adoja de Simpson describ la de n, be esaparició de la significa ón ación esta adística de una aso e ociación e entre vari iables o u una comp paración entre e grup pos, cuan ndo los d datos son desagreg gados por grupos. También es . n refer rida com el cam mo mbio en e sentido de una asociación entre dos el o   13  INTRODUCCIÓN variables (cuantitativas o cualitativas), cuando se controla el efecto de una tercera variable o variable de confusión(12). Se ha señalado también por Holt, Scott y Ewings (1980) (13), que pueden resultar en graves errores de inferencia, del análisis de datos de esquemas complejos de muestreo, si lo que se asume, es que los datos han sido obtenidos bajo un esquema de muestreo aleatorio sencillo.     14  INTRODUCCIÓN 1.2 Breve desarrollo histórico: En esta sección se recoge un breve resumen sobre los modelos estadísticos, que más han contribuido al desarrollo del análisis multinivel. Las herramientas desarrolladas en un área de estudio a menudo pueden ser usadas en otras áreas. Este resumen muestra que los modelos multinivel son un conglomerado de modelos conocidos, tales como, análisis de componentes de la varianza, modelos de coeficientes aleatorios,…. 1.2.1 Componentes de la varianza: El análisis de componentes de la varianza (y análisis de modelos mixtos) tiene una complicada y larga historia. El primer uso de esta técnica fue en astronomía (1861) por Airy (14). Pero fue el trabajo de Fisher (15) el que plantó la semilla para el crecimiento de posteriores trabajos. El procedimiento está diseñado para estimar la contribución de múltiples factores a la variabilidad de una variable dependiente Y. Se usa para analizar un experimento anidado en el cual los factores están estructurados en un estricto orden jerárquico, y en el que todos los efectos se asumen como aleatorios. En este tipo de estudios, las muestras de cada factor, son tomadas del interior de las muestras del factor inmediatamente superiores a él, y la variabilidad de Y es la suma de la variabilidad explicada por los diversos factores. Dentro de estos modelos, los componentes individuales son independientes, pero se correlacionan perfectamente dentro de los grupos. Se han desarrollado modelos de regresión aleatorios para modelar datos continuos (Bock 1983) y también medidas repetidas de datos dicotómicos (16) tradicionales ANOVA. dónde ciertas características de los datos excluyen la utilización de modelos     15  INTRODUCCIÓN 1.2.2 Análisis de la covarianza (ANCOVA): El análisis de la covarianza, es otra forma tradicional de analizar datos agrupados. Los dos niveles de análisis, están incluidos en el modelo, pero no de la misma forma. Las variables explicativas del nivel individual están relacionadas, como en los modelos de regresión, pero al mismo tiempo a las unidades del segundo nivel se les permite variar en el intercepto. Los modelos ANCOVA incorporan tanto variables cuantitativas como cualitativas y por lo tanto tiene un carácter mixto. ANCOVA evalúa el efecto del segundo nivel, corrigiendo por las diferencias pre-existentes entre las unidades de segundo nivel. Este análisis considera los efectos individuales como ruido, y se centra en el efecto de grupo. Todo lo que el ANCOVA puede hacer es estimar si existen diferencias entre los contextos, pero no nos dice por qué existen esas diferencias. La utilización de modelos multinivel se ha visto entorpecida en el pasado por la forma cerrada de las fórmulas matemáticas para estimar los componentes de la varianza y covarianza, que han estado disponibles solamente para diseños perfectamente balanceados. 1.2.3 Modelo de pendientes como resultado: (“slopes as outcomes”) Dentro del escenario de trabajo del los modelos de efectos fijos, la aproximación de “pendientes como resultados” se puede considerar como una aproximación al análisis multinivel. Fue propuesta en 1978 por Burstein et al. (17), como una alternativa a las técnicas de descomposición de la varianza de Cronbach. La idea es realizar un análisis de regresión lineal separado para cada grupo o elemento del nivel macro, seguido por la regresión de los coeficientes del primer nivel en el segundo, usando los interceptos y coeficientes como variable     16  INTRODUCCIÓN respuesta junto con las variables explicativas del nivel macro o nivel superior. Pero esto no aporta nada nuevo desde el punto de vista estadístico, las regresiones intra y entre grupos no están conectadas unas con otras. Si se ignora la estructura jerárquica de los datos y se analiza cada grupo separadamente, se obtienen modelos poco parsimoniosos, y que se ocupan solo de las diferencias y no de los puntos en común. 1.2.4 Modelos de coeficientes aleatorios (MCA): Fueron propuestos por vez primera en 1947 por Wald(18) y en 1950 por Rubin (19), y la revolución computacional en los 70 ayudó a que se extendiera su uso. Estos modelos pueden ser considerados una extensión de los modelos de componentes de la varianza descritos anteriormente, covariables, y en los que se incluyen están variables en explicativas los o conceptualmente basados modelos “pendientes como coeficientes”. Una diferencia entre estos dos modelos es que los MCA no estiman de forma separada los coeficientes para cada grupo o elemento de nivel macro, aunque cada grupo puede diferir de otro en el intercepto, en las pendientes o en ambos (20). En estos modelos, los coeficientes de regresión del primer nivel son tratados como variables aleatorias en el nivel macro. Esto significa que los coeficientes del primer nivel son entendidos como originadores de una distribución de probabilidad. Los parámetros más importantes de esta distribución, media y varianza, están entre el conjunto de parámetros que deben ser estimados por el modelo (2). El problema de estos modelos es que proporcionan estimaciones poco reales para grupos que tienen pocas observaciones. Y no hay ninguna posibilidad de incluir variables de otro nivel.     17  INTRODUCCIÓN 1.3 Análisis multinivel: Conceptos y estructuras Para poder usar tanto coeficientes aleatorios como variables de distintos niveles, se deben utilizar modelos multinivel. El análisis Multinivel permite incluir características de grupos diferentes en modelos de comportamiento individual. Al incorporar las características de grupos al modelo multinivel, se tiene en cuenta la estructura jerárquica de los datos, se obtienen estimaciones correctas de los errores estándar y se facilita la exploración de la variación entre grupos que puede ser de interés por derecho propio. Además se pueden construir también pruebas válidas e intervalos de confianza y se pueden incorporar variables de estratificación al modelo, utilizadas en el diseño de la muestra. En datos estructurados jerárquicamente, los individuos pertenecientes al mismo grupo probablemente son más parecidos entre sí que individuos en grupos diferentes. Debido a esto, las variaciones en el resultado se pueden deber a diferencias entre grupos, y a diferencias individuales dentro de un mismo grupo. Estos son algunos ejemplos de preguntas que pueden ser exploradas usando el análisis multinivel: ¿Puede una variable del campo de la salud variar a través de las distintas áreas de salud? ¿Son estas variaciones entre áreas explicadas por la diferencia en el acceso a los servicios de salud? ¿La variación total entre áreas es diferente entre la zona urbana y la rural? Antes de adentrarnos más en el AM, es necesario hacer un resumen de los conceptos básicos para su entendimiento:     18  INT TRODUCC CIÓN 1. Estructura Jerá árquica: U Una jerarq quía cons siste en un conjunt de n to obse ervaciones que con nforman el nivel in ndividual, primer nivel o micro m nive que se encuentr el, ran anidad dentr de un n das ro nivel supe erior, segu undo nive o nivel macro (e el esto en e caso más senci el m illo, en el que sol se l lo cont templan d nivele aunqu cabe más de un nivel mac dos es, ue cro, como por o ejem mplo pacie entes agr rupados e centros de salu dentro de área de en s ud, o as salu ud, y agr rupados e provin en ncias). Ta ambién se suelen referir a los e nive eles macro como gr o rupos o co ontextos (esto ocur más en el ámbit de rre n to la ed ducación) Ejemplo de esta estruct ). os as turas son pacientes anidado en s os méd dicos o me edidas rep petidas an nidadas dentro de p d personas (2;20). Clas sificación gráfica de Estructu e uras Jerár rquicas (21;22): 1. a Estruct a. turas jerá árquicas de 2 niv s veles: Las estructur ras jerárq quicas ap parecen cu uando ten nemos un unidad del na d prim nivel o del nive más ba anidad en una y solo u mer el ajo da a una unida de ad segu undo nive o nivel m alto. T el más Tipos: a.1 tes o os ud 1. a Pacient dentro de centro de salu CS1 Pac c1 Pac2 Pac3 Pac1 CS2 Pac2 P Pac c1 Pac2 CS3... C Pac3 Pac4 Fig. 1. Diagrama de 2 nivel anidado a les os.   19  INT TRODUCC CIÓN 1. a Medida repetid a.2 as das, datos de panel P1 P2 P3... . M4 M1 M M2 M3 M1 M2 M1 M2 M3 ación y dia agrama de unidades de un dise eño de medidas repet tidas, Fig. 2. Clasifica iciones anid dadas en pa acientes. medi 1. a Respue a.3 estas multivariante dentro de individ es d duos A v veces des seamos m modelar más de una res spuesta. Por ejem mplo, pode emos que erer considerar con njuntamen peso y talla de una pers nte sona, porq que las do respues os stas están probablemente re n elacionadas. P1 P T P2 P P3 T P P4 4... T Fig. 3 Diagrama de un mo 3. a odelo de respuesta mul ltivariante   20  INT TRODUCC CIÓN 1. b Estructu ura de 3 niveles: Área1 CS1 PC1 P PC2 P CS2 PC1 PC1 Área2 Á CS1 PC2 PC3 Fig. 4 Estructu jerárquica de 3-niv 4. ura veles, pacien ntes dentro de centros de salud dentro d de ár reas. 1. b.1 Estudio trasvers repetid o sal do: Individuos dentr de coho ro ortes y estas dentro de ciuda o ades. Murcia Ca artagena Lorc ca 2005 2006 2005 2005 2006 PC C1 PC2 PC1 PC1 PC2 PC3 PC1 PC2 PC1 PC2 Fig. 5 Estructu jerárquic de 3-nive 5. ura ca eles   21  INTRODUCCIÓN 1. c. Estructuras no-jerárquicas: En todos los ejemplos vistos con anterioridad, cada unidad de un nivel inferior se encontraba anidada en una y solo una unidad de nivel superior. Esto es lo que se conoce como jerarquías estrictas. Pero la realidad puede ser más complicada que esto, y podemos encontrar: • Estructuras con clasificación cruzada MED1 MED2 MED3 Pac1 Pac2 Pac3 Pac4 Pac5 Pac6 Pac7 Pac8 DROGA1 DROGA2 DROGA3 Fig6. Muestra los pacientes unidos al tipo de medicamento que toman y al médico que los atendió. El médico no está anidado dentro del tipo de droga, y esta a su vez no está anidada en el nivel médico. Clasificación cruzada. 2. Tipos de variables: Desde el punto de vista de la estadística, en relación a la naturaleza de los datos se habla de variables continuas, discretas, nominales y ordinales; estableciéndose una serie de modelos, procedimientos y formas de análisis según sea el tipo de datos con los que se cuenta. En multinivel, además de tomar en cuenta la naturaleza de los datos, se han establecido otro tipo de clasificaciones, que tienen que ver con el propósito del estudio y con la unidad de análisis de la que se obtiene la información. La primera clasificación agrupa la información en variables de respuesta y variables explicativas, tal como se conocen en el análisis de regresión. La segunda clasificación viene     22  INTRODUCCIÓN dada por la unidad de análisis en la que se le miden las variables. Supongamos una estructura jerárquica en la población donde se identifican las siguientes unidades: pacientes dentro de hospitales, y estos a su vez agrupados dentro de áreas geográficas. Las variables que se extraen de la unidad más pequeña, en este caso los pacientes, se les denominan variables a nivel individual; las variables que se miden a las unidades que agrupan a otras unidades, por ejemplo los hospitales o áreas geográficas, se llaman variables a nivel grupo o variables contextuales. En algunos casos las variables a nivel individual y las de grupo son similares, pero medidas por diferentes indicadores, por ejemplo a nivel individual el ingreso de la persona y al nivel grupo el ingreso medio de un barrio. Por otra parte, está el caso en que la variable puede ser medida únicamente al nivel grupo, porque fue definida sólo en ese nivel, por ejemplo el número de establecimientos de salud dentro de un área geográfica. La importancia de las variables a nivel grupo es que contienen información que no ha sido recogida por las variables a nivel individual, y es por esto que se incluyen en el análisis. En multinivel, las variables de respuesta se miden al nivel individual, y las variables explicativas se miden tanto a nivel individual como de grupo (23). 3. Correlación intraclase (ICC): Es un indicador de la homogeneidad interna de los grupos. Es una medida de la similitud de las unidades del nivel individual y de las diferencias entre las unidades del nivel macro. Por ejemplo, se desea investigar la relación entre el nivel de colesterol y la edad, en este estudio las observaciones de los pacientes están anidadas dentro de distintos médicos. El ICC se define como la varianza entre los médicos dividida entre la varianza total, donde la varianza total es la suma de la varianza entre médicos y la varianza dentro de cada médico (24). Cuanto menor es la varianza dentro de los grupos, mayor es el índice de correlación intraclase.     23  INTRODUCCIÓN 4. “Fijos vs aleatorios”: estos términos se aplican a 3 entidades distintas: a. Efectos fijos y efectos aleatorios. Un factor compuesto por diferentes tratamientos se dice que es un factor de efectos fijos si todos los posibles tratamientos en los que está interesado el investigador están presentes en el experimento. Un efecto aleatorio se refiere a un factor compuesto por una muestra aleatoria de entre todos los tratamientos relevantes. Por ejemplo, los efectos fijos solo permiten que se hagan inferencias acerca de los tratamientos usados en el experimento. b. Variables fijas y aleatorias. Una variable aleatoria es una variable que toma sus valores de una distribución de probabilidad, por lo tanto, tiene una media y una varianza (que puede ser o no conocida). En general, se asume que al medir una variable aleatoria se comete un error, ya que si se realizan dos mediciones, difieren una de otra. Una variable fija es aquella que sus valores son conocidos. Un ejemplo es la variable sexo (20). c. Coeficientes fijos y aleatorios. Son conceptos nuevos, que aparecen en relación a los modelos de coeficientes aleatorios. En los modelos de regresión lineal clásicos, se estiman los parámetros que especifican la recta de regresión, que son el intercepto y las pendientes; estos parámetros son los mismos para todos los grupos, en otras palabras, estos coeficientes son fijos. Los coeficientes aleatorios son coeficientes que se distribuyen según una función de probabilidad (20). Una regla general para los coeficientes de regresión aleatorios es que solo pueden ser considerados aleatorios en el nivel superior en el que han sido medidos.     24  INTRODUCCIÓN 1.4 Campos de aplicación del análisis multinivel: Las ciencias sociales y de la educación han sido las pioneras en la investigación de la relación entre los individuos y el marco contextual en el que desarrollan sus vidas. Como dijo Moellering en 1972 (25) “La Sociedad humana está organizada como modelo general en jerarquías anidadas” El uso del análisis multinivel ha sido progresivo. Si bien en la década de los ochenta podían encontrarse algunas publicaciones en las que se refiriera el uso de tales modelos, es al final de esta década cuando se produce una gran abundancia de las mismas (2). Ver figura 7. Como ya se ha dicho, el análisis multinivel se aplica en múltiples campos como en educación (26-32), demografía (33-40), sociología y sociología y salud (33;41-45) y, por supuesto, en el campo que nos interesa, que es el de las ciencias de la salud. Si realizamos una búsqueda en Pubmed con las siguientes palabras clave: "multilevel model" OR "multilevel analysis" OR "hierarchical model" OR "multilevel modelling" OR "hierarchical linear model" OR "multi-level analysis" OR "multi-level model" OR "multi-level modeling" OR "mixed model" OR "mixed linear model" OR "mixed no linear models" OR "random effects model" OR "random coefficient models" OR "random coefficient model" OR "panel data model" obtenemos los siguientes resultados: Localizados 15204 artículos, 15160 con abstract disponible en el periodo 1966-2012.     25  INTRODUCCIÓN 2500 2000 1500 1000 500 0 Fig7. Gráfico de publicaciones en el periodo 1966-2012 Observamos que el crecimiento de las publicaciones en los últimos 12 años ha sido exponencial, siendo 13666 de estas publicaciones correspondientes al periodo 2000-2012. Y de estos, 9747 son de investigaciones en humanos. El 26.46% de estas publicaciones son estudios con individuos menores de 18 años. Solo 31 del total de estas publicaciones son en español. Dentro del campo de la investigación en salud pública, existe un claro interés en ver qué papel juegan los factores ambientales y su influencia en la susceptibilidad individual a una enfermedad (22). Muchos de los datos observados en las ciencias biomédicas, tienen una estructura jerárquica o anidada. Por ejemplo en los estudios de herencia en humanos y animales existe una jerarquía natural, ya que la descendencia se agrupa en familias. La descendencia de los mismos padres tiende a ser física y mentalmente más parecida que individuos elegidos al azar en una población grande. Por ejemplo los niños de la misma familia pueden tender a ser bajos, quizás porque sus padres son 1966 1968 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012     26  INTRODUCCIÓN bajos o puede que sea debido a un entorno común empobrecido. Muchos experimentos también crean datos estructurados en jerarquías, por ejemplo ensayos clínicos llevados a cabo en varios centros elegidos aleatoriamente (3). El análisis multinivel se ha usado en estudios sobre cáncer (46-49), enfermedades cardiovasculares (50-53), estudios de genética (54-56), enfermedades del aparato respiratorio (57-59) y en otras especialidades médicas. Esta tesis dirige su uso a la investigación de las sibilancias. Existen pocos estudios que hayan utilizado el análisis multinivel para el estudio del asma o sibilancias (43;58;60-71), no habiendo encontrado ninguno que estudie y analice los factores de riesgo de las sibilancias recurrentes en el primer año de vida. En la tabla 3 se resume el tipo de modelo, el número de niveles y las unidades que se eligen en cada nivel de algunos de los estudios citados en el párrafo anterior.     27  INTRODUCCIÓN Referencia bibliográfica 39 Tipo de modelo Poisson Nº de niveles Unidades de análisis 1ºnivel: municipios 2º nivel: comunidades 1ºnivel: pacientes 2º nivel: plan médico 3º nivel: comunidad 1ºnivel: pacientes 2 40 Logístico 3 41 Logístico Medidas repetidas Lineal Lineal Lineal Logístico Logístico Medidas repetidas Logístico Logístico Multinomial Logístico Logístico 4 2º nivel: atención primaria 3º nivel: hospital 4º nivel: área de salud 1ºnivel: medidas realizadas 42 2 2º nivel: pacientes 1ºnivel: pacientes 43 44 45 46 48 49 3 2 2 2 2 2 2º nivel: atención primaria 3º nivel: países 1ºnivel: pacientes 2º nivel: médicos 1ºnivel: pacientes 2º nivel: distritos censales 1ºnivel: pacientes 2º nivel: vecindario 1ºnivel: pacientes 2º nivel: ciudad 1ºnivel: medidas realizadas 2º nivel: pacientes 1ºnivel: individuo 50 51 35 53 54 3 2 2 2 2 2º nivel: área 3º nivel: país 1ºnivel: niño 2º nivel: escuela 1ºnivel: niño 2º nivel: tiempo 1ºnivel: enfermedad 2º nivel: paciente 1ºnivel: paciente 2º nivel: médico Tabla 3. Resumen del tipo de modelo, el número de niveles y las unidades que se eligen en cada nivel.     28  INTRODUCCIÓN 1.5 Modelo básico de regresión multinivel:2 niveles 1.5.1 Del Modelo clásico al modelo multinivel El principio básico más importante que debemos considerar es que el análisis multinivel lineal puede ser visto como una extensión del análisis de regresión lineal. Vamos a partir del modelo clásico de regresión, con variable dependiente continua y aplicado, por ejemplo, a un solo contexto para familiarizarnos con la notación algebraica estándar. Supongamos que estamos interesados en estudiar la respuesta de los individuos en relación a una variable explicativa, como puede ser la edad, con el siguiente modelo de regresión: (1)    / εi ̴ N(0,σε2) Donde yi es la respuesta para el i-ésimo individuo, X1i es el valor de la variable explicativa edad para el i-ésimo individuo, β0 y β1 son los coeficientes de regresión que representan el intercepto (es el valor medio de y para individuos con X =0) y la pendiente (es el incremento que se produce en el valor de y cuando aumenta en una unidad el valor de x), respectivamente; La expresión   es conocida como la parte fija del modelo y εi es el error aleatorio o residuo (es lo que el valor de yi se aleja del resultado esperado de los individuos que tienen su mismo valor de X). Se asume el supuesto de homocedasticidad, Es decir, la varianza de los residuos es siempre la misma e independiente de los valores de X. El residuo es la parte del resultado yi que no podemos explicar mediante la parte fija de la regresión.     29  INTRODUCCIÓN 8 Colesterol Total (mmol/l)  7 6 5 4 30 40 50 60 70 Edad  Fig. 8. Ilustración de un análisis de regresión lineal, de la relación entre colesterol total y edad. Supongamos ahora que en nuestro estudio tenemos pacientes que “pertenecen” al mismo médico. Es lógico asumir, que las características de los pacientes que visitan a un mismo médico, difieren de aquellos pacientes a los que les corresponde otro médico. Estas diferencias pueden ser debidas al área de salud donde ejerce el médico, a ciertas características personales del médico, etc. (2)   i=1…………..n          … .       donde (β2….βm) son los coeficientes de regresión de las variables dummy que representan a los distintos médicos, siendo m el número de médicos.     30  INTRODUCCIÓN 8 Médico5  Médico4  Médico3  Médico2  Médico1  7 6 5 4 30 40 50 60 70 Fig. 9. Ilustración del análisis de regresión lineal, de la relación entre colesterol total y edad, corregido por la variable dicotómica médico. Resumiendo, si tenemos un estudio con 12 médicos, es necesario estimar 11 coeficientes de regresión, en la regresión lineal. Esto supone una pérdida de poder y eficiencia del modelo, porque no existe un interés real en la diferencias de la variable dependiente respecto la variable médico y no parece muy práctico estimar una ecuación de regresión para cada médico como se ve en la figura anterior. (3) . .     31  INT TRODUCC CIÓN Por lo t tanto una forma m a más eficiente de c corregir p por el posible efecto de la v variable m médico es utilizar el análisi multin s is nivel, es decir, d r iable méd dico com 2º niv mo vel o niv vel macro Usand el o. do usar la vari voca abulario propio del an nálisis multinivel, m , decimo os que las obse ervaciones que se h hacen a n nivel de pa aciente, se encuent e tran anida adas dent del ni tro ivel médic Figura 10. Con el uso d anális multin co, a n del sis nivel, no es neces sario esti imar cad intercepto por separad ( da do , , …, ), lo que se e estima es el valor medio del interc s r cepto má la ás varianza de lo interce os eptos en e segundo nivel (efe el o fecto aleat torio). Fig. 10. Es structura m multinivel de 2 niveles. e n: eral si un ítem tien dos su n ne ubíndices ij, indica que a Notación En gene varí de indi ía ividuo en individuo dentro de un mi o ismo grup Si un ítem po. tiene únicame e ente un subíndice j solamen varía entre los grupos j, pero j, nte tiene el mism valor pa todos los individ e mo ara duos de u mismo grupo. Y si un un s ítem no tiene ningún s m subíndice es que es constant a través de todos los s te s indi ividuos y g grupos.   32  INTRODUCCIÓN Si establecemos una jerarquía de dos niveles, donde los individuos del nivel 1 se encuentran agrupados dentro de unidades del nivel 2, se incorpora un nuevo subíndice (j) en el modelo. La ecuación de regresión para el i-ésimo individuo dentro del j-ésimo grupo (elementos de segundo nivel), vendrá dada por: (4) yij = β0j + β1jxij + εij Esta variabilidad en el segundo nivel es la característica principal de los modelos multinivel, dando lugar a un modelo diferente al modelo tradicional (1). En la ecuación (4), yij es la respuesta para el paciente i en el médico j; xij es el valor de la variable explicativa (por ejemplo edad) para el paciente i en el médico j, β0j y β1j son el intercepto y la pendiente, respectivamente, en el médico j y εij es la variación residual del i-ésimo paciente en el j-ésimo médico, es decir, lo que se aparta de la respuesta esperada según su edad. Se asume que tiene una distribución normal, con media 0 y varianza constante, εij ̴ N(0,σε2), es decir, asumimos que la varianza es homogénea para todos los médicos. El objetivo de la modelización multinivel es considerar dentro de un mismo modelo los distintos niveles de la estructura jerárquica y conocer la variabilidad debida al segundo nivel, al ser los coeficientes β0j y β1j valores propios de cada médico. Estamos suponiendo la variabilidad entre contextos, con lo que estos coeficientes pasan a ser variables aleatorias en el nivel macro, y los podemos expresar como: (5) β0j= β0 + u0j (6) β1j= β1+u1j     33  INTRODUCCIÓN El intercepto β0j, se descompone en β0 que es la respuesta media en la población de médicos y representa la parte fija de la ecuación y en u0j que refleja la varianza en los interceptos de los diferentes médicos y representa la parte aleatoria del modelo en el segundo nivel. De igual forma, β1j puede tener variabilidad propia, y se descompone en β1 que es la pendiente para la población de médicos y en u1j que representa la variabilidad de los coeficientes de regresión para edad para los distintos médicos, y es la parte aleatoria del modelo en el segundo nivel vinculada a la pendiente. Entonces: (7) E(β0j) = β0   E(β1j) = β1 E(u0j) = E(u1j) = 0   V(u0j)=σ2u0   V(u1j)= σ2u1 V(εij)= σε2 cov(u0j, u1j)=σu01 σ2u0, σ2u1 y σu01 son la varianza entre los puntos de corte, pendientes y la covariancia entre el punto de corte y pendiente, respectivamente. La idea de variación entre contextos es esencial en los modelos multinivel, si no existiera no sería necesario el empleo de estos modelos.         34  INTRODUCCIÓN La siguiente figura muestra el significado de los siguientes valores que pueden adoptar las varianzas y covarianzas del modelo:   y  y y y y    Pendiente Pendiente   Pendiente Pendiente Pendiente   P. Corte  P. Corte  P. Corte P. Corte P. Corte  (a) (b) (c) (d) (e) Figura 11. Variación en el nivel macro.   Si retomamos el ejemplo de los pacientes anidados en médicos que hemos estado usando hasta ahora vemos que, en la figura 11.a todos los médicos comparten la misma ecuación, es decir, para todos los médicos la relación entre la edad y la variable respuesta es la misma. Tienen la misma recta de regresión por lo tanto:   σ2u0 = σ2u1 = σu01 = 0   En la figura 11.b los médicos comparten la misma pendiente, pero difieren en el intercepto, lo que significa que: σ2u1 = 0 ; σ2u0 >0       35  INTRODUCCIÓN En la figura 11.c se observa que cuanto mayor es la media del médico mayor es la pendiente y también difieren en el punto de corte por lo que: σ2u1 > 0 ; σ2u0 >0 Además cuanto mayor es el punto de corte mayor es la pendiente lo que significa que: σu01 > 0 En la figura 11.d encontremos el caso contrario por lo tanto: σ2u1 > 0 ; σ2u0 >0 ; σu01 < 0 La última ilustración 11.e muestra el caso en el que no hay relación alguna entre el punto de corte y la pendiente, luego: σ2u1 > 0 ; σ2u0 >0 ; σu01 = 0 Resumiendo, el modelo de regresión representado en (4), incluyendo la estructura jerárquica de 2 niveles, se puede expresar como la suma de una parte fija y una parte aleatoria, dando lugar al modelo general (ecuación 5.8) que es un modelo llamado modelo completamente aleatorio: (8) Yij= β0 + β1 xij + ( u1j xij + u0j + εij ) Parte fija Parte aleatoria Los coeficientes de la regresión β0 y β1 son usualmente referidos como parámetros fijos del modelo y el conjunto de varianzas y covarianzas como los parámetros aleatorios (72). En la ecuación 8 se contempla la posibilidad de variación tanto en puntos de corte como en pendiente, sin embargo hay modelos más sencillos y también más complejos.     36  INTRODUCCIÓN Figura 12. Modelo completamente aleatorio. 1.5.2 Modelos que se derivan del modelo completamente aleatorizado: MODELO NULO: o modelo con solo intercepto, es un caso particular del 1º modelo, por lo tanto, es un modelo de interceptos aleatorios en el que no existe ninguna variable predictora. (9) 1º Nivel yij = β0j + εij 2ºNivel β0j= β0 + u0j Modelo Nulo:  yij = β0 +( u0j + εij )  El modelo nulo no sirve para explicar la varianza de la variable dependiente Y, este solo descompone la varianza en dos componentes independientes: σε2, que es la varianza del error del 1º nivel, y σ2u0 que es la varianza del error del nivel macro o 2º nivel (12). Este es un modelo muy importante porque provee una partición básica de la variabilidad de los datos entre los 2 niveles (73). Usando este modelo podemos definir la correlación intraclase (CCI, ρ) o el coeficiente de     37  INTRODUCCIÓN partición de la varianza (VPC en la literatura inglesa) con la siguiente fórmula: (10) ρ= µ µ   Como ya se ha visto en los conceptos básicos, el coeficiente de correlación intraclase indica la proporción de la varianza explicada por la estructura de grupo en la población (74). En nuestro ejemplo de pacientes y médicos, el CCI indica la correlación de las observaciones de los pacientes pertenecientes al mismo médico, y también mide la dependencia de las observaciones de los pacientes dentro del grupo de médicos. El CCI toma valores entre 0 y 1, tal que, si es 0 no hay diferencias entre los elementos del 2º nivel (σ2u0 = 0) y si el CCI es 1, no ha diferencias dentro de cada grupo (Yij=Yj o σε2 = 0). Además de para el cálculo del CCI debemos usar este modelo como estrategia metodológica. Como una primera aproximación al análisis multinivel es necesario ajustar el modelo nulo para ver si la varianza es significativamente distinta de cero, ya que si no es así no tendría sentido incluir variables explicativas en el modelo, porque no habría nada que explicar (2;73). Lo normal, es que exista varianza significativa tanto en el primer nivel como en el segundo, por ello nuestra labor será introducir variables en el modelo que reduzcan la varianza no explicada. MODELO DE INTERCEPTOS ALEATORIOS: en el que se plantea que existe variación entre los puntos de corte σ2u0 >0 pero no hay variación entre pendientes σ2u1 = 0 y β1 se asume que es el mismo para cada grupo (figura 13); El modelo multinivel más simple con una variable explicativa es:     38  INTRODUCCIÓN (11) Modelo de varianza de efectos  aleatorios (variance components  model):  yij = β0 + β1xij +( u0j + εij ) 1º Nivel o nivel micro yij = β0j + β1jxij + εij 2ºNivel o nivel macro β0j= β0 + u0j β1j= β1   Figura 13. Representación modelo de interceptos aleatorios. Figura 14. Líneas de predicción para un modelo de intercepto aleatorio para dos unidades de nivel 2     39  INTRODUCCIÓN MODELO DE PENDIENTES ALEATORIAS (solo): en el que se plantea que existe variación entre las pendientes σ2u1 >0 pero no hay variación entre los puntos de corte σ2u0 = 0, por lo tanto; (12) 1º Nivel yij = β0j + β1jxij + εij 2ºNivel β0j= β0 Modelo de pendientes aleatorias:  yij = β0 + β1xij +( u1jxij + εij ) β1j= β1 + u1j   Figura 15. Representación modelo de pendientes aleatorias. Fig16. Líneas de predicción de un modelo de pendientes aleatorias, para dos grupos.     40  INTRODUCCIÓN 1.5.3 Asunciones en el análisis multinivel Como ya se ha dicho los modelos multinivel son una extensión de los modelos de regresión tradicionales, por ello, comparten básicamente los supuestos de aplicación (2;20), es decir, todas las asunciones para análisis de regresión lineal 'estándar' también se aplican o son válidas para análisis multinivel. Por lo tanto una variable dependiente se debería distribuir Normalmente. Al igual que en el Análisis de regresión lineal, se puede comprobar la normalidad por medio de gráficos de normalidad Spiegelhalter, (vea para detalles: Goldstein y Healy 1995; Goldstein y 1996.) La asunción de independencia de las observaciones no se aplica en estos modelos, porque la razón para realizar un análisis multinivel en primer lugar, es que las observaciones de los datos que van a ser analizados están correlacionadas. Una asunción adicional para análisis de multinivel, y que se ha mencionado anteriormente, es que los interceptos y las pendientes aleatorias deben estar normalmente distribuidos. Esta asunción puede relajarse con distribuciones distintas de la distribución normal, aunque puede complicar el procedimiento de estimación. Además de verificar las asunciones del análisis de multinivel, puede ser también importante comprobar si existen outliers en nuestros datos. Debido a la estructura multinivel de los datos, podemos encontrar outliers en los diferentes niveles. Por ejemplo, las observaciones de pacientes pueden influir en la relación total que se analiza o pueden ser outliers en el nivel paciente. Por otra parte una única observación de un paciente, puede ser también un outlier para un médico en particular a quien ese paciente 'pertenece', en otras palabras, la observación paciente puede ser un outlier al nivel de médico (75-77). Snijders y Brosker (73) plantean las siguientes preguntas, que nos ayudaran a comprobar los supuestos:     41  INTRODUCCIÓN i. ii. iii. iv. La parte fija del modelo ¿contiene las variables adecuadas? La parte aleatoria del modelo ¿contiene las variables adecuadas? Los residuos del primer nivel, ¿están normalmente distribuidos? Los coeficientes aleatorios normalmente distribuidos? del segundo nivel, ¿están v. Los coeficientes aleatorios del segundo nivel, ¿tienen una matriz de varianzas-covarianzas constante? 5.4 Significación y ajuste de los modelos Como en cualquier otro modelo de regresión, la interpretación de los modelos multinivel depende de (2;74): La significación de los coeficientes de regresión. Como de bien el modelo ajusta los datos. La teoría estadística que hay detrás del modelo de regresión multinivel es complicada. A partir de los datos observados, se quieren estimar los parámetros del modelo multinivel: 1. Los coeficientes de regresión  2. Los componentes de la varianza.   Los estimadores más utilizados en el análisis de regresión multinivel son los estimadores de máxima verosimilitud (Maximun likelihood estimators, (MLE) (74;78). El objetivo de la estimación de máxima verosimilitud es encontrar un estimador del parámetro, dependiente de los datos conocidos, más cercano al verdadero valor del parámetro. Es     42  INTRODUCCIÓN decir, dado un conjunto de datos y el modelo probabilístico subyacente, la estimación de máxima verosimilitud, toma el valor del parámetro que da lugar a la distribución con la que los datos son más probables. Los estimadores de ML, nos van a ayudar a contestar a las siguientes preguntas: 1. ¿Este predictor es estadísticamente significativo? El procedimiento de máxima verosimilitud, produce, errores estándar, para la mayoría de las estimaciones. La significación de un predictor viene dada por la ratio entre el estimador del parámetro y su error típico. Este test es conocido como el Test de Wald (79). Esta distribución del estadístico de Wald sirve para aceptar o rechazar la hipótesis nula establecida sobre el estimador del parámetro β (H0: β =0) Se verifica que: ̂ ~  0,1 o lo que es equivalente ̂ ~  .. En la práctica, una regla general para determinar la significación de un predictor es que si, (13) á   2 0.05     43  INTRODUCCIÓN 2. ¿Aporta este modelo (con x predictores) información significativa comparado con el modelo nulo o con otro modelo alternativo?   Los procedimientos de máxima verosimilitud también producen un estadístico llamado Deviance. Este estadístico indica como de bien ajusta el modelo a los datos. Si llamamos L1, al valor del máximo de la función de verosimilitud (likelihood) en la estimación de los parámetros del modelo 1, entonces se define la deviance: (14) 2 ln 2log  Como ya se ha visto anteriormente, si en el modelo nulo no hay varianza estadísticamente distinta de 0 en los niveles contemplados, ningún modelo que se derive de este añadiendo variable explicativas, mejorará el ajuste, ya que, la varianza del intercepto no es significativamente distinta de 0. Si dos modelos están anidados, es decir, un modelo se obtiene a partir de otro más general eliminando parámetros de este último, entonces podemos compararlos. Para llevar a cabo la comparación hacemos uso de la deviance de cada modelo, ya que, la diferencia de las deviances se distribuye como una chi-cuadrado con los grados de libertad iguales a la diferencia del número de parámetros estimados en los modelos que estamos comparando, bajo la hipótesis nula de que ambos modelos son iguales.     44  INTRODUCCIÓN Ejemplo: Supongamos que tenemos dos modelos M1 con m1 parámetros y M2 con m2 parámetros. (15) 2 ln     2 ln 2  ~    Si la diferencia es significativa, nos quedamos con el M2, y sino con M1, es decir, los parámetros que aparecen en el modelo 2 y no en el modelo 1 son significativamente distintos de 0 y, por tanto, las correspondientes variables de ajuste estarán asociadas de forma significativa con la variable respuesta. 3. ¿Cómo comparamos modelos no anidados?(74)   Si los modelos que queremos comparar no están anidados, el principio de parsimonia nos indica que deberíamos escoger el modelo más simple. Pero también podemos usar el Criterio de información de Akaike (80), conocido como AIC. Para un modelo de regresión multinivel el AIC se calcula a partir del valor de la deviance (Dev), y el número de parámetros estimados (q): (16) 2 El AIC, es un índice de ajuste general, que asume que los modelos que se están comparando ajustan el mismo conjunto de datos, y usan un mismo método de ajuste. Un criterio de ajuste similar es el Criterio de información bayesiana de Schwarz (80;81), conocido como BIC y que viene dado por:     45  INTRODUCCIÓN (17) Al igual que la deviance, cuanto menor es el valor de AIC y del BIC mejor es el ajuste. Tanto el AIC como el BIC, penalizan a los modelos con un elevado número de parámetros, pero el BIC impone una mayor penalización para la mayoría de tamaños muestrales, por ello, para los modelos multinivel con diferentes tamaños muestrales y varios niveles, y por lo tanto, el criterio AIC es más recomendable que el BIC. 1.5.5 Métodos de estimación de los parámetros Como ya se ha explicado anteriormente, en un modelo multinivel hay dos tipos de parámetros: fijos y aleatorios. Los parámetros fijos corresponden a los efectos medios en la población, y son las pendientes y el intercepto. Los aleatorios corresponden a las varianzas y covarianzas de todos los niveles (2). A la hora de estimar dichos parámetros, debemos distinguir entre métodos y algoritmos de estimación. Un método de estimación consiste en un conjunto de reglas y principios cuya aplicación da lugar a una ecuación o ecuaciones que ponen en relación los datos con el parámetro buscado. Los algoritmos son métodos matemáticos, que por medio de iteraciones ecuaciones. sucesivas, permiten obtener soluciones para dichas     46  INTRODUCCIÓN MÉTODOS DE ESTIMACIÓN Tanto los coeficientes de regresión como los componentes de la varianza se incluyen en la función de verosimilitud(12). Solo los componentes de la varianza se incluyen en la función de verosimilitud. ALGORITMOS DE ESTIMACIÓN Fisher Scoring Se basa en la mejor aproximación de la función de verosimilitud y se puede usar con ML y REML. Calcula estimaciones máximo-verosímiles en casos en los que existen datos perdidos. Pero es muy lento. Se usa para REML. Refinamiento secuencial del procedimiento basado en Mínimos Cuadrados Generalizados. Produce estimadores sesgados de los parámetros aleatorios debido a que no tiene en cuenta la varianza muestral de la parte fija del modelo. Para estimar los parámetros usa el método REML, y se pueden conseguir estimadores insesgados. Aconsejable para muestras pequeñas. Linealiza la partes fija del valor predecido de la variable dependiente. Máxima verosimilitud(ML)* Máxima verosimilitud restringida (REML) ExpectationMaximization (EM) Iterative Generalized Least Squares (IGLS) Restricted IGLS (RIGLS) Máxima verosimilitud(ML)* Cuasiverosimilitud Para modelos no Marginal lineales con (MQL(82) es) variables Dicotómicas: utilizan expansiones de la Cuasiserie de Taylor para linealizar verosimilitud el modelo multinivel, Penalizada (PQL ) Combina la distribución a priori (integra conocimientos previos de los parámetros) con la función de verosimilitud, y produce una distribución a posteriori, que describe la incertidumbre de los parámetros después de observar los datos. Linealiza ambas partes (fija y aleatoria) del valor predecido de la variable dependiente. Estimación Bayesiana Método Monte Carlo por Cadena de Markov MCMC, Métodos de Monte Carlo por Cadenas de Markov. Simulación de cadenas de Markov convergentes hacia la distribución a posteriori de los parámetros. Tabla 4. Métodos y algoritmos de estimación     47  INTRODUCCIÓN *En la práctica la diferencia entre ML y REML no es muy grande, pero cuando el número de unidades de nivel macro es inferior a 30, es preferible el método REML (83). 1.5.6 Varianza En la regresión múltiple, la varianza explicada mide la proporción de la varianza total de la variable respuesta (Y) que es explicada por la relación lineal que existe entre Y y las variables explicativas del modelo (Xi). Para medir dicha proporción usamos el llamado coeficiente de determinación, más conocido por R2, que toma valores entre 0 y 1. Un valor próximo a 1 se interpreta como un buen ajuste del modelo. Pero ¿cómo se mide en una regresión multinivel, la varianza explicada por el modelo? Los modelos multinivel permiten dividir la varianza total en diferentes componentes de variación según los distintos niveles de agrupación de los datos (84). Por ejemplo en la investigación del asma en la infancia podemos considerar el estudio de los factores de riesgo de la proporción de asmáticos en la infancia, y en este caso podríamos dividir la varianza en variación entre y variación dentro de la unidades del nivel superior (ciudad de residencia, por ejemplo). Supongamos que partimos de un modelo de dos niveles de intercepto aleatorio y con un predictor xij, tratado como un efecto fijo: yij = β0j + β1jx1ij + eij β0j= β0 + u0j var(u0j) =σ2u0 var(eij) =σ2e0 (A) var( yij | x1ij) =σ2u0 + σ2e0     48  INTRODUCCIÓN En este apartado vamos a ver una aproximación a los métodos más usados, que son los de Golstein H. et al. (85) y Snijders T.A.B. et al. (73). 1.5.6.1 MÉTODO PROPUESTO POR GOLSTEIN. En el modelo A podemos resumir la ‘importancia’ del nivel centro, como la proporción de la varianza total explicada, que se conoce como “coeficiente de partición o división de la varianza” (variance partition coefficient) VPC(86) y viene dado por la fórmula: (18)        1º       2º       2º        En el caso de un modelo de intercepto aleatorio el VPC, también mide la correlación residual entre las respuestas de dos niños en la misma ciudad de residencia, y en este caso es conocido también como “Coeficiente de Correlación Intraclase, ρ”, y se usa comúnmente como una medida de la importancia de considerar que los datos están agrupados o estructurados jerárquicamente. El VPC es útil en el caso que tengamos un modelo con una única fuente de variación en cada nivel, pero lo es menos, en un modelo de coeficientes aleatorios.     49  INTRODUCCIÓN Supongamos que tenemos el siguiente modelo: (19) 1º Nivel 2ºNivel yij = β0jx0 + β1jx1ij x0=1   Var(u0j) = β0j= β0 + u0j + eij β1j= β1 + u1j σ2u0, Var(u1j) = σ2u1, σ2e Cov(u0j, u1j ) = σu01, Var(e0ij) =     En este caso el VPC no es igual a la correlación entre unidades. Dados dos niños i1j e i2j, la correlación entre x i1j yx i2j viene dada por: (20) σ σ 2σ x σ σ x x  σ x σ σ x 2σ x x σ x  σ     50  INTRODUCCIÓN 1.5.6.2 MÉTODO PROPUESTO POR SNIJDERS. Snijders y Bosker (73) proponen otra definición de la proporción de varianza explicada, y la llaman Reducción de la proporción del error de la predicción. En el marco de los modelos multinivel de 2 niveles, se puede elegir entre predecir el valor de Y para un individuo en un grupo, o predecir el valor medio de Y para un grupo. Lo que da lugar a dos formas de medir la proporción de varianza explicada: i. Reducción de la proporción del error de predicción de un valor individual. Cuando desconocemos el valor de x para un individuo, la mejor predicción es E(Yi) y la varianza del error de predicción es var(Yi). En cambio cuando conocemos el valor de x la mejor predicción es: ∑ ∑ y el error de predicción es Por lo tanto la varianza del error de predicción es: (21)   Y La reducción de la proporción de la varianza del error de predicción para el nivel 1 será: (22) 1 ∑ 1     51  INTRODUCCIÓN Lo normal es desconocer el valor de estos parámetros, por ello la mejor forma para estimar parámetros. (23) 1 es usar las estimaciones de de dichos N = varianza del modelo nulo A = varianza del modelo alternativo (con al menos un predictor) ii. Reducción de la proporción del error de predicción de la medida de grupo La proporción de varianza explicada en el nivel 2 se puede definir como, la reducción en la proporción de la varianza del error de predicción de la media anterior A. Si conocemos los valores de todos los predictores del grupo j, entonces la mejor predicción de regresión ∑ . . . , de una unidad de nivel 2 elegida al azar. Supongamos que partimos del modelo de 2 niveles del apartado para todos los i es el valor de la y la varianza del error de la predicción: (24) . .   / nj el número de unidades de nivel 1 en el grupo j.     52  INTRODUCCIÓN Entonces a partir de estos datos definimos la reducción en la proporción de la varianza del error de predicción de . como: (25) 1 Y su estimación: . ∑ . . (26) 1 N = varianza del modelo nulo A = varianza del modelo alternativo (con al menos un predictor) La cantidad de varianza explicada en un segundo nivel es un único valor. Pero es posible que cada grupo j tenga un nj distinto, entonces ¿Qué valor se debe usar? Se puede usar cualquier valor que sea considerado a priori, representativo de las unidades de nivel 2. Si los valores de nj varían mucho en la población, se puede usar la media armónica (27) ∑ 1 Respecto a      , sus valores poblacionales no pueden ser menores de cero. En cambio sus estimaciones pueden aumentar su valor al eliminar un predictor o disminuir al incluir un nuevo predictor, esto puede ser debido al azar o por una mala especificación de la parte fija del modelo. Estos cambios en los valores de de especificación de la parte fija.      en una dirección equivocada sirven de diagnóstico para el investigador, para detectar posibles errores     53  INTRODUCCIÓN El cálculo de la varianza explicada en modelos de pendientes aleatorias, implica un aumento en la complejidad de las fórmulas de pueden consultar en Snijders et al (1994) (87).      y se 1.5.7. Multinivel con diferentes variables respuesta y estructura Hasta ahora se ha explicado el análisis multinivel desde el punto de vista de modelos con variable dependiente continua y una estructura simple donde los individuos del primer nivel están anidados dentro de las unidades de segundo nivel, ver figura1. Una de las mayores ventajas de este tipo de análisis es que puede ser usado también con otro tipo de variables respuesta y otras estructuras jerárquicas. Una posible estructuración de los modelos multinivel, es dividirlos según el tipo de variable respuesta: 1) Variable dependiente continua (modelo lineal): a) Medidas repetidas Cuándo se repiten las mediciones en los mismos individuos, por ejemplo hacer un seguimiento de la tensión arterial a un grupo de individuos, se establece una jerarquía de dos niveles, el segundo nivel son los individuos y las repeticiones de la medición son las unidades del primer nivel. Hay distintos modelos que utilizan mediciones repetidas. i) Estudios de crecimiento (caso particular de los estudios longitudinales): las curvas de crecimiento representan un proceso de desarrollo que se produce en función del tiempo, una forma adecuada de modelarlas radica en describir los     54  INTRODUCCIÓN valores esperados de las observaciones como funciones polinómicas del tiempo (3). En un modelo de dos niveles para medidas repetidas, las unidades del Nivel 1 especifican Curvas de crecimiento únicas (polinómicas) o trayectorias de crecimiento, para cada individuo (Unidad del nivel 2) (88) (28)     /         para para aquellos coeficientes que se asumen aleatorios y    aquellos coeficientes no aleatorios … ~ 0, Ω /Ω …   :      donde    representa la medida de la variable dependiente para el sujeto j en la ocasión i. ii) Datos de respuesta multivariante: Las respuestas multivariantes surgen, cuando hay más de una variable dependiente, una variable respuestas medida en el nivel 1(medidas repetidas) y una o más variables respuesta medidas en el nivel 2( nivel individuo) (89). Podemos extender el modelo 6.1, añadiendo una var. Dependiente (29) /el superíndice 2 indica que es una variable respuesta definida en el nivel 2, y es el intercepto de la parte fija.     55  INTRODUCCIÓN b) Diseños cruzados: La asunción que las estructuras de datos son puramente jerárquicas es a menudo una simplificación. Los individuos pueden pertenecer simultáneamente a más de una agrupación de un nivel jerárquico dado. Esto lleva a una estructura clasificada cruzada (89-91). Por ejemplo, podemos clasificar a un enfermo, por el centro de salud al que acude o por el vecindario donde reside, tal que, ambas clasificaciones se estiman como aleatorias. Y se puede modelar: (30) , , , j1=1,…., J1 j2=1,…., J2 donde un paciente i, pertenece a la combinación de c.salud j1 y vecindario j2. La parte aleatoria del modelo, tiene 2 términos residuales del nivel 2     . c) Meta-análisis: nos encontramos con un caso de análisis de datos agrupados; en el que los pacientes (nivel 1) se agrupan en bloques constituidos por cada estudio particular (nivel 2) (89;92). Para un sujeto i, en el estudio j que recibió el tratamiento h, podemos escribir un modelo básico para la respuesta como: (31) j=1,……,J, i=1,……,nj   ~ 0, ~ 0, son la función lineal de las covariables para el sujeto i en el estudio j, es el efecto aleatorio del estudio j y es el residuo es una variable para el sujeto i en el estudio j. El término dicotómica que hace referencia al tratamiento.     56  INTRODUCCIÓN 2) Variable dependiente discreta(modelo no lineal): Aunque los modelos multinivel fueron desarrollados originalmente para variables de respuesta con distribución normal y bajo los supuestos de una distribución normal de los errores en cada individuo, estos métodos han sido generalizados para situaciones en las que la variable de respuesta es binomial, nominal u ordinal y para procesos donde la probabilidad del evento es pequeña y se puede modelar con una distribución de Poisson. Casos particulares son los siguientes. a) Modelo logístico: Se usa cuando nuestra variable dependiente toma dos valores. Es una extensión de los modelos multinomiales estándar. Siendo el modelo multinivel más simple, para una estructura jerárquica de 2 niveles, con una variable independiente, el intercepto aleatorio y link logit, es el siguiente: (32) log /   ~  0, = y   1 Estos modelos se ampliaran, en la parte de metodología.     57  INTRODUCCIÓN b) Modelo Multinomial: Usamos el análisis Multinomial logístico multinivel, cuando la variable dependiente es una variable categórica con más de dos categorías. Este modelo es una generalización de del modelo logit multinivel, y para una estructura de dos niveles, donde la categoría de referencia de la variable respuesta es t, se define: (33) 1 log /   ~  0, y ∑ , S = 1, ..., t-1 1. para las restantes t-1 La ecuación 33, especifica un modelo multinivel. categorías, si t es 2 entonces se reduce a un modelo logit c) Modelo Poisson: La variable dependiente es una variable de conteo, como por ejemplo, número de sibilancias en el último año o número de ataques de asma en el último mes. Son una extensión de los modelos de regresión Poisson. Los datos de conteo son no negativos, por lo tanto si intentamos ajustar un modelo normal a estos datos, podemos obtener predicciones negativas, por ello es preferible usar el logaritmo de los datos, usando una función link log. Un modelo Poisson de efectos mixtos modeliza el número esperado de sibilancias o ataques de asma en un intervalo tiempo (conocido como variable de exposición u “offset”, tij). Esta variable se debe incluir en el modelo como el log(tij). Si la variable dependiente de conteo fue     58  INTRODUCCIÓN recogida en el mismo periodo para toda unidad i de primer nivel en cada unidad j de segundo nivel entonces el modelo log de intercepto aleatorio es el siguiente: (34) , log ,             ~  0, Si el periodo de recogida no es el mismo entonces el modelo log de intercepto aleatorio es el siguiente: (35) log ,             ~  0, d) Modelos de supervivencia: Cuando hablamos de análisis de supervivencia nos referimos al análisis del tiempo de seguimiento (T) de cada unidad de observación hasta que ocurre un fenómeno predefinido (muerte, por ejemplo). Puede suceder que en alguna o algunas unidades de observación no haya ocurrido el evento de estudio en el momento de cerrar el estudio, entonces se habla de “censuras” o “casos censurados”. Existen distintas formulaciones para modelizar datos de supervivencia (93;94). Vamos a mostrar la aproximación que se deriva del modelo ordinal y que usa una función de respuesta log-log (94). Supongamos que, para cada unidad de nivel 1, la observación continúa hasta un tiempo , el tiempo de supervivencia es un vector de 0 excepto el último elemento que tomo el valor de observación es censurada fallar, en el tiempo t como . Si el evento ocurre 1 y si la 0. Definimos la probabilidad de  |  de forma     59  INTRODUCCIÓN análoga se puede definir 1 como la probabilidad de sobrevivir más allá del tiempo t. Entonces podemos formular el modelo log log donde las covariables pueden variar a través del tiempo como: (36) 1 La parte fija del modelo la compone Β es el vector de coeficientes que varían a través del tiempo y Β el vector de coeficientes. La parte aleatoria del modelo la forma el vector de coeficientes de de los efectos aleatorios aleatorios . y el vector de efectos     60  INTRODUCCIÓN 1.5.8. Muestreo: El muestreo es una herramienta que se usa en la investigación científica. Todo estudio ya sea observacional o experimental, lleva implícito en la fase de diseño la determinación del tamaño muestral necesario para la ejecución del mismo (95;96). Existe bastante literatura acerca del cálculo del tamaño muestral en estudios multinivel (2;24;73;97-101). En los estudios más sencillos, de dos niveles, se deben estimar dos tamaños muestrales distintos: 1. El tamaño de la muestra de las unidades del 1º nivel (nj) 2. El tamaño de la muestra de las unidades del 2º nivel (J) El tamaño total de la muestra viene dado por: (37) En los estudios multinivel, generalmente el principal problema es determinar el tamaño muestral de las unidades del nivel grupo o segundo nivel, ya que este suele ser más pequeño que el tamaño de muestra del nivel individual (102). En general, para calcular el número de unidades, individuos o pacientes necesarios en un estudio multinivel, lo primero es calcular un tamaño muestral para un muestreo aleatorio simple. Si queremos comparar las medias del grupo intervención y del grupo control podemos usar la siguiente fórmula: (38) ⁄ 1     61  INTRODUCCIÓN Donde: • • N1 = sujetos necesarios en el grupo intervención = Valor Z de la distribución normal que deja a su izquierda un área de t / t= 1 tipo II • •   = Varianza de la variable respuesta d = Valor mínimo de la diferencia en media que, si existiera, se desea detectar con una probabilidad 1-β. • razón del número de sujetos entre los grupos comparados. (N0 tamaño de la muestra en el grupo control) ⁄2 , 1 , siendo  la probabilidad de cometer el error tipo I y β la probabilidad de cometer el error Si la variable respuesta es dicotómica, se puede usar la siguiente ecuación: (39) ⁄ 1 1 1 Donde: • • • • N1 = sujetos necesarios en el grupo intervención = Valor Z de la distribución normal que deja a su izquierda un área de t / t= 1 ⁄2 , 1 = media ponderada de p0 y p1 razón del número de sujetos entre los grupos comparados. (N0 tamaño de la muestra en el grupo control) • • p1 =proporción de casos en el grupo intervención p0 =proporción de casos en el grupo control     62  INTRODUCCIÓN Después de calcular el tamaño muestral aleatorio simple es necesario multiplicar por un factor de corrección el cual tiene en cuenta el muestreo en dos etapas (103). En un muestreo aleatorio simple el error estándar de la media viene dado por la siguiente fórmula:   .   √ ñ   Supongamos que tenemos N macro-unidades cuyo tamaño es n, entonces el tamaño total de la muestra es Nn. El efecto del diseño es el factor de corrección y es un número que indica cuando debemos ajustar el denominador de la formula anterior para tener en cuenta el cambio en el diseño (pasar de una etapa a dos); se define como el cociente entre la varianza obtenida con el nuevo diseño muestral y la varianza obtenida con el muestreo aleatorio simple para la misma población (73;103). El efecto del diseño para un muestreo de dos etapas con igualdad de tamaño en las macro-unidades o unidades de segundo nivel es:     ñ 1 1 Donde ρ es el coeficiente de correlación intraclase (CCI). Hay autores que proponen distintas reglas de oro, estas reglas son a menudo opiniones personales basadas en la experiencia : 1. Si se está interesado en los efectos fijos del modelo, 10 grupos en el segundo nivel serán suficientes. Si el interés está en los efectos contextuales como mínimo serán necesarios 30 grupos (102). 2. La regla del 30/30, los investigadores deben esforzarse para obtener una muestra de al menos 30 grupos con 30 individuos por grupo como mínimo (104).     63  2. JUSTIFICACIÓN JUSTIFICACIÓN  Los modelos estadísticos son herramientas que nos permiten adentrarnos en la complejidad de los fenómenos que investigamos. La naturaleza de las observaciones estudiadas, será de gran importancia a la hora de elegir el método estadístico más apropiado para abordar su análisis (105). No es necesario recurrir a técnicas complejas de análisis por capricho sino tratar de usar los modelos más sencillos posibles que reproduzcan la complejidad del mundo que tratamos de explicar. Aunque la mayoría de las veces un problema complejo va de la mano de una técnica compleja también. Ante el caso de datos con una estructura definida, como es el caso de datos estructurados jerárquicamente, el enfoque estadístico se plantea desde el punto de vista multinivel, donde se han desarrollado procedimientos estadísticos basados principalmente en la construcción de modelos, que permiten analizar el comportamiento de las respuestas individuales, considerando la información de grupo. El uso de esta técnica estadística se inició en el marco de las Ciencias sociales y la Educación. La aplicación en el campo de las Ciencias de la Salud ha sido posterior y ha sufrido un aumento exponencial en la última década aunque aún no es una técnica de uso habitual. Las sibilancias recurrentes en la infancia tienen una gran importancia sobre la morbilidad y mortalidad en ese grupo de edad, tanto en países en vías de desarrollo como en países desarrollados (106). Son una de las enfermedades respiratorias por las que más se acude al hospital en el primer año de vida, lo que tiene un elevado impacto económico (107). En el estudio multicentrico ISAAC sobre el asma y la alergia en la infancia, se ha visto que la prevalencia de esta enfermedad varía según la ciudad o país donde se estudie (108). Por ello es de interés de esta tesis estudiar los factores de riesgo de las sibilancias recurrentes teniendo en cuenta la estructura jerárquica que conforman los niños dentro de sus ciudades de residencia.     65  3. OBJETIVOS OBJETIVOS Los datos del “Estudio Internacional de Sibilancias en Lactantes” (EISL) (109) presentan una estructura anidada, niños anidados en sus ciudades de residencia, por lo que creemos interesante analizar los factores de riesgo de las sibilancias recurrentes el primer año de vida con los modelos multinivel y nos planteamos en este estudio los siguientes objetivos. Objetivo principal: EL objetivo principal de esta tesis es presentar la aportación que suponen los modelos multinivel para el adecuado tratamiento estadístico de datos estructurados jerárquicamente en el estudio de los factores de riesgo de las sibilancias recurrentes en lactantes. Objetivos secundarios: 2. Comprobar como el análisis multinivel agiliza el proceso de cálculo y mejora la estimación de los factores de riesgo de las sibilancias recurrentes en el primer año de vida frente a estudios anteriores. 3. Estudiar si el enfoque bayesiano para el análisis multinivel mejora la estimación obtenida con el enfoque frecuentista.     67  4. Material y Métodos: MATERIAL Y MÉTODOS  4.1 Datos y variables: En este apartado se van a usar dos bases de datos, la del estudio ESCAPE (110) que usaremos como ejemplo de que no siempre es posible realizar un análisis multinivel y la base del estudio internacional de sibilancias en el lactante (EISL) (109;111). ESTUDIO ESCAPE: El objetivo de este estudio era conocer cómo afectan las distintas estaciones del año a la calidad de vida (CV) de los niños asmáticos. Para ello fueron reclutados por sus pediatras, cuatro grupos distintos de niños asmáticos de 7-14 años, durante cada estación del año, Octubre 2003, Enero 2004, Abril 2004 y Julio 2004. Su CV se midió por medio de la versión española validada (112;113) del Paediatric Asthma Quality of Life Questionnaire (PAQLQ). El cuestionario está compuesto por 23 ítems los cuales miden síntomas, limitaciones de las actividades y la función emocional del niño. Otros factores que se recogieron fueron: gravedad del asma, atopia, tratamiento médico, inmunoterapia, obesidad, hábito de fumar en los padres y medidas ambientales de control alergénico. El Análisis estadístico que se usó fue un modelo de regresión logística, siendo el score de PAQLQ (score global) la variable dependiente (primer tercil =0 vs tercer tercil =1) y las siguientes variables independientes: sexo, tipo de residencia (urbana, rural, intermedia), área geográfica (meseta, costa Mediterránea, costa Norte, tipo de alergia, estación del año, inmunoterapia, severidad del asma, obesidad, mascotas y cubiertas antialérgicas. Para el análisis multinivel la variable dependiente que se va a usar es el score global (primer tercil vs tercer tercil). Se va a estudiar si la siguiente estructura multinivel tiene sentido:     69  MATE ERIAL Y MÉTOD   DOS Otoño n=352 Invie erno n=339 Pr rimavera n=234 Verano n=178 2º nivel  1 1 1 1 1º nivel 2 2 2 2 3 3 3 3 ...352 2 ...339 ...234 ...178 Fig17 Estructu jerárqui estudio ESCAPE 7. ura ica 1ºni ivel: niño os 2º n nivel: esta aciones de año el Vari iable dep pendiente PUNTUA e: ACIÓN GL LOBAL EST TUDIO EIS SL: El e estudio E EISL es un estudio multicentrico, tr o ransversal poblaci l, ional que se ha llevado a cabo u usando métodos estandar m rizados y un cues stionario (ANEXO 1) previa amente va alidado (1 114-116) basado en el e cues stionario del Estud Intern dio nacional de Asma y Alergia e la Infa d en ancia (ISA AAC) (http p://isaac.a auckland.ac.nz). El reclutam E miento se realizó en los n cent tros de sa alud de at tención primaria, localizado en el ár geográ l os rea áfica   70  MATERIAL Y MÉTODOS  del centro EISL correspondiente (ver tabla 5), en el momento en el que los niños acudían para la revisión del niño sano y/o para la administración de la vacuna correspondiente según el programa de vacunas de cada país. El periodo de inclusión de niños en el estudio se mantuvo abierto entre enero de 2005 y enero de 2007. Se invitó a participar en el estudio a los padres o cuidadores en el momento que acudían al centro de salud para una revisión o la administración de la vacuna correspondiente alrededor de la edad de 1 año, haciendo especial énfasis en que todas las preguntas del cuestionario hacían referencia a eventos que habían ocurrido en los últimos 12 meses de vida de su hijo (107). El objetivo de este estudio era el análisis de los factores de riesgo/protección de las sibilancias recurrentes Variables: Las sibilancias se definieron como la respuesta positiva a la pregunta: “¿Ha tenido su hijo/a sibilancias o pitos en el pecho en los primeros 12 meses de vida? Las sibilancias recurrentes, nuestra variable dependiente, fueron definidas como tener 3 o más episodios de sibilancias durante el primer año de vida. Los antecedentes familiares de asma y rinitis se definieron como la respuesta positiva de los padres a las preguntas ¿Tiene el padre o la madre asma?, ¿Tiene el padre o la madre rinitis? Se definió eccema infantil como la respuesta positiva a la pregunta: ¿ha tenido su hijo/a manchas rojas que pican, y aparecen y desaparecen en cualquier parte de su cuerpo excepto alrededor de los ojos, nariz y en la zona del pañal, durante sus primeros 12 meses de vida? Los resfriados comunes se definieron como: haber tenido episodios cortos de resfriado con goteo de nariz, estornudos, obstrucción nasal, tos suave, con o sin fiebre. Otras variables que se han usado en el análisis son el hábito tabáquico de los padres, fumar durante el embarazo, si el niño/a asistió a la guardería en el primer años de vida, lactancia materna exclusiva (más de tres meses vs. 3 o menos), nº de hermanos, nº de personas que viven     71  MATERIAL Y MÉTODOS  en la casa del niño, si hay moho en la casa, si tienen mascotas y nivel de estudios de la madre. 4.2 Metodología: A través de los datos de EISL, vamos a corroborar uno de los objetivos primordiales de esta tesis, es decir, ver como los modelos multinivel mejoran el análisis de los factores de riesgo/protección de la sibilancias recurrentes en el primer año de vida respecto a otro tipo de análisis. Para el análisis desde el enfoque frecuentista se ha usado el programa estadístico MLwiN v2.25 ©Centre for multilevel modelling, University of Bristol http://www.bristol.ac.uk/cmm/ . MLwiN es un programa que permite la especificación y el análisis de un amplio rango de modelos multinivel (117). Para el enfoque bayesiano se ha usado el programa Winbugs, WINBUGS, es un software dentro del proyecto BUGS (Bayesian inference Using Gibbs Sampling) para el análisis bayesiano de modelos estadísticos complejos usando métodos de Monte Carlo por Cadenas de Markov (MCMC), es de distribución gratuita y ha sido desarrollado por un equipo de estadísticos y programadores del Medical research Council Biostatistics Research Unit en Cambridge http://www.mrc-bsu.cam.ac.uk/bugs/ . Para el análisis de los datos se va a usar el modelo de regresión multinivel logístico de 2 niveles tanto para el método de estimación frecuentista de la cuasi-verosimilitud penalizada (PQL) (118), como con el método bayesiano usando la estimación de Monte Carlo por cadenas de Markov (MCMC), que como está descrito en la literatura en algunos casos produce aproximadamente las mismas estimaciones que el método PQL y en la mayoría mejora las estimaciones de los efectos aleatorios (119). Ambos modelos se van a comparar entre si y a su vez     72  MATERIAL Y MÉTODOS  con el análisis realizado anteriormente en que se usó un meta-análisis con efectos aleatorios, en el que se consideran dos posibles fuentes de variabilidad, la variabilidad intra-estudio y la variabilidad entreestudios, que se incorporan al estimador combinado a través de los pesos correspondientes (120;121). Los datos que se usaron en el metaanálisis fueron los resultados de aplicar para cada centro un modelo lineal generalizado con distribución binomial y link logit, para calcular los OR ajustados de los factores de riesgo/protección, siendo las sibilancias recurrentes la variable dependiente. Además se va analizar un modelo de pendientes aleatorias y un modelo que contiene variables de segundo nivel usando el enfoque frecuentista y el enfoque bayesiano. A continuación se presentan los dos enfoques multinivel que hemos usado para nuestro análisis. 4.2.1 Modelo logístico multinivel de 2 niveles: Enfoque frecuentista. El objetivo principal de un regresión logística es predecir la probabilidad πi de que ocurra un evento Y, para un individuo i, en función de un determinado número de variables. Un modelo general para una variable respuesta dicotómica (Yi) y una variable explicativa xi es: (40)   siendo   / P(Y =1) = πi llamada link. una transformación de Las funciones link (122;123) más conocidas son:     73  MATERIAL Y MÉTODOS  1. Link logit, donde 2. Link probit, donde 3. Link log-log, donde   log      log es la función de densidad log 1 acumulada de la distribución normal. Si queremos extender nuestro modelo para tener en cuenta la estructura jerárquica de 2 niveles en nuestros datos, comenzaremos ajustando el modelo nulo con intercepto aleatorio (123). Nuestra variable respuesta es yij toma el valor 1 individuo i tiene la respuesta Y el centro j y 0 si no. Si usamos el link logit, nuestro modelo nulo de dos niveles para una variable respuesta dicotómica queda de la siguiente manera: (41) logit π   Modelo de intercepto aleatorio: Si queremos incluir en el modelo potenciales variables explicativas de la variable respuesta X1,…, Xp, obtenemos el siguiente modelo: (42) log = /  ∑  ~  0,   log odds   /  log  ~  0, = El intercepto β0j está formado por dos componentes: un efecto fijo β0, igual para todos los centros, y un efecto aleatorio u0j específico para cada centro (unidad de segundo nivel) j. En el caso más simple en que tan solo hay una variable explicativa la formulación del modelo es: (43) log =       74  MATERIAL Y MÉTODOS  /  1  ~  0,     se interpreta como el intercepto de conjunto en la relación entre el log-odds y x. El intercepto para una determinada unidad de nivel 2 j es   que será mayor o menor que el intercepto de conjunto es mayor o menor de cero. Como en el caso del  es conocido como el efecto aleatorio =  , se conoce como la varianza dependiendo de si modelo de respuesta continua, intercepto entre grupos es de grupo, el residuo de grupo o el residuo de 2º nivel. La varianza del residual entre grupos o varianza residual de segundo nivel. Y en el modelo con variables explicativas siempre la varianza no explicada de nivel 2. Las varianzas por definición son no negativas, por ello cuando testamos la hipótesis nula unilateral :  :  0 la hipótesis alternativa debe ser 0, por lo tanto probabilidad de que el estadístico Z sea mayor o igual que una variable chi-cuadrado con tantos grados de libertad como parámetros haya en el modelo, hay que dividirla por 2 (73). El modelo multinivel para respuestas binarias se puede derivar también a través de una variable latente de contextualización (73;123). Asumimos que existe una variable continua y*ij subyacente a yij y así podemos formular el llamado modelo umbral, que permite la (44) 1 si y*ij ≥ 0 yij = 0 si y*ij < 0 representación:     75  MATERIAL Y MÉTODOS  Teniendo en cuenta esta representación podemos escribir el siguiente modelo de 2 niveles de intercepto aleatorio para la variable inobservada y*ij, como para cualquier variable continua: (45) y*ij = β0 + β1xij +( u0j + ε*ij )   Para que represente un modelo de regresión logística, los residuos de primer nivel de la variable subyacente y*, deben tener una distribución logística. Lo que significa que: • • • P(ε*ij < x) =logistic (x)   La media de los residuos del primer nivel es 0 La varianza es 3.29 Cuando se asume que ε*ij tiene esta distribución, el modelo logístico visto en el apartado anterior, es equivalente al modelo umbral definido aquí. Coeficiente de partición de la varianza en términos de y*: La fórmula de la VPC es la siguiente:        1º       2º       2º    Y mide la proporción del total de la varianza residual que es debida a la variación entre grupos.     76  MATERIAL Y MÉTODOS  Como hemos visto en la sección anterior, podemos generalizar un modelo logístico de interceptos aleatorios como un modelo umbral para una variable latente, este nuevo modelo tiene la misma forma que un modelo de intercepto aleatorio para una variable respuesta continua, por lo que: (46)     donde = 3.29 para un modelo logit. Este VCP, se interpreta como la proporción de la varianza residual total en la propensión de estar en la categoría 1, que es debida a las diferencias entre grupos. Para modelos con variable dependiente discreta, se recomienda el uso de métodos estimación de los parámetros de cuasi-verosimilitud (123). Estos procedimientos que ya nombramos en el cuadro de algoritmos, tabla 4, usan métodos de lianearización basados en la expansión de series de Taylor, que transforma un modelo con variable dependiente discreta en un modelo con la variable respuesta continua. Se pueden usar dos tipos de algoritmos, la cuasi-verosimilitud marginal (MQL) y la cuasi-verosimilitud predictiva (PQL). Ambos algoritmos pueden incluir tanto términos de 1º orden como de 2º orden de las series de expansión de Taylor. El procedimiento MQL de 1º orden, proporciona una aproximación cruda y se pueden obtener estimaciones sesgadas, especialmente si el tamaño de la muestra dentro de las unidades del segundo nivel es pequeño. El procedimiento PLQ de 2º orden, mejora la aproximación (124), aunque es un método menos estable y puede dar problemas de convergencia. Por ello se aconseja empezar el análisis con el algoritmo MQL de 1º orden, para obtener los valores de inicio del algoritmo PQL de 2º orden (3;125).     77  MATERIAL Y MÉTODOS  Modelo de pendientes aleatorias: Un modelo de intercepto aleatorio asume que la relación entre Y y X es la misma para cada grupo, es decir la pendiente β1 es fija entre los grupos. Podemos relajar está relación permitiendo que la pendiente de una o más covariables varíe aleatoriamente entre grupos, es decir permitiendo un Modelo de pendientes aleatorias de 2 niveles. Modelo de pendiente aleatoria: la siguiente formulación es para una única pendiente aleatoria; la extensión al caso de dos o más pendientes aleatorias es sencilla: (47) log       /     ~  0, = /   ~  y 0,   es la covarianza de los efectos aleatorios. Ωu es la matriz de varianzas covarianzas de los efectos aleatorios. La pendiente de la relación lineal entre X y el log-odds de Y=1 es   para el grupo j. En comparación con el modelo de interceptos     . Se pueden comparar los dos modelos aleatorios el modelo de pendientes aleatorias introduce dos nuevos parámetros respecto del 0    0. llevando a cabo el test estadístico donde la hipótesis nula es que Para un modelo de pendiente aleatoria y una variable explicativa la varianza residual es: (48)     78  MATERIAL Y MÉTODOS  2 2 , Existen varios métodos para valorar la significación respecto al valor 0 de la varianza entre unidades de segundo nivel, y dependen del algoritmo usado para ajustar el modelo. Para el procedimiento de la cuasi-verosimilitud (PQL2), usaremos el test de Wald. Cuando usamos este test para estimar una varianza residual, obtenemos un test crudo, porque depende de la asunción de que la varianza estimada se distribuya normalmente. Sin embargo, nos da una indicación acerca de la fuerza de la evidencia para el efecto de grupo. Una alternativa a estos procedimientos es usar el análisis bayesiano con métodos de Monte Carlo por Cadenas de Markov (MCMC). Este procedimiento posee la ventaja de que en muestras pequeñas tiene en cuenta la incertidumbre asociada a la estimación de los parámetros aleatorios y proporciona medidas precisas de incertidumbre, lo que a su vez es importante debido a que los métodos de máxima verosimilitud tienden a sobreestimar la precisión al ignorar la incertidumbre (126). Modelo de intercepto aleatorio con una variable contextual: Una ventaja de los modelos multinivel es la posibilidad de explorar los efectos de los predictores del nivel 2 mientras simultáneamente se incluyen efectos aleatorios, para permitir efectos de variables no observadas del 2º nivel. A los coeficientes del segundo nivel usualmente se les denomina efectos contextuales. El modelo más sencillo sería un modelo de intercepto aleatorio con una variable explicativa de primer nivel y una variable de segundo nivel: (49)     79  MATERIAL Y MÉTODOS  log   =   /   ~  0, Las covariables de segundo nivel ayudan a explicar solo la varianza residual de grupo o residuo de segundo nivel. 4.2.2 Modelo logístico multinivel de 2 niveles: Enfoque bayesiano. El punto de partida en inferencia paramétrica es un modelo de probabilidad para los datos x, es decir, supondremos que los datos son la realización de una variable aleatoria con una distribución de probabilidad que depende de parámetros. Generalmente dicho modelo vendrá definido mediante una función de densidad | parametrizada por el parámetro θ multidimensional ~ | El objetivo es la estimación de los parámetros , es decir, los datos han sido generados según el modelo para algún valor desconocido de y el objetivo es estimar dicho valor a partir de la observación de los datos. Mientras que la inferencia frecuentista se basa fundamentalmente en la función de verosimilitud | para realizar estimaciones (inferencias) sobre el parámetro, el punto de vista bayesiano trata al parámetro como una variable aleatoria especificando sobre ella una distribución de probabilidad llamada distribución a priori (127-129). La distribución de probabilidad de una variable aleatoria refleja información sobre los valores que puede tomar dicha variable. Si una variable tiene una distribución normal 0,1 , los valores de dicha variable estarán alrededor de 0, será muy raro (aunque no imposible) observar valores superiores a 4 o inferiores a -4 e igualmente probable observar valores superiores a 2 que inferiores a -2.     80  MATERIAL Y MÉTODOS  Por tanto, especificar una distribución a priori sobre establecer información sobre datos x. Tenemos entonces dos variables aleatorias, los datos x y el parámetro . La distribución de probabilidad de los datos, si el valor del parámetro es (distribución condicional), viene dada por distribución del parámetro viene dada por Entonces la distribución de que contiene la información sobre viene dada por el teorema de Bayes (50) | | | , mientras que la , la distribución a priori. es una forma de a priori, es decir, antes de observar los condicionada a haber observado los datos, cuando disponemos de los datos x, y se llama distribución a posteriori . Hemos usado la notación genérica . para denotar la distribución de una variable. Por tanto, toda la información que los datos aportan sobre el parámetro viene recogida en la distribución a posteriori en términos de probabilidades. Con la distribución a posteriori tenemos mucho. Si pensamos en las distribuciones de probabilidad como en una herramienta para cuantificar la información sobre la variable en cuestión, la distribución a posteriori es la herramienta que necesitamos para hacer inferencia (obtener información) sobre los parámetros. Para esto necesitamos describir la distribución a posteriori. Como es una distribución de probabilidad, su descripción puede hacerse mediante cuantiles, media y varianza. Por ejemplo, para parámetros unidimensionales, entre el cuantil 0.025 y el cuantil 0.975 se encuentra el parámetro con probabilidad a posteriori 0.95 = 0.975-0.025, formando dichos cuantiles los extremos de lo que llamaremos intervalo de credibilidad al 95% para dicho parámetro. La probabilidad de que el parámetro esté en dicho intervalo es 0.95, a diferencia del intervalo de     81  MATERIAL Y MÉTODOS  confianza al 95% frecuentista, que contiene al parámetro con probabilidad 0.95, es decir, si obtenemos 100 veces datos en las mismas condiciones y calculamos los 100 intervalos de confianza al 95% correspondientes, entonces aproximadamente 95 de los 100 intervalos contienen al parámetro y 5 de los intervalos no lo contienen. En la práctica solo tenemos una vez los datos y por tanto decimos que confiamos al 95% en que el intervalo calculado con los datos contenga al verdadero valor del parámetro. Métodos MCMC para calcular las características de la distribución a posteriori: En este punto aparece el problema de calcular características de la distribución a posteriori para hacer inferencia. Por ejemplo, la media a posteriori de un parámetro utilizada como estimador de dicho parámetro suele requerir el cálculo de integrales en dimensiones elevadas. Si el parámetro de interés es un componentes del parámetro multidimensional posteriori del parámetro siendo una de las , entonces la media a (51) | viene dada por la integral y en general dicha integral no puede calcularse de manera exacta. El cálculo de dichas características de la distribución a posteriori requiere métodos numéricos. Los métodos más utilizados en estadística para este propósito se conocen como métodos de Monte Carlo por Cadenas de Markov (MCMC) (130;131). Dichos métodos se basan en la simulación de una cadena de Markov apropiada que tiene a la distribución a posteriori como distribución estacionaria (límite): si 1 , 2 ,… es una cadena de Markov con distribución límite la distribución a posteriori, entonces     82  MATERIAL Y MÉTODOS  (52) 1 | lim . En la práctica se simula una cadena de Markov apropiada de gran longitud y la media a posteriori de se aproxima por ∑ / , y análogamente cuantiles y varianzas. Los algoritmos más conocidos para obtener cadenas de Markov con una determinada distribución límite son el algoritmo de Metropolis-Hasting y Gibbs sampling (131). Existen programas informáticos que implementan de estos algoritmos; el más popular es WinBugs v1.4 http://www.mrc-bsu.cam.ac.uk/bugs/winbugs/contents.shtml. Convergencia de los métodos MCMC La función bugs del programa estadística R v2.13 http://www.rproject.org/ actúa como interface entre R y el programa WinBUGS que simula cadenas de Markov en paralelo con distribución estacionaria la distribución a posteriori. Esta interface permite manejar los resultados obtenidos cómodamente. Es una buena práctica que las cadenas empiecen cada una en puntos distintos. Cuando las cadenas que empiezan en puntos distintos no se mezclan es señal de que no se ha alcanzado la convergencia y se necesitan cadenas más largas o adoptar otras estrategias. El estadístico monitoriza esta convergencia para cada parámetro. En 1.1 para todos los parámetros, la convergencia es la práctica cuando aceptable. Otro indicador de convergencia es el número efectivo de simulaciones: n.eff. Al menos n.eff debe ser 100 para todos los parámetros.     83  MATERIAL Y MÉTODOS  Enfoque bayesiano de los modelos multinivel logísticos: Para aplicar la metodología bayesiana en un modelo multinivel de dos niveles hay que especificar la distribución a priori sobre los parámetros del modelo. Consideremos por ejemplo el siguiente modelo “umbral” que permite la representación de la variable dicotómica mediante una variable latente: (44) 1 si y*ij ≥ 0 yij = 0 si y*ij < 0 Teniendo en cuenta esta representación podemos escribir el siguiente modelo de 2 niveles de intercepto aleatorio para la variable inobservada y*ij, como para cualquier variable continua: (53) ~ 0, , ~ 0, Los parámetros del modelo son Los parámetros y , , y , es decir, , , , . son los parámetros de la parte fija del modelo y por similitud con el modelo de regresión simple, para estos parámetros vamos a suponer una distribución con muy poca información ~ 0, 10                  ~ 0, 10     84  MATERIAL Y MÉTODOS  y para los parámetros y podemos usar una distribución uniforme es el producto de las , , y . en el intervalo (0,100). La distribución a priori distribuciones a a priori para cada uno de los parámetros que los parámetros parámetros y y Con estas distribuciones a priori lo que reflejamos es que esperamos estén en el rango (-100,100), y que los estén en el rango (0,100). Si las estimaciones a posteriori no están en estos rangos significa que las distribuciones a priori elegidas no son apropiadas y habría que ampliar los rangos (132). El modelo multinivel considerado es uno de los más simples, sin embargo se requiere de métodos MCMC para realizar la estimación a posteriori de .     85  5. RESULTADOS RESULTADOS  ESCAPE: El número de pediatras que reclutaron niños ha variado a lo largo del periodo de estudio: 132 en otoño, 128 en invierno, 89 en primavera y 74 en verano. Esto representa una pérdida aproximada de 44% en el reclutamiento de los pediatras. El número de niños con datos válidos en cada temporada fue: 345 en otoño, 334 en invierno, en la primavera de 232 y 176 en verano. Las características demográficas de la población en su conjunto y de cada grupo de niños en cada estación del año se muestran en la Tabla 4. Otoño n=352 Edad(años)media (SD) Genero masc. Peso, kg Talla, cm Residencia, n (%) Rural Intermedia Urbana Zona Climática Meseta Costa Mediterránea Costa Norte Tipo de Alergeno Polvo Polen Moho Múltiples Asistencia médica Consulta extra-hospitalaria Atención primaria Inmunoterapia Tratamiento con ICS Severidad del Asma Episódica infrecuente Episódica frecuente Moderada persistente Severa persistente Obesidad Mascotas Perro Gato Cubiertas antialérgicas Almohada Edredón Fumar en casa 182 (51.7) 74 (21.0) 96 (27.3) 86 (24.4) 31 (8.8) 13 (3.7) 156 (44.3) 93 (26.6) 257 (73.4) 261 (23.7) 394 (35.7) 121 (37.1) 123 (37.7) 78 (23.9) 4 (1.2) 32 (9.7) 56 (16.2) 22 (6.4%) 69 (19.6%) 87 (24.7%) 163 (46.8%) 165 (48.7) 70 (20.6) 104 (30.7) 72 (21.2) 29 (8.6) 12 (3.5) 150 (44.2) 88 (26.0) 250 (74.0) 106 (30.1) 135 (38.4) 143 (46.7) 97 (31.7) 60 (19.6) 6 (2.0) 26 (8.3) 61 (18.2) 26 (7.8%) 79 (23.3%) 87 (25.7%) 156 (46.2%) Invierno n=339 10.2 (2.0) 208 (62.3) 40.9 (13.0) 143.2 (13.0) Primavera n=234 10.3 (2.1) 153 (65.9) 41.2 (13.3) 143.4 (13.3) 38 (16.7) 44 (19.4) 145 (63.9) 109 (46.6) 40 (17.1) 85 (36.3) 49 (20.9) 21 (9.0) 8 (3.4) 107 (45.7) 67 (28.9) 165 (71.1) 74 (21.8) 122 (36.0) 105 (47.9) 71 (32.4) 41 (18.7) 2 (0.9) 24 (10.8) 36 (15.9) 11 (4.8%) 59 (25.2%) 63 (26.9%) 113 (48.3%) Verano n=178 10.6 (2.1) 99 (56.3) 43.0 (13.6) 145.4 (14.0) 22 (12.9) 45 (26.5) 103 (60.6) 89 (50.0) 23 (12.9) 66 (37.1) 54 (30.3) 30 (16.9) 5 (2.8) 53 (29.8) 52 (29.4) 125 (70.6) 41 (17.5) 74 (31.6) 68 (42.0) 71 (43.8) 23 (14.2) 0 (0.0) 15 (8.8) 33 (18.5) 11 (6.2%) 34 (19.1%) 44 (24.7%) 78 (44.1%) Todas las estaciones n=1103 10.3 (2.0) 676 (62.2) 41.5 (13.1) 144.0 (13.5) 193 (18.1) 253 (23.8) 619 (58.1) 545 (49.4) 207 (18.8) 351 (31.8) 261 111 38 466 (23.7) (10.1) (3.4) (42.2) 10.4 (2.0) 216 (62.6) 41.5 (12.8) 144.5 (13.7) 63 (18.7) 87 (25.8) 187 (55.5) 70 (21.1) 77 (23.3) 184 (55.6) 300 (27.3) 797 (72.7) 40 (22.5) 63 (35.4) 437 362 202 12 97 (43.1) (35.7) (19.9) (1.2) (9.3) 186 (17.1) 70 (6.5%) 241 (21.8%) 281 (25.5%) 510 (46.5%) Tabla 4. Características demográficas de los participantes     87  RE ESULTAD   DOS En p primer lug se ha ajustado el modelo nulo de intercept aleatori gar o to io En la figura 18 y en tabla 5 se re a ecogen e modelo nulo y las el o estim maciones de los pa arámetros fijos y aleatorios d modelo s del o. Fig18 Modelo n 8. nulo, estudi ESCAPE. io Estimac ción del parám metro β0 ( (intercept to) σ2u(varianza entre esta aciones) -0,1 137 0,2 275 Error e estándar 0,274 0,213 Tabla 5. Estima a ación PQL-2 de los pará 2 ámetros fijo y aleatori os ios. La v varianza e entre esta aciones de año en el log-od el dds de est en el tercil tar t supe erior de l puntua la ación glob se estima com 0,275 con un error bal mo e está ándar de 0 0,213. El estadístico de Wald = (0,275/0,213)2 = 1,670 e cual se compara con o d el a alor de u una variab chi-cu ble uadrado con un gr c rado de li ibertad (n de nº el va pará ámetros e el mode y se o en elo) obtiene un p-valor u n unilateral = 0.110. l   88  RESULTADOS  EISL En este estudio, participaron 16 centros EISL de 6 países distintos. Se eliminaron 771 cuestionarios de entre aquellos que no habían contestado a la variable principal (tener sibilancias el primer año de vida), o no se habían recogido el número de episodios de sibilancias, o aquellos que pertenecían a niños mayores de 24 meses o menores de 12, el total de niños que se han incluido en el análisis es 28687. La tasa de respuesta fue mayor del 70% en todos los centros excepto en Valencia que fue del 61%. La participación fue del 52.3% de niños y un 47.7% de niñas y la edad media de toda la muestra fue de 13.4±1.7 meses.     89  RE ESULTAD   DOS En l figura 1 se mue la 19 estra la es structura jerárquic de 2 niv ca veles: Fortaleza Sant tiago Valdivia Part1 Part1 Part1 1 Part2 Part2 2 Par rt2 part3.... part3.... part3... Recife Belo  Horizonte H Part1 Part2 part3... part3..... par rt3.. Part2 Part2 Bel lem Pa art1 Porto  Alegre Part1 Part2 Curitiba C Sao  Paulo Part1 Part2 Part2 Part1 Barra anquilla Part1 Pa art1 Pa art2 part3... part3 3.. part3.. part3.... La Co oruña Caracas Cartagena Bilbao Zwolle Part1 Valencia Part1 Pa art1 Part1 Part1 Part2 Part1 Part2 Part2 Part2 Part2 Part2 part3..... part3.......... part3.... ....... part3.... part3... pa art3.......... Fig19 Estructu jerárqui estudio EISL. 9. ura ica 1ºni ivel: niño os 2º n nivel: centros Vari iable dep pendiente SIBILAN e: NCIAS RE ECURREN NTES En la tabla 6 se recog gen los c centros pa articipant tes en Lat tinoaméri ica y Europa, el ta amaño de la mues e stra en cada centro y la p c prevalencia de sibil lancias re ecurrentes por cent s tro. La t tabla 7 co ontiene las prevalen s ncias de los factore de riesg es go/protec cción para las sibi a ilancias recurrente en los distintos centros. Y la tab 8 es s bla   90  RESULTADOS  muestra el proceso secuencial de introducción de variables en el modelo hasta llegar al modelo nº13, que es el modelo final. País Centro Chile Santiago Valdivia Brasil Fortaleza Recife Belo Horizonte Belem Porto Alegre Sao Paulo Curitiba Colombia Barranquilla Venezuela Caracas Total America Latina España Valencia Cartagena Bilbao La Coruña Holanda Zwolle Total Europa Total 1079 5063 28687 13.80 15.0 22.2 886 1172 996 930 12.1 16.2 18.6 13.8 3009 23624 17.5 23.7 1688 15.9 1209 1063 2532 3029 1016 1012 3003 22.1 25.0 27.4 21.9 36.3 26.7 22.6 2988 3075 22.0 21.1 N Sibilancias recurrentes(%) Tabla 6. Tabla descriptiva de los centros participantes.     91  RESULTADOS  Family history Niños Asma Rinitis Fumar Resfriados 3 Lactancia Personas Estudios en el primeros Hermanos Guardería materna En casa Universitarios eczema emabarazo meses (RIQ) Moho Mascot. >3m (RIQ) de la madre Chile Santiago Valdivia Brazil Fortaleza Recife Belo Horizonte Belem Porto Alegre Sao Paulo Curitiba Colombia Barranquilla Venezuela Caracas Latin America Total Spain Valencia Cartagena Bilbao La Coruña The Netherlands Zwolle Europe Total Total 53.7 53.1 50.8 49.7 51.7 50.6 50.7 53.6 53.4 52.4 52.8 53.1 52.1 49.9 51.4 51.9 52.3 35.4 40.0 41.4 18.6 37.7 13.0 21.0 29.9 44.0 27.7 10.4 13.2 12.7 14.1 13.2 12.8 25.1 48.5 35.9 52.8 29.9 66.4 48.0 55.8 48.7 46.0 40.9 26.4 23.7 18.3 26.6 44.8 28.2 38.6 52.7 58.9 59.0 58.8 61.1 44.2 54.1 53.4 39.6 50.9 10.6 14.5 12.1 12.7 22.7 14.7 44.7 9.8 12.3 13.1 4.7 19.6 15.6 14.0 3.5 8.2 9.9 14.7 21.0 16.2 15.7 9.2 15.4 10.9 35.7 39.8 36.7 39.8 45.1 32.9 38.8 39.5 43.3 40.1 27.5 31.0 21.4 24.4 43.6 30.0 38.4 3.8 26.3 11.2 1.4 21.5 19.6 25.1 5.4 18.0 13.3 16.2 12.0 28.8 22.0 40.1 23.9 15.2 62.0 59.9 63.8 78.8 7.1 62.7 69.5 68.8 54.4 66.2 47.6 40.3 55.6 42.1 45.4 46.0 62.6 0-2 0-2 0-2 0-2 0-2 0-2 0-2 0-2 0-2 0-2 0-1 0-1 0-1 0-1 0-1 0-1 0-2 3-6 3-5 3-5 4-7 3-5 3-5 3-5 6-8 4-6 3-6 3-4 3-4 3-4 3-4 3-4 3-4 3-6 16.2 30.8 35.5 26.1 44.0 32.7 30.8 41.7 28.7 30.2 3.2 12.8 8.4 16.4 5.6 9.4 26.6 25.5 32.5 33.6 26.9 3.9 41.0 39.5 38.3 49.6 41.1 73.3 73.4 89.6 84.2 97.9 83.8 48.6 35.6 30.7 48.4 42.7 51.6 30.7 50.7 40.7 37.3 44.2 23.2 28.6 12.8 28.3 56.2 30.4 41.8 49.7 59.2 15.1 20.3 19.9 25.1 44.2 45.1 9.0 8.7 44.7 40.0 7.4 15.2 79.7 74.3 0-2 0-2 4-6 4-5 22.9 31.4 58.6 61.2 55.4 44.0 Tabla 7. Prevalencia (%) de los factores de riesgo/protección usados en el análisis     92  RESULTADOS  Covariables Género Antecedentes familiares de asma Antecedentes familiares de rinitis Eccema infantil Fumar durante el embarazo Resfriados 3 primeros meses Asistencia a guardería Lactancia materma >3m Hermanos Nº de personas en casa Moho Estudios Universitarios de la madre Mascotas en casa                           Modelo nulo M. 1 *  M. M. M. M. M. M. M. M. M. M. M. M. 2 3 4 5 6 7 8 9 10 11 12 13 *  *  *  *  *                      *  *  *  *                    *  *  *  *  *                  *  *  *  *  *  *                *  *  *  *  *  *  *              *  *  *  *  *  *  *  *            *  *  *  *  *  *  *  *  *          *  *  *  *  *  *  *  *  *  *        *  *  *  *  *  *  *  *  *  *  *      *  *  *  *  *  *  *  *  *  *  *  *    *  *  *  *  *  *  *  *  *  *  *  *  *  Tabla 8. Proceso de estimación secuencial, que consta de 13 modelos más el modelo nulo   93  RES SULTADOS  Se inicia el análisis ajust tando el mode nulo o mo elo odelo vacio de 2 niveles, este es el modelo que solo co e ontiene los intercepto y e centro. Para ver paso a p el a paso como se ajusta un mo odelo en MLw consultar el manual wiN efectos del i (117). Fig. 20. Model Nulo EISL. lo   94  RESULTADOS  Podemos calcular el Test de wald para contrastar la hipótesis nula que dice 0  : Fig. 21. Salida del MlwiN, que muestra el valor del estadístico del test de Wald para el modelo 0. Z= (0,125/0,046)2 = 7.38~Χ2 con 1g.l. VPC= 0.125/(0.125+3.286)= 0.037 p=0,006 y un p-valor unilateral p=0.003 Ahora vamos a incorporar en el modelo una variable explicativa, incluimos la variable sexo que toma el valor 0 para niñas y el valor 1 para niños.   95  RESULTADOS  Modelo 1 Fig. 22. Salida del MlwiN, para el modelo 1. El coeficiente de partición de la varianza es 0.125/(0.125+3.286)= 0.037 A continuación vamos a ir añadiendo una a una las variables explicativas en el modelo.   96  RESULTADOS  Antecedentes de asma familiar: Modelo2 Fig. 23. Salida del MlwiN, para el modelo 2.   97  RESULTADOS  Antecedentes familiares de rinitis: Modelo 3 Fig. 24. Salida del MlwiN, para el modelo 3. Eccema infantil: Modelo 4 Fig. 25. Salida del MlwiN, para el modelo 4.   98  RESULTADOS  Fumar en el embarazo: Modelo 5 Fig. 26. Salida del MlwiN, para el modelo 5. Tener resfriados en los primeros 3 meses de vida: Modelo 6 Fig. 27. Salida del MlwiN, para el modelo 6.   99  RESULTADOS  Asistir a la guardería: Modelo 7 Fig. 28. Salida del MlwiN, para el modelo 7. Lactancia materna al menos 3 meses: Modelo 8 Fig. 29. Salida del MlwiN, para el modelo 8.   100  RESULTADOS  Nº de personas que viven en la casa: Modelo 9 Fig. 30. Salida del MlwiN, para el modelo 9. Nº de hermanos del niño/a: Modelo 10 Fig. 31. Salida del MlwiN, para el modelo 10.   101  RESULTADOS  Si hay moho en la casa del niño/a: Modelo 11 Fig. 32. Salida del MlwiN, para el modelo 11. Nivel educativo de la madre: Modelo 12 Fig. 33. Salida del MlwiN, para el modelo 12.   102  RESULTADOS  MODELO FINAL, MODELO 13, contiene las mismas variables explicativas que el modelo del artículo de factores de riesgo: Fig. 34. Salida del MlwiN, para el modelo 13. 0.079 0.079 3.286 0.023   103  RESULTADOS  Podemos calcular el Test de wald para contrastar la hipótesis nula 0  : El valor del estadístico es 6.953, el cual se compara con el valor de una variable chi-cuadrado con 1 grado de libertad y se obtiene un p-valor igual a 0.008, si lo dividimos entre 2, obtenemos el p-valor unilateral 0.004 por lo tanto podemos decir que la varianza entre centros es estadísticamente distinta de 0. La tabla 9 muestra los resultados del análisis de los factores de riesgo de las sibilancias recurrentes en el primer año de vida, utilizando la regresión logística meta-análisis, y la regresión logística multinivel desde el punto de frecuentista y desde el punto de vista bayesiano.   104  RESULTADOS  Regresión logística Meta-análisis (A) ORa Efectos fijos Género Masc Antecedentes familiares de asma Antecedentes familiares de rinitis Eccema infantil Fumar durante el embarazo Resfriados 3 primeros meses Asistencia a guardería Lactancia materma >3m Hermanos Nº de personas en casa Moho Estudios Universitarios de la madre Mascotas en casa Intercepto Efectos aleatorios varianza entre centros* 1.55 1.93 1.42 1.73 1.48 3.14 2.66 0.79 1.07 1.04 1.41 0.83 0.96 IC95% 1.38-1.75 1.69-2.20 1.25-1.62 1.56-1.92 1.28-1.72 2.69-3.65 2.21-3.21 0.72-0.87 1.02-1.13 1.02-1.07 1.25-1.60 0.70-0.94 0.87-1.05 Mod. multinivel logit con intercepto aleatorio (B) PQL-2 (Frecuentista) ORa 1.44 1.68 1.27 1.49 1.31 2.36 2.20 0.80 1.04 1.04 1.31 0.87 0.94 -2.597 0.079 IC95% 1.35-1.54 1.56-1.80 1.18-1.36 1.39-1.59 1.19-1.44 2.21-2.52 2.02-2.39 0.75-0.86 1.02-1.07 1.02-1.06 1.22-1.41 0.81-0.93 0.88-1.00 0.094 0.030 (C) MCMC(Bayesiano) ORa 1.45 1.68 1.27 1.49 1.31 2.36 2.21 0.80 1.04 1.04 1.31 0.87 0.94 -2.593 0.108 IC95%† 1.35-1.54 1.56-1.81 1.18-1.35 1.39-1.59 1.19-1.44 2.22-2.53 2.03-2.41 0.74-0.86 1.03-1.06 1.02-1.07 1.21-1.40 0.81-0.94 0.88-1.00 0.099 0.051 Tabla9. Comparación de los resultados de los 3 modelos de análisis. Todas las variables son significativas p<0.001, excepto mascotas. *Para el intercepto y los efectos aleatorios se facilita la estimación del parámetro y su error estándar.† Intervalo de credibilidad   105  RESULTADOS  Modelo de pendientes aleatorias: MODELO 14 El siguiente modelo incluye la pendiente aleatoria para la variable cold3mos Fig. 36. Salida del MlwiN, para el modelo 13 con una pendiente aleatoria para cold3mos. Vemos como aparece un subíndice j en el coeficiente β6 y se añade un nuevo término al modelo El resultado es el siguiente: .   106  RESULTADOS  Fig. 37. Salida del MlwiN, para el modelo multinivel completamente aleatorizado. En la tabla 8 se pueden ver los resultados del análisis, en el cual se ha añadido al modelo de intercepto aleatorio una pendiente aleatoria para la variable “cold3mos”.   107  RESULTADOS  Fig. 38. Representación gráfica de las densidades a posteriori de los 3 parámetros para el modelo con pendiente aleatoria para el modelo multinivel completamente aleatorizado.   108  RESULTADOS  Pendiente aleatoria (1) PQL (2) MCMC ORa Efectos fijos Género Masc Ant. Fam. de asma Ant. fam. de rinitis Eccema infantil Fumar en el embarazo Asistencia a guardería Lactancia materma >3m Hermanos Nº de personas en casa Moho Estudios Univ. de la madre Mascotas en casa Resf. 3 primeros meses Intercepto* Efectos aleatorios* varianza del intercepto varianza de pendiente Cov. del intercepto-pendiente 1.44 1.66 1.27 1.48 1.30 2.23 0.80 1.04 1.04 1.30 0.88 0.94 0.811 -2.597 0.183 0.294 -0.187 IC95% 1.35-1.54 1.54-1.78 1.19-1.37 1.38-1.59 1.18-1.43 2.04-2.43 0.75-0.86 1.02-1.07 1.03-1.06 1.21-1.40 0.82-0.95 0.88-1.01 IC95% 0.545-1.087 0.125 0.047-0.318 0.074-0.513 -0.343;-0.030 ORa 1,44 1,65 1,27 1,48 1,30 2,23 0,80 1,04 1,04 1,30 0,88 0,94 0.870 -2.642 0.242 0.381 -0.228 IC95%† 1,35-1,54 1,53-1,78 1,19-1,36 1,38-1,58 1,18-1,43 2,05-2,42 0,75-0,86 1,03-1,06 1,02-1,07 1,21-1,40 0,82-0,95 0,88-1,01 IC95%† 0.582-1.139 0.124 0.111-0.485 0.162-0.833 -0.519;-0.076 Tabla10. Modelo de Pendiente aleatoria (se deriva del modelo 13) *En cada modelo para el intercepto, pendiente aleatoria y los efectos aleatorios se facilita la estimación del parámetro y su error estándar. † Intervalo de credibilidad   109  RESULTADOS  Podemos comparar los dos modelos llevando a cabo el siguiente test estadístico donde la hipótesis nula es que     son iguales a 0. Para ello usamos la aproximación del test de Wald. Fig. 39. Salida del MlwiN, contraste de hipópetesis H0:   0    0 El valor del estadístico es 6.849, el cual se compara con el valor de una variable chi-cuadrado con 2 grados de libertad y se obtiene un p-valor (bilateral) igual a 0.032 y un p-valor unilateral 0.016. Añadir una o varias variables explicativas de segundo nivel: Cuando aún queda varianza entre centros sin explicar, otra opción es probar a introducir en el modelo final una o más variables contextuales del nivel centro, como es, si el centro es sudamericano o europeo y la latitud del centro y ver si esta explica parte de la variabilidad entre centros.   110  RESULTADOS  Fig. 40. Salida del MlwiN, para el modelo multinivel de intercepto aleatoria con variable de segundo nivel lat_eur.   111  RESULTADOS  Modelo de intercepto aleatorio con dos variables de 2º nivel aleatorias: MODELO 15 Fig. 41. Salida del MlwiN, para el modelo multinivel de intercepto aleatorio con variables de segundo nivel lat_eur y latitud. VPC=0.040/0.040+3.286=0.012   112  RESULTADOS  Mod. logit con intercepto aleatorio y 2 variables contextuales (B) PQL-2 (Frecuentista) ORa Variables de 1º nivel Género Masc Antecedentes familiares de asma Antecedentes familiares de rinitis Eccema infantil Fumar durante el embarazo Resfr. 3 primeros meses Asistencia a guardería Lactancia materma >3m Hermanos Nº de personas en casa Moho Estudios Univ. De la madre Mascotas en casa Intercepto* Variables de 2º nivel Latinoamerica vs Europa Latitud varianza entre centros* 1.443 1.680 1.266 1.486 1.307 2.358 2.199 0.798 1.041 1.044 1.309 0.866 0.936 -2.135 0.544 0.987 0.040 IC95% 1.353-1.540 1.563-1.807 1.182-1.356 1.390-1.588 1.185-1.442 2.211-2.516 2.021-2.392 0.745-0.854 1.025-1.057 1.018-1.071 1.219-1.404 0.805-0.931 0.876-1.001 0.098 0.333-0.890 0.979-0.995 0.016 (C) MCMC(Bayesiano) ORa 1.443 1.680 1.265 1.486 1.310 2.366 2.201 0.797 1.041 1.044 1.307 0.870 0.937  0.069 0.563 0.987 0.069 IC95%† 1.350-1.542 1.560-1.809 1.183-1.354 1.389-1.590 1.191-1.441 2.214-2.527 2.021-2.398 0.744-0.854 1.025-1.056 1.018-1.070 1.218-1.402 0.809-0.935 0.880-0.998 0.036 0.278-1.139 0.977-0.998 0.036 Tabla 11. Modelos de interceptos aleatorios con las variables continente donde está el centro y latitud del centro. *En cada modelo para el intercepto y los efectos aleatorios se facilita la estimación del parámetro y su error estándar. † Intervalo de credibilidad   113  6. Discusión DISCUSIÓN  ESCAPE: Los resultados del análisis multinivel para los datos del estudio ESCAPE proporcionan una estimación de la varianza residual entre estaciones del año de 0.0275 con un error estándar de 0.213. Para testar la significación de la varianza del segundo nivel se ha usado el test de Wald, ya que el método de estimación que se ha usado ha sido la cuasi-verosimilitud de segundo orden. El valor del estadístico del test es 1,670 que se corresponde con un p-valor unilateral = 0.110. Por lo tanto, no podemos concluir que exista una variación significativa entre estaciones en la proporción de individuos que se encuentran en el tercil superior de la puntuación global. El objetivo fundamental de la modelización multinivel es analizar los datos teniendo en cuenta la estructura anidada de estos, pero en este caso podemos afirmar que no tiene sentido el análisis multinivel con esta base de datos. Este es un ejemplo de que, aunque mentalmente se pueda intuir una estructura jerárquica de los datos, no siempre es procedente un análisis multinivel. EISL: En el análisis de los datos del estudio EISL “Estudio Internacional de Sibilancias en Lactantes” se ha evaluado inicialmente si tiene sentido tener en cuenta su estructura jerárquica, dado que los datos de los individuos se encuentran anidados en centros. Por una parte, la variación que existe en la prevalencia de las sibilancias recurrentes en los distintos centros en ambos continentes, por ejemplo Porto Alegre en Brasil tiene una prevalencia del 36.3% frente a un 16.2% de prevalencia en Cartagena (España), sugiere la influencia de factores medioambientales y/o ecológicos regionales o locales, lo que apoya la idea de que es necesario explorar la estructura anidada de los datos, ya que individuos que pertenecen al mismo centro y que tienen una zona de residencia similar, están expuestos a la misma influencia de factores medioambientales y/o ecológicos.   115  DISCUSIÓN  Por otra parte, las diferencias encontradas en la prevalencia de sibilancias son parecidas a las descritas en los estudios ISAAC (“International study of asthma and allergies in childhood”), donde la prevalencia de síntomas de asma actual en niños (6-7 años) y adolescentes (13-14 años) fue signicativamente menor en España y Portugal, que en los países de habla hispana y portuguesa de América Latina (133). Para ajustar el modelo nulo del análisis multinivel frecuentista, hemos usado primero la estimación MQL1, y se han usado las estimaciones MQL como valores de inicio de estimación PQL2, evitando así problemas de convergencia (118). La OR de tener sibilancias recurrentes en un centro (con u0j =0) se estima como exp  exp 1.374 0.253. El valor del intercepto para un centro j es -1.374 + u0j, donde la estimación de la varianza de u0j es 0.125 con un error estándar de 0.046. La pregunta subyacente consiste en si es o no necesario permitir que el intercepto sea diferente entre centros. Para ello usamos el test de Wald. Desde el punto de vista teórico no es correcto realizar un test de Wald sobre parámetros de la varianza, pero nos da una indicación acerca de si la varianza del intercepto es ‘importante’ (24). El test nos indica que es estadísticamente distinto de 0, por lo tanto, podemos concluir que existe variación significativa entre centros que tienen sibilancias recurrentes. Y en este caso sí que tiene sentido realizar un análisis jerárquico de dos niveles. Como se ha visto en la parte teórica, el coeficiente de correlación intraclase se estima como el cociente entre la varianza entre grupos y la varianza total. Como en un modelo logístico la varianza total no está directamente disponible, una alternativa es usar la ecuación propuesta por Tom Snijders et al (73). Si aplicamos está ecuación a los datos del modelo nulo, obtenemos un valor de 0.037 para el coeficiente de   116  DISCUSIÓN  partición de la varianza. Por lo que, el 3.7% de la varianza residual de la sibilancias recurrentes es atribuible a las diferencias existentes entre centros. Al añadir al modelo la variable explicativa sexo, que toma el valor 0 para niñas y el valor 1 para niños, no ha habido ningún cambio en la estimación de la varianza entre centros, lo que sugiere que la distribución de niños ‘1’ y niñas ‘0’ es similar entre centros. El coeficiente de partición de la varianza es 0.037, el 3.7% de la variación residual en la propensión a tener sibilancias recurrentes es atribuible a características de la variable centro desapercibidas. El coeficiente de la variable explicativa es 0.0357 y es significativamente distinto de 0 con un p-valor< 0.001. Al introducir predictores en el primer nivel, es muy frecuente que disminuya la varianza residual en el segundo nivel, ya que es posible que la variable explicativa no tenga la misma distribución en todas las unidades de segundo nivel (2;73). Por ello, al introducir el resto de variables explicativas se observan variaciones en la varianza entre centros. En el caso de la variable “Antecedentes de asma familiar” la varianza entre centros ha bajado de 0.125 a 0.104. El Modelo final es el que contiene las mismas variables explicativas que el articulo de García-Marcos et al. (107) y se corresponde con el modelo 13. El valor del coeficiente de partición de la varianza ha pasado de 0.037 a 0.023, este resultado muestra que aproximadamente el 2.3% de la varianza residual de las sibilancias recurrentes es atribuible las diferencias entre centros, después de controlar por las variables explicativas. En todos los modelos obtenemos que los dos factores de riesgo más elevados han sido la asistencia a la guardería y tener resfriados en los 3 primeros meses de vida. Otros factores de riesgo han sido el ser varón, haber fumado durante el embarazo, tener moho en el domicilio del niño,   117  DISCUSIÓN  número de hermanos del niño y número de personas que habitan en el domicilio del niño. La lactancia materna durante más de 3 meses y que la madre tenga estudios universitarios han sido factores de protección. El único efecto fijo cuyo coeficiente no es significativo ha sido tener mascotas en casa. En los 3 modelos, el sexo masculino es un factor de riesgo de tener sibilancias recurrentes en el primer año de vida. Como se ha visto también en otros estudios (106;107;134) los niños son más susceptibles a padecer asma en edades tempanas. Es interesante la asociación de los antecedentes familiares de asma y rinitis con las sibilancias recurrentes, similares en los 3 modelos. En cuanto a la influencia de la historia familiar de asma o rinitis no existe una evidencia concluyente, pero esta asociación refuerza los resultados obtenidos en estudios previos (133;135). Tener eccema infantil también se asocia positivamente con tener sibilancias recurrentes, este resultado es congruente con lo encontrado por Martínez et al. (136). En todos los modelos se observa que fumar en el embarazo es un riesgo para desarrollar sibilancias recurrentes en el primer año de vida. El hábito tabáquico durante el embarazo se relaciona con el bajo peso al nacimiento (137). Lo que se relaciona con una peor función pulmonar e incrementa el riesgo de sibilancias durante los primeros meses de vida (138). Está descrito en la literatura que las enfermedades virales respiratorias severas y la atopia son factores de riesgo para las sibilancias en la infancia (139;140). Con los tres métodos de análisis se obtiene que ‘tener resfriados en los 3 primeros meses de vida’ es el mayor factor de riesgo para las sibilancias, resultado que está en consonancia con lo publicado hasta el momento. Los factores ambientales que están relacionados con la exposición a virus, como son la asistencia la guardería y el tener hermanos, influyen en la prevalencia de tener   118  DISCUSIÓN  sibilancias. Herr M. et al. (141) Y Stern D.A. et al. (142) también llegaron a estas conclusiones en sus respectivos estudios. La lactancia materna más allá de los 3 primeros meses, es un factor de protección. El papel protector que juega la lactancia materna es ya conocido y hay una amplia bibliografía al respecto (143;144). El tener moho en la casa donde vive el niño es otro factor de riesgo de tener sibilancias recurrentes en el primer año de vida. Los niños pasan la mayor parte del tiempo en el interior, tanto en sus casas con en las escuelas. Los hongos de interior son importantes contaminantes biológicos que afectan a la salud de los niños (145-147). En la tabla 9 se han mostrado los resultados de los distintos análisis estadísticos llevados a cabo. Desde el punto de vista del enfoque frecuentista hemos analizado los datos usando un meta-análisis de efectos aleatorios (modelo A) y un análisis multinivel de 2 niveles mediante el algoritmo de la cuasi-verosimilitud penalizada de 2º orden (modelo B). Desde el punto de vista del enfoque bayesiano hemos usado un análisis multinivel de 2 niveles mediante el Método Monte Carlo por Cadenas de Markov (C), para los efectos fijos se ha usado una distribución a priori normal de media 0 y varianza 10000. Para la desviación típica del efecto aleatorio se ha usado una uniforme en el intervalo (0,100). Las estimaciones del modelo A difieren ligeramente del modelo B y C, el primer modelo obtiene estimaciones más pequeñas para los β de casi todas las variables excepto para las variables lactancia materna, nº de personas en casa y estudios universitarios de la madre que permanecen prácticamente invariables. Si nos fijamos en los intervalos de confianza al 95% para el enfoque frecuentista y en los intervalos de credibilidad al 95% para el enfoque bayesiano vemos que los dos resultados de los modelos multinivel proporcionan intervalos más estrechos, lo que significa que el análisis multinivel mejora la precisión de las   119  DISCUSIÓN  estimaciones. Además de que estos modelos proporcionan el porcentaje de la varianza residual de las sibilancias recurrentes que es atribuible a las diferencias entre centros, después de controlar por las variables explicativas. Rodriguez G. y Goldman N. (148) realizaron un estudio en el que se planteaban el coste de ignorar la estructura jerárquica de los datos en modelos con variable respuesta binaria. En este se comparaba una regresión logística ordinaria con una regresión multinivel con intercepto aleatorio (enfoque frecuentista). En este estudio mostraban que las estimaciones de los efectos fijos βp eran bastante similares entre los dos modelos, en cambio, sí que había diferencia en la estimación de los errores estándar. Breslow y Clayton (118) obtuvieron resultados similares con anterioridad. Si comparamos el modelo B, representante del enfoque frecuentista frente al modelo C, representante del enfoque bayesiano, observamos que las estimaciones de las odds ratio de los efectos fijos son prácticamente iguales, tanto en las estimaciones de los coeficientes como las estimaciones de los errores estándar, lo que se traduce también en unos intervalos de confianza en muchos de los casos iguales.  Está coincidencia de resultados es de esperar debido al gran tamaño muestral de las unidades de primer nivel. En cambio la estimación de la varianza entre centros es ligeramente mayor en el enfoque bayesiano 0.108 frente a 0.079 del enfoque frecuentista. En este caso es difícil decir qué estimación es mejor, si la del enfoque frecuentista que usa el algoritmo PQL-2 o el enfoque bayesiano que usa el método MCMC. Goldstein y Rasbash (149) en 1996 usaron los datos de Rodriguez G. y Goldman N para simular 200 conjuntos de datos, partieron del conocimiento del verdadero valor de los parámetros 0.665, 1.0, 1.0, 1.0, 1.0, 1.0    120  DISCUSIÓN  y obtuvieron que las estimaciones PQL de segundo orden se aproximaban considerablemente al verdadero valor de las estimaciones, excepto en la estimación de la varianza de segundo nivel donde había una sub-estimación del 20%: 0.660, 0.965, 0.968, 1.002, 0.802, 0.968  Engel B. en 1998 (150) sugirió que antes problemas reales, el método de Montecarlo por Cadenas de Markov puede producir estimaciones más aceptables aunque hay que tener cuidado en la elección de las distribuciones a priori de los componentes de la varianza (151). Browne W. y Draper D. (119) en 2006 realizaron un estudio de comparación entre el método bayesiano y el método basado en la máxima verosimilitud para ajustar modelos multinivel logísticos de efectos aleatorios. Para ello se basaron, como Goldstein et al., en los datos utilizados por Rodríguez G. y Goldman N. (148) y partiendo de los verdaderos valores de los parámetros generaron 500 muestras replicando las estructura de los datos de Rodríguez y Goldman. En este caso los resultados para un modelo de efectos aleatorios con 3 niveles y una pendiente fija y dos pendientes aleatorias fueron: Método PQL-2 Bayesiano U(0,∞) . 0.612 (0.009) 0.655 (0.010) 1 0.945 (0.009) 1.015 (0.010) 1 0.958 (0.005) 1.031 (0.005) 1 0.942 (0.011) 0.982 (0.013) 1 0.888 (0.009) 1.023 (0.011) 1 0.568 (0.010) 1.130 (0.016)   121  DISCUSIÓN  Browne W. y Draper D. (119) concluyen que para modelos de efectos aleatorios de 2 niveles ambos métodos, el basado en la verosimilitud (PQL-2) y el método bayesiano, proporcionan estimaciones aproximadamente insesgadas y ambos experimentan dificultades a la hora de obtener los intervalos de confianza/credibilidad en muestras pequeñas, aunque el algoritmo PQL-2 es mejor en esos casos . Y para modelos de 3 niveles las estimaciones obtenidas con el método PQL-2 son sesgadas, sobre todo la estimación de la varianza de segundo nivel y los métodos bayesianos proporcionan estimaciones calibradas para todos los parámetros del modelo. Esto nos hace pensar que sería interesante para nuestro estudio de las sibilancias recurrentes aumentar el número de niveles. Una de las principales ventajas del procedimiento de estimación de la quasi-verosimilitud penalizada, es que incluso con bases de datos muy grandes y un gran número de parámetros la carga computacional es ligera frente al método MCMC que tiene un coste computacional muy elevado, y el tiempo de cálculo aumenta con la complejidad del modelo. Pero gracias a mejoras en la velocidad del hardware y en la eficiencia de los algoritmos de Monte Carlo, el enfoque bayesiano para los modelos multinivel se ha convertido en una herramienta muy interesante. Después de utilizar un modelo de interceptos aleatorios se ha planteado el modelo 14 como respuesta a la pregunta de si es o no necesario permitir que la relación entre los resfriados y las sibilancias recurrentes sea diferente para los centros. O en otras palabras ¿es necesario permitir una pendiente aleatoria para “tener resfriados los primeros 3 meses de vida”. Al permitir que la pendiente de esta variable sea aleatoria obtenemos un modelo completamente aleatorio. Con este modelo se parte del supuesto que los centros variarán tanto en la probabilidad de tener sibilancias recurrentes (variación aleatoria de los puntos de corte) como en la relación que se establece en cada centro   122  DISCUSIÓN  entre tener resfriados los 3 primeros meses y la probabilidad de tener sibilancias recurrentes (variación aleatoria de las pendientes) (2). La extensión de un modelo de intercepto aleatorio a uno de pendientes aleatorias introduce dos nuevos términos en la parte aleatoria del modelo:  , ó                  .   , Podemos ver en la tabla 10 los resultados de los factores de riesgo/ protección de las sibilancias recurrentes obtenidos tanto con el enfoque frecuentista como con el enfoque bayesiano. similares en los dos enfoques. En el enfoque frecuentista para comprobar si tiene sentido permitir la pendiente aleatoria para la variable “resfriados en los 3 primeros meses de vida” podemos llevar a cabo el siguiente test estadístico donde la hipótesis nula es que   Como en el caso del modelo de interceptos aleatorios las estimaciones de los efectos fijos son   son iguales a 0. Usamos la aproximación no puede ser negativo, se del test de Wald y teniendo en cuenta que obtiene un p-valor unilateral de 0.016 y por lo tanto podemos concluir que el efecto de cold3mes varía de verdad entre centros. En el enfoque bayesiano para comprobar si tiene sentido permitir la pendiente aleatoria para la variable “resfriados en los 3 primeros meses de vida” debemos observar la figura 38 donde se ve la representación gráfica de las densidades a posteriori de los 3 parámetros. Como los intervalos de credibilidad no contienen al 0 entonces podemos afirmar que tiene sentido permitir la pendiente aleatoria para esta variable. Para un centro cualquiera j, el efecto de haber tenido resfriados en los tres primeros meses de vida sobre el log-odds de tener sibilancias recurrentes es 0.811 + para el modelo 1 y 0.870 + para el modelo 2. Dependiendo del valor de , las diferencias en un centro dado serán mayores o menores que 0.811.   123  DISCUSIÓN  Para la interpretación de la covarianza, lo más importante es el signo. En el modelo 1 y 2 el signo es negativo, lo que indica una relación inversa entre el intercepto aleatorio y la pendiente aleatoria y se traduce en que para un centro con un intercepto relativamente alto tendrá una pendiente relativamente baja. El enfoque bayesiano proporciona estimaciones de los efectos aleatorios distintas al del enfoque frecuentista como hemos ya citado Goldstein y Rasbash (149) afirman en su estudio que el algoritmo PQL-2 subestima la estimación de la varianza, por ello nos podríamos quedar con los resultados del enfoque bayesiano. Uno de los mayores beneficios de usar el análisis multinivel es la posibilidad de incluir conjuntamente variables del primer nivel y del segundo nivel. En algunos casos podemos estar interesados en estudiar si las variables de segundo nivel pueden explicar la variación entre centros, es decir, es posible que otra parte de la diferencia entre las probabilidades de tener sibilancias recurrentes de los centros se deba a que cada uno de ellos tiene distintas características. La inclusión de las variables contextuales, latitud del centro y si el centro está en Latino-América o en Europa, conlleva una sustancial reducción de la varianza entre centros. En el modelo B (enfoque frecuentista) de la tabla 9 y de la tabla 11, vemos que ha pasado de 0.079 a 0.040, y en el modelo C de la tabla 9 y de la tabla 11, vemos que ha pasado de 0.108 a 0.069, lo que significa que la variación entre centros en la probabilidad de tener sibilancias recurrentes el primer año de vida se asocia con la latitud del centro y si está en Europa o en Latino-América en ambos enfoques.   124  7. Conclusiones CONCLUSIONES  1º Los modelos multinivel mejoran la precisión de las estimaciones de los parámetros respecto a los modelos que no tienen en cuenta la estructura jerárquica de los datos. 2ºLos modelos multinivel aportan información adicional acerca del porcentaje de varianza residual que explican los centros. 3º El análisis multinivel mantiene la significación estadística de los factores de riesgo/protección encontrados con el modelo que no ha tenido en cuenta la estructura jerárquica de los datos. 4º La inclusión de las variables contextuales o variables de segundo nivel (latitud, y Latino-América vs. Europa) mejora el porcentaje de la varianza residual de tener sibilancias recurrentes en el primer año de vida que es debido a las diferencias entre centros. 5º El enfoque bayesiano proporciona resultados numéricos similares, en cuanto a las estimaciones de los parámetros y la precisión de las mismas.  6º Para futuros estudios, se sugiere ampliar el número de unidades de segundo nivel y el número de niveles, para corroborar que el enfoque bayesiano mejora el enfoque frecuentista.   126  8. Bibliografía BIBLIOGRAFÍA  (1) Kreft I, De Leeeuw J, Kim KS. Comparing Four Statistical Packages for Hierarchical Linear Regression. CA UoCP, editor. 311. 1990. Los Ángeles. Ref Type: Report (2) Gaviria-Soto JL, Castro-Morera Lineales. Madrid: 2005. MC. Modelos Jerárquicos (3) Golstein H. Multilevel Statistical Models. Hodder Arnold, editor. 3. 2003. Ref Type: Serial (Book,Monograph) (4) De Leeeuw J, Kreft I. Software for Multilevel http://escholarship.org/uc/item/2xn1n7df . 2011. Angeles: Departaments of statatistics, UCLA. Ref Type: Electronic Citation Analysis. UC Los (5) Bennett N. Teaching styles and pupil progress. London: 1976. (6) Aitkin M, Longford N. Statistical Modelling Issues in School Effectiveness Studies. Journal of the Royal Statistical Society Series A (General) 1986; 149:1-43. (7) Moerbeek M. The consequence of ignoring a level of nesting in multilevel analysis. Multivariate Behavioral Research 2004; 39(1):129-149. (8) Robinson WS. Ecological Correlations and the Behavior of Individuals. American Sociological Review 1950;(15):351-357. (9) Alker H. A typology of ecological fallacies. In: Dogan M, Rokkam S e, editors. Social ecology. Boston: The MIT Press, 1969: 69-86. (10) Diez Roux AV, Schwartz S, Susser E. Ecologic studies and ecologic variables in public health research. In: Oxford University Press, editor. The Oxford textbook of public health. London: 2002: 493-509. (11) Lindley DV, Novick MR. The Role of Exchangeability in Inference. Annals of Statistics 1981; 9(1):45-58. (12) Hox JJ. Applied multilevel analysis. Amsterdam: 1995. (13) Holt D, Scott AJ, Ewings PD. Chi-Squared Tests with Survey Data. Journal of the Royal Statistical Society Series A (General) 1980; 143(3):303-320.   128  BIBLIOGRAFÍA  (14) Airy GB. On the Algebraic and Numerical Theory of Errors of Observations and the Combination of Observations. London: 1861. (15) Fisher RA. Theory of statistical estimation. Proceedings of the Cambridge Philosophical Society 1925; 22:700-725. (16) Gibbons R, Bock R. Trend in Psychometrika 1987; 52(1):113-124. correlated proportions. (17) Burstein L, Linn RL, Capell FJ. Analyzing Multilevel Data in the Presence of Heterogeneous Within-Class Regressions. Journal of Educational and Behavioral Statistics 1978; 3(4):347-383. (18) Wald A. A Note on Regression Analysis. Mathematical Statistics 1947; 18(4):586-589. The Annals of (19) Rubin H. Statistical Inference in Dynamic Economic Models. New York: Wiley, 1950. (20) Kreft I, De Leeeuw J. Introducing multilevel modeling. London: 1998. (21) Browne W, Golstein H, Rabash L. Multiple membership multiple classification (MMMC) models. Statistical Modelling 2001; 1:103-124. (22) Duncan C, Jones K, Moon G. Context, composition and heterogeneity: using multilevel models in health research. Soc Sci Med 1998; 46(1):97-117. (23) Diez Roux AV. A glossary for multilevel analysis. J Epidemiol Community Health 2002; 56(8):588-594. (24) Twisk JWR. Applied multilevel Analysis. Cambridge: 2006. (25) Moellering H, Tobler W. Geographical Variances. Geographical Analysis 1972; 4(1):34-50. (26) Griew P, Page A, Thomas S, Hillsdon M, Cooper AR. The school effect on children's school time physical activity: the PEACH Project. Prev Med 2010; 51(3-4):282-286. (27) Wiium N, Burgess S, Moore L. Brief report: multilevel analysis of school smoking policy and pupil smoking behaviour in Wales. J Adolesc 2011; 34(2):385-389. (28) Saab H, Klinger D. School differences in adolescent health and wellbeing: findings from the Canadian Health Behaviour in School-aged Children Study. Soc Sci Med 2010; 70(6):850-858.   129  BIBLIOGRAFÍA  (29) Wold B, Torsheim T, Currie C, Roberts C. National and school policies on restrictions of teacher smoking: a multilevel analysis of student exposure to teacher smoking in seven European countries. Health Educ Res 2004; 19(3):217-226. (30) Boerboom TB, Mainhard T, Dolmans DH, Scherpbier AJ, Van Beukelen P, Jaarsma AD. Evaluating clinical teachers with the Maastricht clinical teaching questionnaire: how much 'teacher' is in student ratings? Med Teach 2012; 34(4):320-326. (31) Opdenakker MC, Minnaert A. Relationship between learning environment characteristics and academic engagement. Psychol Rep 2011; 109(1):259-284. (32) Ireson J, Hallam S, Plewis I. Ability grouping in secondary schools: effects on pupils' self-concepts. Br J Educ Psychol 2001; 71(Pt 2):315-326. (33) Prince SA, Kristjansson EA, Russell K, Billette JM, Sawada M, Ali A et al. A multilevel analysis of neighbourhood built and social environments and adult self-reported physical activity and body mass index in Ottawa, Canada. Int J Environ Res Public Health 2011; 8(10):3953-3978. (34) Merlo J, Viciana-Fernandez FJ, Ramiro-Farinas D. Bringing the individual back to small-area variation studies: A multilevel analysis of all-cause mortality in Andalusia, Spain. Soc Sci Med 2012. (35) Jackson AL, Davies CA, Leyland AH. Do differences in the administrative structure of populations confound comparisons of geographic health inequalities? BMC Med Res Methodol 2010; 10:74. (36) Gallego B, Westbrook MT, Dunn AG, Braithwaite J. Investigating patient safety culture across a health system: multilevel modelling of differences associated with service types and staff demographics. Int J Qual Health Care 2012; 24(4):311-320. (37) Bentley R, Jolley D, Kavanagh AM. Local environments as determinants of walking in Melbourne, Australia. Soc Sci Med 2010; 70(11):1806-1815. (38) Antai D, Wedren S, Bellocco R, Moradi T. Migration and child health inequities in Nigeria: a multilevel analysis of contextualand individual-level factors. Trop Med Int Health 2010; 15(12):1464-1474.   130  BIBLIOGRAFÍA  (39) Haines VA, Beggs JJ, Hurlbert JS. Neighborhood disadvantage, network social capital, and depressive symptoms. J Health Soc Behav 2011; 52(1):58-73. (40) McMurdo ME, Argo I, Crombie IK, Feng Z, Sniehotta FF, Vadiveloo T et al. Social, environmental and psychological factors associated with objective physical activity levels in the over 65s. PLoS One 2012; 7(2):e31878. (41) Jaime Castillo JM. Actitudes cívicas y dimensiones de la ciudadanía democrática en Europa. Revista Española de Investigaciones Sociológicas 2009; 125:47-80. (42) Diehl K, Schneider S. How relevant are district characteristics in explaining subjective health in Germany? A multilevel analysis. Soc Sci Med 2011; 72(7):1205-1210. (43) Baydar N, Kieckhefer G, Joesch JM, Greek A, Kim H. Changes in the health burden of a national sample of children with asthma. Soc Sci Med 2010; 70(2):321-328. (44) Dragano N, Bobak M, Wege N, Peasey A, Verde PE, Kubinova R et al. Neighbourhood socioeconomic status and cardiovascular risk factors: a multilevel analysis of nine cities in the Czech Republic and Germany. BMC Public Health 2007; 7:255. (45) Bentley R, Kavanagh AM, Subramanian SV, Turrell G. Area disadvantage, individual socio-economic position, and premature cancer mortality in Australia 1998 to 2000: a multilevel analysis. Cancer Causes Control 2008; 19(2):183-193. (46) Fukuda Y, Nakaya T, Nakao H, Yahata Y, Imai H. Multilevel analysis of solar radiation and cancer mortality using ecological data in Japan. Biosci Trends 2008; 2(6):235-240. (47) Meersman SC, Breen N, Pickle LW, Meissner HI, Simon P. Access to mammography screening in a large urban population: a multilevel analysis. Cancer Causes Control 2009; 20(8):1469-1482. (48) Robertson R, Campbell NC, Smith S, Donnan PT, Sullivan F, Duffy R et al. Factors influencing time from presentation to treatment of colorectal and breast cancer in urban and rural areas. Br J Cancer 2004; 90(8):1479-1485. (49) King MT, Kenny P, Shiell A, Hall J, Boyages J. Quality of life three months and one year after first treatment for early stage breast cancer: influence of treatment and patient characteristics. Qual Life Res 2000; 9(7):789-800.   131  BIBLIOGRAFÍA  (50) Ludt S, Wensing M, Szecsenyi J, van Lieshout J, Rochon J, Freund T et al. Predictors of health-related quality of life in patients at risk for cardiovascular disease in European primary care. PLoS One 2011; 6(12):e29334. (51) Verpooten GA, Aerts A, Coen N, Vancayzeele S, Hermans C, Bowles J et al. Antihypertensive effectiveness of aliskiren for the 'real-world' management of hypertension: multilevel modelling of 180-day blood pressure outcomes (the Belgian DRIVER Study). Int J Clin Pract 2011; 65(1):54-63. (52) Kavanagh A, Bentley RJ, Turrell G, Shaw J, Dunstan D, Subramanian SV. Socioeconomic position, gender, health behaviours and biomarkers of cardiovascular disease and diabetes. Soc Sci Med 2010; 71(6):1150-1160. (53) Sundquist J, Malmstrom M, Johansson SE. Cardiovascular risk factors and the neighbourhood environment: a multilevel analysis. Int J Epidemiol 1999; 28(5):841-845. (54) Hallman DM, Friedel VC, Eissa MA, Boerwinkle E, Huber JC, Jr., Harrist RB et al. The association of variants in the FTO gene with longitudinal body mass index profiles in non-Hispanic white children and adolescents. Int J Obes (Lond) 2012; 36(1):61-68. (55) Lee MH, Yang HI, Jen CL, Lu SN, Yeh SH, Liu CJ et al. Community and personal risk factors for hepatitis C virus infection: a survey of 23,820 residents in Taiwan in 1991-2. Gut 2011; 60(5):688-694. (56) Finan PH, Zautra AJ, Davis MC, Lemery-Chalfant K, Covault J, Tennen H. Genetic influences on the dynamics of pain and affect in fibromyalgia. Health Psychol 2010; 29(2):134-142. (57) Pattenden S, Armstrong BG, Houthuijs D, Leonardi GS, Dusseldorp A, Boeva B et al. Methodological approaches to the analysis of hierarchical studies of air pollution and respiratory health--examples from the CESAR study. Central European Study on Air pollution and Respiratory Health. J Expo Anal Environ Epidemiol 2000; 10(5):420-426. (58) Pikhart H, Prikazsky V, Bobak M, Kriz B, Celko M, Danova J et al. Association between ambient air concentrations of nitrogen dioxide and respiratory symptoms in children in Prague, Czech Republic. Preliminary results from the Czech part of the SAVIAH Study. Small Area Variation in Air Pollution and Health. Cent Eur J Public Health 1997; 5(2):82-85.   132  BIBLIOGRAFÍA  (59) Dahal GP, Johnson FA, Padmadas SS. Maternal smoking and acute respiratory infection symptoms among young children in Nepal: multilevel analysis. J Biosoc Sci 2009; 41(6):747-761. (60) Campbell SM, Hann M, Hacker J, Burns C, Oliver D, Thapar A et al. Identifying predictors of high quality care in English general practice: observational study. BMJ 2001; 323(7316):784-787. (61) Francis NA, Butler CC, Hood K, Simpson S, Wood F, Nuttall J. Effect of using an interactive booklet about childhood respiratory tract infections in primary care consultations on reconsulting and antibiotic prescribing: a cluster randomised controlled trial. BMJ 2009; 339:b2885. (62) Patel MM, Chillrud SN, Correa JC, Hazi Y, Feinberg M, Kc D et al. Traffic-related particulate matter and acute respiratory symptoms among New York City area adolescents. Environ Health Perspect 2010; 118(9):1338-1343. (63) Pefoyo AJ, Laurier C, Rivard M. [Determinants of geographic variations in asthma medication in Quebec]. Rev Mal Respir 2010; 27(1):49-62. (64) Pikhart H, Bobak M, Kriz B, Danova J, Celko MA, Prikazsky V et al. Outdoor air concentrations of nitrogen dioxide and sulfur dioxide and prevalence of wheezing in school children. Epidemiology 2000; 11(2):153-160. (65) Sternthal MJ, Jun HJ, Earls F, Wright RJ. Community violence and urban childhood asthma: a multilevel analysis. Eur Respir J 2010; 36(6):1400-1409. (66) Suh M, Kim HH, Choi DP, Kim KW, Sohn MH, Ha KH et al. Association between body mass index and asthma symptoms among Korean children: a nation-wide study. J Korean Med Sci 2011; 26(12):1541-1547. (67) Sunyer J, Atkinson R, Ballester F, Le Tertre A, Ayres JG, Forastiere F et al. Respiratory effects of sulphur dioxide: a hierarchical multicity analysis in the APHEA 2 study. Occup Environ Med 2003; 60(8):e2. (68) Tatalovich Z, Wilson JP, Milam JE, Jerrett ML, McConnell R. Competing definitions of contextual environments. Int J Health Geogr 2006; 5:55. (69) Ungvari I, Hullam G, Antal P, Kiszel PS, Gezsi A, Hadadi E et al. Evaluation of a partial genome screening of two asthma   133  BIBLIOGRAFÍA  susceptibility regions using bayesian network based bayesian multilevel analysis of relevance. PLoS One 2012; 7(3):e33573. (70) Villamizar LA, Lopez AB, Ortiz HC, Velazquez JN, Cala LM. [Incidence of respiratory symptoms and the association with air pollution in preschoolers: a multilevel analysis]. Cad Saude Publica 2010; 26(7):1411-1418. (71) Zuidgeest MG, van Dijk L, Spreeuwenberg P, Smit HA, Brunekreef B, Arets HG et al. What drives prescribing of asthma medication to children? A multilevel population-based study. Ann Fam Med 2009; 7(1):32-40. (72) De la Cruz F. Modelos Multinivel. Rev Per Epidemiol 2008; 12(3):1-8. (73) Snijdders TAB, Bosker RJ. Multilevel Analysis. An introduction to basic and advanced multilevel modeling. London: 1999. (74) Hox JJ. Multilevel analysis. Techniques and applications. New Jersey: 2002. (75) ATKINSON AC. Masking unmasked. Biometrika 1986; 73(3):533541. (76) Barnett V, Lewis T. Outliers in Statistical Data. 3 ed. 1994. (77) Lawrence AJ. Deletion Influence and Masking in Regression. Journal of the Royal Statistical Society Series B (Methodological) 1995; 57(1):181-189. (78) Edwards AWF. Likelihood. 1972. (79) Wald A. Tests of statistical hypotheses concerning several parameters when the number of observations is large. Transactions of the American Mathematical Society 1943; 54(3):426-482. (80) Akaike H. [Data analysis by statistical models]. No To Hattatsu 1992; 24(2):127-133. (81) Schwarz G. Estimating the Dimension of a Model. The Annals of Statistics 1978; 6(2):461-464. (82) Golstein H. Nonlinear multilevel models, with an application to discrete response data. Biometrika 1991; 78(1):45-51.   134  BIBLIOGRAFÍA  (83) Bryk AS, Raudenbush SW. Hierarchical linear models: Applications and data analysis methods. Newbury park, CA: Sage Publications, 1992. (84) Browne WJ, Subramanian SV, Jones K, GOLDSTEIN H. Variance partitioning in multilevel logistic models that exhibit overdispersion. Journal of the Royal Statistical Society: Series A (Statistics in Society) 2005; 168(3):599-613. (85) GOLDSTEIN H, Browne W, Rasbash J. Partitioning Variation in Multilevel Models. Understanding Statistics 2002; 1(4):223-231. (86) GOLDSTEIN H, Browne W, Rasbash J. Partitioning Variation in Multilevel Models. Understanding Statistics 2002; 1(4):223-231. (87) SNIJDERS TAB, BOSKER RJ. Modeled Variance in Two-Level Models. Sociological Methods & Research 1994; 22(3):342-363. (88) Van der leeden R. Multilevel analysis of repeated measures data. Quality and Quantity 1998; 32:15-29. (89) Golstein H, Browne W, Rasbash J. Multilevel modelling of medical data. Statist Med 2002; 21(21):3291-3315. (90) Rasbash J, Golstein H. Efficient Analysis of Mixed Hierarchical and Cross-Classified Random Structures Using a Multilevel Model. Journal of Educational and Behavioral Statistics 1994; 19(4):337-350. (91) Raudenbush SW. A Crossed Random Effects Model for Unbalanced Data with Applications in Cross-Sectional and Longitudinal Research. Journal of Educational Statistics 1993; 18(4):321-349. (92) Goldstein H, Yang M, Omar R, Turner R, Thompson S. Metaanalysis using multilevel models with an application to the study of class size effects. Journal of the Royal Statistical Society: Series C (Applied Statistics) 2000; 49(3):399-412. (93) Goldstein H, Browne W, Rasbash J. Multilevel modelling of medical data. Statist Med 2002; 21(21):3291-3315. (94) Golstein H. Handbook of Multilevel analysis. New York: Springer, 2007. (95) Hulley SB. Diseño de la investigación clínica. Un enfoque epidemiológico. Barcelona: 1993.   135  BIBLIOGRAFÍA  (96) Perez-Fernandez V. Sampling and questionnaires. Immunopathol (Madr ) 2008; 36(4):228-233. Allergol (97) SNIJDERS TAB, BOSKER RJ. Standard Errors and Sample Sizes for Two-Level Research. Journal of Educational and Behavioral Statistics 1993; 18(3):237-259. (98) Lee EW, Dubin N. Estimation and sample size considerations for clustered binary responses. Stat Med 1994; 13(12):1241-1252. (99) Liu G, Liang KY. Sample size calculations for studies with correlated observations. Biometrics 1997; 53(3):937-947. (100) Cohen MP. Determining Sample Sizes for Surveys with Data Analyzed by Hierarchical Linear Models. Journal of Official Statistics 1998; 14(3):267-275. (101) Plewis I, Hurry J. A Multilevel Perspective on the Design and Analysis of Intervention Studies. Educational Research and Evaluation 1998; 4(1):13-26. (102) Maas CJM, Hox JJ. Sufficient Sample Sizes for Multilevel Modeling. Methodology: European Journal of Research Methods for the Behavioral and Social Sciences 2005; 1(3):86-92. (103) Cochran WG. Sampling Techniques. 3 ed. New York: 1977. (104) Kreft I. Are Multilevel Techniques Necessary?: An overview, including Simulation Studies. Los Angeles: 1996. (105) Pita-Fernandez S. Uso de la estadística y la epidemiología en atención primaria. Jarpyo Editores SA, editor. 115-161. 1997. Madrid, Universidad de Alicante. Manual de metodología de trabajo en atención primaria. Ref Type: Serial (Book,Monograph) (106) Mallol J, Andrade R, Auger F, Rodriguez J, Alvarado R, Figueroa L. Wheezing during the first year of life in infants from low-income population: a descriptive study. Allergol Immunopathol (Madr ) 2005; 33(5):257-263. (107) Garcia-Marcos L, Mallol J, Sole D, Brand PL. International study of wheezing in infants: risk factors in affluent and non-affluent countries during the first year of life. Pediatr Allergy Immunol 2010; 21(5):878-888. (108) Pearce N, Ait-Khaled N, Beasley R, Mallol J, Keil U, Mitchell E et al. Worldwide trends in the prevalence of asthma symptoms:   136  BIBLIOGRAFÍA  phase III of the International Study of Asthma and Allergies in Childhood (ISAAC). Thorax 2007; 62(9):758-766. (109) Mallol J, Garcia-Marcos L, Sole D, Brand P. International prevalence of recurrent wheezing during the first year of life: variability, treatment patterns and use of health resources. Thorax 2010; 65(11):1004-1009. (110) Garcia-Marcos L, Carvajal U, I, Escribano MA, Fernandez BM, Garcia dlR, Tauler TE et al. Seasons and other factors affecting the quality of life of asthmatic children. J Investig Allergol Clin Immunol 2007; 17(4):249-256. (111) Mallol J, Garcia-Marcos L, Aguirre V, Martinez-Torres A, PerezFernandez V, Gallardo A et al. The International Study of Wheezing in Infants: questionnaire validation. Int Arch Allergy Immunol 2007; 144(1):44-50. (112) Tauler E, Ferrer M, Vall O, Alonso J. [Validation of the Spanish version of the Pediatric Asthma Quality of Life Questionnaire in children with asthma]. Med Clin (Barc ) 2002; 118(11):439. (113) Tauler E, Vilagut G, Grau G, Gonzalez A, Sanchez E, Figueras G et al. The spanish version of the paediatric asthma quality of life questionnaire (PAQLQ): metric characteristics and equivalence with the original version. Qual Life Res 2001; 10(1):81-91. (114) Bianca AC, Wandalsen GF, Miyagi K, Camargo L, Cezarin D, Mallol J et al. International Study of Wheezing in Infants (EISL): validation of written questionnaire for children aged below 3 years. J Investig Allergol Clin Immunol 2009; 19(1):35-42. (115) Mallol J, Garcia-Marcos L, Aguirre V, Martinez-Torres A, PerezFernandez V, Gallardo A et al. The International Study of Wheezing in Infants: questionnaire validation. Int Arch Allergy Immunol 2007; 144(1):44-50. (116) Chong Neto HJ, Rosario N, Dela Bianca AC, Sole D, Mallol J. Validation of a questionnaire for epidemiologic studies of wheezing in infants. Pediatr Allergy Immunol 2007; 18(1):86-87. (117) Rabash J, Steele F, Browne WJ, Golstein H. A User's Guide to MLwiN v2.10. Bristol: 2009. (118) Breslow NE, Clayton DG. Approximate inference in generalized linear mixed models. J Am Statist Assoc 1993;(88):9-25.   137  BIBLIOGRAFÍA  (119) Browne WJ, Draper D. A comparison of Bayesian and likelihoodbased methods for fitting multilevel models. Bayesian Analysis 2006; 1(3):473-514. (120) Normand SL. Meta-analysis: formulating, evaluating, combining, and reporting. Stat Med 1999; 18(3):321-359. (121) Hedges LV, Vevea JL. Fixed- and random-effects models in metaanalysis. Psychological Methods 1998; 3(4):486-504. (122) Olsson U. Generalized linear models, an applied aproach. Sweden: 2002. (123) Guo G, Zhao H. Multilevel Modeling for Binary Data. Annual Review of Sociology 2000; 26:441-462. (124) GOLDSTEIN H, Rasbash J. Improved approximations for multilevel models with binary responses. Journal of the Royal Statistical Society Series A-Statistics in Society 1996; 159:505513. (125) BRESLOW NC. APPROXIMATE INFERENCE IN GENERALIZED LINEAR MIXED MODELS. (126) Golstein H. Hierarchical Linear Models: Problems and Prospects. Journal of Educational and Behavioral Statistics 1995; 20(2):201204. (127) Berger JO. Statistical decision theory and Bayesian Analysis. 2nd revised ed. New York: 1993. (128) Box GEP, Tiao GC. Bayesian inference in statistical Anlysis. 1973. (129) Robert C. The Bayesian Choice: from Decision-Theoric Foundations to Computational Implementation. 2nd ed. New york: 2001. (130) Casella G, Robert C. Monte Carlo statistical methods. New York: 1999. (131) Spiegelhalter WR. Markov Chain Monte Carlo in practice. 1995. (132) Gelman A, Hill J. Data anlysis multilevel/hierarchical models. 2006. using regression and (133) Mallol J, Clayton T, Asher I, Williams H, Beasley R. ISAAC Findings In Children Aged 13-14 Years - An Overview. Allergy and Clinical Inmunology International 1999; 11(5):176-182.   138  BIBLIOGRAFÍA  (134) Sherriff A, Peters TJ, Henderson J, Strachan D. Risk factor associations with wheezing patterns in children followed longitudinally from birth to 3(1/2) years. Int J Epidemiol 2001; 30(6):1473-1484. (135) Belanger K, Beckett W, Triche E, Bracken MB, Holford T, Ren P et al. Symptoms of wheeze and persistent cough in the first year of life: associations with indoor allergens, air contaminants, and maternal history of asthma. Am J Epidemiol 2003; 158(3):195202. (136) Martinez FD, Wright AL, Taussig LM, Holberg CJ, Halonen M, Morgan WJ. Asthma and wheezing in the first six years of life. The Group Health Medical Associates. N Engl J Med 1995; 332(3):133-138. (137) Haddow JE, Knight GJ, Palomaki GE, Kloza EM, Wald NJ. Cigarette consumption and serum cotinine in relation to birthweight. Br J Obstet Gynaecol 1987; 94(7):678-681. (138) Brooke AM, Lambert PC, Burton PR, Clarke C, Luyt DK, Simpson H. The natural history of respiratory symptoms in preschool children. Am J Respir Crit Care Med 1995; 152(6 Pt 1):18721878. (139) Kusel MM, Kebadze T, Johnston SL, Holt PG, Sly PD. Febrile respiratory illnesses in infancy and atopy are risk factors for persistent asthma and wheeze. Eur Respir J 2012; 39(4):876-882. (140) Wu P, Dupont WD, Griffin MR, Carroll KN, Mitchel EF, Gebretsadik T et al. Evidence of a causal role of winter virus infection during infancy in early childhood asthma. Am J Respir Crit Care Med 2008; 178(11):1123-1129. (141) Herr M, Just J, Nikasinovic L, Foucault C, Le Marec AM, Giordanella JP et al. Influence of host and environmental factors on wheezing severity in infants: findings from the PARIS birth cohort. Clin Exp Allergy 2012; 42(2):275-283. (142) Stern DA, Morgan WJ, Halonen M, Wright AL, Martinez FD. Wheezing and bronchial hyper-responsiveness in early childhood as predictors of newly diagnosed asthma in early adulthood: a longitudinal birth-cohort study. Lancet 2008; 372(9643):10581064. (143) Just J, Belfar S, Wanin S, Pribil C, Grimfeld A, Duru G. Impact of innate and environmental factors on wheezing persistence during childhood. J Asthma 2010; 47(4):412-416.   139  BIBLIOGRAFÍA  (144) Chulada PC, Arbes SJ, Jr., Dunson D, Zeldin DC. Breast-feeding and the prevalence of asthma and wheeze in children: analyses from the Third National Health and Nutrition Examination Survey, 1988-1994. J Allergy Clin Immunol 2003; 111(2):328336. (145) Bueso A, Figueroa M, Cousin L, Hoyos W, Martinez-Torres AE, Mallol J et al. Poverty-associated risk factors for wheezing in the first year of life in Honduras and El Salvador. Allergol Immunopathol (Madr ) 2010; 38(4):203-212. (146) Iossifova YY, Reponen T, Ryan PH, Levin L, Bernstein DI, Lockey JE et al. Mold exposure during infancy as a predictor of potential asthma development. Ann Allergy Asthma Immunol 2009; 102(2):131-137. (147) Cho SH, Reponen T, LeMasters G, Levin L, Huang J, Meklin T et al. Mold damage in homes and wheezing in infants. Ann Allergy Asthma Immunol 2006; 97(4):539-545. (148) Rodriguez G, Goldman N. An Assessment of Estimation Procedures for Multilevel Models with Binary Responses. Journal of the Royal Statistical Society Series A (Statistics in Society) 1995; 158(1):73-89. (149) Goldstein H, Rasbash J. Improved approximations for multilevel models with binary responses. Journal of the Royal Statistical Society Series A-Statistics in Society 1996; 159:505-513. (150) Engel B. A Simple Illustration of the Failure of PQL, IRREML and APHL as Approximate ML Methods for Mixed Models for Binary Data. Biom J 1998; 40(2):141-154. (151) Hobert JP, Casella G. The effect of improper priors on {G}ibbs sampling in hierarchical linear mixed models. Journal of the American Statistical Association 1996; 91(436).   140  9. Anexos ANEXOS  Cuestionario EISL   142  ANEXOS    143  ANEXOS    144  ANEXOS    145