Models economètrics en entorns big data enfocats a desigualtats

Author

Perafita Basart, Xavier ORCID

Director

Sáez Zafra, Marc

Date of defense

2023-11-24

Pages

228 p.



Department/Institute

Universitat de Girona. Departament d'Economia

Doctorate programs

Programa de Doctorat Interuniversitari en Dret, Economia i Empresa

Abstract

In the last twenty years, the study of social inequalities has been a topic of special interest, revealing how differences between social classes have increased. During the same period, data generation has exponentially grown, leading to the normalization of the term "Big Data," which is widely recognized by the general population. This thesis examines the econometric mechanisms used in the management of massive data and applies them to social inequalities. To achieve this, existing mechanisms have been identified through a systematic review, which revealed five types of algorithms: classifiers, penalized classifiers, quasi-Bayesian penalized classifiers, clusters, and neural networks. Based on this review, the results of different algorithms have been utilized and compared to perform the clustering of municipalities in the province of Girona. The best grouping has served as the foundation for designing the sampling of the cohort driven by the Social, Environmental, and Health Observatory of Dipsalut. To study the inequality of vulnerable families in Catalonia, data on the typology of households and their environments have been obtained to analyze the living conditions of these families. The market they have access to is more limited, where the characteristics of the homes do not play a significant role in the possibility of renting housing; instead, the environment determines where they can live. These environments are more insecure, unhealthy, and impoverished, highlighting how low-income families are forced to reside in settings that exacerbate the poverty trap. Additionally, the study demonstrates that different logics regarding inequalities exist in urban and rural areas, which should be considered when designing and implementing any policies addressing inequality


En els últims vint anys, l'estudi de les desigualtats socials han estat un tema d'especial interès, mostrant com les diferències entre les classes socials han augmentat. En el mateix període, la generació de dades ha augmentat de manera exponencial, provocant la normalització del terme Big Data, el qual és reconegut per la població general. Aquesta tesi estudia quins són els mecanismes economètrics que s'utilitzen en la gestió de dades massives i ho aplica a les desigualtats socials. Per a fer-ho, s'han detectat els mecanismes existents a través d'una revisió sistemàtica, en la qual, s'han detectat cinc tipus d'algorismes: classificadors, classificadors amb penalització, classificadors gairebé bayesians amb penalització, agrupadors i les xarxes neuronals. A partir d'aquesta revisió, s'han utilitzat i comparat els resultats de diferents algorismes per a realitzar la clusterització dels municipis de la província de Girona. La millor agrupació s'ha usat com a base pel disseny del mostreig de la cohort que impulsa l'Observatori Social, Ambiental i de Salut del Dipsalut. Per a estudiar la desigualtat a Catalunya de les famílies vulnerables, s'ha obtingut dades sobre la tipologia de llars i els seus entorns per a estudiar en quina situació poden viure aquestes famílies. El mercat al qual tenen accés és més reduït, on les característiques de les llars no juguen un paper significatiu en la possibilitat de llogar o no l'habitatge i acaba sent l'entorn el que determina on poden viure. Aquests entorns són més insegurs, insalubres i pobres. Mostrant com les famílies amb baixos recursos, han de viure en entorns que acreixen el parany de la pobresa. A més, es demostra que existeixen diferents lògiques sobre les desigualtats en àrees urbanes i en àrees rurals, les quals s'haurien de tenir en compte en l'hora de dissenyar i aplicar qualsevol política sobre desigualtats

Keywords

Dades massives; Datos masivos; Big data; Desigualtat social; Desigualdad social; Social inequality; Trampa de la pobresa; Trampa de la pobreza; Poverty trap; Clusterització de dades; Clustering; Econometria; Econometría; Econometrics

Subjects

338 - Economic situation. Economic policy. Management of the economy. Economic planning. Production. Services. Prices; 68 - Industries, crafts and trades for finished or assembled articles

Documents

This document contains embargoed files until 2024-05-22

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/

This item appears in the following Collection(s)