Escuela de Matemáticas CA-0303 Estadı́stica Actuarial I Relación entre los indicadores de progreso socioeconómico y el Índice de Felicidad de los paı́ses en el periodo 2014-2018 Luis Fernando Amey Apuy 1, Anthony Jiménez Navarro1, Javier Hernández Navarro1, Erick Venegas Espinoza1 luisfernandoamey@gmail.com, anthonyjimeneznavarro@gmail.com javierhdezn@gmail.com, venegas15erick@gmail.com Maikol Solı́s Chacón 2 maikol.solis@ucr.ac.cr RESUMEN El estudio se centra principalmente en examinar la relación entre diversos marcadores socio- económicos y el Índice de Felicidad de diferentes paı́ses en el periodo del 2014-2018. Para llevar a cabo esto, se utilizaron datos recolectados de The World Bank (2018), World Happiness Report (2018) y Transparency International (2018) en conjunto con metodologı́as y pruebas estadı́sticas relevantes como el coeficiente de correlación de Pearson, el cual se utilizó para obtener correla- ciones significativas entre el Índice de Felicidad y variables socioeconómicas relevantes como el PIB per cápita, el acceso a electricidad y agua potable, la clase social y el Índice de Percepción de la Corrupción. A su vez, se utilizó la Transformación Z de Fisher con el fin de obtener intervalos de confianza asegurando en un 95% la probabilidad de que los coeficientes de dichas correlaciones sean los correctos. Los resultados muestran que en efecto existe una correlación positiva entre las variables seleccionadas y el Índice de Felicidad, sugiriendo que mejorar estos marcadores podrı́an influir en los niveles de felicidad percibidos por la sociedad. Finalmente, las pruebas realizadas a la variable del Índice de Felicidad mostraron tiene un comportamiento normal que, en conjun- to con las correlaciones observadas, ofrece una base sólida para futuros análisis para decisiones polı́ticas. PALABRAS CLAVE: Producto Interno Bruto, Correlación de Pearson, Método Delta, Trans- formación Z de Fisher, normalización. INTRODUCCIÓN La felicidad del ser humano es un concepto bastante abstracto que se ha buscado cuantificar durante mucho tiempo, dado que contar con herramientas para medirla puede ser muy útil en muchos aspectos. Por ejemplo, un buen gobernador deberı́a enfocarse en mejorar el progreso de la nación al mismo tiempo que trabaja para que estas personas posean una calidad de vida, lo que se traduce en un ganar-ganar para todos. Es decir, contar con herramientas que mejoren la calidad de vida de las personas, ya sea su utilidad o felicidad, y al mismo tiempo contribuir al progreso 1Estudiantes de Ciencias Actuariales de la Universidad de Costa Rica 2Profesor encargado del curso CA-0303 Estadı́stica Actuarial I en el periodo I-24 1 del paı́s serı́a lo ideal en la utopı́a de saber gobernar. Por ello, tener información a mano de cómo se comporta el progreso socioeconómico con la felicidad de las personas es muy importante. El presente trabajo tiene como objetivo presentar y resumir la información de cómo ciertas va- riables socioeconómicas se relacionan con el Índice de Felicidad reportado por diferentes paı́ses, en el periodo del 2014 al 2018. Para este análisis, se utiliza la literatura de economı́a del bienestar como base teórica, justificando la selección de las variables utilizadas como marcadores socio- económicos. Estas variables incluyen el PIB per cápita, el acceso a electricidad, el acceso a agua potable, la clase social, el Índice de Percepción de la Corrupción, entre otros. En el mismo se aplican técnicas de estadı́stica inferencial, con el fin de buscar relaciones en- tre variables y proporcionar información valiosa. Estas técnicas permiten identificar la manera en que interactúan las variables socioeconómicas y la felicidad de manera cuantitativa. Además, se emplean metodologı́as que combinan probabilidad y estadı́stica para asegurar que los resultados obtenidos sean robustos y fiables, lo que es crucial para la interpretación correcta de los datos y para la toma de decisiones basada en evidencia. A su vez, se aplican técnicas adicionales pa- ra analizar la distribución del Índice de Felicidad, proporcionando información útil para estudios futuros sobre la felicidad en la sociedad. Este trabajo busca aportar nuevos conocimientos, adaptándose a la demandas cambiarias y destacando su relevancia polı́tica, social, económica y académica. Su objetivo es descubrir si las condiciones socioeconómicas están relacionadas de alguna manera con la felicidad, al mismo tiempo de que se busca estudiar el comportamiento de la varaible en cuestión. METODOLOGÍA Para comenzar, se cuenta con la base de datos llamada World Development Data (Burca, 2018), esta es un compilado de métricas obtenidas por The World Bank (2018), World Happiness Report (2018) y Transparency International (2018). A su vez, se dispone de la base de datos original del World Happiness Report (2018), en donde aparecen más variables de carácter social, la mayorı́a numéricas, trayendo en ella la percepción de felicidad, la cual se usará como Índice de Felicidad y a su vez será la variable de estudio. Esta segunda base de datos se mezclará con la principal, ya que la información coincide en paı́ses y en años. En la base de datos, se decide reemplazar los valores N/A presentes en distintas entradas por el promedio de la variable en cuestión. Por otro lado, en la estructura que presentan los datos se puede observar que cada variable tiene una columna propia. A su vez, cada observación es única, puesto que se trata de un paı́s por observación. Además, existe un identificador claro para cada una de las entradas, en este caso corresponde a la columna country que indica el paı́s. Finalmente, se quiere que todas las variables manejen valores numéricos, ası́ que se va a reemplazar los valores categóricos por su factor, para de esta forma tener únicamente variables numéricas y preparar los datos para el análisis de correlación. Una vez la base estaba lista para el análisis, se obtuvo una matriz de correlación con un mapa de calor para mejorar la visualización de la misma, dado que eran muchas variables. Con ella se observó de forma sencilla cuáles son las variables que tienen una relación más fuerte con nuestra variable de estudio, la cual corresponde al Índice de Felicidad. Ası́, una vez identificadas las mismas, se procedió a calcular explı́citamente el coeficiente de correlación de Pearson de cada una de ellas. Es importante explicar que el coeficiente de correlación de Pearson es un ı́ndice que mide el grado de covariación entre distintas variables relacionadas linealmente. (Ortega, 2020) Un ı́ndice 2 positivo indica que a medida que una variable aumenta, la otra también lo hace. De manera simi- lar, un ı́ndice negativo indica que a medida que una variable aumenta, la otra disminuye. Este se calcula con la siguiente fórmula, suponiendo que las variables son independientes: ρxy = ∑ ZxZy N Donde Zx es la desviación estándar de la variable X , Zy es la desviación estándar de la va- riable Y y N es la cantidad de datos. Por otra parte, se realizó una investigación sobre variantes del Método Delta (Pustejovsky, 2018), y a partir ella, se dio con el Método Delta Multivariable (Zou, 2014), esto con el fin de entender la distribución lı́mite del coeficiente de correlación de Pearson. Para ello, se hace uso de la transformación Z de Fisher (Bobbit, 2022), la cual sirve para determinar los intervalos de confianza dado un coeficiente de correlación de Pearson. La Transformación Z de Fisher nos per- mite transformar el coeficiente de correlación de Pearson ρ y convertirlo a un valor zρ, el cual nos va a permitir calcular un intervalo de confianza para el coeficiente de correlación de Pearson. La fórmula de dicha transformación viene dada por: zρ = 1 2 ln ( 1 + ρ 1− ρ ) = arctanh(ρ) Ahora bien, para calcular el intervalo de confianza (Candia & Caiozzi, 2005) es necesario en- contrar la cota superior e inferior de la siguiente manera: U = zρ + z1−α/2√ n− 3 , L = zρ − z1−α/2√ n− 3 Y ası́, una vez obtenidas las cotas, el intervalo de confianza se puede calcular de la siguiente manera: IC = [ e2L − 1 e2L + 1 , e2U − 1 e2U + 1 ] Finalmente, uno de los objetivos secundarios de la investigación es determinar la distribución que tiene la variable aleatoria del Índice de Felicidad, para esto se decidió utilizar las Pruebas de Shapiro-Wilks (Dietrichson, 2019) y a su vez para corroborar los resultados, se van a utilizar las pruebas cuantil-cuantil, ya que estas cuantifican que tan normal tiende a ser una variable. Se decidió utilizar el método proporcionado por Shapiro-Wilks ya que utiliza en su cálculo las covarianzas de las variables involucradas, razón por la cual resulta más natural escoger esta prueba estadı́stica de normalidad, esto porque hemos estado trabajando con las covarianzas en los cálculos del coeficiente de correlación de Pearson. Para llevar a cabo esta prueba, inicialmente se establecen dos hipótesis: H0: Los datos siguen una distribución normal. H1: Los datos no siguen una distribución normal. Se define el estadı́stico de la prueba como: 3 W = ( n∑ i=1 aix(i) )2 n∑ i=1 (xi − x̄)2 Donde: (a1, . . . , an) = mTV −1 (mTV −1V −1m)1/2 siendom = (m1, . . . ,mn) T dondem1, . . . ,mn son los valores medios del estadı́stico orde- nado y V denota la matriz de covarianzas de ese estadı́stico de orden. Para este caso, la hipótesis nula se rechazará si W es un valor cercano a 0. La aplicación de todas las metodologı́as explicadas anteriormente se llevó a cabo de manera computacional haciendo uso del software R (R Core Team, 2024), en la versión 4.3.3, en conjun- to con las librerı́as importadas de plotly (Sievert et al., 2024), ggpubr (Kassambara, 2023), zoo (Zeileis et al., 2024), dplyr (Wickham et al., 2024), readxl (Wickham & Bryan, 2024), gtsummary (Sjoberg & Oberski, 2024), pastecs (Husson et al., 2024), summarytools (Comtois, 2024), ggplot2 (Wickham, 2024), corrplot (Wei & Simko, 2023), openxlsx (Walker & Crozier, 2024), y knitr (Xie, 2024). Si el lector lo considera necesario o desea profundizar el tema, el código del trabajo está a su disposición en el repositorio de GitHub (Amey et al., 2024) RESULTADOS En primer lugar, se identificaron las variables más relevantes para el estudio, las cuales fue- ron seleccionadas por su alto nivel de relación con el Índice de felicidad obtenido del gráfico de correlación inicial. Estas variables corresponden a: PIB per cápita, acceso a la electricidad, acceso al agua potable, clase social y el Índice de Percepción de Corrupción. Luego, dado que se realizaron dos metodologı́as diferentes para calcular el coeficiente de co- rrelación de Pearson, se consideró pertinente unificar y comparar los resultados de cada método. Esto con el fin de poder concluir la forma en que influyen las variables socioeconómicas de interés sobre nuestra variable del Índice de Felicidad. Además, como se hizo uso de la Transformación Z de Fisher, se agregó a su vez el intervalo de confianza obtenido, esto con el fin de verificar si am- bos coeficientes estaban dentro del mismo. A continuación se adjunta la tabla con los cálculos que arrojó cada metodologı́a en la parte del análisis de datos: Tabla 1 Coeficientes de Correlación de las variables numéricas seleccionadas Variable C.Pearson M.Delta IC Inf IC Sup PIB per Cápita 0,81 0,80 0,71 0,84 Acceso a electricidad 0,67 0,66 0,56 0,74 Acceso al agua 0,71 0,70 0,60 0,77 Índice de Corrupción 0,71 0,72 0,61 0,78 Fuente: Elaboración propia a partir de las base de datos de The World Bank (2018), Transparency International (2018) y World Happiness Report (2018) 4 https://github.com/bluke7ide/Proyecto_Estadistica Lo importante acá es que los valores obtenidos como coeficientes de correlación de Pearson son muy similares según ambos métodos, ya que las diferencias son sutiles y radican en el segundo decimal. A su vez, esto se puede corroborar con el intervalo de confianza, ya que fácilmente se puede ver que cada uno de los valores obtenidos se encuentra efectivamente dentro de este intervalo. Recordemos que este intervalo contiene el valor real del coeficiente con un 95% de probabilidad. Ahora bien, de la Tabla 1, el resultado que más nos llama la atención es el coeficiente de correlación obtenido entre el PIB per cápita y el Índice de Felicidad. Este puede considerarse como un coeficiente casi perfectamente positivo, por lo que nos parece pertinente agregar el gráfico del mismo. Figura 1 Gráfico de correlación entre el PIB per cápita (log gdp per capita) y el Índice de Felicidad (li- fe ladder) R = 0.81 p < 2.2e−16 0 2 4 6 8 7 8 9 10 11 log_gdp_per_capita lif e_ la dd er Fuente: Elaboración propia a partir de las base de datos de The World Bank (2018), Transparency International (2018) y World Happiness Report (2018) Este resultado proporciona los indicios necesarios para comprobar que existe una fuerte rela- ción entre el ingreso que tienen las personas y la utilidad o felicidad que reciben. Esto es un buen camino dado a que inicialmente en la literatura se mencionaba este determinante, pero ahora son nuestros datos los que nos lo confirmaron. A su vez, el siguiente coeficiente más alto fue el de la relación entre el Índice de Percepción de Corrupción y el Índice de Felicidad, por lo que de igual manera se procede a agregar el gráfico: Figura 2 Gráfico de correlación entre el Índice de Percepción de Corrupción (cpi) y el Índice de Felicidad (life ladder) 5 R = 0.72 p < 2.2e−16 0 2 4 6 8 25 50 75 cpi lif e_ la dd er Fuente: Elaboración propia a partir de las base de datos de The World Bank (2018), Transparency International (2018) y World Happiness Report (2018) Nuevamente, de la Figura 2 se puede comprobar que hay un mayor nivel de felicidad percibida por las persona en los paı́ses que presentan menor corrupción. Aunque no es sorpresa para nadie, los datos comprobaron dicho resultado. De manera similar se obtuvieron los demás resultados, los cuales a su vez revelan una relación positiva entre la felicidad de las personas y el disponer de servicios públicos tales como agua y luz. Para finalizar con las correlaciones, se añade el gráfico de la relación entre la Clase Social y el Índice de Felicidad, es importante enfatizar que esta variable era inicialmente categórica, por lo que se trabajó como factor para ası́ poder analizarla su relación, siendo 0 la clase social baja y 3 la alta. Figura 3 Gráfico de cajas y bigotes de Clase Social (income class) con el Índice de Felicidad (life ladder) 3 4 5 6 7 0 1 2 3 income_class lif e_ la dd er income_class 0 1 2 3 Fuente: Elaboración propia a partir de las base de datos de The World Bank (2018), Transparency International (2018) y World Happiness Report (2018) 6 Como se puede observar de la Figura 3, conforme se asciende de clase social, se percibe un mayor Índice de Felicidad, esto a su vez nos dice que existe una relación positiva entre ambas variables. De esta forma, se puede visualizar que en efecto las variables seleccionadas como re- levantes están estrechamente ligadas al Índice de Felicidad. Por otro lado, se tenı́a como objetivo en este estudio determinar la distribución del Índice de Felicidad, para esto se utilizaron las pruebas de Shapiro-Wilks. Después de realizar dicha prueba, se obtuvo que el estadı́stico W tiene un valor de 0, 96, con un valor p de 0, 0572. Aquı́ es impor- tante especificar que un resultado del estadı́stico W cercano a 1 indica que los datos se ajustan bien a una distribución normal. A su vez, el valor p indica la probabilidad de obtener un estadı́stico W tan extremo como el observado, bajo la suposición de que los datos provienen de una distribu- ción normal. En nuestro caso, se obtuvo un valor p mayor a 0,05, lo cual dice que no hay suficiente evidencia para rechazar la hipótesis nula de que los datos provienen de una distribución normal. Es decir, los datos pueden ser considerados normales. A su vez, se realizó un gráfico cuantil-cuantil sobre la variable del Índice de Felicidad, esto con el fin de corroborar bajo otro método si el comportamiento del Índice de Felicidad seguı́a una distribución normal. Este se presenta a continuación: Figura 4 Gráfico cuantil-cuantil del Índice de Felicidad (life ladder) 0.0 2.5 5.0 7.5 10.0 −2 −1 0 1 2 Theoretical lif e_ la dd er Fuente: Elaboración propia a partir de las base de datos de The World Bank (2018), Transparency International (2018) y World Happiness Report (2018) Nótese que en la Figura 4, los puntos obedecen al área entre cuantiles, lo que significa que se asemejan a la distribución teórica, la normal. Finalmente, dado que ambos métodos impulsaron a que el Índice de Felicidad seguı́a una distribución normal, se utilizó el Teorema del Lı́mite central para obtener el resultado deseado, y ası́ lograr comparar la densidad original con una normal de parámetros iguales a los del Índice de Felicidad. Figura 5 Gráfico de la distribución del Índice de Felicidad (life ladder) 7 0.0 0.1 0.2 0.3 0.4 0.0 2.5 5.0 7.5 10.0 Valores D en si da d Normal con parámetros de life_ladder Densidad Histograma Fuente: Elaboración propia a partir de las base de datos de The World Bank (2018), Transparency International (2018) y World Happiness Report (2018) CONCLUSIONES El estudio de los datos realizado, apoyado mediante la literatura, revela que los marcadores socioeconómicos tales como el PIB per cápita, el acceso a electricidad, el acceso a agua potable y el Índice de Percepción de la Corrupción presentan una correlación positiva con el Índice de Felicidad. Los resultados muestran que a mayores niveles de los indicadores, se asocian mayores niveles de felicidad en la población, lo que sugiere que el progreso socioeconómico está relacio- nado de forma positiva con el bienestar subjetivo de los individuos de alguna manera. Esto a su vez se pudo corroborar mediante los intervalos de confianza obtenidos, ya que en todo caso, los coeficientes estuvieron dentro de estos, dándonos un 95% de probabilidad de que las correla- ciones son las correctas. Por otro lado, el estudio realizado sobre el comportamiento de la variable del Índice de Felici- dad indica que esta tiene una distribución normal, lo que sugiere que la felicidad en la población se distribuye de manera equilibrada y que los valores extremos son menos comunes. La distri- bución normal también facilita el uso de técnicas estadı́sticas inferenciales para la evaluación y comparación de la felicidad en diferentes contextos socioeconómicos. Sin embargo, es importante resaltar algunas limitantes que tuvo este estudio, en primer lugar la variable de la felicidad resulta ser muy compleja a la hora de modelar, esto por lo subjetiva que puede llegar a ser. Para este estudio, esta se basa en una encuesta, sin embargo, se están dejando de lado muchas otras variables asociadas, por ello se insta a realizar más estudios de esta varia- ble de felicidad para determinar cómo serı́a una manera más integral de modelarse. Otra de las limitantes es que en la base de datos utilizada para el estudio, algunos paı́ses no aportaron da- tos. Esto puede introducir sesgos en el análisis, ya que que solo se puede modelar una parte de la realidad, limitando la capacidad del estudio para ofrecer conclusiones totalmente representativas y globales. En sı́ntesis, este trabajo tiene como finalidad complementar la teorı́a económica y social, con- tribuyendo en ambos campos una pequeña porción en el análisis de variables seleccionadas en esta investigación, ya que muestra una correlación positiva en las variables socioeconómicas con 8 el Índice de Felicidad, utilizando herramientas de la estadı́stica inferencial y el análisis de datos. En particular, mostrando esta correlación de los indicadores socioeconómicos y la percepción de felicidad de los habitantes, se podrı́a generar pruebas de estudio con el fin de generar un impacto positivo a nivel polı́tico-económico en los paı́ses. AGRADECIMIENTOS Nos gustarı́a hacer un especial agradecimiento al profesor Maikol Solı́s por siempre encami- nar este trabajo y no permitir que se desbordara, además de brindar la bibliografı́a más adecuada. También, agradecer a los compañeros que realizaron un trabajo similar donde la retroalimenta- ción fue muy gratificante y de mucha ayuda para tener crı́ticas constructivas y mejorar el estudio. De igual forma, nos parece oportuno agradecer a la asistente Ana Laura López, ya que se tomó el tiempo de darnos retroalimentación de calidad para mejorar considerablemente las bitácoras. 9 BIBLIOGRAFÍA Amey, L. F., Jiménez, A., Hernández, J., & Venegas, E. (2024). Proyecto Estadı́stica Actuarial CA0303 Universidad de Costa Rica. https://github.com/bluke7ide/Proyecto Estadistica Bobbit, Z. (2022). Fisher Z Transformation. https://www.statology.org/fisher-z-transformation/ Burca, K. V. (2018). World Development Data. https : / / www . kaggle . com / datasets / keithvincentburca/world-development-data Candia, R., & Caiozzi, G. (2005). Intervalos de confianza. Revista médica de Chile, 133(9), 1111-1115. Comtois, D. (2024). summarytools: Tools to Quickly and Neatly Summarize Data. https://cran.r- project.org/web/packages/summarytools/index.html Dietrichson, A. (2019). Métodos Cuantitativos. https : / / bookdown . org / dietrichson / metodos - cuantitativos/test-de-normalidad.html Husson, F., Josse, J., & Pagès, J. (2024). pastecs: Package for Analysis and Display of Statistical Information. https://cran.r-project.org/web/packages/pastecs/index.html Kassambara, A. (2023). ggpubr: ’ggplot2’ Based Publication Ready Plots. https://rpkgs.datanovia. com/ggpubr/ Ortega, C. (2020). ¿Qué es el coeficiente de correlación de Pearson? https://www.questionpro. com/blog/es/coeficiente-de-correlacion-de-pearson/ Pustejovsky, J. E. (2018). The multivariate delta method. https://jepusto.com/posts/Multivariate- delta-method/index.html R Core Team. (2024). The R Project for Statistical Computing. https://www.r-project.org Sievert, C., Parmer, C., Hocking, T., Chamberlain, S., Ram, K., & Corvellec, M. (2024). plotly: Create Interactive Web Graphics via ’plotly.js’. https://plotly.com/r/ Sjoberg, D. D., & Oberski, D. J. P. L. (2024). gtsummary: Presentation-Ready Data Summary and Analytic Result Tables. https://www.danieldsjoberg.com/gtsummary/ The World Bank. (2018). World Development Indicators. https : / / datacatalog . worldbank . org / search/dataset/0037712/World-Development-Indicators Transparency International. (2018). 2018 Corruption Perception Index. https://www.transparency. org/en/cpi/2018 Walker, A., & Crozier, A. (2024). openxlsx: Read, Write and Edit xlsx Files. https://cran.r-project. org/web/packages/openxlsx/index.html Wei, T., & Simko, V. (2023). corrplot: Visualization of a Correlation Matrix. https://cran.r-project. org/web/packages/corrplot/index.html Wickham, H. (2024). ggplot2: Create Elegant Data Visualisations Using the Grammar of Graphics. https://ggplot2.tidyverse.org/ Wickham, H., & Bryan, J. (2024). readxl: Read Excel Files. https://readxl.tidyverse.org/ 10 https://github.com/bluke7ide/Proyecto_Estadistica https://www.statology.org/fisher-z-transformation/ https://www.kaggle.com/datasets/keithvincentburca/world-development-data https://www.kaggle.com/datasets/keithvincentburca/world-development-data https://cran.r-project.org/web/packages/summarytools/index.html https://cran.r-project.org/web/packages/summarytools/index.html https://bookdown.org/dietrichson/metodos-cuantitativos/test-de-normalidad.html https://bookdown.org/dietrichson/metodos-cuantitativos/test-de-normalidad.html https://cran.r-project.org/web/packages/pastecs/index.html https://rpkgs.datanovia.com/ggpubr/ https://rpkgs.datanovia.com/ggpubr/ https://www.questionpro.com/blog/es/coeficiente-de-correlacion-de-pearson/ https://www.questionpro.com/blog/es/coeficiente-de-correlacion-de-pearson/ https://jepusto.com/posts/Multivariate-delta-method/index.html https://jepusto.com/posts/Multivariate-delta-method/index.html https://www.r-project.org https://plotly.com/r/ https://www.danieldsjoberg.com/gtsummary/ https://datacatalog.worldbank.org/search/dataset/0037712/World-Development-Indicators https://datacatalog.worldbank.org/search/dataset/0037712/World-Development-Indicators https://www.transparency.org/en/cpi/2018 https://www.transparency.org/en/cpi/2018 https://cran.r-project.org/web/packages/openxlsx/index.html https://cran.r-project.org/web/packages/openxlsx/index.html https://cran.r-project.org/web/packages/corrplot/index.html https://cran.r-project.org/web/packages/corrplot/index.html https://ggplot2.tidyverse.org/ https://readxl.tidyverse.org/ Wickham, H., François, R., Henry, L., & Müller, K. (2024). dplyr: A Grammar of Data Manipulation. https://cran.r-project.org/web/packages/dplyr/index.html World Happiness Report. (2018). World Happiness Report Data Dashboard. https : / / worldhappiness.report/data/ Xie, Y. (2024). knitr: A General-Purpose Package for Dynamic Report Generation in R. https://yihui. org/knitr/ Zeileis, A., Grothendieck, G., Ryan, J. A., Ulrich, J. M., & Andrews, F. (2024). zoo: S3 Infrastructure for Regular and Irregular Time Series (Z’s Ordered Observations). https://cran.r-project.org/ web/packages/zoo/index.html Zou, C. (2014). Lecture Notes on Asymptotic Statistics. https://www.datascienceassn.org/sites/ default/files/Asymptotic%20Statistics%20-%20Lecture%20Notes.pdf 11 https://cran.r-project.org/web/packages/dplyr/index.html https://worldhappiness.report/data/ https://worldhappiness.report/data/ https://yihui.org/knitr/ https://yihui.org/knitr/ https://cran.r-project.org/web/packages/zoo/index.html https://cran.r-project.org/web/packages/zoo/index.html https://www.datascienceassn.org/sites/default/files/Asymptotic%20Statistics%20-%20Lecture%20Notes.pdf https://www.datascienceassn.org/sites/default/files/Asymptotic%20Statistics%20-%20Lecture%20Notes.pdf