Tumgik
detrasdeldataset · 24 days
Text
La Influencia del Alcoholismo en la Depresión: Un Análisis Moderado por la Dependencia a la Nicotina
En esta entrada, exploraremos si el alcoholismo influye en la depresión, utilizando la dependencia a la nicotina como un moderador potencial. Para ello, llevaremos a cabo una prueba de independencia chi-cuadrada. Nuestra hipótesis es que la relación entre el alcoholismo y la depresión puede variar dependiendo de si una persona es dependiente de la nicotina o no.
Primero, filtramos nuestro dataset para conservar únicamente las filas donde la variable "dependencia_nicotina" es verdadera, y luego aquellas donde es falsa. En cada subset, realizamos una prueba chi-cuadrada para examinar la asociación entre el alcoholismo y la depresión.
Resultados para Personas con Dependencia a la Nicotina
Tabla de contingencia:
Tumblr media
Porcentaje:
Tumblr media
Prueba Chi-Cuadrada:
Tumblr media
Estadístico de chi-cuadrada: 6.4295
Valor p: 0.0112
Para las personas dependientes de la nicotina, el valor p (0.0112) es menor al nivel de significancia estándar (0.05), lo que indica que existe una asociación significativa entre el alcoholismo y la depresión en este grupo. Específicamente, las personas alcohólicas tienen una mayor probabilidad de sufrir depresión en comparación con las no alcohólicas.
Resultados para Personas sin Dependencia a la Nicotina
Tabla de Contingencia:
Tumblr media
Porcentaje:
Tumblr media
Prueba Chi-Cuadrada:
Tumblr media
Estadístico de chi-cuadrado: 12.8037
Valor p: 0.0003
Para las personas sin dependencia a la nicotina, el valor p (0.0003) también es menor al nivel de significancia estándar, indicando una asociación significativa entre el alcoholismo y la depresión en este grupo. Al igual que con el grupo dependiente de la nicotina, las personas alcohólicas sin dependencia a la nicotina también presentan una mayor probabilidad de sufrir depresión.
Tumblr media
Dependencia a la Nicotina:
La gráfica muestra que el porcentaje de alcohólicos es mayor en personas con depresión (24.69%) en comparación con las personas sin depresión (20.43%).
Sin Dependencia a la Nicotina:
La gráfica muestra que el porcentaje de alcohólicos es mayor en personas con depresión (16.01%) en comparación con las personas sin depresión (10.77%).
Análisis de los Resultados
Conclusión
En ambos casos, el valor p es menor a 0.05, indicando una asociación significativa entre el alcoholismo y la depresión. Sin embargo, la asociación parece ser más fuerte en personas sin dependencia a la nicotina, como lo demuestra el menor valor p en este grupo.
En resumen, los resultados sugieren que tanto en personas con como sin dependencia a la nicotina, la relación entre el alcoholismo y la depresión es significativa, pero la magnitud de esta relación varía dependiendo de la presencia de dependencia a la nicotina. La dependencia a la nicotina parece influir en la prevalencia de alcoholismo entre personas con depresión.
0 notes
detrasdeldataset · 1 month
Text
DESCIFRANDO LA RELACIÓN ENTRE INGRESOS Y CONSUMO DE ALCOHOL: EL MISTERIO DEL COEFICIENTE DE CORRELACIÓN DE PEARSON
En esta entrada, exploraremos el coeficiente de correlación de Pearson, centrándonos en la relación entre el ingreso total anual y el consumo total anual estimado de alcohol.
Análisis de los Datos
Comenzamos creando una copia de nuestro conjunto de datos y eliminando las filas con entradas NaN, ya que el coeficiente de correlación no puede calcularse con datos faltantes.
Tumblr media
Luego, procedimos a realizar un diagrama de dispersión de estas variables.
Tumblr media
Observamos que el comportamiento de las variables no es lineal; de hecho, parece más apropiado considerar un ajuste logarítmico para establecer una regresión entre ellas. Este será un tema que exploraremos en futuras entradas del blog.
Resultados del Análisis
Tras la realización del diagrama de dispersión, calculamos el coeficiente de correlación de Pearson.
Tumblr media Tumblr media
El resultado obtenido fue un coeficiente de aproximadamente -0.015 (-0.014984230083466107), con un valor p significativo de 0.022912246058339945.
Además, el coeficiente de determinación asociado fue de 0.0002245271511942507, indicando que una fracción extremadamente baja de la variabilidad del consumo total anual de alcohol puede explicarse por el ingreso total anual.
Conclusión
Este análisis revela una correlación negativa débil entre el ingreso total anual y el consumo total anual estimado de alcohol. Sin embargo, el coeficiente de determinación sugiere que el ingreso total anual es un predictor poco confiable del consumo de alcohol, ya que explica solo una pequeña fracción de la variabilidad observada en los datos.
0 notes
detrasdeldataset · 1 month
Text
PRUEBA CHI-CUADRADA DE INDEPENDENCIA: EXPLORANDO LA RELACIÓN ENTRE DEPENDENCIA A LA NICOTINA Y ESTADO CIVIL EN PERSONAS CON ALCOHOLISMO
En esta ocasión, nos adentramos en el análisis de la relación entre la dependencia a la nicotina y el estado civil en individuos diagnosticados con alcoholismo dentro de nuestro conjunto de datos.
1.-PRUEBA DE CHI-CUADRADO DE INDEPENDENCIA GENERAL:
Se llevó a cabo una prueba de independencia chi-cuadrada para examinar la relación entre los valores categóricos de la variable "estado_civil" y la columna "dependencia_nicotina", la cual indica si el individuo es dependiente de la nicotina o no.
Nuestras hipótesis son las siguientes:
H0:La dependencia a la nicotina es independiente al estado civil para las personas alcoholicas
H1: La dependencia a la nicotina es dependiente al estado civil para las personas alcohólicas.
Tumblr media Tumblr media
El valor p obtenido (2.2783779067746558e-48) indica una asociación significativa entre la dependencia a la nicotina y el estado civil en personas con diagnóstico de alcoholismo. Esta baja probabilidad sugiere que la asociación observada entre estas variables es poco probable que se deba al azar. Por lo tanto, rechazamos la hipótesis nula y concluimos que la dependencia a la nicotina está relacionada con el estado civil en personas con alcoholismo. A continuación, procederemos a realizar comparaciones múltiples para identificar qué pares de categorías de estado civil difieren significativamente.
2.-RESULTADOS NO SIGNIFICATIVOS DE LAS COMPARACIONES MÚLTIPLES:
Los resultados revelan que algunas comparaciones entre los niveles de estado civil no muestran diferencias significativas en términos de dependencia a la nicotina en personas con alcoholismo. Estas comparaciones no alcanzaron el nivel de significancia ajustado mediante el método de Bonferroni.
A continuación se muestra el fragmento de código con el cual se realizó el ajuste bonferroni y las pruebas chi-cuadrada de independencia para cada par de combinaciones de estado civil:
Tumblr media
2.1-COMPARACIONES NO SIGNIFICATIVAS ESPECÍFICAS:
Tumblr media
CONCLUSIÓN:
Aunque existe una asociación significativa entre la dependencia a la nicotina y el estado civil en personas con alcoholismo en general, algunas comparaciones específicas entre los niveles de estado civil no resultan significativas. Esto sugiere que la relación entre la dependencia a la nicotina y el estado civil puede variar dependiendo de los pares de categorías de estado civil que se comparen.
Puedes consultar el código utlizado aquí:
chicuadrado.py
datos_nesarc.csv
0 notes
detrasdeldataset · 2 months
Text
Explorando la Relación entre Depresión, Consumo de Alcohol y Ocupación: Un Análisis de Varianza y Prueba F
¡Bienvenidos de nuevo a nuestro blog sobre el alcoholismo y la salud mental!
En esta ocasión, nos sumergiremos en el fascinante mundo del análisis de varianza (ANOVA) y la prueba F. Esta herramienta estadística nos permite explorar si existen diferencias significativas entre las medias de dos o más grupos. En nuestro estudio, nos enfocaremos en la variable "depresión" y en cómo se relaciona con el consumo total anual de alcohol.
La prueba F en este contexto se utiliza para determinar si hay una diferencia significativa entre las medias de dos grupos. En este caso, se estudiará la variable “depresión" la cual tiene dos niveles: True (presencia de depresión) y False (ausencia de depresión).
La hipótesis nula (H0) en la prueba F establece que no hay diferencia significativa entre las medias del consumo total anual para los dos grupos, es decir, que el consumo total anual es el mismo para las personas con y sin depresión.
Por otro lado, la hipótesis alternativa (H1) sugiere que hay al menos una diferencia significativa entre las medias de los grupos.
Tumblr media
Dado que el valor p asociado con la prueba F es prácticamente cero (0.000), esto indica que hay suficiente evidencia para rechazar la hipótesis nula. Por lo tanto, concluimos que la media del consumo total anual de las personas difiere significativamente según si tienen depresión o no.
Durante la fase de visualización de datos, se observó que el porcentaje de alcoholismo variaba entre el 15% y el 17% para cada categoría ocupacional. Esta primera inspección sugirió inicialmente que podría no haber diferencias estadísticas significativas entre los grupos. Sin embargo, con el fin de verificar esta suposición de manera rigurosa, se optó por llevar a cabo un análisis de varianza (prueba F) para evaluar si existían diferencias estadísticamente significativas en la prevalencia de alcoholismo entre los distintos grupos ocupacionales. Los porcentajes que habíamos observado de alcoholismo por ocupación son:
Tumblr media
La prueba F se utilizó para determinar si existe una diferencia significativa entre las medias de la variable de respuesta (en este caso, el indicador de alcoholismo) entre los diferentes grupos definidos por la ocupación.
La hipótesis nula (H0) establece que no hay diferencia significativa entre las medias del indicador de alcoholismo para los diferentes grupos ocupacionales.
Mientras que la hipótesis alternativa (H1) sugiere que al menos una diferencia significativa está presente.
Tumblr media
El resultado de la prueba F mostró un valor p de aproximadamente 5.13e-43, lo que indica que este valor es esencialmente cero. Por lo tanto, tenemos evidencia suficiente para rechazar la hipótesis nula y concluir que hay diferencias significativas en el indicador de alcoholismo entre los diferentes grupos ocupacionales.
Después de realizar la prueba F y rechazar la hipótesis nula, se llevaron a cabo comparaciones múltiples entre los diferentes grupos ocupacionales para determinar cuáles de ellos presentaban diferencias significativas en cuanto a la prevalencia de alcoholismo.
Las comparaciones múltiples se realizaron utilizando el método de Tukey HSD (Diferencia Significativa Mínima Honestamente). Este método ajusta el valor p para tener en cuenta el error de tipo I acumulado debido a las múltiples comparaciones.
Tumblr media Tumblr media Tumblr media
Los resultados de las comparaciones múltiples indicaron que hubo diferencias significativas en la prevalencia de alcoholismo entre varios pares de grupos ocupacionales. Se encontraron diferencias significativas entre ciertos grupos, mientras que otros no mostraron diferencias significativas.
Conclusión:
En conclusión, el análisis de varianza (ANOVA) y la prueba F nos han proporcionado una valiosa perspectiva sobre la relación entre la depresión, el consumo de alcohol y la ocupación. Hemos descubierto que las personas con depresión tienen un consumo total anual de alcohol significativamente diferente en comparación con aquellas sin depresión. Además, al analizar la prevalencia de alcoholismo entre diferentes grupos ocupacionales, encontramos diferencias significativas que nos brindan una comprensión más profunda de cómo el entorno laboral puede influir en los patrones de consumo de alcohol. Este análisis riguroso nos acerca un paso más a comprender los complejos vínculos entre el alcoholismo y la salud mental, lo que potencialmente podría informar estrategias más efectivas de prevención y tratamiento.
Puedes consultar el código y los datos con los que estamos trabajando aquí:
ANOVA.py
datos_nesarc.csv
0 notes
detrasdeldataset · 2 months
Text
VISUALIZACIÓN DE DATOS
Análisis de Tendencia Central y Dispersión:
Comenzamos nuestra exploración visual con un análisis detallado de la tendencia central y la dispersión de variables clave, incluyendo edad, frecuencia de consumo de alcohol y consumo total anual de alcohol.
Edad: Al observar el gráfico de densidad de la variable edad, notamos que la distribución se concentra mayormente entre los 33 y 50 años. La amplitud de la curva sugiere una alta dispersión de los datos.
Tumblr media
Frecuencia de Consumo de Alcohol: El histograma revela un sesgo hacia la derecha, indicando que la mayoría de los datos se sitúan entre 0 y 12 veces al año, con un declive marcado para frecuencias de consumo más altas.
Tumblr media
Consumo Total Anual de Alcohol: Similar al análisis de frecuencia de consumo, el consumo total anual se centra principalmente entre 0 y 5,000 tragos, con una disminución significativa después de los 200 tragos al año.
Tumblr media
Análisis Multivariado:
Alcoholismo y Edad: Mediante un gráfico de cajas, observamos que la mediana de la edad para no alcohólicos y alcohólicos es similar (44 y 46 años, respectivamente), con solapamiento entre las distribuciones, sugiriendo que la edad no parece ser un factor influyente en el alcoholismo.
Tumblr media
Ocupación y Alcoholismo: Al examinar un gráfico de barras apiladas de la ocupación, notamos que la mayoría de las ocupaciones muestran niveles bajos de alcoholismo, con porcentajes menores al 20% en todos los casos. No se evidencia una asociación clara entre el tipo de ocupación y la dependencia al alcoholismo.
Tumblr media
Ingreso Total Anual y Consumo Total Anual: Contrario a las expectativas, el gráfico de dispersión no revela una relación clara entre niveles más bajos de ingreso total anual y un mayor consumo total anual de alcohol.
Tumblr media
Frecuencia de Consumo e Ingreso Total Anual Estratificado por Estado Civil: A pesar de observar una mayor frecuencia de consumo en personas alcohólicas, los datos muestran una distribución similar para personas alcohólicas y no alcohólicas en cada nivel de ingreso total anual. La cantidad de consumo no parece verse afectada por el alcoholismo.
Tumblr media
Adicciones y Condiciones de Salud Mental: Al examinar gráficos de barras apiladas, se observa que la mayoría de las personas en la muestra no sufren de alcoholismo, dependencia a la nicotina, ansiedad, depresión o ludopatía, lo que indica un bajo porcentaje de prevalencia para estas condiciones.
Tumblr media
Comparación entre Ansiedad y Depresión: Los gráficos de barras apiladas al 100% muestran que los niveles de adicciones son similares tanto para personas que sufren de ansiedad y depresión como para aquellas que no. Este hallazgo sugiere que las adicciones no son un rasgo distintivo de las personas que padecen estos trastornos, desafiando así la hipótesis inicial.
Tumblr media
Conclusión:
Nuestro análisis visual ha proporcionado una visión detallada de las variables clave relacionadas con el alcoholismo y la salud mental en nuestra muestra. A pesar de las expectativas iniciales, nuestros hallazgos sugieren que factores como la edad, el tipo de ocupación y el ingreso total anual no muestran una asociación clara con el alcoholismo. Además, la comparación entre ansiedad, depresión y adicciones indica que las adicciones no son necesariamente un predictor distintivo de estos trastornos mentales.
Estos resultados plantean nuevas preguntas e invitaciones a investigaciones adicionales para comprender mejor las complejidades de estas relaciones. Un análisis más profundo y longitudinal podría ayudar a desentrañar los mecanismos subyacentes y proporcionar información valiosa para la prevención y el tratamiento de estos trastornos.
En última instancia, este análisis visual nos permite avanzar en nuestro entendimiento de la intersección entre el alcoholismo y la salud mental, destacando la importancia de enfoques multidisciplinarios y basados en evidencia para abordar estos desafíos de salud pública.
0 notes
detrasdeldataset · 2 months
Text
Preparación para la Visualización de Datos
Antes de adentrarnos en la visualización de datos, se realizó una última manipulación del conjunto de datos para sintetizarlo y dejarlo listo para el análisis.
En primer lugar, se modificaron los nombres de ciertas variables para hacerlos más comprensibles.
Tumblr media
Luego, se crearon nuevas columnas que condensaron información relacionada. Por ejemplo, las variables dummy que indican el tipo de ocupación se agruparon en una sola columna llamada 'ocupación'. Asimismo, se utilizaron múltiples columnas relacionadas con el consumo de alcohol y el tabaquismo para diagnosticar la dependencia y el abuso de estas sustancias.
Tumblr media Tumblr media
Para identificar la presencia de trastornos de ansiedad, se evaluaron los síntomas de trastornos de pánico y agorafobia, así como los de trastornos de ansiedad general. Se contabilizaron los síntomas presentes en cada grupo y se estableció un umbral para diagnosticar la presencia de trastornos de ansiedad.
Tumblr media
Del mismo modo, se clasificó la ludopatía en función de los síntomas asociados al juego compulsivo, tales como la frecuencia de apuestas, intentos fallidos de dejar de apostar y problemas cotidianos debido al juego.
Tumblr media
Una vez completado este proceso, se conservaron únicamente las siguientes columnas: 'id''edad', 'sexo', 'estado_civil', 'ultimo_grado_escolar', 'tipo_empleo', 'total_ingresos', 'bebedor_activo', 'tragos_por_ocasion', 'FrecuenciadeConsumo', 'ConsumoTotalAnual', 'ocupacion', 'alcoholismo', 'alcoholismo_familiar', 'fumador_activo', 'dependencia_nicotina', 'depresion', 'ansiedad' y 'ludópata'. Estas columnas fueron seleccionadas en función de los siguientes criterios de diagnóstico:
Alcoholismo: Se diagnosticó como alcohólico a aquellos participantes cuya frecuencia de consumo de alcohol a la semana era mayor a tres veces o cuya suma de otras frecuencias relacionadas superaba el valor de 4.
Alcoholismo Familiar: Se diagnosticó como positivo si el entrevistado tenía 4 o más de los siguientes factores relacionados con el alcoholismo familiar: padre/madre alcohólico/a, número de hijos alcohólicos, abuelo/a paterno/materno alcohólico/a.
Dependencia a la Nicotina: Se diagnosticó como dependiente de la nicotina a aquellos participantes cuyas horas desde el último cigarro eran menores a 6 meses y cuya frecuencia de consumo de cigarros era mayor a 3 días a la semana, o si presentaban al menos 4 de 7 síntomas relacionados con el consumo de tabaco.
Depresión: Se diagnosticó como positivo a aquellos participantes que presentaban más de 5 de los síntomas relacionados con la depresión.
Tumblr media
Trastornos de Ansiedad: Se diagnosticó la presencia de trastornos de ansiedad si el número de síntomas relacionados con el trastorno de pánico era mayor o igual a 4 y el número de síntomas relacionados con la ansiedad general era mayor o igual a 5.
Ludopatía: Se diagnosticó como ludópata a aquellos participantes que presentaban más de 5 de los síntomas asociados a la ludopatía.
Una vez completado este proceso, se conservaron únicamente las columnas más relevantes, reduciendo el dataframe de 80 columnas a solo 19. Con los datos preparados y el diagnóstico realizado ¡Estamos listos para avanzar con la visualización!
Tumblr media
0 notes
detrasdeldataset · 2 months
Text
Gestión de Datos en Nuestra Investigación: Optimización y Procesamiento
En esta fase de nuestra investigación sobre la relación entre el alcoholismo y los trastornos de ansiedad, nos adentramos en la gestión de datos, un paso fundamental para garantizar la calidad y eficiencia en nuestro análisis. Dividimos esta etapa en cinco partes esenciales: codificación de variables, recodificación de variables, creación de variables secundarias, agrupación de variables y tratamiento de valores faltantes.
Inicialmente, cargamos el dataframe utilizado en nuestra publicación anterior, y agregamos una línea de código adicional para exportar el dataframe final y evitar repeticiones de pasos.
Tumblr media Tumblr media
Observamos que todas las columnas fueron reconocidas como enteros o flotantes, lo que indicó que el problema previo con las columnas tipo 'objeto' había sido resuelto. Posteriormente, convertimos nuevamente aquellas columnas que son categóricas.
Tumblr media Tumblr media
Este proceso redujo significativamente el espacio en memoria, pasando de 26.6MB a 5.9MB. La reducción del espacio en memoria es crucial para la eficiencia del análisis y la capacidad de manejar conjuntos de datos más grandes sin comprometer el rendimiento del sistema. Optimizar el tamaño del dataframe mejora la manipulación de los datos, con tiempos de procesamiento más cortos y una mayor capacidad para explorar y analizar variables y relaciones.
1.-Codificación de Variables de Interés
Una de las decisiones clave en nuestra gestión de datos fue la codificación de la variable 'S3AQ2A1', que representa la edad en la que se consumió el primer cigarro. En lugar de mantener las edades individuales, optamos por una codificación que reflejara las etapas de la vida en las que las personas de la muestra fumaron por primera vez.
Esta decisión se basó en nuestra evaluación de que visualizar las etapas de la vida en las que ocurrió el consumo proporcionaría una comprensión más intuitiva y significativa de los patrones de inicio del consumo de tabaco en nuestra muestra. Para lograr esto, empleamos el método 'cut()' de la librería Pandas, que nos permitió crear intervalos de edad que representan diferentes etapas de la vida, como 'Niño 0-11', 'Adolescente 12-17', 'Joven Adulto 18-29', 'Adulto 30-60' y 'Adulto Mayor 60+', facilitando así el análisis y la interpretación de los datos.
A continuación se presentan las primeras 10 entradas de la variable que no son NaN
Tumblr media Tumblr media
2.-Creación de Variables Secundarias
En esta etapa, estimamos la cantidad de tragos anuales consumidos por las personas de la muestra. Creamos la variable secundaria 'Frecuencia de Consumo', que se derivó de la variable 'S2AQ8A' la cual representa las veces que se consumió alcohol en el último año.
El valor de la variable ‘Frecuencia de Consumo’ se obtuvo como se muestra en la siguiente tabla:
Tumblr media
Esta nueva variable nos permite estimar el total de tragos anuales, multiplicando su valor por la variable 'S2AQ8B', que representa el promedio de tragos consumidos cada vez que se consume alcohol.
Tumblr media Tumblr media
Antes de calcular la 'cantidad de tragos anuales consumidos', recodificamos la variable 'S2AQ8B' debido a la presencia de valores nulos y categorías poco útiles en el libro de códigos. Los valores nulos se recodificaron como 0, ya que indican que la persona era abstemia de toda la vida, mientras que las entradas con valor '99' se sustituyeron por NaN, ya que no podían ser cuantificados con certeza pues el valor '99' representaba que el entrevistado desconocía el promedio de tragos cada vez que consumía alcohol.
Tumblr media Tumblr media
3.-Agrupación de Variables
Realizamos un análisis para observar la distribución de fumadores y consumidores de alcohol, agrupados por sexo y estado civil. Modificamos las etiquetas de estas variables para hacer el dataframe resultante más comprensible.
Tumblr media
Al observar los resultados de la tabla pivote que muestra el recuento de personas fumadoras y consumidoras de alcohol agrupadas por sexo y estado civil, podemos extraer varias observaciones importantes:
3.1.-Patrones de Consumo de Alcohol y Tabaco:
Entre los hombres casados, hay una proporción relativamente alta de consumidores de alcohol y fumadores en comparación con otras categorías de estado civil. Las mujeres casadas también muestran una alta proporción de consumidores de alcohol, especialmente en comparación con otros grupos de estado civil.
3.2.-Diferencias por Estado Civil:
Para ambos géneros, las personas en estado civil "Soltero" muestran una mayor variedad de patrones de consumo, con una proporción significativa de consumidores de alcohol y fumadores. Las personas divorciadas y viudas tienden a tener una proporción más alta de abstemios en comparación con otros grupos de estado civil.
4.-Tratamiento de Valores Faltantes
Finalmente, identificamos un patrón en todas las variables que presentaban valores faltantes. Utilizando la información del libro de códigos, sustituimos los valores que representaban la opción "Lo desconozco" (usualmente representada por el valor '9' o '99') por NaN, ya que no aportan información relevante para nuestro análisis.
Puedes consultar el script del código aquí:
gestiondedatos.py
0 notes
detrasdeldataset · 2 months
Text
Explorando los Datos: Un Análisis Profundo sobre la Relación entre Alcoholismo y Trastornos de Ansiedad
Hoy continuaremos nuestra exploración en la investigación sobre la propensión al alcoholismo y su correlación con los trastornos de ansiedad. Como siguiente paso, nos sumergiremos en un análisis exploratorio de los datos obtenidos del estudio NESARC.
Dada la magnitud del conjunto de datos, nos enfrentamos a un desafío inicial debido a su considerable tamaño. Al cargar el archivo como un dataframe, notamos un consumo significativo de memoria, lo que podría potencialmente ralentizar la ejecución del código.
Tumblr media
Para optimizar nuestra investigación, decidimos conservar únicamente las variables relevantes para nuestro estudio, las cuales se detallan en el libro de códigos.
LIBRO DE CÓDIGO.pdf
Durante este proceso, identificamos que algunas columnas no se importaron con el tipo de dato correcto. Por ejemplo, variables como 'S2AQ11', 'S3AQ2A1', y 'S3AQ3A1R', que representan el número de tragos tolerados sin sentirse intoxicado, la edad de inicio del consumo de tabaco, y la duración en horas desde la última vez que se consumió tabaco, respectivamente, deberían ser de tipo numérico, sin embargo, se detectaron como tipo 'objeto'. Del mismo modo, una lista de aproximadamente 32 variables que deberían ser categóricas también se identificó erróneamente como tipo 'objeto'.
A continuación se presenta la salida en consola del método pandas.info() después de filtrar el dataframe original.
Tumblr media Tumblr media
Durante la corrección del tipo de dato, además, reemplazamos las entradas que contenían espacios en blanco con valores NaN de la biblioteca NumPy, lo que permite a Python reconocer adecuadamente los valores faltantes.
A continuación se presenta la salida en consola del método pandas.info() después de corregir el tipo de dato para cada columna del dataframe:
Tumblr media Tumblr media
Es importante destacar que, al realizar estos ajustes, logramos reducir significativamente el uso de memoria del dataframe. Cuando filtramos las columnas, conseguimos reducir el uso de memoria de 989.6MB a solo 26.6MB. Además, al dejar el dataframe con los tipos de columnas correctos, también conseguimos reducir el uso de memoria, quedando solamente 5.6MB. Esta reducción en el uso de memoria es crucial, ya que permite un procesamiento más eficiente de los datos y mejora el rendimiento del análisis exploratorio.
Con el dataframe corregido y cada columna ahora con su tipo de dato correcto, procedimos con el análisis exploratorio de los datos. Dado que contamos con un total de 81 variables, para una mejor comprensión de la estructura del conjunto de datos, decidimos presentar de manera ilustrativa la frecuencia de las variables de Edad, Sexo y Estado Civil.
Tumblr media
Observamos que en el estudio hay más mujeres que hombres y el tipo de estado civil más común es el de Casado.
Posteriormente, analizamos el número de valores faltantes y el número de valores únicos por columna.
Tumblr media
Por último, presentamos un resumen estadístico de las variables cuantitativas, lo que nos permite obtener una comprensión más profunda del comportamiento de los datos en nuestra muestra.
Tumblr media
Con los datos limpios y un análisis exploratorio detallado en marcha, estamos en un punto crucial de nuestra investigación sobre la relación entre el alcoholismo y los trastornos de ansiedad. Esta optimización en el uso de memoria y la corrección de los tipos de datos nos permiten ahora adentrarnos aún más en el análisis de estos datos fundamentales.
Próximamente, estaremos explorando patrones y tendencias en los datos que podrían arrojar luz sobre la compleja interacción entre el alcoholismo y los trastornos de ansiedad. Manténgase atento para descubrir cómo estos hallazgos podrían informar no solo nuestra comprensión científica, sino también las posibles intervenciones y políticas para abordar estos desafíos de salud mental.
También puedes consultar el código utilizado aquí:
analisisexploratorio.py
Y descargar el dataset con el que estamos trabajando aquí:
nesarc_pds.csv
0 notes
detrasdeldataset · 2 months
Text
EXPLORANDO LAS PROFUNDIDADES DEL ALCOHOLISMO Y SU IMPACTO EN LA SALUD MENTAL
Adentrándome en el vasto mundo de los datos del estudio NESARC (National Epidemiologic Survey on Alcohol and Related Conditions), me encontré inmerso en un océano de posibilidades para la investigación. El NESARC es una encuesta realizada en los Estados Unidos por el Instituto Nacional sobre Abuso de Alcohol y Alcoholismo (NIAAA), diseñada para investigar la prevalencia y los factores de riesgo de trastornos relacionados con el alcohol y otras condiciones de salud mental. Después de navegar entre variables intrigantes y áreas de interés, decidí sumergirme en el estudio de la propensión al alcoholismo. Pero no me detuve ahí. Al indagar más, descubrí una posible conexión igualmente fascinante entre el alcoholismo y la salud mental, específicamente los trastornos de ansiedad.
Explorando la Propensión al Alcoholismo:
Mi enfoque inicial se centrará en desentrañar los hilos que conectan el historial familiar, la depresión, el consumo de tabaco y la ludopatía con la propensión al alcoholismo. ¿Cómo se entrelazan estas variables? ¿Qué papel desempeñan en el desarrollo de la adicción al alcohol? Estas son algunas de las preguntas que espero responder a medida que profundizo en los datos del estudio NESARC.
Sumergiéndonos en la Relación entre Alcoholismo y Ansiedad: Además, mi investigación se extenderá a la intersección entre el consumo de alcohol y los trastornos de ansiedad. ¿Existe una conexión directa entre ambos? ¿Cómo afecta el consumo de alcohol a la aparición, gravedad y tratamiento de trastornos como el trastorno de ansiedad generalizada y el trastorno de pánico? Estas son las preguntas que me guiarán mientras exploramos los datos recopilados por el estudio NESARC
Variables Clave y Preguntas de Investigación:
Factores de riesgo y protectores para el alcoholismo: ¿Cuáles son los factores de riesgo y protección asociados con la propensión al alcoholismo? Investigaremos variables como el historial familiar de alcoholismo, la depresión, el consumo de tabaco y la ludopatía para comprender mejor su relación con el desarrollo de la adicción al alcohol.
Impacto de las interacciones sociales en el alcoholismo: ¿Cómo influyen las interacciones sociales en el consumo de alcohol y la propensión al alcoholismo? Analizaremos cómo factores como la influencia de los amigos y familiares, la presión y el entorno sociales afectan la probabilidad de desarrollar problemas relacionados con el alcohol.
Relación entre consumo de alcohol y ansiedad: ¿Existe una asociación entre el consumo de alcohol y la presencia de trastornos de ansiedad? Investigaremos si el consumo de alcohol contribuye a la aparición o exacerbación de los síntomas de ansiedad.
Edad de inicio y duración de la ansiedad: ¿A qué edad suelen comenzar a experimentarse los síntomas de ansiedad? ¿Cuánto tiempo suelen durar estos síntomas? Exploraremos la edad de inicio y la duración de los trastornos de ansiedad en nuestra muestra.
Las variables que se utilizarán para el estudio se pueden consultar en el siguiente documento:
LIBRO DE CÓDIGO.pdf
Revisión Bibliográfica:
Allende, S. (2009). Impacto de la genética en el alcoholismo. Un enfoque desde la lógica difusa. Rev hanan cienc méd La Habana.
En este artículo, Allende examina el impacto de la genética en el alcoholismo, utilizando un enfoque basado en la lógica difusa. Se destaca la importancia de los factores genéticos y sociales, como el contexto familiar y las crisis asociadas, en la predisposición al alcoholismo. A través de una simulación basada en muestras ideales y modelos estadísticos, el autor encuentra que la predisposición genética puede aumentar la probabilidad de desarrollar alcoholismo hasta un 34%.
González-González, A., et al. (2012). Depresión y consumo de alcohol y tabaco en estudiantes de bachillerato y licenciatura. Salud mental, 35(1), 51-55.
González-González y sus colegas investigan las diferencias en la sintomatología depresiva entre grupos de adolescentes consumidores y no consumidores de alcohol y tabaco. Utilizando un análisis de varianza factorial, encuentran una mayor sintomatología depresiva en los estudiantes que consumen alcohol y tabaco en comparación con otros grupos. Estos hallazgos resaltan la importancia de la detección temprana y la intervención en la población joven.
Montalvo, J. F., et al. (2005). Prevalencia del juego patológico en el alcoholismo: un estudio exploratorio. Revista de psicopatología y psicología clínica, 10(2), 125-134.
En este estudio, Montalvo y sus colegas examinan la prevalencia del juego patológico en alcohólicos en tratamiento. Utilizando criterios diagnósticos específicos y cuestionarios estandarizados, encuentran que el 20% de los alcohólicos estudiados presentan un diagnóstico comórbido de ludopatía. Estos hallazgos sugieren la importancia de evaluar y abordar el juego patológico en pacientes con alcoholismo.
De Pablo, J., et al. (2002). Análisis de comorbilidad entre síndrome de dependencia del alcohol y ludopatía en pacientes en tratamiento en centros de salud mental. Anales del Sistema Sanitario de Navarra, 25(1), 31-36.
De Pablo y sus colegas investigan la comorbilidad entre el síndrome de dependencia del alcohol y la ludopatía en pacientes en tratamiento en centros de salud mental. Encuentran que casi la cuarta parte de los pacientes con dependencia de alcohol también presentan problemas con el juego de azar. Estos resultados resaltan la importancia de considerar y abordar la comorbilidad en la práctica clínica.
Torres, A. B. M., et al. (2017). La evaluación psicofisiológica de ansiedad en el síndrome de abstinencia alcohólica: estudio de caso. Revista Electrónica de Psicología Iztacala, 20(1), 115-138.
Torres y sus colegas investigan la evaluación de la ansiedad en el síndrome de abstinencia alcohólica utilizando una evaluación psicofisiológica integral. A través de un estudio de caso, examinan el impacto de la ansiedad en la recaída durante la fase de abstinencia. Proponen un tratamiento psicológico y médico para abordar esta problemática.
Conclusión:
A medida que nos sumergimos en estas áreas de investigación, espero arrojar luz sobre la compleja relación entre el alcoholismo y la salud mental. Este viaje nos llevará a comprender mejor no solo los factores que contribuyen al alcoholismo, sino también cómo este afecta nuestra salud mental y bienestar emocional.
Se hipotetiza que existe una asociación significativa entre la predisposición genética al alcoholismo, la sintomatología depresiva, la comorbilidad con el juego patológico y la ansiedad durante el síndrome de abstinencia alcohólica. Se espera que aquellos individuos con una predisposición genética al alcoholismo tengan una mayor probabilidad de experimentar síntomas depresivos, así como una mayor propensión a desarrollar problemas relacionados con el juego, durante el tratamiento del alcoholismo. Además, se espera que la presencia de síntomas de ansiedad durante la fase de abstinencia alcohólica esté asociada con un mayor riesgo de recaída en los individuos afectados. Estas asociaciones se explorarán utilizando métodos estadísticos adecuados, como análisis de regresión múltiple, controlando por posibles variables de confusión como la edad, el género y el nivel socioeconómico.
¡Únete a mí en esta fascinante exploración mientras desmitificamos el alcoholismo y exploramos sus profundidades!
2 notes · View notes