/ viernes 31 de julio de 2020

UG TU CONECTE CON LA CIENCIA

La estadística en tiempos de COVID-19

Desde que empezó la pandemia en México se han dado noticias sobre los modelos epidemiológicos que el gobierno mexicano utiliza para el control de epidemias y pandemias, así como los enojos populares sobre por qué falló la predicción y han dado varias fechas, entre otros comentarios.

Como especialista, y amante de la bioestadística, puedo entender que estos modelos han sido poco comprendidos y hay que entender que desarrollarlos lleva años, pero lo que no han explicado es ¿si es bueno el modelo por qué falló?, ahora, desde un punto de vista neutral, pues no soy epidemiólogo, tengo que aportar algo al entendimiento de como desarrollan este tipo de técnicas estadísticas para entender el por qué no ha sido fácil estimar “el pico de la pandemia”.

Los modelos de regresión son técnicas estadísticas que se basan en entender las tendencias de los datos, es decir, no siempre podemos evaluar a todos los individuos —los censos, para estadísticas poblacionales sólo lo hacen cada 10 años— por lo que los modelos predicen más allá de un error de estimación cual puede ser el valor que, incluso, aún no se tiene. Pero es necesario tener datos confiables para generar o validar modelos de problemas ya probados en condiciones similares.

Para probar que los datos siguen los modelos se realizan dos pruebas estadísticas y se obtiene un coeficiente de determinación —que indica el ajuste del modelo— todas importantes para saber que el modelo predice más allá de errores aleatorios datos por factores externos —en este caso la genética, enfermedades preexistentes y hábitos de vida— aunque los niveles de confiabilidad los establece el especialista. Sin embargo, el número de datos con las que se alimenta el modelo es de gran importancia y entre mayor número de datos se dan al modelo mejores resultados se pueden tener.

Ahora, ¿qué falló? ¿el modelo? ¿los datos? ¿el especialista?, es difícil saberlo, pero las diferentes versiones del modelo cambian porque cada vez se tiene más información y entre más se tenga mejor podrán aplicar un modelo que se aproxime a la realidad, mientras tanto, creo que falta que los que entendemos —aunque a medias— salgamos a explicar lo que está pasando, entre más información tengamos ¡mucho mejor! hay que explicar ciencia como decía Einstein “si sabes ciencia es porque puedes explicársela a tu abuela” y hay que tratar de hacerlo, como yo intento hacerlo con mis estudiantes. Recuerden la ciencia no es difícil, los científicos sí.

Cualquier comentario sobre este artículo, favor de dirigirlo a eugreka@ugto.mx. Para consulta de más artículos www.ugto.mx/eugreka

Dr. Carlos Alberto Núñez-Colín

Departamento de Ingenierías

División de Ciencias de la Salud e Ingenierías

Campus Celaya-Salvatierra

Universidad de Guanajuato.


La estadística en tiempos de COVID-19

Desde que empezó la pandemia en México se han dado noticias sobre los modelos epidemiológicos que el gobierno mexicano utiliza para el control de epidemias y pandemias, así como los enojos populares sobre por qué falló la predicción y han dado varias fechas, entre otros comentarios.

Como especialista, y amante de la bioestadística, puedo entender que estos modelos han sido poco comprendidos y hay que entender que desarrollarlos lleva años, pero lo que no han explicado es ¿si es bueno el modelo por qué falló?, ahora, desde un punto de vista neutral, pues no soy epidemiólogo, tengo que aportar algo al entendimiento de como desarrollan este tipo de técnicas estadísticas para entender el por qué no ha sido fácil estimar “el pico de la pandemia”.

Los modelos de regresión son técnicas estadísticas que se basan en entender las tendencias de los datos, es decir, no siempre podemos evaluar a todos los individuos —los censos, para estadísticas poblacionales sólo lo hacen cada 10 años— por lo que los modelos predicen más allá de un error de estimación cual puede ser el valor que, incluso, aún no se tiene. Pero es necesario tener datos confiables para generar o validar modelos de problemas ya probados en condiciones similares.

Para probar que los datos siguen los modelos se realizan dos pruebas estadísticas y se obtiene un coeficiente de determinación —que indica el ajuste del modelo— todas importantes para saber que el modelo predice más allá de errores aleatorios datos por factores externos —en este caso la genética, enfermedades preexistentes y hábitos de vida— aunque los niveles de confiabilidad los establece el especialista. Sin embargo, el número de datos con las que se alimenta el modelo es de gran importancia y entre mayor número de datos se dan al modelo mejores resultados se pueden tener.

Ahora, ¿qué falló? ¿el modelo? ¿los datos? ¿el especialista?, es difícil saberlo, pero las diferentes versiones del modelo cambian porque cada vez se tiene más información y entre más se tenga mejor podrán aplicar un modelo que se aproxime a la realidad, mientras tanto, creo que falta que los que entendemos —aunque a medias— salgamos a explicar lo que está pasando, entre más información tengamos ¡mucho mejor! hay que explicar ciencia como decía Einstein “si sabes ciencia es porque puedes explicársela a tu abuela” y hay que tratar de hacerlo, como yo intento hacerlo con mis estudiantes. Recuerden la ciencia no es difícil, los científicos sí.

Cualquier comentario sobre este artículo, favor de dirigirlo a eugreka@ugto.mx. Para consulta de más artículos www.ugto.mx/eugreka

Dr. Carlos Alberto Núñez-Colín

Departamento de Ingenierías

División de Ciencias de la Salud e Ingenierías

Campus Celaya-Salvatierra

Universidad de Guanajuato.