Youyang Gu, el joven de 27 años que se convirtió en una superestrella de datos de Covid-19 en EEUU

“La primavera de 2020 trajo consigo la llegada del modelo estadístico de celebridades. Mientras el público trataba de evaluar qué tan importante podría ser el coronavirus en marzo y abril, se señaló una y otra vez a dos sistemas de pronóstico: uno construido por el Imperial College de Londres, el otro por el Instituto de Métricas y Evaluación de la Salud, o IHME, con sede en Seattle”, comienza la introducción de un artículo publicado por bloomberg.com

“En el concurso sobre quién podría hacer el pronóstico de coronavirus más preciso, fueron las instituciones globales contra un hombre que vivía con sus padres en Santa Clara”, señala en el inicio Ashlee Vance, autor de la publicación

Pero los modelos arrojaron predicciones tremendamente divergentes. Imperial advirtió que Estados Unidos podría ver hasta 2 millones de muertes por Covid-19 para el verano, mientras que el pronóstico de IHME era mucho más conservador, prediciendo alrededor de 60,000 muertes para agosto.


Resultó que ninguno de los dos estaba muy cerca. Estados Unidos alcanzó finalmente alrededor de 160.000 muertes a principios de agosto.

La enorme discrepancia en las cifras de pronóstico esa primavera llamó la atención de un científico de datos de 26 años llamado Youyang Gu. El joven tenía una maestría en ingeniería eléctrica e informática del Instituto de Tecnología de Massachusetts y otra licenciatura en matemáticas, pero no tenía capacitación formal en un área relacionada con la pandemia como la medicina o la epidemiología. Aún así, pensó que su experiencia en el manejo de modelos de datos podría resultar útil durante la pandemia.


A mediados de abril, mientras vivía con sus padres en Santa Clara, California, Gu pasó una semana construyendo su propio predictor de muerte Covid y un sitio web para mostrar la información mórbida. En poco tiempo, su modelo comenzó a producir resultados más precisos que los elaborados por instituciones con cientos de millones de dólares en financiación y décadas de experiencia.

“Su modelo era el único que parecía cuerdo”, dice Jeremy Howard, un renombrado experto en datos e investigador científico de la Universidad de San Francisco. “Se demostró que los otros modelos no tenían sentido una y otra vez y, sin embargo, no hubo introspección por parte de las personas que publicaron los pronósticos o de los periodistas que informaron sobre ellos. La vida de las personas dependía de estas cosas, y Youyang era la única persona que realmente miraba los datos y lo hacía correctamente".

El modelo de pronóstico que construyó Gu fue, en cierto modo, simple. Primero había considerado examinar la relación entre las pruebas de Covid, las hospitalizaciones y otros factores, pero descubrió que los estados y el gobierno federal informaban esos datos de manera inconsistente.


Las cifras más fiables parecían ser los recuentos diarios de muertes. "Otros modelos utilizaron más fuentes de datos, pero decidí confiar en las muertes pasadas para predecir las muertes futuras", dice Gu.

"Tener eso como la única entrada ayudó a filtrar la señal del ruido".

El giro novedoso y sofisticado del modelo de Gu provino de su uso de algoritmos de aprendizaje automático para perfeccionar sus figuras. Después del MIT, Gu pasó un par de años trabajando en la industria financiera escribiendo algoritmos para sistemas comerciales de alta frecuencia en los que sus pronósticos tenían que ser precisos si quería mantener su trabajo.


En lo que respecta a Covid, Gu siguió comparando sus predicciones con los eventuales totales de muertes reportados y ajustó constantemente su software de aprendizaje automático para que condujera a pronósticos cada vez más precisos. Aunque el trabajo requería las mismas horas que un trabajo exigente de tiempo completo, Gu ofreció su tiempo como voluntario y vivió de sus ahorros.


Quería que sus datos se vieran libres de conflictos de intereses o prejuicios políticos. Aunque ciertamente no es perfecto, el modelo de Gu funcionó bien desde el principio. A fines de abril, predijo que Estados Unidos vería 80.000 muertes para el 9 de mayo.


“La cifra real de muertos fue de 79.926. Un pronóstico similar de finales de abril de IHME predijo que EE. UU. No superaría las 80.000 muertes en todo el 2020. Gu también predijo 90.000 muertes el 18 de mayo y 100.000 muertes el 27 de mayo, y una vez más acertó las cifras”


Donde IHME esperaba que el virus se desvaneciera como resultado del distanciamiento social y otras políticas, Gu predijo que habría una segunda gran ola de infecciones y muertes a medida que muchos estados volvieran a abrir después de los bloqueos.


IHME enfrentó algunas críticas en marzo y abril, cuando sus números no coincidían con lo que estaba sucediendo. Aún así, el prestigioso centro, con sede en la Universidad de Washington y respaldado por más de US$ 500 millones en fondos de la Fundación Bill y Melinda Gates, fue citado casi a diario durante las sesiones informativas de miembros de la Administración del presidente Donald Trump.

En abril, el jefe de enfermedades infecciosas de EEUU, Anthony Fauci, le dijo a un entrevistador que el número de muertos de Covid "se parece más a 60.000 que los 100.000 a 200.000" que se esperaba antes, una predicción que refleja los pronósticos de IHME.


Y el 19 de abril, el mismo día que Gu advirtió sobre una segunda ola, Trump señaló el pronóstico de 60.000 muertes de IHME como un indicador de que la lucha contra el virus pronto terminaría.

Los funcionarios del IHME también promovieron activamente sus números. “Tenías al IHME en todos estos programas de noticias tratando de decirle a la gente que las muertes llegarían a cero en julio”, dice Gu.


“Cualquiera con sentido común podría ver que estaríamos entre 1.000 y 1.500 muertes diarias durante un tiempo. Pensé que era muy falso que ellos hicieran eso ". Christopher Murray, director de IHME, dice que una vez que la organización logró controlar mejor el virus después de abril, sus pronósticos mejoraron radicalmente.

Pero esa primavera, semana tras semana, más personas comenzaron a prestar atención al trabajo de Gu. Señaló su modelo a los reporteros en Twitter y envió correos electrónicos a epidemiólogos, pidiéndoles que verificaran sus números.


Hacia fines de abril, el prominente biólogo de la Universidad de Washington Carl Bergstrom tuiteó sobre el modelo de Gu, y poco después los Centros para el Control y la Prevención de Enfermedades de EEUU, incluyeron los números de Gu en su sitio web de pronóstico Covid.

A medida que avanzaba la pandemia, Gu, un inmigrante chino que creció en Illinois y California, participó en reuniones periódicas con los CDC y equipos de modelistas profesionales y epidemiólogos, mientras todos intentaban mejorar sus pronósticos.


El tráfico al sitio web de Gu se disparó y millones de personas se registraron a diario para ver lo que estaba sucediendo en sus estados y en Estados Unidos en general. La mayoría de las veces, sus cifras pronosticadas terminaron abrazando la línea de las cifras reales de muertes cuando llegaron unas semanas después.


Con un interés tan intenso en torno a estos pronósticos, comenzaron a aparecer más modelos durante la primavera y el verano de 2020. Nicholas Reich, profesor asociado en el departamento de bioestadística y epidemiología de la Universidad de Massachusetts, Amherst, recopiló los 50 modelos y midió su precisión durante muchos meses en el Covid-19 Forecast Hub. "El modelo de Youyang estuvo constantemente entre los mejores", dice Reich.

En noviembre, Gu decidió poner fin a su operación de pronóstico de muerte. Reich había estado combinando los diversos pronósticos y encontró que las predicciones más precisas provenían de este "modelo de conjunto" o datos combinados.


"Youyang dio un paso atrás con un notable sentido de humildad", dice Reich. "Vio que a los otros modelos les estaba yendo bien y que su trabajo aquí estaba hecho".


“Un mes antes de detener el proyecto, Gu había predicho que Estados Unidos registraría 231.000 muertes el 1 de noviembre. Cuando llegó el 1 de noviembre, Estados Unidos informó 230,995 muertes”

Murray del IHME tiene su propia opinión sobre la salida de Gu. Él dice que el modelo de Gu no habría captado la naturaleza estacional del coronavirus y se habría perdido el aumento invernal de casos y muertes.


“Él hizo que la epidemia desapareciera en el invierno, y nos dimos cuenta de que había estacionalidad ya en mayo”, dice Murray.

Los métodos de aprendizaje automático utilizados por Gu funcionan bien en predicciones de corto alcance, dice Murray, pero "no son muy buenos para comprender lo que está sucediendo" en el panorama general.


Los algoritmos, basados ​​en el pasado, no pueden dar cuenta de las variantes del virus y qué tan bien las vacunas pueden o no funcionar contra ellas, según Murray. Por su parte, el IHME calificó correctamente el pico temprano del virus, y luego se equivocó a la hora de predecir una fuerte disminución de muertes hasta que ajustó su modelo para reflejar mejor la realidad. “Nos equivocamos el primero de abril”, dice Murray. "Desde entonces, somos el único grupo que lo ha hecho bien de manera consistente".


Después de tomarse un pequeño descanso, Gu, que ahora tiene 27 años y vive en un apartamento de Nueva York, regresó al juego del modelaje. Esta vez, está creando cifras relacionadas con la cantidad de personas en los EEUU que han sido infectadas por Covid-19, la rapidez con la que se implementan las vacunas y cuándo, si es que alguna vez, el país podría alcanzar la inmunidad colectiva.

Sus pronósticos sugieren que alrededor del 61% de la población debería tener alguna forma de inmunidad, ya sea de la vacuna o de una infección pasada, para junio. Antes de la pandemia, Gu esperaba iniciar una nueva empresa, posiblemente en análisis deportivo.


Ahora está considerando apegarse a la salud pública. Quiere encontrar un trabajo en el que pueda tener un gran impacto evitando la política, los prejuicios y el bagaje que a veces viene con las grandes instituciones. “Hay muchas deficiencias en el campo que las personas con mi experiencia podrían mejorar”, dice. "Pero todavía no sé muy bien cómo encajaría", agrega y finaliza el reporte de Bloomberg.


Hasta pronto !


Jorge W. Rausch McKenna

*CEO Consultoría *Analista Político *Abogado *Periodista

Twitter: @JorRausch

Maldonado, R. O. del Uruguay


Fuente del artículo Bloomberg https://www.bloomberg.com/news/articles/2021-02-19/covid-pandemic-how-youyang-gu-used-ai-and-data-to


9 vistas0 comentarios
  • Twitter
  • LinkedIn
  • Facebook
  • YouTube
  • Icono social Instagram