Fútbol
Datos, cálculos y deporte: entrevista a Guillermo Durán
Programa, con su equipo, los fixtures del fútbol chileno desde 2005 y lo hizo en la Superliga, la Liga Nacional de Básquet y Liga Argentina de Vóley, entre otras competencias. Además, realizan predicciones de resultados en competencias como los mundiales de fútbol. Ciencia de datos y optimización aplicados al deporte.
Decano de la Facultad de Ciencias Exactas de la Universidad de Buenos Aires, ex Director del Instituto de Cálculo (UBA-Conicet) y fanático del deporte, Guillermo Durán intersecciona trabajo y pasiones en el estudio y aplicación de herramientas matemático-computacionales destinadas a competencias deportivas.
Durán visitó la Universidad Nacional de Río Cuarto, donde participó de una mesa llamada ¿Qué es “esa” cosa llamada ciencia… de datos? junto a los docentes-investigadores locales Marcelo Ruiz y Marcelo Arroyo. En diálogo con Al Toque Deportes, Guillermo Durán esboza una respuesta a esa pregunta: “Es una disciplina que vive entre la Computación y la Matemática. Aquel quien se dedica a la Ciencia de Datos tiene que tener una base matemática y estadística fuerte y alguna formación en programación. Es difícil definir qué es, pero digamos que es el uso de herramientas matemático-computacionales para usar de manera inteligente grandes volúmenes de datos”, y añade: “Aparecen muchas subdisciplinas y aparecen decenas, centenas y miles de campos de aplicación: este tipo de problemas o este tipo de técnicas tienen aplicación a problemas de los más diversos”.
Uno de esos campos de aplicación es el deporte. Con su equipo, Durán trabaja en Chile en la confección de las programaciones del fútbol trasandino, aunque aclara que más que Ciencia de Datos, lo que se aplica en este caso es una optimización. El Doctor en Computación explica: “Cuando te digo que programamos el fútbol de Chile quiere decir que utilizamos herramientas matemático computacionales para generar una programación del torneo de Primera de Chile que fuera mejor que el método usual canónico que hacían o hacen buena parte de los países, que es un método muy fácil de hacer manualmente, donde hay una asignación de numeritos a las diferentes fechas y un sorteo de esos numeritos que es muy limitado en cuanto a la potencialidad que tiene”.
Hoy están realizando el fixture de la Primera, la Segunda, la Tercera, el Fútbol Femenino y la Copa Chile. “Todo eso se programa con técnicas matemáticas, superamos cambios de directivas: o sea, hoy nadie se imagina en Chile que se pueda volver a esa programación manual que es la que usa la Argentina hoy”, añade Durán y dice que también realizaron las programaciones de la Superliga 2018-2019 y de la 2019-2020, además de la Liga Nacional de Básquet, la Liga Argentina de Vóley y actualmente, por cuarto año consecutivo, lo están realizando en el fútbol ecuatoriano.
“El tipo de técnicas son diferentes de acuerdo a los deportes, porque los campeonatos son diferentes”, afirma Durán y amplía: “Hay alguna variación en cuanto a la matemática y en cuanto a la dificultad de los problemas. No inventamos la pólvora, en Estados Unidos es muy usual: NBA, béisbol, fútbol americano se programan con estas técnicas. Sí era poco usual en fútbol. Yo creo que fuimos de los primeros que lo usamos así consistentemente, con el fútbol de Chile”. Esta programación permite optimizar viajes y recursos para los equipos participantes, sobre todo cuando los torneos abarcan grandes distancias.
Pronósticos
Ya dentro de la Ciencia de Datos, con el manejo de grandes volúmenes de datos, un “juego” que se propusieron desde el Instituto de Cálculo es el de las predicciones de resultados. Comenzaron con la Copa del Mundo de Rusia 2018 y también incorporaron las competencias de Copa América 2019 y 2021, Mundial de Rugby 2019 y Mundial de básquet en el 2019, además del torneo de Primera de AFA. “ Vos decís, en función de la historia, qué va a pasar en el Mundial”, ejemplifica Durán y agrega: “En el Mundial pasado el modelo que realizamos nos daba como favorito a Brasil y Brasil perdió un cuarto de final. O en la Copa América última daba como favorito a Brasil muy por encima de Argentina y Argentina salió campeón. Nosotros no decimos que esto dice qué es lo que va a pasar: te da una cierta idea de qué es lo más probable».
– ¿Qué variables juegan en estos modelos de predicción?
– Esencialmente lo que nosotros tomamos es la historia de los últimos cuatro años. Vos mirás la historia de los últimos cuatro años y eso te da una cierta fuerza ofensiva y defensiva de cada equipo y después hacés competir a esas fuerzas ofensivas y defensivas cuando juegan entre sí. Entonces si juega Argentina con Francia, los goles que va a hacer Argentina son producto de la fuerza ofensiva de Argentina y la fuerza defensiva de Francia, los goles que va a hacer Francia son producto de la fuerza ofensiva de Francia y de la fuerza defensiva de Argentina y eso te da una cierta probabilidad de los distintos resultados del partido entre Argentina y Francia. Así para cualquier enfrentamiento y con eso simulás el Mundial entero y como lo que querés es que tenga una cierta consistencia el resultado, no lo simulás uno, diez o cien veces, sino que lo simulás un millón de veces o 100.000 veces. Y si lo simulás un millón de veces y en 260.000 Brasil salió campeón, entonces tiene un 26%.
Las predicciones del fútbol argentino se publican en la web 301060.exactas.uba.ar, proyecto del Instituto de Cálculo de la UBA. “El por qué del numerito 30-10-60 queda a adivinanza o interpretación del lector, pero cualquier futbolero debería identificar rápido por qué el sitio se llama así”, dice con complicidad Durán. De todas formas, la ilustración de la cabecera del sitio ya despeja toda duda. Ciencia y religión conviven.
En convenio con el Diario La Nación, el deportivo del periódico publicará las predicciones del Mundial de Qatar que surjan de este modelo en el que, adelanta el científico, Brasil es el favorito y efectivamente tiene un 26% de posibilidades de salir campeón o “un 74% de que no salga campeón”. ¿Argentina? Está segunda con un porcentaje superior al 10%
El modelo y Ginóbili
El Mundial de básquet de China 2019 será recordado en el país deportivo por el sobresaliente desempeño del equipo de Sergio Hernández que llegó a la final luego de eliminar a Serbia en cuartos de final y a Francia en las semis. El sueño concluyó con la derrota ante la siempre esquiva España. Desde el Instituto que dirige Guillermo Durán hicieron su pronóstico: “Argentina fue el que se nos fue de la lógica de los números. Cosa que sabemos, Argentina rindió más que lo que la lógica decía”, menciona Durán y recuerda una anécdota que incluye a Manu Ginóbili: “Teníamos como favorito a Estados Unidos, algo casi obvio porque la historia llevaba a eso – Estados Unidos no salió campeón- y teníamos segundo a España que fue campeón. Tercero a Serbia. La lógica de alguna forma de los expertos era al revés: Serbia estaba por arriba de España, y en el modelo nuestro España estaba por arriba de Serbia”. Esa predicción llegó a Manu Ginóbili quien se expresó con un “estos matemáticos no saben nada, Serbia es mucho más favorito que España”; Durán continúa: “España terminó campeón y Serbia eliminado por Argentina en cuartos de final. Decimos ‘el modelo le ganó a Manu’ (risas) Simpáticamente y con todo el cariño que uno le tiene a Manu decimos que el modelo le ganó a Manu. Lo que Manu decía era lo que la experiencia del básquet decía: Serbia estaba en un gran momento, pero uno miraba los resultados de la historia y bueno, parecía que España tenía mejores resultados en los últimos tres o cuatro años, que es lo que el modelo toma como insumo. Así como a veces mostramos esa donde el modelo gana, en otras pierde”.
En definitiva, en el modelo de predicciones aplicado a deporte aparece como un juego y evidencia la potencialidad para otras áreas: “Te permite jugar un poco, te permite mostrar modelos matemáticos para una cosa que que tiene impacto en la gente y decir ‘para qué estoy usando esto’ y después lo puedo usar para problemas que son de la vida real. Esto es más que un juego, pero el nivel de difusión que esto tiene te permite mostrar la matemática en la resolución de problemas que me parece que está bueno”.
Uno de esos ámbitos de aplicación fue durante la pandemia por covid-19 en la que su equipo trabajó desde la Ciencia de Datos. Recuerda Durán: “Hubo bastante de trabajo de los grupos nuestros, de alguna manera intentando entender de dónde venía y hacia dónde iba la pandemia y en algún sentido poder darles esas herramientas a los decisores: a los ministerios de salud de los nacionales, provinciales, municipales que pudieran bajo algunos análisis, algunas simulaciones, saber de dónde veníamos hacia dónde íbamos y poder tomar decisiones en cuanto a políticas sanitarias que estuvieran sustentadas en evidencia de datos. Después, con la aparición de la vacuna, lo mismo: poder entender qué impacto tuvieron, para qué sirvieron, qué vacunas sirvió más, en qué rango etario fue más útil… una serie de cuestiones que tienen que ver, otra vez, con la aplicación de datos para -en este caso- políticas públicas”. Las matemáticas en la resolución de problemas deportivos y extradeportivos.
– También tenemos la cuestión de las matemáticas, de los datos, de la Big Data ya para cuestiones tácticas del deporte: en el fútbol, los mapas de calor, cuánto recorrió cada jugador, etc.
– Sí, por supuesto. Nosotros no hemos hecho nada de eso pero pero hay un montón. digo desde Moneyball para acá -del libro y la película donde el equipo este de béisbol con poco presupuesto y utilizando mucho el Big Data logró armar un equipo competitivo- y eso tiene que ver. Los deportes profesionales de Estados Unidos usan mucho eso: el beisbol, el fútbol americano, la NBA. El basquet en general: a nadie se le pasa por la cabeza que cuando hay una falta técnica y hay que elegir quién tira el tiro libre obviamente lo tira el que mejor porcentaje tiene. Los deportes profesionales de Estados Unidos está como muy metido, muy institucionalizado, muy comprendido y muy analizado todo eso. Está menos expandido en el fútbol, pero hay campo seguro en eso. Sobre todo cuando, por ejemplo, tenés que hacer contrataciones y mantenerse con un determinado presupuesto. Una cosa que pasa mucho en el fútbol y es algo que por ahí no se mira: traés un jugador por su nombre y por ahí en vez de ponerte a mirar qué hizo en los últimos dos años, cuánto estuvo lesionado, cuántos goles hizo, cuántos asistencias dio. Por ahí se mira poco eso y se compra o se adquiere más por por el nombre que por lo que te dicen los datos, y a veces eso te sale mal. Entonces creo que hay poco todavía, hay margen para muchas cosas y ahí sí, el fútbol tiene que aprender de otros deportes que lo usan mucho más.
– ¿No se puede caer en un riesgo de atentar contra esto de la dinámica de lo impensado en el fútbol?
– En cualquier cosa que nosotros aplicamos los modelos siempre decimos que tiene que estar la visión del experto del tema de la mano. Nunca estos modelos reemplazan al experto. Simplemente que le permiten al experto tomar mejores decisiones, mirar más escenarios, simular más cosas porque la potencialidad de la computadora mirando casos es mucho mejor que la del ojo humano, por decirlo de alguna manera. Entonces esto me parece que aplica para el fútbol también. Yo creo que vos no podés reemplazar totalmente al experto, pero sí darle al manager, director técnico, presidente o quien sea herramientas cuantitativas. Después decidís vos en función de tu conocimiento y por ahí me parece que va un poco. No se puede cuantificar todo y que todo sea totalmente medible y tomar decisiones sólo con eso. Pero aplica no sólo para el fútbol, aplica para cualquier cosa que se haga con uso de modelos matemáticos. Siempre nosotros damos ese mensaje: el experto del tema tiene que ir de la mano con los modelos y saber usarlos, pero nunca reemplazar a ese experto. Porque a veces hay muchas cosas que son difíciles de cuantificar y que a los modelos se le pueden escapar. Nosotros tratamos de meternos en los problemas del fútbol porque nos gusta el fútbol, pero hemos hecho muchas cosas de recolección de residuos, de organización de la logística para la recolección de residuos. Siempre la decisión final es del Presidente de la AFA o del secretario de higiene de un municipio, siempre la decisión final es del decisor. Vos apoyás con los modelos y sobre todo le da fuerte poder de cálculo: lo que antes vos hacías a mano o con una planilla Excel y que analizabas un par de escenarios, ahora podés analizar decenas de miles en un rato y eso te permite jugar un poco: qué pasa si agregás un camión, qué pasa si sacás un camión para recolectar la basura y eso en general, si lo hacías a mano, se complicaba; si lo hacés con un modelo detrás tenés mucha más potencialidad.
Fotografía: Cecilia Grosso/UNRC
Redacción Al Toque
Este artículo fue posible a la autogestión de periodistas. Hoy necesitamos de vos. Te invitamos a que seas parte de la comunidad de Al Toque Deportes asociándote con un mínimo aporte mensual