La Premier League recurre a Oracle Cloud para consolidar los datos de los partidos de fútbol del Reino Unido

Oracle Autonomous Data Warehouse ayuda a ligas, equipos, medios de comunicación y otros usuarios a ser más creativos con sus análisis durante y después de los partidos.

Jeff Erickson | 5 de julio de 2024


Cuando un equipo de fútbol va al ataque, los jugadores no esperan permiso para moverse. Con el balón en su poder, la creatividad se apodera de ellos y las posibilidades abundan, pero los momentos son fugaces.

De manera similar, una amplia gama de intereses futbolísticos fuera del campo en el Reino Unido, incluidos medios de comunicación, empresas de apuestas, equipos y organizaciones de ligas individuales, y sus socios comerciales, desean la libertad de moverse rápidamente al explorar las posibilidades ocultas en los datos de los partidos. Hasta hace poco, esos datos, generados por la Premier League y otras ligas y competiciones, se almacenaban en los sistemas de diversos proveedores de datos deportivos, lo que añadía intermediarios y pasos adicionales que dificultaban las exploraciones creativas de datos.

Ahora, con el respaldo de expertos en datos y la infraestructura en la nube de Oracle, una empresa llamada Football DataCo (FDC), propiedad conjunta de la Premier League y la English Football League, está consolidando todos esos datos de los partidos, 32 años, que abarcan 27 ligas y competiciones eliminatorias diferentes del Reino Unido, además de transmisiones continuas de los días de partido- en Oracle Autonomous Data Warehouse. El acuerdo proporciona a la Premier League un nuevo nivel de control sobre el impresionante acervo de datos que posee.

Al ser la liga de fútbol más popular del mundo, solo la Premier League genera terabytes de datos del día del partido, capturados 25 veces por segundo por las cámaras que siguen a cada jugador, carrera, pase, disparo, atajada, entrada y otros "eventos" que ocurren en la cancha. Esos datos están disponibles, previa solicitud, de los medios de comunicación, analistas de la liga y otros usuarios citados anteriormente.

"Ahora podemos mantener esos datos actualizados a medida que se juegan los partidos, de forma autónoma, y permitir que el usuario entre y los consulte a través del propio front-end de la Premier League", declara Mark Bowden, director de productos y relaciones de FDC. Bowden prevé que los analistas vinculados a la Premier League, a otras competiciones en el Reino Unido y a sus socios utilicen los datos acumulados con mayor creatividad aprovechando casi cualquier herramienta de análisis que elijan. Las posibilidades no harán más que crecer a medida que Oracle Autonomous Data Warehouse aprenda a dejar que las personas interactúen con los datos mediante grandes modelos de lenguaje (LLM) de inteligencia artificial generativa. "GenAI supone un verdadero cambio en la forma en que podremos acceder a los datos", afirma.

Según Bowden, al interactuar con GenAI en lugar de con programadores de SQL, los tipos editoriales y creativos pueden aportar su propio enfoque a la narración con los datos, "más allá de lo que un especialista en datos podría imaginar". "Me encantaría verlo".

Los usuarios podrían consultar el almacén de datos con preguntas sencillas sobre el desempeño actual de los jugadores, como cuánto han corrido los centrocampistas seleccionados durante un partido y cuántos pases han hecho en campo contrario. O podrían hacer preguntas divertidas, como cuántas veces ha marcado un portero el gol de la victoria en un partido de la Premier League. También podrán consultar el almacén de datos con preguntas tácticas complejas: ¿Está el equipo en desventaja jugando demasiado adelantado contra el oponente? ¿Cómo les ha ido a otros equipos con esta táctica? ¿Ha propiciado muchos goles en contraataques?

Un tesoro de datos

Solo la Premier League ha recopilado datos sobre 73.000 partidos distintos de 250 equipos diferentes en 345 estadios distintos, afirma Simon Wigley, director de análisis de Oracle Technology Consulting, que está trabajando con FDC. "En cada uno de esos partidos, conocemos las alineaciones y las posiciones de cada jugador, así como quién fue sustituido", dice Wigley. Son datos sobre unos 20.000 jugadores y 130.000 goles, así como estadísticas sobre los entrenadores y los árbitros. Y aunque las revisiones del VAR (árbitro asistido por video) son relativamente nuevas en la Premier League y otras competiciones, hay datos sobre 1.200 de esas decisiones, señala.

Sin embargo, todos estos datos históricos son pequeños cambios en comparación con lo que se produce el día del partido con los sistemas modernos basados en IA, comenta Wigley.

Ahora podemos mantener esos datos actualizados a medida que se juegan los partidos, de forma autónoma, y permitir que el usuario entre y los consulte a través del propio front-end de la Premier League".

Mark Bowden Gerente de productos y relaciones, Football DataCo

Por ejemplo, la Premier League. Sus partners no solo recopilan datos sobre cada pase, disparo, carrera, córner, etc. -39 millones de esos eventos están ahora en el almacén de datos-, sino que cada uno de esos eventos contiene también una serie de atributos. "Cuando haya un pase, el sistema anotará su velocidad, quién lo hizo y quién lo recibió", comenta Wigley. "En un tiro de esquina se anotará la dirección y quién lo ejecutó". Y la lista continúa. En total, 180 millones de esos atributos están en el conjunto de datos consolidados, afirmó.

"Eso es información para que alguien como yo pueda responder a cualquier pregunta", dice Brian MacDonald, arquitecto de la nube de ciencia de datos de Oracle que se especializa en analítica deportiva de Oracle. "Cuando estoy viendo un partido, puedo ver algo y decir: Oye, creo que nunca he visto eso antes. Luego puedo hacer un análisis que pregunte: ¿Ha ocurrido antes? Y en caso afirmativo, ¿con qué frecuencia ocurre? Una pregunta lleva a otra muy rápidamente".

MacDonald dice que a menudo va a la Oracle Analytics Platform conectada a una instancia de Autonomous Data Warehouse, aplica filtros y comienza a visualizar su análisis mediante gráficos y tablas. "Podría querer construir algún tipo de modelo predictivo, como la probabilidad de victoria de un juego en curso, basado en simulaciones utilizando datos históricos", comenta.

La vida en la vía rápida

El funcionamiento de la recopilación de datos consiste en que, cada semana, la plataforma Oracle transfiere al almacén de datos el contenido de los recopiladores de datos locales, que asciende a 94.000 cargas útiles diferentes. El tiempo es importante: hay cientos de partidos a lo largo de la semana, y las ligas inferiores recopilan datos con distintos niveles de detalle. Además, con los torneos eliminatorios del fútbol inglés, los horarios cambian constantemente. "El sistema debe saber no solo qué datos pedir, sino cuándo pedirlos", dice Wigley. "Se trabajó mucho para asegurarnos de que nuestro código y nuestra lógica lo cubrían todo".

El sistema ingiere datos de distintas formas para distintos usos. Algunas de esas cargas útiles, como las alineaciones, la asistencia a los partidos y otros datos estándar, se almacenan junto con los datos de los jugadores, donde los analistas pueden agregarlos y utilizarlos para generar resúmenes posteriores a los partidos y propiciar análisis y predicciones más profundos.

El siguiente paso del proyecto, actualmente una prueba de concepto, consiste en ingerir simultáneamente datos de partidos en curso a través de lo que Wigley denomina la "vía rápida". Estos datos se ponen a disposición de los analistas en tiempo real. "Cuando ocurra algo en un partido de la Premier League, los usuarios del almacén de datos podrán incorporarlo inmediatamente a sus análisis", afirma.

Ahora la Premier League y otros usuarios tienen acceso a todos estos datos históricos y de partidos para utilizarlos como consideren oportuno, afirma Wigley. Por ejemplo, la Premier League podría extraer datos relevantes directamente del almacén de datos, aplicarles GenAI y crear resúmenes personalizados de los partidos para los aficionados en su propio idioma, basándose en parámetros -como un equipo, un jugador o una posición en el campo- por los que hayan mostrado interés.

Bowden, de FDC, afirma: "Para nosotros es un verdadero cambio sentir que tenemos el control y la capacidad de utilizar una gran variedad de fuentes de datos dispares. Y lo más emocionante es que no sabemos exactamente adónde nos llevarán."