O Oracle Autonomous Data Warehouse ajuda ligas, times, mídia e outros usuários a serem mais criativos com análises durante e após os jogos.
Jeff Erickson | 5 de julho de 2024
Quando um time de futebol parte para o ataque, os jogadores não esperam permissão para agir. Com a posse da bola, a criatividade toma conta e as possibilidades são infinitas, mas é tudo muito inconstante.
Da mesma forma, diversos interesses fora dos campos de futebol no Reino Unido — incluindo veículos de mídia, empresas de apostas, organizações de times e ligas individuais, e seus parceiros comerciais — desejam a liberdade de agir rapidamente na exploração das possibilidades ocultas nos dados dos dias de jogo e em outras formas de dados. Até recentemente, esses dados, gerados pela Premier League e outras ligas e competições, eram frequentemente armazenados nos sistemas de vários fornecedores de dados esportivos, adicionando intermediários e etapas adicionais que dificultavam as explorações criativas de dados.
Agora, com o apoio de especialistas em dados e infraestrutura na nuvem da Oracle, uma empresa chamada Football DataCo (FDC), de propriedade conjunta da Premier League e da English Football League, está consolidando todos esses dados (coletados por 32 anos, incluindo 27 ligas e competições eliminatórias diferentes do Reino Unido, além de feeds contínuos dos dias de jogo) em um único Oracle Autonomous Data Warehouse. O acordo concede à Premier League um novo nível de controle sobre o impressionante armazenamento de dados que ela possui.
Como a liga de futebol mais popular do mundo, a Premier League sozinha gera terabytes de dados do dia do jogo, capturados 25 vezes por segundo por câmeras que acompanham cada jogador, corrida, passe, chute, defesa, ataque e outros “eventos” que acontecem no campo. Esses dados são disponibilizados mediante solicitação aos meios de comunicação, analistas da liga e outros usuários mencionados anteriormente.
“Agora podemos manter esses dados atualizados à medida que os jogos acontecem, de forma autônoma, e permitir que o usuário acesse e os consulte no próprio front-end da Premier League”, diz Mark Bowden, gerente de produtos e relacionamento da FDC. Bowden prevê analistas vinculados à Premier League, outras competições no Reino Unido e seus parceiros ficando criativos com os dados acumulados usando quase qualquer ferramenta de análise que escolherem. As possibilidades só aumentarão à medida que o Oracle Autonomous Data Warehouse aprender a deixar as pessoas interagirem com os dados por meio dos grandes modelos de linguagem (LLMs) de IA generativa. “A GenAI é um verdadeiro divisor de águas para a maneira como poderemos acessar os dados”, diz ele.
Segundo Bowden, ao interagir com a GenAI e não com os programadores de SQL, os tipos editoriais e criativos podem trazer sua própria abordagem para contar histórias com os dados, “além do que um especialista em dados poderia imaginar”, diz ele. “Eu adoraria ver isso.”
Os usuários podem consultar o data warehouse com perguntas simples sobre os desempenhos atuais dos jogadores, como até onde os meios-campistas escolhidos correram durante uma partida e quantos toques eles deram no campo adversário. Ou os usuários podem fazer perguntas históricas divertidas, como quantas vezes um goleiro marcou o gol da vitória em um jogo da Premier League. Os usuários também poderão consultar o data warehouse com perguntas táticas complexas: O time que está perdendo está jogando muito à frente contra esse adversário? Como outros times se saíram com essa tática? Isso resultou em muitos gols em contra-ataques?
A Premier League sozinha coletou dados de 73.000 partidas diferentes de 250 times diferentes em 345 estádios diferentes, diz Simon Wigley, diretor de análise da Oracle Technology Consulting, que trabalha com a FDC. “Para cada um desses jogos, sabemos as escalações e as posições de cada jogador e quem foi substituído”, diz Wigley. São dados sobre cerca de 20.000 jogadores e 130.000 gols, além de estatísticas sobre os treinadores e árbitros. Ele observa que, embora as análises do VAR (árbitro de vídeo) sejam relativamente novas na Premier League e em outras competições, há dados sobre 1.200 dessas decisões.
No entanto, todos esses dados históricos são uma pequena mudança em comparação com as riquezas do dia de jogo criadas pelos sistemas modernos baseados em IA, diz Wigley.
“Agora podemos manter esses dados atualizados conforme os jogos acontecem, de forma autônoma, e permitir ao usuário entrar e consultá-los por meio do próprio front-end da Premier League.”
Veja a Premier League. Seus parceiros não apenas coletam dados sobre todos os passes, chutes, corridas, desarmes, escanteios, etc. (39 milhões desses eventos estão agora no data warehouse), mas cada um deles também contém vários atributos. “Quando acontecer um passe, o sistema registrará a velocidade, quem o fez e quem o recebeu”, diz Wigley. “Um escanteio vai indicar a direção e quem o cobrou.” A lista continua. No total, 180 milhões desses atributos estão no conjunto de dados consolidado, diz ele.
“Isso é matéria-prima para alguém como eu responder a qualquer pergunta”, diz Brian Macdonald, arquiteto da nuvem de ciência de dados da Oracle com especialização em análise esportiva. “Quando estou assistindo a uma epartida, posso ver alguma coisa dizer: ‘Ei, acho que nunca vi isso antes.’ Depois, posso fazer uma análise e questionar: ‘Isso já aconteceu antes?’ E se já tiver acontecido, com que frequência? Uma pergunta leva a outra muito rápido.”
MacDonald diz que muitas vezes ele abre a Oracle Analytics Platforms conectada a um Autonomous Data Warehouse e aplica filtros e começa a visualizar sua análise criando gráficos e tabelas. “Talvez eu queira construir algum tipo de modelo preditivo, como probabilidade de vitória de um jogo contínuo, com base em simulações usando dados históricos”, diz ele.
Como a coleta de dados funciona: a cada semana a plataforma Oracle transfere conteúdo de coletores de dados locais, totalizando 94.000 cargas úteis diferentes, para o data warehouse. O tempo importa: há centenas de jogos acontecendo ao longo da semana, com ligas inferiores coletando dados em diferentes níveis de detalhe. Além disso, com os campeonatos eliminatórios do futebol inglês, os horários estão sempre mudando. “O sistema precisa saber não apenas quais dados solicitar, mas também quando solicitá-los”, diz Wigley. “Foi necessário muito trabalho para garantir que nosso código e nossa lógica abrangessem tudo isso.”
O sistema ingere dados de diferentes maneiras para diferentes usos. Algumas dessas cargas úteis, incluindo escalações, presença no jogo e outros dados padrão das partidas, são armazenadas juntamente com os dados de acompanhamento dos jogadores, os quais os analistas podem agregar e usar para gerar resumos pós-jogo e alimentar análises e previsões mais profundas.
A próxima etapa do projeto, atualmente uma prova de conceito, é a ingestão simultânea de dados de correspondência em andamento por meio do que Wigley chama de “faixa de ultrapassagem”. Esses dados são disponibilizados aos analistas em tempo real. “Quando algo acontecer em um jogo da Premier League, os usuários do data warehouse poderão incluir isso imediatamente nas análises”, diz ele.
Agora, a Premier League e outros usuários têm acesso a todos esses dados históricos e de partidas para usar como bem entenderem, diz Wigley. Por exemplo, a Premier League poderia extrair dados relevantes diretamente do data warehouse, aplicar a GenAI a eles e criar resumos de partidas personalizados para os torcedores, no idioma deles e com base em parâmetros (como time, jogador ou posição no campo) pelos quais eles tenham demonstrado interesse.
Bowden, da FDC, diz: “É uma verdadeira mudança sentir que temos o controle e o poder de usar uma ampla gama de fontes de dados diferentes. E o mais empolgante é que não sabemos exatamente aonde isso vai dar.”
A plataforma Oracle Analytics é um serviço nativo da nuvem que fornece os recursos necessários para abordar todo o processo analítico, incluindo ingestão e modelagem de dados, visualização e colaboração, sem comprometer a segurança e a governança.
O Oracle Analytics Cloud analisou dados de todas as 380 partidas para encontrar os vencedores da Reviravolta Mais Improvável e do Gol Mais Poderoso da temporada de 2024.