Die Premier League nutzt Oracle Cloud, um Fußballspieldaten in Großbritannien zu konsolidieren

Oracle Autonomous Data Warehouse ermöglicht es Ligen, Teams, Medien und anderen Benutzern, bei ihren Analysen während und nach dem Spiel kreativer zu sein.

Jeff Erickson | 5. Juli 2024


Wenn eine Fußballmannschaft (oder ein „Soccer-Team“, wie man in Amerika sagen würde) in die Offensive geht, warten die Spieler nicht auf Erlaubnis, bevor sie sich bewegen. Sobald sie im Ballbesitz sind, übernimmt die Kreativität. Dabei ergeben sich oft viele Möglichkeiten – aber nur für einen kurzen Moment.

Ebenso möchten sich zahlreiche Interessierte in Großbritannien außerhalb des Spielfelds – wie zum Beispiel die Medien, Wettunternehmen, einzelne Mannschafts- und Liga-Organisationen sowie deren Geschäftspartner – die Freiheit sichern, schnell zu reagieren, um die Möglichkeiten zu erkunden, die in den Spieltagsinformationen und anderen Datenformen verborgen sind. Bis vor Kurzem wurden diese Daten, die von der Premier League und anderen Ligen und Wettbewerben generiert wurden, oft in den Systemen verschiedener Sportdatenanbieter gespeichert. Daraus resultierte die Notwendigkeit von Vermittlern und zusätzlichen Schritten, was das kreative Erkunden der Daten erschwerte.

Nun konsolidiert ein Unternehmen namens Football DataCo (FDC), das im gemeinsamen Besitz der Premier League und der English Football League ist, mit Unterstützung von Datenexperten von Oracle sämtliche Spieldaten – aus 32 Jahren, aus 27 verschiedenen britischen Ligen und K.O.-Wettbewerben sowie laufenden Feeds zu Spieltagen – in einem Oracle Autonomous Data Warehouse. Dank dieses Arrangements verfügt die Premier League nun über ein neues Maß an Kontrolle über ihren beeindruckenden Datenbestand.

Als beliebteste Fußballliga der Welt generiert die Premier League allein Terabytes an Spieltagsdaten, die 25 Mal pro Sekunde von Kameras erfasst werden. Dabei wird jeder Spieler verfolgt sowie jeder Lauf, jeder Pass, jeder Schuss, jede Rettung, jeder Nahkampf und alle anderen „Ereignisse“, die auf dem Spielfeld stattfinden. Diese Daten werden den Medien, Liga-Analysten und anderen oben genannten Benutzern auf Anfrage zur Verfügung gestellt.

„Jetzt können wir diese Daten autonom auf dem neuesten Stand halten, während das Spiel stattfindet. Und die Benutzer können sie direkt einsehen und über das eigene Frontend der Premier League abfragen“, erzählt Mark Bowden, Produkt- und Beziehungsmanager von FDC. Bowden prognostiziert, dass Analysten, die mit der Premier League, anderen britischen Wettbewerben oder ihren Partnern verbunden sind, mit den gesammelten Daten kreativ umgehen werden. Dabei werden sie fast jedes Analysetool verwenden können. Sobald Oracle Autonomous Data Warehouse lernt, Menschen mit den Daten über große Sprachmodelle (Large Language Models, LLMs) mit generativer KI interagieren zu lassen, werden sich noch mehr Möglichkeiten ergeben. „GenAI ist eine echte Revolution hinsichtlich der Art und Weise, wie wir auf die Daten zugreifen können“, erläutert er.

„Dadurch, dass sie mithilfe von GenAI anstatt über SQL interagieren können“, erklärt Bowden, „können Redakteure und Kreative ihren eigenen Ansatz für das Storytelling mit den Daten umsetzen, über das hinaus, was vielleicht einem Datenspezialisten einfallen würde.“ „Ich freue mich darauf, das zu erleben.“

Benutzer könnten das Data Warehouse mit einfachen Fragen zu den aktuellen Leistungen der Spieler abfragen, z. B. wie weit ausgewählte Mittelfeldspieler während eines Spiels gelaufen sind und wie viele Ballberührungen sie in der Hälfte des Gegners hatten. Oder sie könnten lustige historische Fragen stellen, z. B. wie oft ein Torwart das Siegtor in einem Premier League-Spiel erzielt hat. Den Anwendern wird es auch möglich sein, das Data Warehouse mit komplexen taktischen Fragen abzufragen, wie etwa: „Spielt das zurückliegende Team gegen diesen Gegner zu weit nach vorne? Wie hat diese Taktik bei anderen Teams funktioniert? Hat dies zu vielen Toren durch Konterangriffe geführt?“

Ein Schatz an Daten

„Allein in der Premier League wurden Daten zu 73.000 verschiedenen Spielen von 250 verschiedenen Teams in 345 verschiedenen Stadien erfasst“, erzählt Simon Wigley, ein Analytics Director bei Oracle Technology Consulting, der mit FDC zusammenarbeitet. „Für jedes dieser Spiele kennen wir die Aufstellungen und die Positionen jedes einzelnen Spielers sowie, wer später eingewechselt wurde“, erklärt er weiter. „Das sind Daten zu etwa 20.000 Spielern und 130.000 Toren sowie Statistiken zu den Managern und Schiedsrichtern. Und obwohl Überprüfungen durch einen Videoschiedsrichter (Video Assistant Referee, VAR) in der Premier League und anderen Wettbewerben relativ neu sind, gibt es bereits Daten zu 1.200 dieser Entscheidungen“, bemerkt Wigley.

„All diese historischen Daten sind jedoch nur eine Kleinigkeit im Vergleich zu den Datenschätzen, die an Spieltagen von modernen KI-basierten Systemen erzeugt werden“, berichtet er weiter.

"„Jetzt können wir diese Daten autonom auf dem neuesten Stand halten, während die Spiele gespielt werden, und es den Benutzern ermöglichen, auf sie zuzugreifen und über das eigene Frontend der Premier League abzufragen.“

Mark Bowden Produkt- und Beziehungsmanager, Football DataCo

Nehmen wir die Premier League als Beispiel. Ihre Partner erfassen nicht nur Daten zu jedem Pass, Schuss, Lauf und Angriff sowie jeder Ecke usw. – 39 Millionen dieser Ereignisse befinden sich bereits jetzt im Data Warehouse –, sondern jedes dieser Ereignisse enthält auch eine Reihe von Attributen. „Bei einem Pass erfasst das System auch seine Geschwindigkeit, wer ihn geschossen hat und wer ihn angenommen hat“, berichtet Wigley. „Auch bei einem Eckstoß wird die Richtung erfasst und welcher Spieler ihn angenommen hat. Und es gibt noch weitere derartiger Merkmale. Insgesamt sind 180 Millionen dieser Attribute im konsolidierten Datensatz enthalten“, erklärt er.

„Das sind für jemanden wie mich die Rohmaterialien, um jede Frage beantworten zu können“, erläutert Brian Macdonald, ein Oracle Data Science Cloud Architect, der auf Sportanalysen spezialisiert ist. „Wenn ich ein Match beobachte, könnte ich beispielsweise etwas sehen und dann sagen: ‚Hey, ich glaube, das ist noch nie vorgekommen.‘ Ich kann dann eine Analyse durchführen zu der Frage: ‚Hat es das jemals schon gegeben? Und wenn ja, wie oft kommt so etwas vor?‘ Eine Frage führt dann sehr schnell zu nächsten.“

MacDonald sagt, dass er häufig auf die Oracle Analytics Platform geht, die mit einem Autonomous Data Warehouse verbunden ist, Filter anwendet und seine Analyse visualisiert, indem er Diagramme und Tabellen erstellt. „Ich würde gerne eine Art Vorhersagemodell erstellen, wie beispielsweise die Gewinnwahrscheinlichkeit eines laufenden Spiels auf der Basis von Simulationen mit historischen Daten“, erzählt er.

Leben auf der Überholspur

So wie die Datenerfassung funktioniert, überträgt die Plattform von Oracle jede Woche Inhalte von lokalen Datenerfassern in einem Volumen von 94.000 verschiedenen Payloads in das Data Warehouse. Dabei kommt es auf dasTiming an: Während der Woche finden Hunderte Spiele statt, wobei niedrigere Ligen Daten auf verschiedenen Detailstufen erfassen. Außerdem ändern sich durch die K.O.-Turniere des englischen Fußballs ständig die Zeitpläne. „Das System muss nicht nur wissen, um welche Daten es sich handelt, sondern auch, wann es diese abfragen soll“, erklärt Wigley. „Es war eine Menge Arbeit erforderlich, um sicherzustellen, dass unser Code und unsere Logik auch wirklich alles abdecken.“

Das System erfasst Daten auf unterschiedliche Arten und für verschiedene Zwecke. Einige dieser Paylaods, wie z. B. Aufstellungen, Besucherzahlen und andere Standard-Spieldaten, gehen neben den Daten zur Spielerverfolgung in den Datenspeicher, wo Analysten sie aggregieren und verwenden können, um nach dem Spiel Zusammenfassungen zu generieren und fundiertere Analysen und Vorhersagen bereitzustellen.

Der nächste Schritt des Projekts, der derzeit ein Proof of Concept ist, besteht darin, gleichzeitig laufende Spieldaten über das aufzunehmen, was Wigley die „Überholspur“ nennt. Diese Daten werden dann von Analysten in Echtzeit zur Verfügung gestellt. „Wenn etwas in einem Premier League-Spiel passiert, können die Benutzer des Data Warehouse dies sofort in ihre Analyse integrieren“, erläutert er.

„Schon jetzt haben die Premier League und andere Benutzer Zugriff auf all diese Spiel- und historischen Daten, die sie nach Belieben verwenden können“, erklärt Wigley weiter. Zum Beispiel könnte die Premier League relevante Daten direkt aus dem Data Warehouse abrufen, GenAI darauf anwenden und personalisierte Spielzusammenfassungen für Fans in ihren eigenen Sprachen erstellen, die auf Parametern basieren – wie beispielsweise einem Team, einem Spieler oder einer Position auf dem Spielfeld –, an denen diese Fans in der Vergangenheit Interesse gezeigt haben.

Bowden von FDC erklärt: „Für uns ist das etwas ganz Neues, denn wir haben jetzt die Kontrolle über eine breite Palette von Daten und sind in der Lage, diese zu nutzen. Und das Spannende daran ist, dass wir noch nicht genau wissen, welche Entwicklungen noch in der Zukunft möglich sein werden.“