英超聯賽運用 Oracle Cloud 整合英國足球賽事資料

Oracle Autonomous Data Warehouse 可協助聯盟、團隊、媒體和其他使用者透過遊戲內和後續比對分析發揮更大的創意。

Jeff Erickson | 2024 年 7 月 5 日


當一支足球隊 (足球隊、您到美國球迷) 球隊開槍時,球員不必等候許可。在球的掌控下,創造力會接手,而且很可能,但時刻也很迷惑。

同樣地,在英國 (包括媒體插座、投注公司、個人團隊和聯賽組織及其業務合作夥伴) 的偏離足球興趣中,跨領域也希望能夠快速發展,以探索隱藏在 Matchday 和其他形式資料中的可能性。直到不久前,英超聯賽及其他賽事產生的資料常分散在不同運動資料供應商的系統中,層層轉手、流程繁複,讓深入應用與創新分析變得困難。

如今,在 Oracle 資料專家與雲端基礎架構的支援下,由英超與英格蘭足球聯賽共同擁有的 Football DataCo (FDC) 正將過去 32 年、涵蓋 27 個英國聯賽與盃賽的比賽資料,以及持續更新的賽事資訊,全面整合至 Oracle Autonomous Data Warehouse。這項合作讓英超聯賽能夠前所未有地掌握其豐富且具價值的資料。

作為全球最受歡迎的足球聯賽,英超每場比賽日就產生數兆位元組的資料,這些資料來自高速攝影機每秒 25 次的追蹤,精準記錄場上每位球員的動作、跑位、傳球、射門、撲救、鏟球等各種關鍵賽事動態。這些資料可依需求提供給媒體、聯賽分析師及其他相關使用者。

FDC 產品與關係經理 Mark Bowden 表示:「現在,我們能在比賽進行的同時,自動更新這些資料,並透過英超的前端平台,讓使用者即時查詢。Bowden 認為,英超、其他英國賽事及其合作夥伴的分析師將能運用各式各樣的分析工具,靈活發揮這些龐大資料的價值。只要 Oracle Autonomous Data Warehouse 學習如何讓人們透過生成式 AI 大型語言模型與資料互動 (LLM),就可以實現這些可能性。他說:「GenAI 改變了我們存取資料的方式。

Bowden 表示,透過與生成式 AI 互動,而非仰賴 SQL 程式設計師,編輯與創意工作者能用自己的方式詮釋資料、講述故事,打造出連資料專家都未曾想像的內容。他表示:「我非常期待看到這樣的發展。」

使用者可以透過簡單的問題查詢資料倉儲,瞭解玩家目前的表現,例如在比賽中選擇中場者執行的次數,以及他們在對手半年有多少次接觸。或者,使用者也可以提出有趣的歷史問題,例如,在英超聯賽中,守門員得分多少次贏得比賽。使用者也將能夠以複雜戰術問題來查詢資料倉儲:尾端團隊是否對對手進行過遠的比賽?其他團隊如何面對這個策略?它是否導致了反攻的許多目標?

海量資料

Oracle Technology Consulting 分析總監 Simon Wigley 表示,只有英超聯賽在 345 個不同體育場合收集了 73,000 場來自 250 支不同團隊的資料。Wigley 同時也與 Football DataCo 合作。Wigley 指出:「我們掌握每場比賽的先發名單、球員站位,以及替補球員的資訊。」這是關於約 20,000 名球員和 130,000 名球員的資料,以及經理和被推薦人的統計數據。雖然英超聯賽與其他競賽的 VAR (影片輔助推薦人) 評論相對較為新,但這些決定中有 1,200 筆資料,他指出。

然而,與現代 AI 系統建立的匹配日程相比,這些歷史資料幾乎沒有變化,Wigley 表示。

現在,隨著遊戲的進行、自主地進行,我們可以隨時掌握最新資料,讓使用者能夠在英超聯賽的前端進行查詢。」

Mark Bowden 足球產品及關係經理 DataCo

參加英超聯賽。其合作夥伴不僅會收集每次傳遞、拍攝、執行、處理、轉角等資料,其中 3,900 萬個事件現在都在資料倉儲中,但這些事件也包含許多屬性。Wigley 說:「當有通行證時,系統會記下其速度、執行者及接收者。「一個角踢會記下方向 , 誰走了。」清單隨即開啟。他說,總共有 1 億 8 千萬個屬性都在合併的資料集中。

Oracle 資料科學雲端架構師 Brian Macdonald 表示:「這是像我這樣的人的原料,他專門從事體育分析。「當我看一場比賽時,我可以看到一些東西,說『嘿,我以前沒看過。』然後,我可以做一些問的分析:「以前發生過了嗎?」如果有了,那麽多久會發生?一個問題使另一個問題變得非常快速。」

MacDonald 表示,他通常會前往連線至 Autonomous Data Warehouse 的 Oracle Analytics Platform ,並套用篩選條件,並透過建立圖表和表格來開始視覺化分析。他說:「根據使用歷史資料的模擬,我可能想要建立一些預測模型,例如持續遊戲的獲勝機率。」

生活在快車道

資料收集的運作方式,每週 Oracle 平台會將內容從本機資料收集器傳輸至資料倉儲,量達 94,000 個不同的有效負載。時機很重要:一週內發生數百場比賽,較低的聯盟會收集不同層級的詳細資料。此外,有了英式足球的敲擊錦標賽,排程會不斷變化。Wigley 表示:「系統不僅必須知道要要求哪些資料,還需要何時要求。「有很多工作需要確保我們的程式碼和邏輯涵蓋一切。」

系統以不同方式擷取不同用途的資料。其中一些有效負載 (包括排隊、遊戲出勤和其他標準比對資料) 會與玩家追蹤資料一起進入資料儲存區,分析師可以在其中聚總資料,並使用該資料來產生比對後的摘要,並提供更深入的分析和預測。

專案的下一個步驟,目前是概念驗證,是透過 Wigley 所謂的「快速路線」來同時擷取進行中的比對資料。此資料會即時提供給分析師使用。他說:「英超聯賽發生了一些事情時,資料倉儲的使用者將能夠立即將其帶入分析中。

Wigley 表示,現在英超聯賽和其他使用者可以存取所有比賽和歷史資料,以便在符合資格時使用。例如,英超聯賽可以直接從資料倉儲中提取相關資料、在資料倉儲中套用 GenAI,並根據球隊、球員或球場等參數,為球迷建立個人化的比賽摘要。

FDC 的 Bowden 說道:「我們擁有控制權和權力,能夠使用大量不同的資料來源,這是真正的轉變。令人振奮的是,我們並不清楚即將到來的地方。」