Oracle Autonomous Data Warehouseにより、リーグ、チーム、メディアなどのユーザーは、試合中や試合後の分析でより創造的な取り組みが可能になります。
Jeff Erickson | 2024年7月5日
サッカーで攻撃に転じたチームの選手は、指示を待たずに動き出します。ボールを持てば創造性が発揮され、可能性は広がりますが、その瞬間はあっという間です。
同様に、英国のメディア、ブックメーカー、各クラブ・リーグ組織、ビジネス・パートナーなど、ピッチ外の関係者も、試合データやその他のデータに潜む可能性をすばやく探求する自由を求めています。これまで、プレミアリーグをはじめとする各リーグや大会で生成されるデータは、多くの場合、複数のスポーツ・データ・ベンダーのシステムに分散保存されており、仲介者の存在や手間の多さが創造的なデータ活用の障壁となっていました。
現在では、プレミアリーグとEFL(English Football League)が共同所有するFootball DataCo(FDC)が、オラクルのデータ専門家とクラウド基盤の支援のもと、過去32年間にわたって蓄積された膨大な試合データ—イギリス国内27リーグとノックアウト戦の全記録、さらに現在進行中の試合のリアルタイム・データフィード—をすべて1つのOracle Autonomous Data Warehouseに統合しています。この取り組みにより、プレミアリーグは自らが保有する膨大なデータ資産を新たなレベルで管理できるようになります。
世界で最も人気のあるサッカーリーグであるプレミアリーグでは、試合ごとにカメラが1秒間に25回撮影することで、選手のドリブル、パス、シュート、セーブ、タックルなど、ピッチ上でのあらゆる「イベント」が記録され、テラバイト単位のデータが生成されます。これらのデータは、メディア、リーグアナリスト、その他の関係者のリクエストに応じて提供されます。
「今では、試合進行中でもデータを自律的に最新の状態に保つことが可能で、ユーザーはプレミアリーグ独自のフロントエンドから自由にクエリを実行できます」とFDCの製品・関係担当マネージャー、Mark Bowden氏は述べています。Bowden氏は、プレミアリーグやその他のイングランド・サッカーの試合に関するアナリスト、それらのパートナーが、好みの分析ツールを使って蓄積データを創造的に活用するようになると見込んでいます。Oracle Autonomous Data Warehouseが生成AIの大規模言語モデル(LLM)を通じて人々とデータを結びつけるようになれば、その可能性はさらに広がります。「生成AIは、データへのアクセス方法に革命をもたらす存在です」と彼は述べます。
Bowden氏によれば、SQLプログラマーではなく生成AIを介してデータにアクセスすることで、編集者やクリエイターも「データ専門家が想像する範囲を超えた」独自のストーリーテリングが可能になります。「そういう使い方をぜひ見てみたいですね」
ユーザーは、特定のミッドフィールダーが試合中にどれだけ走ったか、敵陣で何回ボールに触れたかといった、選手の現在のパフォーマンスに関するシンプルな質問をデータウェアハウスに投げかけることができます。あるいは、「プレミアリーグでゴールキーパーが決勝点を挙げたのは何回か」といった興味深い過去についての質問も可能です。さらに、戦術的に複雑な質問、たとえば、「劣勢チームはこの相手に対して前がかりになりすぎているか?」「他のチームはこの戦術でどのような結果を残しているか?」「その結果、カウンター攻撃による失点は多かったか?」などに対応できます。
Oracle Technology Consultingの分析ディレクターでFDCと協働しているSimon Wigleyによれば、プレミアリーグだけで、345スタジアムでの250チームによる73,000試合のデータが収集されています。「各試合ごとに、出場選手の布陣、ポジション、交代選手の情報まで把握しています」とWigleyは語ります。このデータには、約20,000人の選手、130,000のゴール、監督や審判に関する統計も含まれます。また、プレミアリーグや他の大会では比較的新しいVAR(ビデオ・アシスタント・レフェリー)の記録も1,200件存在すると彼は述べています。
Wigley氏は、こうした過去データも、最新のAIベースシステムによって生成される試合当日の膨大な情報量と比べれば「微々たるものだ」と述べています。
「今では、試合進行中でもデータを自律的に最新の状態に保つことが可能で、ユーザーはプレミアリーグ独自のフロントエンドから自由にクエリを実行できます」
プレミアリーグを例に取りましょう。プレミアリーグのパートナーは、パス、シュート、ドリブル、タックル、コーナーなどのすべてのプレーを記録しており、これらのイベントは3,900万件にも上り、それぞれに多様な属性情報が付随しています。「パスが出たときには、システムがその速度、出し手、受け手を記録します」とWigley氏は述べます。「コーナーキックなら、蹴った方向やキッカーの情報も含まれます」。このように、そのメリットは多岐にわたります。これらの属性は、合計で1億8,000万件が統合データセットに収められていると彼は述べています。
スポーツ分析を専門とするオラクルのデータサイエンス・クラウド・アーキテクト、Brian Macdonaldは「こうしたデータは、私のような人間がどんな問いにも答えるための素材です」と語ります。「試合を見ていて、ふと "こんなの見たことないな" と思うことがあります。そこで "これまでに起きたことがあるのか?" という分析をします。もし起きていたなら、"どのくらいの頻度で起きているのか?" という具合に、1つの疑問からすぐに次の疑問へとつながっていくんです」
Macdonaldは、Autonomous Data Warehouseと連携したOracle Analytics Platformを使ってフィルタを適用し、チャートや表で分析結果を視覚化することが多いと述べます。「たとえば、過去データを用いたシミュレーションを通じて、進行中の試合の勝率を予測するモデルを構築したりします」と彼は語ります。
データ収集の仕組みとしては、オラクルのプラットフォームが毎週、ローカルのデータ収集元から94,000件のペイロードをデータウェアハウスに転送しています。タイミングも重要です。週を通じて何百もの試合があり、下位リーグでは詳細レベルの異なるデータが収集されています。さらに、イングランド・サッカーのノックアウト戦ではスケジュールが絶えず変動します。「システムは、何のデータを要求するかだけでなく、いつ要求すべきかも理解している必要があります」とWigleyは語ります。「そのすべてをカバーするために、コードやロジックに多くの工夫を凝らしました」
システムは用途に応じてデータの取り込み方法を変えています。出場メンバー、観客数、その他標準的な試合データなどの一部ペイロードは、選手追跡データと共に保存され、アナリストが集計や試合後の要約作成、さらに深い分析や予測に活用できます。
このプロジェクトの次のステップ(現在は概念実証段階)は、Wigleyが「ファスト・レーン」と呼ぶ仕組みで進行中の試合データをリアルタイムに取り込むことです。このデータはアナリストがリアルタイムで利用できます。「プレミアリーグの試合で何かが起きたとき、データウェアハウスのユーザーは即座にそれを分析に取り込むことができます」と彼は述べます。
Wigleyは「今ではプレミアリーグや他のユーザーが、試合データと過去データを自由に活用できるようになりました」と述べます。たとえば、プレミアリーグは、データウェアハウスから関連データを取り出し、それに生成AIを適用することで、ファンが関心を示したチーム、選手、ポジションなどのパラメータに基づいて、そのファンの母語でパーソナライズされた試合要約を生成できます。
FDCのBowden氏は「さまざまなデータソースを自分たちの意思で活用できるようになったという感覚は、私たちにとって大きな転機です」と述べます。「そして興味深いのは、この可能性が今後どこまで広がるか、まだ誰にもわからないということです」
Oracle Analyticsプラットフォームは、データの取込みとモデリング、可視化とコラボレーションなどの分析プロセス全体に必要な機能を、セキュリティとガバナンスを損なうことなく提供できる、クラウド・ネイティブ・サービスです。
Oracle Analytics Cloudは、全380試合のデータを分析し、2024シーズンの「Most Improbable Comeback(最も信じられない逆転劇賞)」と「Most Powerful Goal(最も力強いゴール賞)」の受賞者を選出しました。