Oracle Autonomous Data Warehouse는 리그, 팀, 미디어를 포함한 다양한 분야별 사용자들이 경기 중 및 경기 후 데이터 분석 결과를 더욱 창의적으로 활용할 수 있도록 지원합니다.
Jeff Erickson | 2024년 7월 5일
축구에서 팀이 공격을 할 때, 선수들은 허락 받고 움직이지 않습니다. 선수가 공을 잡는 순간, 본능적인 감각과 재량이 발휘되기 때문이죠. 공을 소유한 그 순간은 찰나에 불과합니다.
마찬가지로 미디어 매체, 베팅 회사, 각 팀 및 리그/협회, 그리고 그들의 비즈니스 파트너 등 영국 축구 경기장 밖의 다양한 이해관계자들은, 경기 당일의 데이터와 그 다양한 형태의 데이터에 숨겨진 의미와 가능성을 빠르게 탐색하고 해석할 수 있는 솔루션이 필요합니다. 최근까지 Premier League 및 다른 리그의 경기를 통해 생성된 데이터는 각기 다른 스포츠 데이터 공급업체의 시스템에 저장되어 왔고, 여기에 중개 기관, 그리고 추가적인 단계가 더해지며 데이터 분석이 더욱 어려울 수밖에 없었죠.
그러나 이제 Premier League와 English Football League가 공동 소유한 Football DataCo(FDC)라는 기업이 Oracle의 데이터 전문가와 클라우드 인프라의 지원을 바탕으로 27개 영국 리그와 토너먼트 대회, 진행 중인 경기의 당일 피드에 이르는 모든 경기 데이터를 하나의 Oracle Autonomous Data Warehouse에 통합하고 있습니다. 이를 통해 Premier League는 엄청난 양의 데이터를 차원이 다른 수준으로 활용할 수 있게 되었습니다.
세계에서 가장 인기 있는 축구 리그인 Premier League에서는 경기장 내 모든 선수들을 추적하는 카메라가 달리기, 패스, 슈팅, 세이브, 태클 및 다른 많은 '이벤트'를 초당 25회 포착하며 매 경기마다 테라바이트급의 데이터를 생성합니다. 해당 데이터는 언론 매체, 리그 분석가를 비롯해 앞서 언급한 다양한 사용자들의 요청에 따라 제공됩니다.
FDC의 제품 및 관계 매니저인 Mark Bowden은, "이제 경기가 진행되는 동안 경기 데이터는 항상 최신 버전으로 자동 업데이트 되고, 시스템 사용자들은 Premier League의 자체 프론트엔드를 통해 데이터를 쿼리할 수 있게 됐습니다." 라고 이야기합니다. Bowden은 Premier League뿐만 아니라, 영국 내 다른 경기와 관련 분석가들이 이제 거의 모든 종류의 분석 도구를 통해 축적된 데이터를 통해 보다 창의적인 활동을 하게 되리라 기대하고 있습니다. 생성형 AI eorbah 언어 모델(LLM)을 통해 사람들이 데이터와 자연어로 상호작용할 수 있는 기능이 Oracle Autonomous Data Warehouse에 추가됨에 따라 데이터의 창의적 활용 가능성은 앞으로 더욱 커질 것입니다. Bowden은 추가적으로, "생성형 AI는 데이터 액세스 방식을 뒤바꿔놓은 진정한 게임 체인저입니다."라고 첨언하며
SQL 프로그래머가 아닌 편집자 및 크리에이터들이 생성형 AI와 직접 상호작용함으로써 "데이터 전문가가 상상할 수 있는 범위를 벗어나" 데이터 스토리텔링에 개성적인 접근 방식을 가져올 것이라고 기대했습니다.
사용자는 경기 중 특정 미드필더가 얼마나 멀리 뛰었는지, 상대팀의 영역에서 얼마나 많은 터치를 했는지 등 선수의 현재 경기력에 대한 간단한 질문을 입력하는 것만으로 데이터 웨어하우스를 쿼리할 수 있습니다. Premier League 경기에서 골키퍼가 몇 번이나 승부를 결정짓는 골을 넣었는지와 같은 재미있는 역사적 질문을 할 수도 있습니다. 또한 사용자는 다음과 같은 복잡한 전술적 질문을 입력하여 데이터 웨어하우스를 쿼리할 수도 있습니다. - 지금 밀리고 있는 팀이 상대 팀을 상대로 너무 전진 플레이를 하고 있을까요? 다른 팀들은 이 전술로 성공했었나요? 이 팀은 역습을 통해 많은 골을 넣었나요?
FDC와 협력 중인 Oracle Technology Consulting의 분석 책임자 Simon Wigley에 따르면 Premier League에서만 345개 경기장 내 250개 팀의 73,000개 경기에 대한 데이터가 수집되었다고 합니다. "경기별 라인업과 각 선수의 포지션은 물론 교체 투입된 선수도 모두 파악하고 있습니다." 이는 약 2만 명의 선수, 13만 개의 골, 그 외 감독 및 심판들과 관련된 데이터 및 스탯을 의미합니다. Premier League 및 다른 경기 대회에서 비디오 판독(VAR)이 비교적 최근에 도입되었기는 했지만, 여기서 추출된 1,200건의 판정에 대한 데이터 또한 함께 축적했다고도 덧붙였습니다.
그러나 이 모든 과거 데이터 역시 모던 AI 기반 시스템이 만들어내고 있는 경기 당일의 수많은 데이터에 비하면 작은 변화일 뿐이라고 Wigley는 말했습니다.
"이제 경기가 진행되는 동안 경기 데이터는 항상 최신 상태로 자동 업데이트 되고, 사용자들은 Premier League의 자체 프론트엔드를 통해 데이터를 쿼리할 수 되었습니다."
Premier League를 예로 들어보겠습니다. Premier League의 파트너사들은 모든 패스, 슛, 달리기, 태클, 코너링 등에 대한 데이터를 수집합니다. 현재 3,900만 개의 행동 데이터가 데이터 웨어하우스에 저장되어 있습니다. 뿐만 아니라 각각의 행동 데이터에는 여러 속성이 함께 포함되어 있습니다. "패스가 이루어질 때마다 시스템은 패스의 속도, 패스를 시도한 선수, 패스를 받은 선수를 기록합니다." Wigley는 말했습니다. "코너킥이 발생하면 킥의 방향과 킥한 선수를 기록합니다." 추가 속성의 목록은 끝없이 이어집니다. 총 1억 8천만 개의 속성이 통합 데이터 세트에 포함되어 있다고 합니다.
"저 같은 기술자는 Oracle이 저장 중인 로우 데이터를 활용하여 모든 질문에 대한 답을 찾을 수 있습니다." Oracle의 Data Science Cloud Architect이자 스포츠 분석 전문가인 Brian Macdonald는 말했습니다. "경기를 보다 보면 '저런 건 예전에 본 적이 없는 것 같은데'라는 생각이 들 때가 있습니다. 그러면 '전에도 이런 일이 있었나요?'라는 질문을 입력하여 데이터 분석을 수행합니다. 만약 전에도 그런 일이 있었다면, '얼마나 자주 발생했을까요?'라는 질문을 이어서 입력합니다. 하나의 질문이 다른 질문으로 빠르게 이어지죠."
MacDonald는 종종 Autonomous Data Warehouse에 연결된 Oracle Analytics Platform으로 이동하여 필터를 적용하고 차트와 표를 만들어 분석을 시각화해 본다고 합니다. "과거 데이터에 기반한 시뮬레이션을 통해 진행 중인 경기의 승리 확률과 같은 일종의 예측 모델을 구축할 수도 있습니다." MacDonald는 말했습니다.
Oracle 플랫폼의 데이터 수집 작업은 매주 94,000개 페이로드에 달하는 로컬 데이터 수집기의 콘텐츠를 데이터 웨어하우스로 전송합니다. 중요한 것은 타이밍입니다. 일주일 내내 수백 개의 경기가 개최되고, 하위 리그의 경우 각각 서로 다른 수준의 세부 데이터를 수집합니다. 또한 영국의 토너먼트 방식 대회 일정은 수시로 변합니다. Wigley는 "시스템은 어떤 데이터를 요청할지뿐만 아니라 언제 요청해야 할지도 파악해야 합니다.”라며, "코드와 로직이 필요한 모든 부분을 커버할 수 있도록 많은 노력을 기울였습니다."라고 말했습니다.
Oracle의 시스템은 용도에 따라 다양한 방식으로 데이터를 수집합니다. 라인업, 관객 수 등의 표준 경기 데이터가 포함된 일부 페이로드는 선수 추적 데이터와 함께 데이터 저장소로 이동하여 데이터 분석가의 집계, 경기 후 데이터 요약 생성, 보다 심층적인 분석 및 예측 등의 작업에 사용됩니다.
현재 개념 증명 단계인 본 프로젝트의 다음 단계는 Wigley가 '추월 차선(fast lane)'이라 부르는 방식을 통해 진행 중인 경기 데이터를 실시간으로 수집하는 것입니다. 수집된 데이터는 분석가에게 실시간으로 제공됩니다. "프리미어 리그 경기에서 어떤 이벤트가 발생하든 데이터 웨어하우스 사용자는 즉시 해당 데이터를 분석할 수 있습니다." Wigley는 말했습니다.
Wigley는 이제 Premier League 관계자 및 다른 사용자들이 모든 경기 및 기록 데이터에 액세스하여 원하는 대로 활용할 수 있게 되었다고 말했습니다. 예를 들어, Premier League는 데이터 웨어하우스에서 바로 데이터를 가져와 생성형 AI 도구를 적용하고, 팬들이 관심을 보인 팀, 선수, 경기장 내 위치 등의 매개변수를 기반으로 팬들을 위한 개인화된 경기 요약을 작성할 수 있습니다.
FDC의 Bowden은 "방대한 양의 서로 다른 데이터 소스를 사용할 수 있는 통제권과 권한을 갖게 된 것은 정말 큰 변화입니다. 또한 흥미로운 점은 우리가 그것을 활용하여 앞으로 어떤 일들을 만들게 될지 현재로서는 정확히 알 수 없다는 점입니다."라고 말했습니다.
Oracle Analytics 플랫폼은 조직의 기존 보안과 거버넌스를 훼손하지 않으면서도 데이터 수집 및 모델링, 시각화 및 협업 등 분석 프로세스 전반에 요구되는 역량을 제공하는 클라우드 네이티브 서비스입니다.
Oracle Analytics Cloud는 2024년 시즌의 가장 놀라운 역전승(Most Improbable Comeback)과 가장 강력한 골(Most Powerful Goal)의 수상자를 찾기 위해 380개의 모든 경기 데이터를 조각조각 파헤쳤습니다.