يستفيد الدوري الإنجليزي الممتاز من Oracle Cloud لدمج بيانات مباريات كرة القدم في المملكة المتحدة

يساعد مستودع بيانات Oracle المستقل الدوريات والفِرق والإعلام والمستخدمين الآخرين على أن يصبحوا أكثر إبداعًا من خلال تحليلاتهم في أثناء المباراة وبعدها.

جيف إريكسون | 5 يوليو 2024


عندما يرتكب فريق لكرة القدم (سوكر، بالنسبة إلى المشجعين في أمريكا)، خطأ لا ينتظر اللاعبون الإذن بالتحرك. بينما الكرة في حوزتهم، يظهر الإبداع وتكثر الاحتمالات، لكن اللحظات عابرة.

وبالمثل، يرغب قطاع من مصالح كرة القدم خارج الملعب في المملكة المتحدة - بما في ذلك وسائل الإعلام وشركات الرهان والفريق الفردي ومؤسسات الدوري وشركاؤهم التجاريون - في حرية التحرك بسرعة في استكشاف الاحتمالات المخفية في يوم المباراة وأشكال البيانات الأخرى. حتى وقت قريب، كانت هذه البيانات، التي تم إنشاؤها بواسطة الدوري الإنجليزي الممتاز وغيرها من الدوريات والمسابقات، غالبًا ما يتم تخزينها في أنظمة مختلف بائعي البيانات الرياضية، ما يضيف وسطاء وخطوات إضافية جعلت عمليات استكشاف البيانات الإبداعية أمرًا صعبًا.

الآن، وبدعم من خبراء البيانات والبنية الأساسية السحابية من Oracle، تقوم شركة تسمى Football DataCo (FDC)، المملوكة بشكل مشترك من قبل الدوري الإنجليزي الممتاز والدوري الإنجليزي لكرة القدم، بدمج كل بيانات المباريات تلك -32 عامًا منها، والتي تغطي 27 دوريًا مختلفًا ومسابقات لخروج المغلوب في المملكة المتحدة، بالإضافة إلى مواجز يوم المباراة المستمرة - في مستودع بيانات Oracle مستقل واحد. يمنح الترتيب للدوري الإنجليزي الممتاز مستوى جديدًا من التحكم في مخزون البيانات المثير للإعجاب الذي يمتلكه.

باعتبار الدوري الإنجليزي الممتاز دوري كرة القدم الأكثر شعبية في العالم، فإنه وحده يولد تيرابايت من بيانات يوم المباراة التي يتم التقاطها 25 مرة في الثانية بواسطة الكاميرات التي تتعقب كل لاعب، والركض، والتمرير، والركل، والصد، والتدخل، وغيرها من "الأحداث" التي تحدث على أرض الملعب. تتوفر هذه البيانات عند الطلب إلى وسائل الإعلام ومحللي الدوري وغيرهم من المستخدمين المذكورين أعلاه.

يقول مارك بودن، مدير المنتجات والعلاقات في شركة FDC: "يمكننا الآن تحديث هذه البيانات في أثناء لعب المباريات بشكل مستقل والسماح للمستخدم بالدخول والاستعلام عنها من خلال الواجهة الأمامية الخاصة بالدوري الإنجليزي الممتاز". يتوقع بودن أن يكون المحللون المرتبطون بالدوري الإنجليزي الممتاز والمسابقات الأخرى في المملكة المتحدة وشركاؤهم مبدعين من خلال البيانات المتراكمة باستخدام أي أداة تحليلات يختارونها تقريبًا. لن تنمو الإمكانات إلا مع تعلم مستودع بيانات Oracle المستقل السماح للأشخاص بالتفاعل مع البيانات من خلال نماذج اللغات الكبيرة (LLMs) للذكاء الاصطناعي التوليدي. ويضيف "الذكاء الاصطناعي التوليدي تغيير حقيقي في قواعد اللعبة من حيث الطريقة التي سنتمكن بها من الوصول إلى البيانات".

يقول بودن إنه من خلال التفاعل مع الذكاء الاصطناعي التوليدي بدلاً من مبرمجي SQL، يمكن للأنواع التحريرية والإبداعية أن تجلب نهجها الخاص في سرد القصص باستخدام البيانات، "بما يتجاوز ما قد يحلم به أخصائي البيانات. أود أن أرى ذلك."

يمكن للمستخدمين الاستعلام عن مستودع البيانات مع أسئلة بسيطة عن الأداء الحالي للاعبين، مثل مدى ركض لاعبي خط الوسط المحددين خلال المباراة وعدد اللمسات التي أجروها في نصف ملعب الخصم. أو يمكن للمستخدمين طرح أسئلة تاريخية ممتعة، مثل عدد المرات التي سجل فيها حارس المرمى الهدف الفائز في مباراة في الدوري الإنجليزي الممتاز. سيتمكن المستخدمون أيضًا من الاستفسار من مستودع البيانات بأسئلة تكتيكية معقدة: هل يلعب الفريق اللاحق ضد هذا الخصم بعد مدة كبيرة جدًا؟ كيف كان أداء الفرق الأخرى بهذا التكتيك؟ هل أدى ذلك إلى العديد من الأهداف من الهجمات المضادة؟

حصاد البيانات

يقول سيمون ويغلي، مدير التحليلات في Oracle Technology Consulting، الذي يعمل مع FDC، لقد جمع الدوري الإنجليزي الممتاز وحده بيانات عن 73,000 مباراة مختلفة من 250 فريقًا مختلفًا في 345 ملعبًا مختلفًا. يقول ويغلي "بالنسبة إلى كل مباراة من تلك المباريات، نحن نعرف التشكيلة ومراكز كل لاعب، وكذلك من تم تبديله. هذه بيانات عن حوالي 20,000 لاعب و 130,000 هدف، فضلا عن إحصائيات عن المديرين والحكام. على الرغم من أن مراجعات VAR (الحكم بمساعدة الفيديو) جديدة نسبيًا في الدوري الإنجليزي الممتاز والمسابقات الأخرى، إلا أنه توجد بيانات حول 1,200 من هذه القرارات.

ومع ذلك، فإن كل هذه البيانات التاريخية هي تغيير صغير مقارنة بثروات يوم المباراة التي أنشأتها الأنظمة الحديثة القائمة على الذكاء الاصطناعي، كما يقول ويغلي.

"يمكننا الآن تحديث هذه البيانات مع ممارسة المباريات بشكل مستقل والسماح للمستخدم بالدخول والاستعلام عنها من خلال الواجهة الأمامية الخاصة بالدوري الإنجليزي الممتاز."

مارك بودن مدير المنتجات والعلاقات، Football DataCo

انظر مثلاً للدوري الممتاز. لا يقتصر شركاؤه على جمع البيانات عن كل تمريرة، وركلة، وركض، وتدخل، وزاوية، وما إلى ذلك—39 مليون من تلك الأحداث موجودة الآن في مستودع البيانات—لكن كل حدث من تلك الأحداث يحتوي أيضًا على عدد من السمات. يقول ويغلي "عندما توجد تمرير، فإن النظام سيلاحظ سرعتها، ومن صنعها، ومن استلمها. ستسجل ركلة الزاوية الاتجاه ومن أخذها." القائمة مستمرة. يقول إن 180 مليون من هذه السمات إجمالاً موجود في مجموعة البيانات الموحدة.

يقول برايان ماكدونالد، مهندس سحابة علوم البيانات في Oracle والمتخصص في التحليلات الرياضية: "هذه هي المواد الخام المطلوبة ليجيب شخص مثلي عن أي سؤال. عندما أشاهد مباراة، استطيع أن أرى شيئًا وأقول: ’لا أعتقد أنني رأيت ذلك من قبل‘. يمكنني بعد ذلك إجراء بعض التحليل الذي يسأل: ’هل حدث ذلك من قبل؟‘ إذا كان الأمر كذلك، فكم مرة يحدث ذلك؟ يؤدي سؤال واحد إلى سؤال آخر بسرعة كبيرة".

يقول ماكدونالد إنه سيذهب غالبًا إلى منصة Oracle Analytics المتصلة مع Autonomous Data Warehouse وتطبيق المرشحات والبدء في تمثيل تحليله مرئيًا من خلال إنشاء رسوم بيانية وجداول. يقول: "قد أرغب في بناء نوع من النماذج التنبؤية، مثل احتمال الفوز في مباراة جارية، استنادًا إلى عمليات المحاكاة باستخدام البيانات التاريخية".

الحياة في المسار السريع

طريقة عمل جمع البيانات، تنقل منصة Oracle كل أسبوع المحتوى من جامعي البيانات المحليين الذي يصل إلى 94,000 حمولة مختلفة إلى مستودع البيانات. التوقيت مهم: توجد مئات من المباريات على مدار الأسبوع، مع دوريات أقل تجمع البيانات بمستويات مختلفة من التفاصيل. بالإضافة إلى ذلك، مع مسابقات خروج المغلوب في كرة القدم الإنجليزية، تتغير الجداول باستمرار. يقول ويغلي: "يجب أن يعرف النظام ليس فقط البيانات التي يجب طلبها ولكن متى يجب طلبها. "لقد اتجه كثير من العمل إلى التأكد من أن تعليماتنا البرمجية ومنطقنا تناولوا كل شيء."

يستوعب النظام البيانات بطرق مختلفة للاستخدامات المختلفة. تدخل بعض تلك الحمولات، بما في ذلك تشكيلات الفِرق وحضور المباراة وبيانات المباراة القياسية الأخرى، إلى تخزين البيانات جنبًا إلى جنب مع بيانات تتبع اللاعبين حيث يمكن للمحللين تجميعها واستخدامها لإنشاء ملخصات بعد المباراة وتغذية تحليلات وتنبؤات أعمق.

تتمثل الخطوة التالية من المشروع، وهو دليل على المفهوم حاليًا، في استيعاب بيانات المباراة الجارية بشكل متزامن من خلال ما يسميه ويغلي "الممر السريع". تتوفر هذه البيانات للمحللين في الوقت الحقيقي. يقول: "عندما يحدث شيء ما في مباراة في الدوري الإنجليزي الممتاز، سيتمكن مستخدمو مستودع البيانات من إدخاله على الفور في تحليلهم".

الآن أصبح بإمكان الدوري الإنجليزي الممتاز والمستخدمين الآخرين الوصول إلى كل هذه البيانات عن المباريات والبيانات التاريخية لاستخدامها بالشكل الذي يرونه مناسبًا، كما يقول ويغلي. على سبيل المثال، يمكن للدوري الإنجليزي الممتاز سحب البيانات ذات الصلة مباشرةً من مستودع البيانات، وتطبيق الذكاء الاصطناعي التوليدي عليها، وإنشاء ملخصات مطابقة مخصصة للمشجعين بلغاتهم الخاصة بناءً على المعلمات—مثل الفريق أو اللاعب أو المركز على أرض الملعب—التي أبدوا اهتمامًا بها.

يقول بودن من شركة FDC: "إنه تحول حقيقي بالنسبة إلينا أن نشعر بأن لدينا التحكم والتمكين لاستخدام مجموعة واسعة من مصادر البيانات المختلفة. والشيء المثير في الأمر هو أننا لا نعرف بالضبط أين ستذهب".