Увійти

Cтавки на гольф. Плюси і мінуси моделі Data Golf

22:04, 4 Квітня 2019
Рейтинг Букмекерів
Підписатися Читати в повній версії

Гольф один з найскладніших для прогнозування видів спорт. Фахівці, які розробили модель Data Golf, присвятили роки відточуванню моделі прогнозування результатів в гольфі. Як використовувати статистику для прогнозів на гольф? Розкажуть експерти БК Pinnacle.

Поділитися:

Cтавки на гольф. Плюси і мінуси моделі Data Golf

На перший погляд, прогнозувати результати в такому виді спорту, як гольф, складно: як правило, на ігрових полях (тобто на полях для гольфу), які можуть істотно відрізнятися один від одного в залежності від турніру, змагаються від 132 до 156 гравців. Якщо ви хочете ефективно прогнозувати результати турнірів з гольфу, з чого ж слід почати?

На нашу думку, відповідь варто шукати в статистичному моделюванні. Статистична модель – це опис процесу, який виконується з метою генерування набору даних (наприклад, про результати гольфіста).

У цій статті мова піде про просту модель прогнозування результатів в гольфі та аналізі висновків, зроблених в процесі її застосування.

З чого варто почати?

У гольфі важливий не результат гравця, а ефективність його виступів на тому чи іншому полі. Вважається, що показник в 72 удари на турнірі, де середня кількість ударів на полі становить 74, на 4 пункти кращий показника в 72 удари на полі, де середня кількість ударів – 70. Застосувати таке коригування проблематично, особливо якщо два гравці не рівні за силами (але цей момент ми поки проігноруємо).

Наступний крок після коригування результатів з урахуванням фактору поля передбачає опис процесу генерування даних про результати (тобто побудова моделі).

Почнемо з припущення, яке значно спростить нашу задачу. Отже, припустимо, що результати різних гравців в гольф на конкретному полі не залежать один від одного, тобто на підставі даних про результативність одного гравця не можна судити про результативність іншого.

Такий підхід дозволить розбити задачу з прогнозування результатів на трохи простіші задачі. Ці завдання полягають в прогнозуванні результату кожного гольфіста.

Далі визначимо рівень майстерності гравця, завдяки якому він може в кожен конкретний момент часу показувати середній гіпотетичний результат в рамках нескінченно повторюваного раунду гри в гольф. Наприклад, рівень кваліфікації Тайгера Вудса на турнірі Genesis Open – це середній результат, продемонстрований ним на полях Riviera Country Club в рамках нескінченно великої вибірки раундів. Значення цієї величини дізнатися неможливо, але її можна використовувати як інструмент.

З часом в результатах гравців в гольф відбуваються досить великі варіації. Їх формування залежить від двох чинників: зміни рівня майстерності гольфіста і залишкового чинника, що включає всі інші аспекти, які впливають на результати. Останній можна віднести до випадкових або, в залежності від ваших філософських переконань, варіацій, викликаних впливом неспостережуваних змінних.

У окремо взятий день результат гравця може залежати від сумарного впливу його майстерності і неспостережуваних змінних. Наприклад, результат Тайгера Вудса в 65 ударів в третьому раунді Genesis Open був на шість ударів кращий за середній показник для цього конкретного поля. У нашій моделі цей результат можна представити як суму впливу майстерності Вудса (нехай його показник результативності на два пункти вищий середнього значення по полю) і позитивного непередбачуваного результату чотирьох ударів.

На завершальному етапі побудови моделі введемо останнє припущення, спрощує наше завдання. З плином часу рівень кваліфікації гравців в гольф стабілізується і стає фіксованим. Якщо гравець володіє чітко визначеною майстерністю, то всі варіації його результатів можна вважати випадковими.

Основа побудови моделі прогнозування гольфу

Тільки що повністю (хоча і довільно) ми задали параметри для статистичної моделі, яка описує процес генерування даних про результати турнірів з гольфу. Отже, три твердження, які складають основу цієї моделі.

  1. Кожен гравець в гольф володіє певним рівнем майстерності.
  2. Результат кожного гравця, показаний ним на конкретно взятому полі в певний день – сумарний результат впливу його майстерності і випадкових варіацій.
  3. Результати гравців, показані ними на тому чи іншому конкретному полі, не залежать одне від одного.

Всі підсумки турніру (перемога, проходження кваліфікації) – це детерміновані функції величини результату кожного гравця на тому чи іншому конкретному полі. Модель дозволяє отримати опис будь-якого результату в обраному за нашим бажанням турнірі з гольфу.

Ця базова модель надає надійну основу для роздумів про результати гри в гольф.

Важливість розміру вибірки

Логічно обґрунтований перший крок до використання цієї моделі – це спроба оцінити майстерність гравців. Припустимо, що у нас є вибірка даних про результати минулих виступів одного конкретного гольфіста. Якщо ця вибірка досить велика, то середній показник результативності, визначений на її підставі, можна співвіднести з рівнем майстерності цього гравця. Але вибірку якого розміру можна вважати достатньою?

Емпірично вдалося виявити, що величина середньоквадратичного відхилення результатів цього гравця – приблизно 2,75 удару. Якщо виходити з припущення, що розподіл підпорядковується нормальному закону, то для 68% результатів воно буде знаходитися в межах величини 2,75 від середнього значення, а для 95% – в межах 5,5. Використовуючи базову статистичну теорію, можна в деякій мірі бути впевненим в тому, що для вибірки даних про 100 раундів середнє значення буде перебувати в межах 0,275 удару від показника рівня майстерності.

Варто звернути увагу на той факт, що різниця в середніх показниках результативності за сезон гравців, які займають в світовому рейтингу 50-е і 100-е місця, становить менше половини удару. Це підводить нас до основного практичного висновку, пов’язаного із застосуванням моделі: щоб зробити цікаві висновки про рівень майстерності, потрібно спиратися на вибірки даних про минулі виступи великих розмірів.

Відповідно до цієї моделі відмінності в результатах гольфістів, продемонстрованих ними в окремо взятий тиждень, місяць або навіть рік, переважно обумовлені випадковістю. Щоб мати можливість з упевненістю вважати, що різниця в рівнях майстерності двох гольфістів в межах 0,5 удару, потрібно проаналізувати дані не менше 100 раундів.

Прийти до такого висновку можна тільки завдяки припущенням, включеним в алгоритм нашої моделі. Але дані, отримані в результаті застосування цієї моделі, можуть виявитися помилковими. Цілком можливо, що з плином часу рівень майстерності гравця залишається нестабільним. Що на різних полях для гольфу гравці теж демонструватимуть одні і ті ж результати. Тому ті чинники, які ми досить зневажливо назвали «неспостережуваними змінними», насправді можуть виявитися цілком такими, спостерігаються.

Певний рівень майстерності або схильність до гри на конкретному полі?

Якщо вважати, що гравці в гольф мають відповідний рівень майстерності, то відмінності в показниках їх результативності на різних полях – наслідок впливу випадкових варіацій, але в моделі, що враховує схильність гольфістів до гри на конкретному полі, ця розбіжність в результатах принаймні частково відображає відмінності в майстерності.

Це не просто різниця. Те, наскільки ви вірите, що відмінності в показниках результативності гравців на різних полях обумовлені реальними відмінностями в їх майстерності, на відміну від випадкових коливань, має великий вплив на те, як ви будете оцінювати рівень майстерності цих гравців. В підсумку це впливає на ваші прогнози.

Чим більша роль випадкових варіацій, тим більша повинна бути вибірка, на підставі якої ви зможете дати точну оцінку майстерності. Якщо рівень майстерності чітко визначено, тоді всі варіації в результатах гольфіста випадкові, отже, для усереднення дисперсії потрібно дуже велика вибірка даних про результативність.

Втім, оскільки велика частина спостережуваних варіацій обумовлена ​​схильністю гольфістів до гри на тому чи іншому полі, можливо, що для отримання обґрунтованих оцінок подібної схильності потрібні будуть дані про всього лише декілька раундів гри на відповідному полі.

Яка модель найбільше наближена до реальності? Якщо не звертатися до формального аналізу даних, то достовірним буде твердження про те, що генерування даних про результати гри проходить в рамках процесу, який ближче до моделі певного рівня майстерності, ніж до моделі, в основі якої ідея про те, що рівні майстерності гравців схильні до частих коливань.

Повернемося до прикладу, пов’язаного зі схильністю гольфістів до гри на конкретному полі. Зверніть увагу на те, що в масштабах гри на одному і тому ж полі кількість варіацій в результатах гольфіста ненабагато менша числа варіацій, що фіксуються в результатах цього гравця в раундах, зіграних загалом на всіх полях.

Це свідчення того, що при визначенні результатів виступів гравців як і раніше слід враховувати низку різних факторів, не кажучи вже про те, що їх показники можуть варіюватися в залежності від поля. І це має на увазі наступний висновок: для розуміння ступеня варіювання результатів гольфістів на різних полях потрібні більші вибірки даних.

Тренд виживання в гольфі

Загалом, з точки зору статистики, дуже важко пояснити наявність величезної кількості варіацій в результатах гравців з впливом спостережуваних факторів (це фактори, про існування яких було відомо до початку турніру).

З іншого боку, чи не суперечить модель, заснована на припущенні про певний рівень майстерності гравців, деяким закономірностям, які викликають подив і спостерігаються в масивах даних?

Наприклад, недавно Тоні Фінау в четвертий раз поспіль не зміг пройти відбірковий тур Phoenix Open PGA Tour. Чи переконливий це доказ того, що саме на полях TPC Scottsdale рівень майстерності Фінау опускається до найнижчої позначки? Можливо, але якщо модель, побудована на принципі певного рівня майстерності, правильна, то закономірності, подібні до цієї, все одно виявилися б.

Тут та ж логіка, що і у випадку з трендом виживання, поширеним в середовищі капперів. Навіть якщо ймовірність того, що гравець рівня Фінау чотири рази поспіль не зможе пройти відбірковий тур, становить 1 до 500, то з урахуванням всіх можливих комбінацій полів для гольфу і гравців (яких налічується тисячі) можна очікувати, що протягом декількох сезонів PGA Tour лише одна подія з 500 буде відбуватися досить часто.

Концентрація уваги на одному або двох прикладах і ігнорування при цьому інших прикладів не дозволить вам отримати повне уявлення про різницю в результатах гольфістів на різних полях.

Побудова простої моделі прогнозування гольфу

Модель, про яку ми говоримо, спрощує розуміння різних способів аналізу результатів гри. Хоча обидві моделі (модель, заснована на принципі певного рівня майстерності, і модель, в основу якої покладено ідею про схильність гольфістів до гри на конкретному полі) засновані на абсолютно різних системах знань, їх можна проаналізувати, використовуючи одну і ту ж методику, що дозволить виявити їх недоліки та переваги.

Чим менше вимірювань, на підставі яких можна визначити межі варіації рівнів майстерності гравців, тим більше даних потрібно для оцінки. Наприклад, для оцінки рівня майстерності гравця в гольф, яку демонструє він на кожному полі турніру PGA Tour, нам в більшості випадків будуть доступні дані лише для 5-10 раундів.

І навпаки, для оцінки певного рівня майстерності кожного гольфіста можна використовувати дані, які вже існують. Жодна з представлених систем не може вважатися кращою за іншу. Ефективність моделі, заснованої на принципі певного рівня майстерності, буде тим вища, чим більшу роль відіграють випадкові варіації в процесі визначення результатів.

Наш підхід до розуміння результатів тісніше пов’язаний з моделлю певного рівня майстерності. Хоча ця модель очевидно «помилкова», той факт, що з її допомогою можна прогнозувати закономірності в результатах гри в гольф, вражає.

Основний практичний висновок, який можна винести, погодившись з припущенням, що модель, побудована на принципі певного рівня майстерності, дозволяє дати досить близьку до реальності оцінку гри гольфіста, в тому, що в такому випадку дуже легко опинитися «обдуреним випадковістю».

Опубліковано у: Знання: Букмекерські вилки, Поради гравцям, Вибір редакції
Теги:
Поділитися:
Схожі записи
Стратегія ставок на футбол в режимі live
22:04, 4 Квітня 2019
Інформація про ставки типу «грошова лінія»: що це таке?
22:04, 4 Квітня 2019
Розрахунок сум ставок як мірило успіху на ринку
22:04, 4 Квітня 2019
Коментарі
Написати коментар
Повна версія