Загальновизнано, що перемогти букмекера, особливо такого, як Pinnacle, – дуже складне завдання. Але що у в цьому такого важкого? Чи може погляд на речі з точки зору букмекера допомогти зрозуміти, наскільки вправні ви повинні бути, щоб виграти на спортивних ставках? Читайте далі, щоб дізнатися про це.
Чи можна виміряти, наскільки вправні повинні бути беттори, щоб перемогти букмекера? Як завжди, ми маємо на увазі на просте везіння, а довгострокову очікувану прибутковість за допомогою принципів вартісного парі.
Очевидно, ми знаємо, що для досягнення такого результату ми повинні подолати маржу букмекера. Той факт, що лише невеликому відсотку гравців вдається досягти цього, свідчить про те, що це досить складне завдання, навіть коли маржа на популярні ринки становить усього 2%.
Крім того, є кілька інструментів Excel, які можуть служити для виміру статистичних шансів досягнення прибуткової очікуваної цінності, а також з їхньою допомогою можна судити про те, як ці показники можуть розподілятися з урахуванням певних припущень про ставки.
Однак цього разу ми маємо намір дослідити саме те, як положення «бути кращим, аніж букмекер» виглядає з точки зору невизначеності. Саме парі, як ми знаємо, є невизначеною справою, навіть для найкращих прогнозистів. Наскільки ми повинні піти від цієї невизначеності, щоб подолати маржу і стати довгостроковим переможцем?
Завдяки спробам імітувати відповідь, стає зрозуміло, наскільки точний такий букмекер, як Pinnacle, насправді, і чому він повинен бути таким постійно, щоб залишатися з прибутком. Це і є асиметрія букмекерства.
Є два типи невизначеності. По-перше, існує алеаторна або статистична невизначеність. Це відноситься до властивої невизначеності, обумовленої ймовірнісною мінливістю. Повторіть процес багато разів, наприклад, кидаючи монету, і тонкі варіації в початкових умовах приведуть до різних результатів. Ці відмінності залишаються невідомими заздалегідь. Алеаторну невизначеність неможливо зменшити.
Знайдуться і такі, хто буде стверджувати, що це просто наслідок обмеженої інформації та недостатньої обчислювальної потужності. Якби ми могли точно знати всі початкові умови, ми могли б з упевненістю передбачити точні результати.
У практичному плані складність цих систем зводить такий збір інформації до рівня неможливого. Однак, можливо, більш важливо те, що ймовірнісна, а не детермінована природа реальності в крихітних масштабах означає, що навіть теоретично це завдання приречене на провал.
Саме з цієї причини є сенс говорити про «справжню» ймовірність результатів і не обманювати себе, вважаючи їх детермінованими (або 0%, або 100%). Звичайно, в спорті, на відміну від підкидання монет або кидка кісток, ми не знаємо і не можемо знати ці «справжні» ймовірності, але є сенс розглядати нашу задачу так, ніби вони існують.
Другий тип невизначеності – це епістемічна або модельна невизначеність, що виникає через неповне розуміння того, що ми намагаємося моделювати. Епістемічна невизначеність може бути зменшена за допомогою додаткових знань про моделі.
Мета кількісної оцінки невизначеності полягає в тому, щоб звести епістемічну невизначеності до алеаторної, хоча на практиці через складність системи та ймовірнісної природи реальності межа між ними може бути нечіткою.
Різниця між двома типами невизначеності добре показана в одному з досліджень, яку здійснив експерт БК Pinnacle:
«Припустимо, ви даєте футбольній команді 60% ймовірності перемоги, ставите на неї гроші, але вона програє. Чому ви програли свою ставку? Можливо, ви мали слушність у своїй оцінці, але вам не пощастило – відбулася подія з 40%-ою ймовірністю. Це процесна (алеаторна) невизначеність – хороша ставка, але невдалий результат. З іншого боку, можливо, ви помилилися в своїй оцінці – справжня ймовірність могла бути 50%, або 30%, або навіть 1%. Ви зробили ставку, яку вважали хорошою, але насправді це була погана ставка. Це параметрична (епістемічна) невизначеність. Оскільки справжня ймовірність невідома, дуже важко обчислити, наскільки ваші результати – як хороші, так і погані – обумовлені невизначеністю процесу, а не невизначеністю параметрів».
В умовах ставок алеаторна невизначеність буде однаковою для всіх. Одні і ті ж події відбуваються в будь-якому окремо взятому спортивному змаганні, з тими ж змінними. Кожен гравець живе однією і тією ж історією.
Досить легко моделювати алеаторну невизначеність за допомогою простого генератора випадкових чисел. Припустимо, у нас є змагання, де ймовірність перемоги і поразки 50 на 50, з чесними шансами (тобто з коефіцієнтом 2.00). Для моделювання алеаторної невизначеності ми можемо просто використовувати генератор випадкових чисел для виведення чисел між 0 і 1. Нижче 0,5 – це виграшна ставка. Вище – це програшний варіант. Розподіл результатів (виграшних і програшних ставок) буде ставитися до біноміального.
Моделювання епістемічної невизначеності є трохи проблематичнішим, оскільки абсолютно не очевидно, яким буде розподіл пов’язаних з нею помилок. У згаданому дослідженні використовувався бета-розподіл для моделювання, але ми вдамося до розподілу Гаусса. Крім того, припустимо, що розподіл епістемічних помилок зосереджений навколо істинної ймовірності результату. Звичайно, якщо систематичні помилки присутні, такий метод не можна вважати досить правильним.
Для букмекера, принаймні, це є цілком обґрунтованим припущенням, оскільки для великих спортивних ринків ставки Pinnacle дуже ефективні. Це означає, що в середньому вони дуже точно відображають ймовірності істинного результату, навіть якщо в індивідуальному порядку будуть допущені помилки. Це також правильно для гравців, але, можливо, меншою мірою.
Щоб змоделювати ефект епістемічної невизначеності, ми створимо серію з 1000 гіпотетичних ставок, де справжня ймовірність виграшу кожної ставки становить 50%. Для кожної ставки наша гіпотетична прогнозна модель показує певну епістемічну помилку в оцінці тих справжніх ймовірностей виграшу, розмір яких визначається шістьма різними стандартними відхиленнями: 0%, 1%, 2%, 3% 4% і 5%. Наприклад, при стандартному відхиленні в 1% трохи більше двох третин модельованих «істинних» ймовірностей виграшу буде перебувати між 49% і 51%, а близько 95% – між 48% і 52%.
Для великих стандартних відхилень розкидання цих «справжніх» ймовірностей виграшу, отриманих за допомогою прогнозної моделі, буде ще більше, як показано на діаграмі 1 нижче. Очевидно, що за стандартного відхилення 0% всі ймовірності виграшу дорівнюватимуть 50%, тому ця лінія не відображена. Чим ширший розподіл, тим більша епістемічна невизначеність.
З графіку видно, що хоча кожний з цих розподілів ймовірності виграшу є ефективною модель – середнє значення завжди становить 50% – величина епістемічної невизначеності є змінною.
Інвертування «істинних» ймовірностей виграшу надасть нам розподіл коефіцієнтів. Через зворотну залежність між імовірністю виграшу і коефіцієнтами, вони будуть логарифмічно нормально розподілені.
У вибірці з 1000 ставок це означає, що змодельовані «справжні» коефіцієнти, як правило, будуть коливатися між 1,88 і 2,13, 1,78 і 2,28, 1,69 і 2,46, 1,60 і 2 66, а також 1,52 і 2,89 для стандартних відхилень 1%, 2%, 3%, 4% і 5% відповідно. Це показано на діаграмі 2:
Давайте використаємо цю модель епістемічної невизначеності в оцінці справжніх коефіцієнтів, щоб провести умовне змагання між букмекером і гравцем. Для кожної ставки букмекерська контора публікує те, що вона вважає істинними коефіцієнтами, зі своєю маржею 2,5%, що знижує ціну ставки. Наприклад, вони виставили б коефіцієнт 1.95, якби думали, що справжня ціна дорівнює 2.00. У вибірці з тисячі ставок ці коефіцієнти будуть варіюватися в залежності від розподілу, показаного вище.
У гравця є інша модель, і він використовує її для оцінки істинних коефіцієнтів. Якщо опубліковані букмекером коефіцієнти вищі, ніж оцінка гравця, то гравець робить ставку в 1 одиницю. Якщо ні, то немає і ставки.
Для розрахунку ставок справжні коефіцієнти для кожної ставки, невідомі як букмекерові, так і беттору, складають 2.00, і генератор випадкових чисел використовується для визначення результату. Як вже пояснювалося раніше, будь-яке відхилення тут є наслідком алеаторної невизначеності.
Таке змагання було повторено з використанням моделювання Монте-Карло 10 тисяч разів. Результати представлені в Таблиці 1 нижче. Спочатку подивимося на середнє число ставок, зроблених для кожної з 36 різних пар епістемічної невизначеності «букмекера-беттора». Чим більша епістемічна невизначеність (показана в заголовках рядків і стовпців) для беттора або букмекера, тим імовірніше, що різниця між двома моделями буде більшою, ніж розмір маржі, отже, тим імовірніше, що ставка буде виграшною.
Очевидно, що там, де і букмекер, і беттор діють ідеально, ставок не буде, оскільки букмекерська контора завжди буде публікувати коефіцієнт 1.95, а гравець завжди буде знати, що це менше, ніж справжня ціна.
Таблиця 2 показує середню (очікувану) прибутковість, яку вдалося досягти гравцеві для кожної пари невизначеності. Пам’ятайте, що чим менше стандартне відхилення, тим нижча епістемічна невизначеність і тим краща модель.
Не дивно, що коли букмекерська контора діє ідеально і прогнозує ймовірність кожної ставки точно, то незалежно від того, наскільки хороший гравець, він втратять суму, еквівалентну розміру маржі (2,5%). Невелика мінливість навколо цього числа є просто наслідком алеаторної невизначеності. Більш точне моделювання Монте-Карло її б знизило.
Також зверніть увагу, що там, де модель беттора краща (менш невизначена), ніж модель букмекера, цього достатньо, щоб отримати очікуваний прибуток. Але є також і щось дуже загадкове. Коли модель букмекера погана, гравець все ще може отримати очікуваний прибуток, навіть якщо його модель гірша. Наприклад, якщо епістемічна невизначеність букмекера має стандартне відхилення 3% в ймовірності виграшу, то гравець все ще може розраховувати на отримання +0.68%, коли його модель має стандартне відхилення невизначеності 5%. Це положення здається абсурдним.
Щоб вирішити цей парадокс, ми повинні пильно подивитися, як було побудовано наше змагання. Як і на будь-якому ринку, букмекерська контора виставить свою ціну. Потім гравець повинен вирішити, чи прийме він виклик, роблячи це тільки в тому випадку, якщо опубліковані котирування вищі, ніж його власні оцінені «справжні» коефіцієнти. Якщо це станеться, букмекерська контора вже не зможе відкликати пропозицію про ставку.
У нашому модельному сценарії, якщо будь-яка епістемічна невизначеність присутня, 50% помилок букмекера будуть показувати «справжні» коефіцієнти, які більші, ніж реальні справжні коефіцієнти (2,00), а решта 50% – навпаки, менші. Аналогічно, 50% помилок гравця будуть або більшими, або меншими 2.00.
Ми ніколи не зможемо дізнатися, що букмекер дійсно вважає «істинними» коефіцієнтами своїх ринків
Однак, коли коефіцієнти букмекера менші, ніж 2.00, існує менше можливостей для того, щоб коефіцієнти беттора були ще меншими, таким чином, припускаючи розміщення ставки. І навпаки, існує більше можливостей для розміщення ставки, коли коефіцієнти букмекера занадто великі.
Ця асиметрія призводить до більшої частки позитивних очікуваних вартісних ставок у порівнянні з негативними. Чим більша епістемічна невизначеність, тим більша асиметрія. Коли і букмекер, і гравець показують 2%-ве стандартне відхилення в невизначеності, 56% ставок мають позитивне очікуване значення, а середній коефіцієнт ставки становить 2,01. Коли стандартне відхилення в невизначеності зростає до 5% для обох, 68% ставок укладаються з коефіцієнтом більше 2,00 з середнім значенням 2,10.
Якщо замість цього ми запустимо іншу модель, в якій і гравець, і букмекер повинні взаємно домовитися про те, чи слід брати участь в ставці з коефіцієнтом, опублікованими третьою стороною, ця асиметрія значною мірою зникає. Тоді вони обидва також конкурують з третьою стороною і її моделлю епістемічної невизначеності. Якщо епістемічна невизначеність цієї третьої сторони мала, то і букмекер, і гравець, якщо вони мають однаково невизначені моделі, будуть втрачати еквівалент маржі, яка встановлена третьою стороною.
Всі ці висновки ґрунтуються на одному важливому та, ймовірно, нереалістичному припущенні. Припускається, що букмекерська і бетторстка моделі повністю незалежні один від одного. Насправді це малоймовірно, оскільки розробники моделей, як правило, використовують аналогічні дані та аналогічні алгоритми прогнозування.
Якщо букмекер заходить занадто далеко у своїй оцінці справжніх коефіцієнтів, тобто реальний шанс, що гравець теж зробить це, і навпаки. Деякі гравці також можуть бути частково прив’язані до ціни букмекера.
Будь-яка модельна кореляція між букмекером і гравцем знизить очікуване значення для гравця і ускладнить його успіх.
Проте ця модель епістемічної невизначеності дає ключ до розуміння того, наскільки хорошим повинен бути типовий букмекер, щоб залишатися прибутковим, навіть маючи перевагу у вигляді власної маржі. Оскільки букмекери не можуть скасувати ставки після того, як гравець прийняв їх, вони повинні бути впевнені, що вони зменшили свою епістемічну невизначеність до мінімуму.
Мінімізація епістемічної невизначеності і максимізація ефективності шансів – основа букмекерського бізнесу
Ми ніколи не зможемо дізнатися, що букмекер дійсно вважає «істинними» коефіцієнтами своїх ринків. Ми також не можемо знати, які реальні справжні котирування, обчислені в результаті цих оцінок. Отже, ми не можемо точно визначити, яка епістемічна невизначеність існує на ринку.
Однак ми можемо зробити обґрунтоване припущення про те, що коефіцієнти лінії закриття букмекера (без урахування маржі) представляють собою реальні справжні коефіцієнти. Потім різниця між первинними коефіцієнтами і коефіцієнтами лінії закриття буде служити мірою того, наскільки велика була помилка моделі.
Взявши вибірку попередніх і остаточних коефіцієнтів БК Pinnacle для футбольних матчів англійської Прем’єр-ліги цього сезону, видаляючи маржу і стандартизуючи коефіцієнти закриття до 2,00, стандартне відхилення ймовірності виграшу, обчислене на основі підсумкових котирувань, становить трохи більше 2%. Це ближче до нижнього краю наших змодельованих стандартних відхилень, що знову доводить, що модель БК Pinnacle досить ефективна для мінімізації епістемічної невизначеності.
Щоб перемогти букмекера, гравці повинні бути принаймні так само вправні, з асиметрією на їхньому боці. Якщо епістемічна помилка БК Pinnacle в матчах з ймовірністю виграшу 50% становить всього 2%, то у гравця не так багато можливостей для подолання такого стану справ. Очевидно, що беттори можуть збільшити ймовірність виграшу ставки на свою користь, застосовуючи мінімальні очікувані порогові значення перед розміщенням ставок в БК Pinnacle. Але будь-яка кореляція моделей ускладнить це завдання.
Ми вже говорили, що обіграти букмекера, і зокрема БК Pinnacle, – завдання не з легких. І тепер у нас є ще один доказ цього. Встановлюючи коефіцієнти, букмекер, на відміну від своїх клієнтів, не має можливості вибирати, яка ставка буде хорошою. Йому доводиться щоразу ризикувати своїми коштами і сподіватися, що його експерти все зробили правильно. Для БК Pinnacle мінімізація епістемічної невизначеності і максимізація ефективності шансів – основа букмекерського бізнесу.