Как изменилась эффективность рынка ставок на футбол в БК Pinnacle
Букмекерская компания Pinnacle широко известна своими высокоэффективными рынками ставок, в особенности на популярные виды спорта, к которым относится и футбол. Но становятся ли они со временем еще эффективнее? Читайте дальше, чтобы узнать ответ!
Для начала напомним еще раз, что такое эффективность рынка. Если выражаться простым языком, то, называя рынок эффективным, мы подразумеваем, что его коэффициенты максимально точно отображают истинные вероятности результатов событий.
Иногда обывателю достаточно сложно усвоить это понятие. Дело в том, что, говоря о вероятности события, мы держим в уме, что на самом деле оно может закончиться с двумя возможными результатами – победой (100%) нашей ставки или же поражением (0%). Тогда получается, что любой коэффициент по определению является неточным, поскольку не отображает реальный результат.
На самом деле надо представить себе некую модель, в котором итоговый результат является лишь одним из вариантов развития событий. Знание же о том, какой из множества вариантов состоится в действительности, скрыто природой неопределенности.
Представьте, что можно было бы множество раз переигрывать одни и те же футбольные поединки. В этом случае мы могли бы наблюдать перераспределение результатов – иногда была бы победа дома, в другой раз – ничья или победа в гостях. От того, насколько верно предполагаемые вероятности отображают это распределение, и зависит точность, или эффективность, соответствующих коэффициентов.
Как измерить эффективность рынка?
Увы, но реальные результаты – это единственное, чем мы располагаем при определении точности (эффективности) рынка ставок на футбол в букмекерской компании Pinnacle (как, разумеется, и в любой другой БК). При этом истинные вероятности мы никогда не узнаем. Однако у нас существует возможность воспользоваться так называемым скоринговым правилом, которое измеряет точность вероятностных прогнозов.
К таким скоринговым правилам относятся показатель Бриера, показатель неосведомленности (связанный с энтропией Шеннона, иначе говоря, информацией, заложенной в результатах случайной переменной), а также показатель успешности вероятностного прогноза в ранжированных категориях (RPS). О RPS и пойдет в дальнейшем речь в нашем материале.
Понимание RPS
Итак, показатель успешности вероятностного прогноза в ранжированных категориях (RPS) — это скоринговое правило для вероятностных результатов, учитывающее расстояние или порядок. При определении эффективности котировок футбольных ставок это означает, что мы принимаем условие, согласно которому ничья ближе к победе на своем поле, чем к победе на выезде (и наоборот для поражений). RPS высчитывается по следующей Формуле:
Здесь r — это количество потенциальных результатов (для рынка ставок на футбольные матчи это значение равно 3, то есть победа, ничья или поражение), а pj и ej — это вероятностные прогнозы и наблюдаемые результаты в точке j. В качественном отношении показатель RPS представляет собой сумму квадрата разности суммарных распределений прогнозов и наблюдений. Ее значение находится в пределах от 0 (при совершенном прогнозе) и 1 (при полностью несовершенном прогнозе).
Чтобы проиллюстрировать эту формулу, рассмотрим такой пример. Возьмем справедливые коэффициенты (то есть без учета букмекерской маржи) на матч английской Премьер-Лиги «Манчестер Юнайтед» — «Манчестер Сити», состоявшийся 8 марта 2020 года. Согласно средним коэффициентам рынка значения вероятности домашней победы, ничьей и выездной победы (ph, pd и pa) составили 0,211, 0,245 и 0,544 соответственно. В этом матче победу одержал «Манчестер Юнайтед», поэтому коэффициент eh равен 1, а ed и ea равны 0.
Сначала нужно высчитать суммарные прогностические вероятности. Как это сделать, показано в Таблице 1:
В Таблице 2 делаем то же самое для результатов:
Теперь посчитаем квадрат их разности для каждого возможного результата, а затем найдем сумму и разделим ее на 2 (так как r – 1 = 2, если r равно 3) – см. Таблицу 3:
Как видим, показатель RPS для этого матча оказался достаточно высок – 0,459 – поскольку его результат (победа «Манчестер Юнайтед», изначально не являвшегося фаворитом) оказался самым непредсказуемым. В случае, если бы победил «Манчестер Сити», RPS составил бы только 0,126.
Явным преимуществом использования скорингового правила, учитывающего расстояние, является возможность генерировать меньший показатель для ничьих при равных по силе командах. «Бернли» с «Тоттенхэмом» сыграли вничью 7 марта. При этом шансы каждой из команд на победу оценивались одинаково (35,7 %). Показатель RPS составил 0,127, хотя ничья считалась наименее вероятным из трех возможных результатов (28,7 %). Если бы одна из команд победила, показатель RPS для этого матча составил бы 0,270.
Несмотря на то что ничья была наименее вероятна, интуитивно это кажется обоснованным значением как минимум с точки зрения скорингового правила и соответствия вероятностей модели (в данном случае, коэффициентов) реальным событиям. Однако подобная аргументация считается спорной.
Показатель RPS как оценка эффективности рынка
Теоретически эффективность коэффициентов ставок на рынке можно оценить, подсчитав средний показатель RPS для выборки матчей. Чем ниже оценка, тем эффективнее рынок и точнее модель коэффициентов. Мы сделали расчеты для большой выборки (более 162 тысяч) футбольных матчей, прошедших по всему миру с 2007 по 2017 г. При этом средний показатель RPS для коэффициентов линии закрытия БК Pinnacle составил 0,2046.
Без какой-либо точки привязки сложно понять, что значит это число и как с его помощью оценить точность коэффициентов ставок. Известно, что в масштабах отдельно взятого матча эти коэффициенты «неверны» с точки зрения детерминизма. Но насколько? Идеальная оценка равна 0, но, разумеется, ни одна модель коэффициентов не сможет достичь такого значения.
Самая простая модель коэффициентов, которой можно воспользоваться, – это обычное угадывание. Используя генератор случайных чисел в Excel, мы рандомизировали вероятности для домашней победы, ничьей и выездной победы, после чего посчитали коэффициенты RPS на основе того же набора фактических результатов матчей. Средний показатель RPS при моделировании методом Монте-Карло составил 0,293. Очевидно, что как прогностическая модель коэффициенты линии закрытия БК Pinnacle статистически гораздо лучше произвольного угадывания (на 451 пункт среднеквадратического отклонения).
Однако все любители футбола знают, что домашняя победа куда вероятнее ничьей или победы на выезде, по крайней мере, в большинстве случаев. Изучение архивов данных показывает, что около 45 % матчей заканчиваются домашней победой, а примерно 27 % и 28 % – ничьей и выездной победой соответственно. Если попробовать применить эти цифры к каждому матчу выборки, то показатель RPS опустится до значения 0,225, которое превосходит угадывания, но все равно значительно уступает по точности коэффициентам линии закрытия БК Pinnacle.
Соотношение коэффициентов линии открытия и линии закрытия БК Pinnacle
Как соотносятся коэффициенты линии открытия и линии закрытия Pinnacle? Многие на уровне интуиции понимают, что чем более устоявшимся является рынок ставок, что выражается в повышенной активности и большем обороте средств, представляющих различные взгляды, тем точнее становятся коэффициенты.
Средний показатель RPS для выборки матчей составил 0,2059. Это выше, чем для коэффициентов линии закрытия, хотя разница несущественная. Свидетельствует ли такая незначительная разница об увеличении эффективности коэффициентов между линиями открытия и закрытия рынка?
Это можно проверить, в частности, определив, насколько удачными или неудачными являются эти значения. Не стоит забывать, что исход матча во многом зависит от удачи; это явление называется случайностью, или статистической неопределенностью. Невозможно каждый раз получать один и тот же результат. Фактические результаты представляют собой лишь один из 3 в 162 282 степени возможных вариантов развития событий.
Вместо того чтобы использовать фактические результаты, попробуем их рандомизировать, определив вероятности согласно коэффициентов линий открытия и закрытия БК Pinnacle, чтобы получить диапазон ожидаемых показателей RPS с помощью моделирования методом Монте-Карло.
Для коэффициентов линии закрытия ожидаемый (то есть средний) показатель RPS составил 0,2045 со среднеквадратическим отклонением 0,0003. Это значит, что примерно две трети значений показателя RPS для модели коэффициентов линии закрытия находятся в пределах от 0,2042 до 0,2048. То же верно и для показателя RPS фактических результатов. Примерно 99,8 % находятся в пределах трех пунктов среднеквадратического отклонения, т. е. от 0,2036 до 0,2054. Схожим образом среднее значение коэффициентов линии открытия составило 0,2056 со все тем же среднеквадратическим отклонением 0,0003.
Поскольку разница между фактическими показателями RPS для коэффициентов линий открытия и закрытия составляет 0,13 (или свыше четырех пунктов среднеквадратического отклонения), это свидетельствует о статистически значимой разнице между двумя моделями коэффициентов, из чего можно сделать вывод, что коэффициенты линии закрытия и вправду эффективнее (точнее), чем коэффициенты линии открытия. Таким же образом применение одностороннего t-критерия к фактическим показателям RPS матча для коэффициентов линий открытия и закрытия обеспечивает p-значение 0,001 (что приблизительно равно немногим более чем трем пунктам среднеквадратического отклонения).
Как изменилась точность рынков футбольных ставок БК Pinnacle?
Так стали ли со временем более эффективными коэффициенты ставок на футбол от букмекерской компании Pinnacle? Мы распределили показатели RPS по годам и отобразили полученную тенденцию на приведенной ниже Диаграмме 1:
Несмотря на значительную дисперсию в смежных годах, эффективность постепенно все же повышается. При этом коэффициенты линии закрытия опережают по темпам роста эффективности коэффициенты линии открытия. Средний показатель RPS для коэффициентов линии открытия отображает точность модели, по которой БК Pinnacle устанавливает коэффициенты, в то время как средний показатель RPS для коэффициентов линии закрытия отображает все модели клиентов БК Pinnacle в дополнение к ее собственной. В то же время это свидетельствует и о росте числа клиентов БК Pinnacle.
Эффективность футбольных лиг
Бытует мнение, что получить выгоду легче на не слишком популярных и потому менее эффективных рынках, чем на тех, где размещает ставки большинство игроков. Это на самом деле так, тем более, что БК Pinnacle применяет различные ограничения ставок для разных лиг с целью управления собственными рисками.
По не самым популярным чемпионатам гораздо меньше информации, а также им свойственна большая неопределенность и дисперсия, поэтому букмекерская компания Pinnacle не дает клиентам злоупотреблять повышенной погрешностью, ограничивая лимиты ставок. Для какого-нибудь низшего дивизиона одной из стран Европы ограничение может достигать всего лишь нескольких тысяч рублей. Зато на матчи топовых лиг или еврокубков можно поставить и суммы, доходящие до трех миллионов рублей.
На Диаграмме 2 данные из Диаграммы 1 разбиты на категории популярных и не слишком популярных футбольных соревнований. Разделяя лиги на «большие» и «малые», мы руководствовались субъективными критериями. В «популярную» категорию вошли элитные дивизионы Англии, Шотландии, Испании, Италии, Германии и Франции, а также Лига чемпионов, Лига Европы, Чемпионат Европы и Чемпионат мира, матчи которых составили примерно 15 % выборки.
Выделим два момента. Во-первых, у «популярных» рынков средний показатель RPS ниже, чем у «непопулярных». При этом статистически разница между ними огромная. Для коэффициентов линий открытия и закрытия шанс такого исхода по чистой случайности равен примерно 1 к 50 миллиардам. Во-вторых, «популярные» рынки продемонстрировали тенденцию к снижению показателя RPS, а значит, и к повышению эффективности за гораздо меньший временной промежуток. В то же время показатели «непопулярных» рынков почти не изменились.
Чем обусловлена более стремительная тенденция больших рынков к повышению эффективности? Это можно объяснить тем, что интерес клиентов к «большим» рынкам растет быстрее, чем к «малым». Что неудивительно ввиду увеличивающегося количества рекламы ставок на спорт в Интернете и на телевидении, сосредоточенной на крупнейших соревнованиях.
Однако влияет ли вообще повышенная эффективность на более низкий средний показатель RPS больших рынков? Это может быть одним из возможных объяснений. Другое же состоит в том, что в «больших» соревнованиях чаще выделяются популярные фавориты и аутсайдеры с более высокими коэффициентами. Иными словами, у них выше дисперсия по трем возможным результатам матча.
Эпистемическая неопределенность
Допустим, составленная модель на матч прогнозирует вероятности 45 %, 27 % и 28 % для домашней победы, ничьей и гостевой победы соответственно. Если эта модель правильная, ожидаемый показатель RPS составит 0,225. Статистическая неопределенность, обусловленная случайными воздействиями во время матча, указывает на то, что фактический показатель составит 0,191 (для домашней победы), 0,140 (для ничьей) или 0,360 (для гостевой победы), но, если такие матчи переигрывать бесконечное количество раз, средний показатель RPS составит 0,225.
Предположим другие соответствующие показатели модели – 70 %, 20 % и 10 %. Дисперсия по трем вероятным результатам будет больше, как и дисперсия по трем возможным показателям RPS (домашняя победа — 0,05, ничья — 0,25, выездная победа — 0,65), но ожидаемый показатель RPS будет меньше — 0,150.
Если допустить, что обе предложенные модели правильные, показатель RPS будет ниже при большей определенности хотя бы одного конкретного результата. Таким образом, становится очевидным, почему средний показатель RPS для больших рынков ниже, чем для малых. На «популярных» рынках 5 % коэффициентов нашей выборки подразумевали вероятность победы свыше 70 %. На «непопулярных» таких коэффициентов было лишь 2 %. Точно так же более 20 % коэффициентов на «больших» рынках прогнозировали победу с вероятностью ниже 20 %, а на «малых» – только 13 %.
Если иметь в виду фаворитов «популярных» соревнований, проходивших в период выборки, таких как мадридский «Реал», «Барселона», «Ювентус», «Манчестер Сити», «Челси», «ПСЖ» и «Бавария», эта разница кажется обоснованной. В «больших» соревнованиях больше популярных фаворитов, и соответственно, больше андердогов. Поскольку коэффициенты отображают асимметричность предполагаемых вероятностей, они имеют более неравное среднее значение в «больших» соревнованиях.
Давайте теперь предположим, что вторая модель в нашем эксперименте совершенно неверная. Допустим, что истинные вероятности на самом деле 60 %, 25 % и 15 %. В таком случае ожидаемый показатель RPS поднимется до значения 0,190, поскольку в действительности выездных побед больше, чем должно быть согласно модели. Тем не менее ожидаемый показатель RPS все равно будет ниже, чем для матчей, исход которых прогнозирует первая модель. Это создает впечатление более точного набора прогнозов, но нам известно, что это не так. Они лишь кажутся более точными из-за большей дисперсии вероятностей трех возможных результатов для данной выборки матчей.
Систематическую неопределенность (или погрешность) в модели также именуют эпистемической неопределенностью. Сложность заключается в том, чтобы определить имеющуюся степень систематической неопределенности в выборках показателей RPS. Невозможно сделать вывод, основываясь на одних числовых значениях показателей. Коэффициенты «популярных» футбольных рынков могут показаться более точными (и эффективными) в силу меньшего среднего показателя RPS, но мы уже убедились в том, что это не совсем так. Меньший средний показатель RPS не обязательно свидетельствует о более точной модели прогноза
Подведем итоги
Таким образом, показатель успешности вероятностного прогноза в ранжированных категориях (RPS) можно использовать для определения точности вероятностных прогнозов на рынке футбольных ставок. С его помощью можно увидеть, что коэффициенты линии закрытия более эффективны, чем коэффициенты линии открытия, и эта тенденция усиливается от года к году. Кроме того, хоть популярные рынки более эффективны, это в первую очередь объясняется наличием большего числа популярных фаворитов.
В то же время эпистемическая неопределенность, свойственная моделям, с помощью которых прогнозируются вероятности результатов, ограничивает использование этих показателей для оценки точности соответствующих моделей.
Вывод – делать с их помощью суждения об эффективности рынка футбольных ставок надо очень осмотрительно. Главная проблема заключается в том, что нам никогда не будут известны истинные вероятности результатов футбольных матчей – в противном случае мы уже могли бы стать миллиардерами.
Уведомления о новых публикациях этого автора будут приходить на электронный адрес, указанный Вами при регистрации на "РБ"
Уведомления о новых прогнозах этого эксперта будут приходить на электронный адрес, указанный Вами при регистрации на "РБ"
Это значит что вы больше не будете получать уведомления о новых публикациях этого автора на ваш электронный адрес.
Это значит что вы больше не будете получать уведомления о новых прогнозах этого эксперта на ваш электронный адрес.