Почему средние показатели могут искажать прогнозы? Модус и медиана: важные понятия в беттинге
Содержание
Самый популярный метод обработки данных в беттинге — использование средних показателей, но является ли этот метод самым полезным? Модус и медиана зачастую лучшая альтернатива, поэтому их понимание имеет решающее значение для успешности ставок.
Проблема средних показателей для игроков в букмекерских конторах
Из-за простоты многие игроки используют средние показатели для оценки команды в статистическом выражении. Но многие ли знают об ограниченности этого метода?
Читайте также:
- Выбрать лучшего букмекера для ставок на спорт
- Прогнозы на сегодня от профессионалов
- Как выбрать букмекерскую контору – советы «РБ»
- Бездепозитные бонусы букмекерских контор
- Как не проиграть первую ставку – 6 советов новичку
К примеру, делая ставки на общий тотал голов в футболе, игроки могут полагать, что высчитав среднее количество мячей, забитое за предыдущие игры, они могут предсказать точное количество голов, которое ожидается в предстоящем матче. Но действительно ли здесь уместно использование средней результативности?
В качестве примера давайте рассмотрим количество голов, забитых в английской Премьер-лиге, по сравнению с испанской Примерой в сезоне 2013/2014. Среднее количество голов за игру в этих лигах составило 2.77 и 2.75 соответственно. Эти данные могут привести игрока к мысли, что в Ла Лиге матчи чаще играются на тотал меньше 2.5, чем в АПЛ. Тем не менее это не так — 48.4% матчей в АПЛ заканчиваются на ТМ2.5, по сравнению с 47.3% в Примере.
Хотя общее распределение количества голов схоже, в АПЛ чаще всего забивают два гола за матч, а в Примере этот показатель составляет 3 гола, как можно понять по изображению ниже. Средний показатель маскирует и скрывает от нас этот факт.
Почему так происходит? Хотя средние показатели дают нам общую картину результативности, они не показывают, как распределяются голы.
Другой пример опасности использования средних показателей — при ставках на гандикапы в матчах «футбольных карликов», которые считаются мальчиками для битья в каждой отборочной кампании. Но так ли они плохи, какими их пытаются представить? Среднее количество голов в их матчах может достигать больших показателей, однако эта цифра может возникнуть в результате редких, но очень крупных поражений команды. В итоге игроки ошибаются, часто переоценивая ожидаемое количество голов в матче.
Ниже мы рассмотрим альтернативы средним показателям — модус и медиану, и используем три набора чисел и два сценария, при которых средний показатель не даст адекватную информацию.
Рассмотрим следующие наборы чисел (в каждом из них средне арифметическое равняется 5).
Набор А: 4, 5, 5, 5, 6
Набор B: 3, 4, 4, 4, 10
Набор C: 3, 4, 5, 6, 7
Первый сценарий: наличие отклонений в меньшую или большую сторону
Хотя все три набора имеют одинаковое среднее арифметическое и сумма чисел в каждом наборе равняется 25, они имеют совершенно разное распределение.
Набор А можно назвать симметрично распределенным. Два числа из пяти одинаково отклоняются в большую и меньшую стороны от среднего значения: 4 меньше 5, а 6 больше 5 на одинаковую величину.
Средняя величина идеально подходит для использования в случаях с симметричным распределением, когда отклонения от среднего значения одинаковы и происходят одинаково часто, и средняя величина находится в середине множества значений.
В противоположность подобному распределению Набор В насчитывает четыре числа меньше среднего и только одно выше. Это можно назвать асимметричным распределением.
При использовании большой базы данных игроки могут проверить пригодность среднего показателя для анализа с помощью других методов измерения — модуса и медианы.
Медиана — это значение, которое лежит в середине распределения, в порядке возрастания или убывания. В наборах А и В это число 5 и 4 соответственно.
Модус — это наиболее часто повторяющаяся величина, и в наборах А и В это также соответственно 5 и 4.
Симметричное распределение должно иметь одинаковые среднюю, медиану и модус. Разница между двумя последними величинами и средней в Наборе В говорит о том, что это несимметричное распределение, и поэтому средняя не является идеальной величиной в данном случае.
Второй сценарий: разные распространения
Два набора из нашего примера могут быть оба симметрично распределены, но не в равной степени распространяться. К примеру, Набор С симметрично распределен, как и Набор А, потому что они имеют равные величины выше и ниже средней, а также отклонение от средней одинаково в обе стороны в обоих наборах.
Тем не менее хотя средняя арифметическая в обоих наборах 5, использование средней величины является более подходящим для Набора А, поскольку он содержит большее количество чисел, равных средней величине. Разница между двумя этими наборами лежит в дисперсии в значениях каждого набора. Поэтому мы должны измерить и эту дисперсию.
Чтобы сделать это, игроки должны высчитать диапазон и стандартное отклонение. Диапазон — это разница между максимальным и минимальным значениями, вычислить диапазон совсем не сложно. С другой стороны, стандартное отклонение является более сложным показателем. В общих словах, применительно к данной статье, эта величина отражает изменение значений в наборе относительно средней величины.
Набор А и С имеют диапазоны 2 и 4 соответственно, в то время как их стандартные отклонения составляют 0.71 и 1.58. Раз обе эти величины выше в Наборе С, мы можем сделать вывод, что распространение в ней выше.
Вывод
Понимая ограниченность средних показателей, перекос распределения и различия в дисперсии, игроки окажутся в более выгодном положении, используя эти методы в прогнозировании.
Спасибо за Вашу помощь!
Мы ценим Вашу бдительность!
Уведомления о новых публикациях этого автора будут приходить на электронный адрес, указанный Вами при регистрации на "РБ"
Уведомления о новых прогнозах этого эксперта будут приходить на электронный адрес, указанный Вами при регистрации на "РБ"
Это значит что вы больше не будете получать уведомления о новых публикациях этого автора на ваш электронный адрес.
Это значит что вы больше не будете получать уведомления о новых прогнозах этого эксперта на ваш электронный адрес.
Данный вид анализа наиболее пригоден для хорошего экспресса на тур одной из лиг ТОП-5, но никак ни на матчи ЛЧ. Здесь совершенно другие задачи и мотивация футболистов.
Когда я, будучи молодым, работал в одном из пунктов приема одной из популярных контор, у меня был постоянный клиент, профессор математики из университета напротив. Так вот у него были методы гораздо поизащреннее этого вашего графика).Сказать , что он выигрывал? Да нет, скорее напротив, это было похоже на наркоманию, т к, его статус и образование не позволяло ему признать ошибки его методов мат анализа. моё мнение, что каждый матч уникален (что касается тенниса) и сложно прицепить эти графики к многим спортсменам , процент из которых ставит на себя
Спасибо за отзыв!