Как работают наши прогнозы на НХЛ

Sape plugin info: Не заполнено поле - sape user в параметрах плагина.

В 2021 году мы добавили хоккей в список видов спорта, которые FiveThirtyEight прогнозирует с помощью рейтинговой системы Эло . Чтобы создать Эло для НХЛ, мы использовали результаты всех игр в истории лиги, начиная с сезона 1916–18 (благодаря данным Hockey-Reference.com ). Система присваивает каждой команде рейтинг силы и использует его, чтобы предсказать, кто выиграет каждую игру, а также кто поднимет Кубок Стэнли в сезоне. Вот как это работает.

Прогнозы на игры

В системе Эло каждая команда получает числовой рейтинг, который действует как ее рейтинг силы в любой момент времени, при этом средний показатель по лиге составляет около 1500. Для игры между командами (A и B) мы можем вычислить Team Вероятность победы А по установленной формуле, основанной на предигровом рейтинге Эло каждой команды:

EloDiff — это рейтинг Эло перед игрой команды А минус рейтинг Эло перед игрой команды Б, а также некоторые поправки:

Корректировка преимущества домашнего льда добавляет хозяевам поля 50 очков. EloDiff, равный 50, был бы хорош для вероятности победы 57,1 процента, поэтому это делает команду хозяев небольшим фаворитом, если бы в остальном обе команды были равны . (В играх на нейтральных площадках корректировка домашнего льда не предусмотрена.)
Корректировка плей-офф , которая умножает скорректированный EloDiff на 1,25 для игр плей-офф, что объясняет наш вывод, что фавориты, как правило, превосходят аутсайдеров с большим отрывом в плей-офф, чем в регулярном сезоне.

После каждой игры команда-победитель получает очки Эло, а рейтинг проигравшей команды падает на такое же количество очков. Мы точно рассчитываем, насколько изменится рейтинг Эло команды после каждой игры по этой формуле:

сдвиг = K * Множитель запаса на победу * Фаворитный множитель перед игрой

К представляет собой К-фактор — фиксированный параметр, определяющий, насколько быстро рейтинги реагируют на результаты игры. Он регулирует, сколько очков Эло перейдёт из рук в руки, если мы не приспособимся к контексту, специфичному для команды. Чем выше К-фактор, тем сильнее рейтинг команды в зависимости от результата каждой отдельной игры.

Настройка К-фактора важна в модели Эло. Слишком высокий К-фактор создает нестабильные рейтинги, которые слишком остро реагируют на недавние результаты. Низкий К-фактор имеет противоположную проблему: он слишком медленно реагирует на изменения качества команды, такие как травмы или изменения в составе, а прогнозы на хоккей не сильно меняются независимо от того, кто в каких играх выиграет. Что касается НХЛ, мы обнаружили, что К-фактор, равный 6 , дает нам точную корректировку рейтингов команд после каждой игры в целях прогнозирования будущих игр.

Наша система Эло НХЛ заботится не только о том, выиграете ли вы, но и о том, как вы выиграете:

победа стоит больше, чем близкая победа. Мы корректируем это с помощью множителя запаса победы , который учитывает убывающую прибыль.

Поскольку мы включаем разницу в рейтингах Эло, нам также необходимо скорректировать этот множитель, чтобы учесть неприятный побочный эффект, известный как автокорреляция . Вообще говоря, автокорреляция — это тенденция временного ряда коррелировать с его прошлыми и будущими значениями. В нашей системе Эло НХЛ это означает, что автокорреляция стремится повысить рейтинги уже хороших команд и подавить рейтинги не очень хороших команд. Поскольку Эло отдает больше внимания более крупным победам, а фавориты, как правило, увеличивают счет в своих победах чаще, чем аутсайдеры (даже в таком виде спорта с низкими показателями, как хоккей), команды с высоким рейтингом могут увидеть, что их рейтинги вырастут непропорционально без корректировки. Поэтому мы умножаем множитель запаса на победу на следующую поправку автокорреляции:формула, которая ограничивает выигрыш Эло для команд, которые были большими фаворитами перед игрой.

Поскольку Эло постоянно корректирует себя, чтобы отточить истинную силу каждой команды, команды также должны набирать больше очков за победу в игре, которую они ожидали проиграть (игры, в которых модель была неверной относительно относительной силы каждой команды), и снижать больше очков за проигрыш в игре, которую, по мнению модели, они должны были выиграть. Мы учитываем это с помощью любимого множителя перед игрой.

TeamWin — это двоичный файл, представляющий результаты игры (1, если команда выиграла игру, и 0, если команда проиграла), а TeamWinProb — это вероятность победы команды перед игрой (см. расчет выше).

Мы экспериментировали с другими настройками Эло, специфичными для НХЛ. Бета -версия нашей модели Эло, например, учитывала обстоятельства результата (то есть, был ли он получен в основное время, дополнительное время или серию пенальти) в самих рейтингах. Это связано с тем, что в НХЛ действует правило « очков проигравших », согласно которому команде присуждается 1 очко за проигрыш в овертайме, но ничего за проигрыш по правилам. Но, несмотря на преобладающее мнение, что хоккей становится случайным по мере продвижения к серии пенальти, наше исследование не обнаружило, с точки зрения Эло, никакой предсказательной силы в различении результатов с одним голом в основное время от овертайма/буллитов - поэтому победа в один гол в Правило дает команде такое количество очков Эло, как и победа в овертайме или в серии пенальти.

Умножьте все приведенные выше факторы вместе, и вы получите количество очков Эло, которые добавляются к предигровому рейтингу Эло победившей команды (и вычитаются из предигрового рейтинга Эло проигравшей команды) после игры. Эти новые рейтинги Эло после игры затем становятся рейтингами Эло перед игрой для следующей игры команды и используются для определения вероятности победы перед игрой в этой последующей игре. Этот процесс повторяется для каждой игры сезона, вплоть до последней игры финала Кубка Стэнли.

Предсезонные рейтинги

Рейтинги Эло команд перед сезоном основаны на их последнем рейтинге Эло после игры в предыдущем сезоне, а также на некотором возврате к среднему показателю по лиге. Согласно нашему прогнозу для НХЛ, команды сохраняют 70 процентов своего рейтинга по сравнению с концом предыдущего сезона и возвращаются на 30 процентов к 1505. 1 Например, «Торонто Мэйпл Лифс» завершили сезон 2020–21 с рейтингом Эло 1541, 2 поэтому они начинают сезон 2021–22 с рейтингом Эло.

Использование восстановленных рейтингов на конец сезона имеет смысл для команд, которые играли в НХЛ в предыдущем сезоне, но что тогда остается командам расширения? Начиная с первого сезона НХЛ 1917–18, мы давали каждой новой команде рейтинг Эло 1380, исходя из предположения, что новые команды начинают игру значительно ниже среднего, но при этом догоняют уже существующие команды. 3 Такой подход имел смысл до сезона 2005–06, который был первым в рамках нового потолка зарплат , введенного в коллективном договоре (положившего конец годовому локауту, который отменил сезон НХЛ 2004–05).). В эпоху ограничения зарплат в НХЛ команды больше не обязательно защищают своих лучших игроков на драфтах расширения — они могут оставить хороших игроков уязвимыми для новой команды, которая может их поймать, если у него более высокий предел зарплат, чем они могут себе позволить. Эпоха команд расширения, которым требовалось несколько лет, чтобы стать конкурентоспособными, закончилась — именно эта динамика позволила «Вегас Голден Найтс» выйти в финал Кубка в первый год существования.

Но если команды расширения в эпоху ограничения зарплат должны иметь более высокий рейтинг, чем предыдущий контрольный показатель 1380, насколько лучше должен быть их рейтинг? (Этот вопрос особенно актуален для Сиэтлского Кракена, который начал играть в том же сезоне, когда мы внедрили нашу модель Эло.) Чтобы ответить на этот вопрос, мы посмотрели на вещи через несколько разных линз, взяв среднее Эло между:

Насколько хорош рынок ставок , по мнению рынка ставок, будет «Вегас» в своем первом сезоне (1433) и насколько хорош «Вегас» на самом деле — согласно базе данных Эло — после своего первого сезона (1517).

Насколько хорошо, по мнению рынка ставок, Сиэтл должен подойти к сезону 2021–22 (1509)

Наше наиболее обоснованное предположение о том, как, по нашему мнению, следует оценивать команды расширения сейчас (1485). Это, по общему признанию, немного произвольно, но оно основано на логике расширения «Голден Найтс» в 2017 году: лига хотела, чтобы ее новые команды не были полным слабаком, в отличие от 1990-х и начала 2000-х годов. 4
Затем мы усреднили эти три подхода вместе, получив рейтинг 1490 для команд расширения в эпоху ограничения зарплат — все еще ниже среднего, но гораздо более конкурентоспособный, чем 1380. Мы используем этот измененный рейтинг в качестве первого предсезонного Эло для команд расширения, созданных после 2005 года. -06, как «Голден Найтс» в сезоне 2015–17 и «Кракен» в сезоне 2021–22.

От рейтингов команд к прогнозам

Теперь, когда у нас есть система, основанная на Эло, которая оценивает качество каждой команды и обновляет данные на основе результатов их игр, нам нужно превратить это в прогноз, который учитывает текущее состояние лиги и рассчитывает вероятность каждой команды выйти в плей-офф или выиграть турнир. Кубок Стэнли. Для этого мы реализуем симуляцию Монте-Карло , используя случайность для симуляции каждой (оставшейся) игры в сезоне и плей-офф тысячи раз, отслеживая, что происходит в каждой симуляции. Как и в случае с другими нашими спортивными прогнозами, мы запускаем эти симуляции в «горячем режиме», что означает, что рейтинг команды не является статичным — скорее, он меняется в течение каждого моделируемого сезона на основе результатов каждой моделируемой игры, включая бонусы за победы в плей-офф и поражения.

Для каждой из тысяч запускаемых нами симуляций мы сначала генерируем результаты игры, начиная с того, какая команда «выиграла» или «проиграла» эту симуляцию, на основе вероятности победы на основе Эло, входящей в игру, которую мы вычислили ранее. Затем мы используем логистическую регрессию , чтобы определить вероятность того, что эта смоделированная игра перейдет в овертайм, используя следующую формулу:

Для смоделированных игр, которые «перешли в овертайм», мы затем рандомизировали, перешла ли эта овертаймовая игра в серию пенальти 5 — исторически сложилось так, что чуть менее 49 процентов овертаймов, сыгранных с сезона 2005–06, заканчивались пенальти.

Мы моделируем, сколько голов каждая команда забила в этой игре 6 , сначала генерируя «базовый» счет команды на основе следующей линейной регрессии, где EloDiff положителен для фаворита и отрицателен для проигравшего.

Затем мы генерируем смоделированную оценку как случайное целое число из распределения Пуассона, сосредоточенного вокруг этой «базовой» оценки (с десятичными знаками) в качестве среднего значения. Получив два смоделированных результата (по одному для каждой команды), мы сверяем их с результатами, которые мы только что получили. Мы можем использовать наши вновь сгенерированные результаты в качестве общего количества голов для этой игровой симуляции, если выполняются два условия:

Команда-победительница забила больше голов, чем команда-проигравшая

В симуляциях «овертайма» и «буллитов» преимущество в победе составляло ровно один гол. 7
Если условия не выполняются, мы восстанавливаем новые игровые результаты до тех пор, пока они не будут выполнены.

Затем мы создаем симуляцию (оставшейся части) регулярного сезона или плей-офф, основанную на реальных результатах уже завершенных игр и этих смоделированных игровых результатах. В симуляции каждого сезона мы отслеживаем, сколько очков набирает каждая команда: 8кто выйдет в плей-офф, кто выиграет каждый раунд плей-офф и кто выиграет Кубок Стэнли. Затем мы запускаем симуляцию всего сезона тысячи раз, усредняя результаты по всем симуляциям для каждой команды. Так, например, когда вы видите, что команда имеет 37-процентную вероятность выхода в плей-офф в интерактивном прогнозе, это означает, что команда вышла в плей-офф в 37 процентах проведенных нами симуляций, каждая из которых берет свой текущий рекорд и оставшиеся график во внимание. После каждой игры НХЛ мы сохраняем результаты этой игры, повторно запускаем тысячи симуляций и обновляем интерактивный интерфейс последними цифрами. Если вы хотите самостоятельно поиграть с данными нашей модели, вы можете загрузить их в необработанном формате CSV через страницу обмена данными FiveThirtyEight .