Неподалеку от футбола
Блог "Неподалеку от футбола"
Улучшенная система начисления очков для футбола
Эдуардо Фернандес-Кантелли (отдел маркетинга клуба «Реал» Мадрид)
Глен Миден (факультет статистики Университета Миннесоты)
Май 2002
Исторически, скажем, до 1980 года, футбольные лиги давали два очка за победу в матче и ноль за поражение. В случае ничьей каждая команда получала по очку. Окончательный результат лиги основывался на количестве набранных командой за сезон очков. Во время действия этой системы беспокойство вызывали малое количество забитых голов и количество матчей, завершавшихся вничью. Отчасти эти результаты вызваны тем, что более слабая команда избирает на матч откровенно оборонительную стратегию. В попытке справиться с этой проблемой несколько сильных европейских лиг изменили систему подсчета очков 2-1-0 на систему 3-1-0, где победившей команде присуждалось 3 очка, а не 2. Система 3-1-0 сейчас распространена повсеместно, в том числе на чемпионатах мира, проходящих раз в четыре года.
Англия стала первой, кто применил систему 3-1-0. Впервые ее ввели в сезоне 1981/82. В последующие годы ее стали применять и другие страны. Мы собрали данные из высших лиг десяти стран, перешедших с системы 2-1-0 на систему 3-1-0. Например, для Англии мы взяли данные о 17 сезонах до 1981 года (с системой 2-1-0) и о последующих 19 сезонах (с системой 3-1-0). Наименьшее количество игр в этих десяти странах, проведенных под одной из двух систем начисления очков – 1230, наибольшее – 9616. Для каждой из десяти стран мы подсчитали среднее число забитых голов и пропорцию ничьих для обеих систем подсчета. Результаты – в таблице 1.

Таблица 1: среднее количество голов, забитых за игру, и доля игр, завершившихся вничью, для 10 стран с n2 сезонами по двухочковой системе и n3 последующими сезонами по трехочковой системе
Из таблицы мы видим, что собранных данных недостаточно, чтобы подтвердить гипотезы ни о том, что система 3-1-0 привела к большей результативности, ни о том, что благодаря ей стали меньше играть вничью. В половине стран забивать после смены системы стали больше, в половине – меньше. В шести странах из десяти снизилось количество ничьих, но лишь в Турции и Италии – значительно. Мы постараемся объяснить, почему переход на систему подсчета очков 3-1-0 не принес желаемых результатов, и предложим новую систему, благодаря которой результативность повысится.
Вычисление ожидаемых очков
Главный инструмент, который мы используем для обсуждения командной стратегии – вычисление ожидаемых очков, то есть очков, которые команда рассчитывает получить в конкретной игре. Предположим, что Барселоне и Мадриду предстоит матч, и мы знаем, что Барселона в среднем забивает λ голов (в нашем примере – 2), а Мадрид – μ (в нашем примере – 1.5) за игру. Несколько ученых обнаружили, что распределение количества забитых мячей каждой команды приближается к распределению Пуассона. Если принять B и M за количество мячей, которые забьет каждая из команд, то можно с достаточной точностью смоделировать финальный счет, если принять, что у B и M независимые распределения Пуассона со средними значениями λ и μ соответственно. С помощью этих предположений мы можем вычислить вероятность для любого возможного результата встречи, например, что Барселона выиграет 2:1 или что Мадрид выиграет 3:0. Это делается с помощью распределения Пуассона. Рассмотрев все возможные результаты, мы можем оценить вероятность победы одной из команд либо ничьей. Таким образом, еще до игры мы можем рассчитать ожидаемые очки каждой команды. При системе 2-1-0 ожидаемые очки Барселоны равны сумме удвоенной вероятности того, что Барселона забьет больше, чем Мадрид, и вероятности того, что они забьют поровну. Ответ зависит только от значений λ и μ. Если λ = 2, а μ = 1.5, то Барселона побеждает с вероятностью 0.49, проигрывает с вероятностью 0.29 и играет вничью с вероятностью 0.22; ожидаемое количество набранных Барселоной очков, следовательно, равно .
Предположим, что в первом тайме ни одна команда не забила. Таким образом, если Барселона в среднем забивает λ голов за игру, то можно ожидать, что в среднем она забьет λ/2 голов во втором тайме. Соответственно, от Мадрида мы ожидаем, что он забьет μ/2 голов во втором тайме. Предположив, что после первого тайма счет 0:0, мы можем вычислить ожидаемые очки каждой из команд к началу второго тайма. Как мы вскоре узнаем, ожидаемые очки в перерыве будут отличаться от ожидаемых очков в начале матча.
Обобщим: если выражает ту часть игры, которая уже прошла, и к времени t счет 0:0, то, согласно нашей пуассоновской модели, количество голов, которые Барселона и Мадрид забьют в оставшейся части игры, подчиняется независимым распределениям Пуассона со средними параметрами λ(1 – t) и μ(1 – t) соответственно. Таким образом, мы можем вычислить ожидаемые очки в любой момент игры. Практически точно так же можно рассчитать ожидаемые очки Барселоны, если она ведет в один или два мяча или столько же проигрывает. То же можно сказать и о Мадриде. Однако при системе начисления очков 2-1-0 на любом этапе игры достаточно вычислить ожидаемые очки только одной команды, потому что сумма их ожидаемых очков всегда равняется двум (в каждой игре команды разыгрывают ровно два очка).
Как пример, мы рассчитали ожидаемые очки Барселоны во время игры при двух разных сценариях: когда счет ничейный и когда они ведут в один мяч. В обоих случаях мы предположили, что в среднем Барселона забивает 2.0 гола за игру, а Мадрид – 1.5 гола. Результаты приведены на рисунке 1. Заметим, что в течение игры ожидаемые очки Барселоны снижаются с 1.2 в начале до 1.0 в конце, если счет ничейный. Если Барселона ведет в один мяч, то ожидаемые очки повышаются с 1.6 (если они забивают рано) до 2.0 (если ведут, когда матч заканчивается). Это типично для системы 2-1-0. Ожидаемые очки более сильной команды всегда уменьшаются, если она не ведет в счете, и увеличиваются, когда ведет.

Рисунок 1: ожидаемые очки Барселоны при системе 2-1-0 в течение игры, если она ведет в один мяч (верхняя линия) и если счет ничейный (нижняя линия), в случае, когда Барселона забивает 2.0 гола за игру, а Мадрид – 1.5 гола.
Пока что мы считали, что используется система 2-1-0. Но такие же калькуляции можно провести и для системы 3-1-0. Более того, для любой системы начисления очков мы можем вычислить ожидаемые очки для каждой команды на любом этапе игры, если знаем исходные пуассоновские параметры обеих команд, оставшееся до конца матча время и текущий счет. Далее мы рассмотрим ожидаемые очки команд и при двухочковой, и при трехочковой системе.
Стратегия для стандартных систем
Мы начнем с системы начисления очков 2-1-0 и рассмотрим поведение ожидаемых очков Барселоны с течением игры. Сначала рассмотрим ситуацию, когда в игре ничья. На рисунке 1 мы увидели, что при λ = 2.0 и μ = 1.5 ожидаемые очки Барселоны всегда уменьшаются с продвижением t от нуля до единицы. Так будет в любом случае, если Барселона – лучшая команда, то есть λ > μ. Таким образом, чем дольше игра идет без забитых голов, тем более невыгодной она становится для более сильной команды. Напротив, ожидаемые очки Мадрида увеличиваются с течением игры. Чем дольше игра идет без забитых мячей, тем выгоднее она слабой команде. Это объясняет популярную стратегию, когда слабая команда с самого начала играет на удержание счета. Играя от обороны, слабая команда снижает количество голов обеих команд до значений, близких нулю. Когда оба средних значения распределения Пуассона малы, ожидаемые очки обеих команд близки к единице. Это выгоднее более слабой команде, чем нормальная игра. Таким образом, игра от обороны или на удержание счета – это, по сути, сокращение игры. С точки зрения интуиции это имеет смысл, поскольку чем короче игра, тем меньше шансов у сильной команды продемонстрировать свое превосходство.
В более общем случае каждый раз, когда ожидаемые очки команды увеличиваются с течением игры, она должна играть от обороны или на удержание счета, чтобы ограничить количество голевых моментов и сократить игру. С другой стороны, если ожидаемые очки команды уменьшаются со временем, она должна играть нормально. Она даже должна применять более агрессивную или атакующую стратегию, которая увеличит количество голевых моментов и, по сути, удлинит игру. Это наблюдение важно для понимания того, как команда должна определять стиль игры во время матча. Чтобы максимизировать свои ожидаемые очки, она должна играть от обороны, когда ожидаемые очки увеличиваются, и играть нормально, когда они уменьшаются. Это лежит в основе большинства дальнейших рассуждений.
Теперь рассмотрим ситуацию, когда Барселона, более сильная команда, забила первой. Если λ = 2, а μ = 1.5, то, как мы увидели на рисунке 1, их ожидаемые очки увеличиваются, когда t приближается к единице. То есть после того, как сильная команда выйдет вперед, в ее интересах играть от обороны, снизить количество голевых моментов у обеих команд и, по сути, сократить игру. С другой стороны, слабая команда должна играть агрессивнее, если пропустит.
Предположим, что первой забила слабая команда. Калькуляции показывают, как и ожидалось, что в ее интересах играть от обороны и снизить вероятность любых забитых голов. Все эти результаты показывают, что вне зависимости от счета одной команде всегда выгодно играть на удержание, если только команды не равны по силе, а счет ничейный. Это помогает объяснить малую результативность при двухочковой системе.
В системе 3-1-0 сумма ожидаемых очков двух команд не постоянна, как в системе 2-1-0. Однако вычисления показывают, что оптимальные стратегии для обеих команд точно такие же, как и при двухочковой системе. Слабая команда должна играть на удержание счета, пока не начнет проигрывать. Сильная команда должна играть нормально, пока не поведет в счете. Если любая из команд ведет в счете, то ей нужно играть от обороны, а сопернику – агрессивно.
Новая система начисления очков
Проблема со стандартной системой состоит в том, что вне зависимости от текущего состояния игры и относительной силы команд одной из них всегда выгодно ограничить количество голевых моментов. Единственное исключение – когда команды одинаково сильны, а счет равный. В свете этого мы хотим создать систему начисления очков, которая поощряет нормальную игру обеих команд в течение части игры. С практической точки зрения любая новая система не должна слишком отличаться от стандартных систем.
Теперь мы предложим такую новую систему. В этой системе каждая из команд за ничью получает ноль очков. Если команда выигрывает с разницей в три или более мяча, то получает три очка. Если выигрывает в один-два мяча – одно очко. Проигравшая команда получает -1.5 очка, если проигрывает в три или более мяча, и -0.5 очка, если проигрывает в один-два мяча. Ожидаемые очки для трех систем собраны в таблице 2. В этой системе в конце сезона команды-аутсайдеры будут иметь отрицательное число очков. Как и в случае с трехочковой системой, сумма ожидаемых очков в новой системе не постоянна, а полная сумма полученных командами очков будет зависеть от результата. Но, как и ранее, можно вычислить ожидаемые очки для каждой команды в любой момент игры.

Таблица 2: количество очков, присуждаемых при двух стандартных системах и новой системе в зависимости от результата матча
Стратегия для новой системы
Чтобы понять, как новая система воздействует на стратегии команд, нам нужно сначала найти оптимальную стратегию для каждой команды в разных игровых ситуациях и с разными параметрами Пуассона. Вернемся к рассмотренному ранее примеру, когда Барселона в среднем забивает λ = 2.0 гола, а Мадрид - μ = 1.5 гола за игру.
Сначала предположим, что счет 0:0, и нанесем на график изменение ожидаемых очков команд со временем. Это график I на рисунке 2. Верхняя линия – ожидаемые очки Барселоны, которые снижаются, если игра продолжается со счетом 0:0. Неудивительно, потому что Барселона – более сильная команда. Снижение ожидаемых очков означает, что Барселона продолжит играть в нормальном стиле. Заметим, однако, что ожидаемые очки Мадрида (нижняя линия) увеличиваются примерно до момента, когда сыграно три четверти матча, а потом начинают уменьшаться. Вспомним, что при прежней системе ожидаемые очки Мадрида в случае нулевой ничьей росли на протяжении всей игры. Таким образом, оптимальная стратегия Мадрида при предложенной системе начисления очков – играть от обороны примерно три четверти матча, а потом играть нормально. Каковы причины этой приятной перемены? Когда остается мало времени, то вероятнее всего, что в это время будет забит один гол или вообще ни одного. Когда сила обеих команд не слишком различается, вероятность того, что слабая команда забьет первой, будет достаточно близка к одной второй (хотя и не достигая ее), чтобы слабой команде стало выгодно играть на победу, потому что награда за победу в один мяч (1 очко) вдвое больше, чем штраф за поражение в один мяч (-0.5 очка). Если вероятность забить гол для слабой команды превышает 1/3, то она должна прекратить играть от обороны и начать пытаться забить гол. Точное место, когда слабая команда должна перейти от игры на удержание счета к нормальной игре, зависит от относительной силы двух команд. Но когда две команды не слишком различаются по силе, новая система начисления очков поощряет игру на победу для обеих команд, если под конец игры счет ничейный.
Теперь предположим, что Барселона ведет в один мяч. При стандартной системе ее оптимальной стратегией была бы игра на удержание счета до самого конца матча. Однако на графике II рисунка 2 мы видим, что их ожидаемые очки (верхняя линия) продолжают уменьшаться до момента, когда сыграно более 80% игры. Так что играть на удержание счета ей стоит только ближе к концу матча. Почему? Поскольку Барселона – более сильная команда, в ее интересах играть агрессивно и попытаться выиграть с крупным счетом, потому что она в среднем забивает больше голов, чем Мадрид, если обе команды играют в нормальную игру. Только ближе к концу игры Барселона стоит играть на удержание, когда становится маловероятным, что она сможет забить два гола раньше, чем Мадрид – один. Насколько близко к концу матча им играть на удержание, зависит от значений λ и μ. С другой стороны, Мадрид тоже должен продолжать играть нормально, потому что его ожидаемые очки (нижняя линия) на графике II тоже уменьшаются. Проиграть в два мяча – не хуже, чем проиграть в один, а шанс забить гол у команды есть.
На графике III рисунка 2 мы предполагаем, что в один мяч ведет Мадрид. Их ожидаемые очки (здесь – верхняя линия) увеличиваются весь матч. Поскольку Мадрид – более слабая команда, его оптимальная стратегия – забыть о победе в три мяча и играть от обороны, стараясь удержать преимущество в один гол. Барселона, естественно, продолжает играть нормально.

Рисунок 2: ожидаемые очки Барселоны и Мадрида на протяжении матча при новой системе начисления очков в различных игровых ситуациях. На графиках I и II верхняя линия – ожидаемые очки Барселоны, нижняя – ожидаемые очки Мадрида. На графике III Барселону означает нижняя линия, Мадрид – верхняя.
На рисунке 3 мы предполагаем, что обе команды равны, λ = μ = 2, и Барселона ведет в один мяч. Мадрид проигрывает и, таким образом, должен играть нормально. Ожидаемые очки Барселоны (верхний график) уменьшаются до момента, когда остается примерно 27% времени матча. Здесь Барселона тоже сначала играет нормально, чтобы попытаться одержать крупную победу, и начинает играть на удержание только после того, как шансы на крупную победу уменьшаются. Опять-таки момент перегиба графика ожидаемых очков и изменения оптимальной стратегии зависит от количества забиваемых голов. Если каждая команда забивает в среднем всего по голу за игру, то команда, которая поведет в счете, начнет играть от обороны раньше. Точно так же можно проанализировать и другие игровые ситуации.

Рисунок 3: ожидаемые очки Барселоны (верхняя линия) и Мадрида (нижняя линия) при новой системе начисления очков, когда Барселона ведет в один мяч, и обе команды в среднем забивают по два мяча за игру.
Эти примеры выявляют следующие различия между предложенной новой системой начисления очков и стандартными системами:
• При предложенной новой системе, когда в матче ничья, слабая команда должна перестать играть на удержание счета и начать играть нормально ближе к концу игры. При стандартных системах слабая команда всегда должна играть на удержание.
• При предложенной новой системе, когда сильная команда выходит вперед, она должна играть нормально до поздних этапов матча. При стандартных системах сильная команда должна начать играть на удержание, как только выйдет вперед.• При предложенной новой системе, когда более слабая команда пропускает гол, она должна играть от обороны почти до самого конца матча. При стандартных системах она всегда должна играть нормально, когда проигрывает.• При предложенной новой системе, когда сильная команда ведет в счете в два мяча, она должна продолжать играть нормально, а слабая – от обороны. (Команды меняются ролями относительно стандартных систем из-за награды за крупную победу).
В общем, два главных достоинства новой системы состоят в том, что на значительных отрезках игры обе команды должны играть нормально, и почти до самого конца матча сильная команда должна играть нормально, когда выйдет вперед. Длина этих интервалов нормальной игры зависит от относительной силы двух команд. Но игры, где сильная команда продолжает атаковать, пока не добьется крупного счета, должны быть интереснее, чем игры, где сильная команда забивает один гол и начинает играть на удержание.
Последние замечания
Одно возможное возражение к нашему подходу и новой системе начисления очков состоит в том, что команды, скорее всего, не имеют возможности или даже желания математически вычислять свои ожидаемые очки. А если бы возможность даже и была, то выбрать нужные параметры Пуассона для любого выбранного матча очень сложно. Они зависят от многих факторов: места проведения игры, погоды, манеры игры противника, места команды в чемпионате, тренерских стратегий и т.д. На практике команды не могут точно оценить свои силы относительно друг друга, и мы не можем заявить, что они всегда следуют оптимальным стратегиям, особенно когда их силы почти равны. Но, как мы заявили ранее, практика, когда слабая команда откровенно играет на ничью, и незначительный эффект, который трехочковая система оказала на количество ничьих и общее количество забиваемых голов, свидетельствует о том, что команды могут приближенно вычислять и вычисляют свои ожидаемые очки, выбирая стратегию на игру. Мы считаем, что это останется и после принятия новой системы. В частности, если обе команды примерно равны, забивают много, а счет открыт довольно рано, то ни одной команде не выгодно играть на удержание счета. Заметим, что подобное положение дел справедливо для многих матчей, и не нужно никаких сложных вычислений, чтобы обе команды решили, что в их интересах продолжать играть нормально. Настоящее достоинство новой системы в том, что она стимулирует сильную команду играть нормально в течение значительного отрезка матча, что приведет к более интересным матчам.
Другое возможное возражение – то, что предложение слишком сложно. Мы думали и над другими системами начисления очков. Все они предполагали ноль очков за ничью, положительное количество очков для победителя и отрицательное для проигравшего, причем количество очков зависело от счета, с которым одержана победа. Легко найти другие системы, работающие похоже на ту, что предложили мы. Проведя значительный объем вычислений, мы выбрали эту систему, потому что она не слишком отличается от стандартных систем, а мы не смогли найти другую, которая работала бы лучше. Более того, новая система не намного сложнее, чем существующая система 3-1-0, и команды и болельщики легко к ней адаптируются. Связанное с этим возражение: трехочковая система тоже вводилась для того, чтобы сделать футбол более атакующим, но ничего не вышло. Однако наш подход показывает, что это в общем-то неудивительно. Нужны системы начисления очков, где дифференцируются крупные и некрупные победы, чтобы действительно дать стимул для более атакующей игры во время матчей.
Недавний чемпионат мира 2002 года дает этому недвусмысленные доказательства. В предварительном раунде 32 команды были разделены на 8 групп по 4. В каждой группе был проведен круговой турнир, чтобы определить две команды, выходящие в плей-офф. Если команды набирали одинаковое количество очков, то места распределялись по правилам, учитывающим количество забитых голов. 16 команд затем участвовали в кубковом соревновании. В 15 играх на вылет было забито 26 голов, в среднем – 1.73 за игру. Из них 2 забили в дополнительное время. Многие комментаторы отмечали низкую результативность в этих матчах. С другой стороны, в 30 играх первого этапа, в которых участвовала хотя бы одна команда, вышедшая в плей-офф, было забито 118 голов, в среднем – 3.93 за игру. В 6 играх первого этапа, где участвовали две команды, вышедшие в плей-офф, был забит 21 гол, в среднем – 3.5 за игру. На предварительном этапе результативность оказалась в разы выше, чем в плей-офф. Одно возможное объяснение – слабые команды в групповых турнирах. Но важнее, как мы считаем, оказались правила распределения мест в случае равенства очков. На первом этапе сильным командам не обязательно нужно было играть от обороны, забив гол. А в плей-офф, когда важна только победа, с любым счетом, забившая команда, естественно, начинала играть на удержание.
Из других известных командных игр на футбол больше всего похож хоккей. В частности, в плане взаимодействия команд во время матча и распределения мест в чемпионатах. Но есть и важные отличия. В хоккее, например, слабой команде гораздо сложнее играть от обороны в попытке сделать ничью, потому что в типичном хоккейном матче голевых моментов намного больше, чем в типичном футбольном. Один из способов повысить результативность в футболе – изменить правила, чтобы создавалось больше голевых моментов. Например, можно изменить правило офсайда или увеличить размер ворот. В отличие от американских профессиональных видов спорта вроде бейсбола, баскетбола и американского футбола, которые постоянно меняют что-то в правилах, чтобы создать более привлекательный продукт, официальные лица футбола намного более консервативны в плане изменений. Вместо изменений правил, которые могли бы повлиять на результативность, можно использовать нашу систему в качестве самого простого способа добиться более интересных и результативных матчей.
Приложение: распределение Пуассона в футболе
Распределение Пуассона моделирует случайные события, происходящие со временем, например, голы в футбольном матче. Если λ > 0 – это среднее число голов, забитых командой B во время типичного матча, то в конкретной игре вероятность того, что команда B забьет k мячей при распределении Пуассона, равна

Если команда M забивает в среднем μ > 0 голов за игру, и две команды забивают независимо друг от друга, то вероятность того, что B забьет k голов, а M – l голов, равна

Хотя предположение, что команды забивают независимо друг от друга, неверно, поскольку только одна команда может забить гол в любой момент времени, результаты футбольных матчей в целом подчиняются независимой модели Пуассона. Используя эти выражение, возможно вычислить вероятность любого результата. Например, при λ = 2 и μ = 1.5 (случай, рассмотренный в статье), вероятность нулевой ничьей составляет 0.030, победы Барселоны со счетом 2:0 – 0.060, победы Мадрида со счетом 2:0 – 0.034 и т.д. Сложив все возможные результаты, мы получим распределение результатов матча.

Таблица 3: вероятность различных результатов по модели Пуассона для Барселоны (2 мяча за игру) и Мадрида (1.5 мяча за игру)
Распределение Пуассона вновь порадовало. Удивительная вещь.
вот здесь сразу несколько: http://sider.home.nov.ru/book/side1/ch2_4.htm