Ноя
11

Об оценке 4 факторов.




  • Безымянный 27625

  • Ближний Востк - дело тонкое! (март 2009) - Set #13 - Назарет (часть 1-я).


  • использовалась книга Mathletics (Wayne L. Winston)

    Как можно оценить и какую ещё информацию можно почерпнуть из 4 факторов ?

    Для примера возьмем данные по регулярному сезон НБА 2010-11.

    Интересная вещь, но эти факторы между собой практически некоррелируют. Т.е нет линейной зависимости (чем ближе значение к 1 или к  -1, тем зависимость сильнее и наоборот, если значение близко к 0, то линейной зависимости - нет).

     

    Рассмотрим две самых больших (по абсолютному значению) взаимосвязи:

    1) -0,606 - связь между eFG% соперника и подборами в защите. Это означает, что при подъёме процента атаки соперника имеется тенденция у защищающейся команды становиться слабоподбирающей под своим щитом. Это имеет право на существование, т.к., если команда не подбирает после промахов соперника, те, в свою очередь, могут иметь много попыток из под щита, к примеру высокопроцентных бросков сверху.
    2) -0,41 - связь между собственным eFG% и подборами в нападении. Это означает, что при увеличении процента попадания атакующей команды имеется тенденция к худшей работе на чужом щите. В нашем случае этот феномен иллюстрирует Бостон (6-ой по проценту и 30-ый по подборам).

    Итак, как можно оценить относительную важность этих показаетелей?
    Воспользуемся регрессией.
    Введем следующие перменные:
    1) eFG% - opp eFG% ;
    2) TOV% - opp TOV% ;
    3) ORB% - DRB% ;
    4) FT/FGA - opp FT/FGA.

    Результат:
    количество побед = 52,35 + 421,82(eFG% - opp eFG%) - 274,92(TOV% - opp TOV%) + 23,92(ORB% - DRB%) + 17,74(FT/FGA - opp FT/FGA)
    Коэффициент корреляции 0,92, говорит о тесной линейной связи и означает, что эти четыре независимых переменных объясняют 92% отклонений от нормальной величины побед.
    Стандартная погрешность 3,93 говорит о том, что с 95% увереностью можно утверждать, что предсказанные победы будут находится в диапазоне 2 х 3,93 = 7,86 побед.

    Меру влияния каждого из этих 4 переменных можно увидеть из корреляции этих переменных и числа побед:

    1) eFG% - opp eFG% имеет сильную взаимосвязь с победами и объясняет 82% отклонений от нормальной величины побед ;
    2) TOV% - opp TOV% имеет слабую взаимосвязь с победами и объясняет 6% отклонений от нормальной величины побед ;
    3) ORB% - DRB% имеет слабую взаимосвязь с победами и объясняет 14% отклонений от нормальной величины побед ;
    4) FT/FGA - opp FT/FGA имеет небольшую взаимосвязь с победами и объясняет 33% отклонений от нормальной величины побед.

    Т.е. разница в эффективных процентах попадания была ключевым фактором успеха в НБА в сезоне 2010-11.

    Относительная важность этих переменных заключается в следующем (по всей лиге):
    1) изменение eFG% - opp eFG% на 0,01 имело ценность в 4,2 победы
       - увеличение "нашего" eFG% на 1% (например с 47% од 48%);
       - уменьшение eFG% соперника на 1%;
       - увеличение "нашего" eFG% на 0,5% и уменьшение eFG% соперника на 0,5% также могло быть причиной увеличения числа побед на 4,2.
    2) изменение TOV% - opp TOV% на 0,01 имело ценность в 2,7 победы
       - одна потеря на 100 владений в зависимости от того, кто её совершил могло быть причиной как увеличения так и уменьшения числа побед (соответственно, если "наша" команда теряет, то уменьшение; если соперник, то увеличение) на 2,7
    3) изменение ORB% - DRB% на 0,01 имело ценность в 0,23 победы
       - один подбор в нападении на 100 своих промахов;
       - один подбор в защите на 100 промахов соперника также могло быть причиной увеличения числа побед на 0,23
    4) изменение FT/FGA - opp FT/FGA на 0,01 имело ценность в 0,17 победы
       - на одно больше попадание со штрафного на 100 бросков с игры;
       - на одно меньше попадание со штрафного соперника на его 100 бросков с игры также могло быть причиной увеличения числа побед на 0,17.

    Подводя итог, ещё раз можно убедиться, что разложение командных показателей, способностей на 4 фактора дают возможность быстро оценить слабые и сильные стороны команды. Эта модель может быть применена и к финальным показателям сезона и к текущим (накопленным к определенной дате) данным, а также просто к box score конкретной игры.

    Продолжение следует...



























  • Безымянный 27625

  • Ближний Востк - дело тонкое! (март 2009) - Set #13 - Назарет (часть 1-я).



  • Социальные сети

    Рубрики

    Последние записи