Ноя
11

Прогнозирование и значимость показателей




  • Gaz: Spot Price in Europe

  • Мой последний день.


  • Для предсказания процента побед той или иной команды по ходу конкретного турнира, а также анализа значимости баскетбольных показателей на выступление, возможно использовать линейный регрессионный анализ (статистический метод исследования зависимости между зависимой переменной Y и одной или несколькими независимыми переменными X1,X2,...,Xp).
    В нашем случае зависимой переменной является процент побед сиречь удачное выступление. А независимыми могут выступать совершенно различные показатели, которые, по мнению анализирующего человека, влияют на конечный результат. Вообще можно включать абсолютно любые показатели для определения значимости каждого из них. Также следует обратить внимание на то, что, чем больше количество игр (больше данных), тем качественнее модель возможно построить.

    В качестве примера приведем розыгрыш Евролиги сезона 2000-01.

    Сначала покажем зависимость от рейтинга игры в нападении и в защите (ORtg и DRtg)
    ORtg = (набранные очки / количество своих владений) х 100; {offensive rating}
    DRtg = (пропущенные очки / количество владений соперников) х 100. {defensive rating}
    Итак, по всем играм регулярного чемпионата и плей-офф, картина была следующая:


      Wins ORtg DRtg
    Kinder Bologna 86% 114 100
    Tau Ceramica 68% 109 103
    PAF Bologna 67% 104 103
    AEK 67% 106 103
    Benetton Basket 60% 116 108
    Real Madrid 67% 113 102
    Union Olimpija 60% 111 103
    Olympiakos 64% 115 106
    Muller Verona 50% 120 116
    PAOK 62% 113 105
    Barcelona 67% 112 102
    Zalgiris 50% 114 111
    Peristeri 58% 113 108
    Adecco Estudiantes 33% 108 114
    KK Buducnost 58% 109 117
    Cibona VIP 25% 101 109
    KK Zadar 20% 113 114
    Hapoel Jerusalem 30% 105 118
    St. Peterburg Lions 20% 102 109
    Lugano Snakes 30% 99 118
    Haribo London Towers 10% 92 115
    Spirou Basket 20% 104 115
    Ovarense Aerosoles 0% 98 128
    Opel Skyliners 10% 97 115

    Используя эти данные, получаем регрессию Y=1,118+0,015*ORtg-0,02*DRtg.
    Т.е., зная рейтинг игры в нападении и рейтинг игры в защите в турнире, с помощью данной функции, можно спрогнозировать процент побед. Коэффициенты +0,015 и -0,02 означают, что ORtg и DRtg примерно равнозначны (с небольшим преимуществом игры в обороне) в своем влиянии. Знаки "+" и "-" перед коэффициентами соответствуют логике, т.е. хорошая игра в нападении увеличивает значение ожидаемых побед настолько больше, насколько команда была в нападении хороша, и наоборот хорошая игра в защите уменьшает значение ожидаемых побед тем меньше, чем лучше игра в обороне. Для определения тесноты связи используют коэффициент детерминированности, который в нашем случае равен 0,79. Это говорит о довольно тесной связи (если он равен 1, то имеет место полная корреляция с моделью, т. е. нет различия между фактическим и оценочным значениями Y, в противоположном случае, если коэффициент детерминированности равен 0, то уравнение регрессии неудачно для предсказания значений Y.)
    Подставим имеющиеся значения ORtg и DRtg в функцию и сравним с реальными показателями (полученные значения Y умножали на 100%).


      Wins Y Δ
    Kinder Bologna 86% 75% 12%
    Tau Ceramica 68% 61% 7%
    PAF Bologna 67% 54% 13%
    AEK 67% 57% 10%
    Benetton Basket 60% 61% -1%
    Real Madrid 67% 69% -3%
    Union Olimpija 60% 64% -4%
    Olympiakos 64% 64% 0%
    Muller Verona 50% 51% -1%
    PAOK 62% 63% -2%
    Barcelona 67% 68% -1%
    Zalgiris 50% 52% -2%
    Peristeri 58% 57% 1%
    Adecco Estudiantes 33% 37% -4%
    KK Buducnost 58% 33% 26%
    Cibona VIP 25% 37% -12%
    KK Zadar 20% 45% -25%
    Hapoel Jerusalem 30% 25% 5%
    St. Peterburg Lions 20% 39% -19%
    Lugano Snakes 30% 16% 14%
    Haribo London Towers 10% 12% -2%
    Spirou Basket 20% 29% -9%
    Ovarense Aerosoles 0% -6% 6%
    Opel Skyliners 10% 19% -9%

    Имеющиеся крупные расхождения, как в случае с Будучностью, объясняются тем, что рассматривался не просто гладкий чемпионат, а регулярка с плей-офф, где команда с более низким посевом получала (и проигрывала) дополнительные игры с более сильным соперником, соответственно ухудшала свои показатели, также и более сильные соперники свои показатели улучшали. Т.е. не было относительно равномерного распределения соперников (по силе) на протяжении всего рассматриваемого турнира. Также свою немаловажную роль сыграло относительно небольшое количество, проведенных командами игр.

    Далее рассмотрим зависимость от "4 факторов", причем для нападения и защиты. Т.е. по совокупности 8 факторов.
    Подробнее про них можно посмотреть здесь http://igko.livejournal.com/14163.html
    Итак, "4 фактора" для нападения:


      Wins eFGo% TOVo% ORB% FTMo/FGAo
    Kinder Bologna 0,86 0,56 0,20 0,30 0,37
    Tau Ceramica 0,68 0,53 0,19 0,30 0,30
    PAF Bologna 0,67 0,51 0,20 0,27 0,31
    AEK 0,67 0,49 0,17 0,30 0,30
    Benetton Basket 0,60 0,56 0,19 0,31 0,37
    Real Madrid 0,67 0,57 0,21 0,31 0,31
    Union Olimpija 0,60 0,52 0,20 0,36 0,29
    Olympiakos 0,64 0,57 0,19 0,30 0,35
    Muller Verona 0,50 0,56 0,15 0,29 0,27
    PAOK 0,62 0,53 0,16 0,24 0,40
    Barcelona 0,67 0,52 0,20 0,38 0,27
    Zalgiris 0,50 0,55 0,19 0,26 0,33
    Peristeri 0,58 0,55 0,21 0,33 0,30
    Adecco Estudiantes 0,33 0,51 0,22 0,34 0,31
    KK Buducnost 0,58 0,51 0,18 0,35 0,25
    Cibona VIP 0,25 0,42 0,20 0,33 0,29
    KK Zadar 0,20 0,54 0,18 0,28 0,31
    Hapoel Jerusalem 0,30 0,50 0,23 0,35 0,31
    St. Peterburg Lions 0,20 0,51 0,22 0,25 0,35
    Lugano Snakes 0,30 0,49 0,21 0,29 0,24
    Haribo London Towers 0,10 0,47 0,27 0,31 0,25
    Spirou Basket 0,20 0,50 0,22 0,35 0,22
    Ovarense Aerosoles 0,00 0,54 0,27 0,27 0,23
    Opel Skyliners 0,10 0,46 0,20 0,26 0,23

    "4 фактора" для защиты (т.е. "4 фактора" команды соперника):


      Wins eFGd% TOVd% DRB% FTMd/FGAd
    Kinder Bologna 0,86 0,49 0,21 0,71 0,30
    Tau Ceramica 0,68 0,51 0,21 0,75 0,33
    PAF Bologna 0,67 0,50 0,20 0,72 0,25
    AEK 0,67 0,51 0,21 0,71 0,31
    Benetton Basket 0,60 0,52 0,23 0,65 0,30
    Real Madrid 0,67 0,51 0,21 0,71 0,29
    Union Olimpija 0,60 0,51 0,21 0,75 0,39
    Olympiakos 0,64 0,51 0,22 0,67 0,28
    Muller Verona 0,50 0,55 0,17 0,71 0,33
    PAOK 0,62 0,47 0,19 0,65 0,25
    Barcelona 0,67 0,47 0,20 0,69 0,28
    Zalgiris 0,50 0,49 0,17 0,66 0,27
    Peristeri 0,58 0,52 0,19 0,72 0,29
    Adecco Estudiantes 0,33 0,53 0,18 0,69 0,30
    KK Buducnost 0,58 0,55 0,16 0,70 0,29
    Cibona VIP 0,25 0,53 0,19 0,72 0,32
    KK Zadar 0,20 0,54 0,20 0,66 0,30
    Hapoel Jerusalem 0,30 0,61 0,22 0,68 0,30
    St. Peterburg Lions 0,20 0,52 0,19 0,69 0,30
    Lugano Snakes 0,30 0,61 0,24 0,67 0,38
    Haribo London Towers 0,10 0,56 0,18 0,71 0,31
    Spirou Basket 0,20 0,57 0,19 0,69 0,34
    Ovarense Aerosoles 0,00 0,61 0,17 0,64 0,30
    Opel Skyliners 0,10 0,53 0,18 0,62 0,29

    Используя эти данные получаем регрессию:
    Y=-1,404+2,113*eFGo%-2,785*TOVo%+0,918*ORB%-0,417*FTMo/FGAo-1,66*eFGd%+3,825*TOVd%+2,773*DRB%-2,046*FTMd/FGAd
    Чем больше (по модулю) числовое значение коэффициента, тем выше значимость того или иного фактора. Про логику "+" и "-" перед коэффициентом написано выше, хотя в данном случае есть выбивающийся из логики фактор - это отрицательный коэффициент перед FTMo/FGAo - способность попадать штрафные. По логике он должен быть положительным, т.к. попадания со штрафных - это тоже набор очков, которые способствуют победе, но в данном случае, видимо имело место ситуация, когда набор очков со штрафных по отношению к общему числу бросков приводил к поражениям, вследствие того, что большое количество штрафных приводило к уменьшению попыток с дистанции и соответственно меньшему количеству набранных очков. Следует отметить, что, в нашем случае, это самый малозначимый фактор. Коэффициент детерминированности равен 0,872, что говорит о довольно тесной связи.
    Подставим имеющиеся значения в функцию и сравним с реальными показателями (полученные значения Y умножали на 100%)


      Wins Y Δ
    Kinder Bologna 86% 69% 18%
    Tau Ceramica 68% 70% -2%
    PAF Bologna 67% 66% 1%
    AEK 67% 60% 7%
    Benetton Basket 60% 59% 1%
    Real Madrid 67% 70% -4%
    Union Olimpija 60% 59% 1%
    Olympiakos 64% 68% -4%
    Muller Verona 50% 55% -5%
    PAOK 62% 56% 5%
    Barcelona 67% 70% -3%
    Zalgiris 50% 44% 6%
    Peristeri 58% 62% -3%
    Adecco Estudiantes 33% 35% -2%
    KK Buducnost 58% 44% 15%
    Cibona VIP 25% 30% -5%
    KK Zadar 20% 45% -25%
    Hapoel Jerusalem 30% 31% -1%
    St. Peterburg Lions 20% 31% -11%
    Lugano Snakes 30% 20% 10%
    Haribo London Towers 10% 11% -1%
    Spirou Basket 20% 27% -7%
    Ovarense Aerosoles 0% -6% 6%
    Opel Skyliners 10% 9% 1%

    Итак, в нашем случае, для Евролиги сезона 2000-01, основополагающими факторами для одержания победы (в порядке убывания) были потери соперника (TOVd%), собственные потери (TOVo%), подборы на своем щите (DRB%), собственный процент попадания (eFGo%), пробитие штрафных командой соперника (FTMd/FGAd), процент попадания соперника (eFGd%), подборы на чужом щите (ORB%), пробитие штрафных (FTMo/FGAo).

    Следует помнить, что регрессионный анализ нельзя использовать для определения наличия связи между переменными, поскольку наличие такой связи и есть предпосылка для применения анализа.

    Продолжение следует...


















  • Gaz: Spot Price in Europe

  • Мой последний день.



  • Социальные сети

    Рубрики

    Последние записи