Саберметрикаға кіріспе

The source text is taken from here: http://www-math.bgsu.edu/~albert/papers/saber.html

Джим Альберт/Jim Albert

Саберметрия дегеніміз не?

Саберметрия – бейсбол жазбаларын математикалық және статистикалық талдау. Саберметрияның өрісін түсіну үшін алдымен бейсбол ойынымен танысу керек. Бұл спорт Америка Құрама Штаттарындағы ең танымал ойындардың бірі болып табылады; ол көбіне «ұлттық ойын-сауық» деп аталады. Бейсбол 1800-ші жылдардың ортасында Америка Құрама Штаттарында басталды. Кәсіби бейсбол XVIII ғасырдың аяғында басталды; Ұлттық лига 1876 жылы құрылды және 1900 жылы американдық лигада. Қазіргі уақытта Америка Құрама Штаттарында Американдық және Ұлттық лигалардағы 28 кәсіби команда бар, ал миллиондаған адамдар футбол алаңдарында және теледидарда ойын көреді.

Бейсбол ойыны

Бейсбол ойыны екі команда арасында ойнайды, олардың әрқайсысы тоғыз ойыншының қатысуымен. Тоғыз ойыншы – кәдімгі, аулаушы, бірінші старшан, екінші старшан, шорт, үшінші шабандоз, сол жақ шебері, орталығының шабуылшысы және құқық иесі. Бейсбол ойындары тоғыздан тұрады. Бір төсеу екі бөлікке бөлінеді; иннингтің жоғарғы жартысында бір команда далада ойнайды, ал екінші команда жарысқа түседі, ал төменгі жартысында командалар рөлдерді кері қайтарады. Белгілі бір жарыс кезінде ойнап жүрген команда ұпай жинауға тырысады. Ойынның жеңімпазы – тоғыз иннинг соңында жүгірудің көп саны бар команда.

Шабыс кезінде команданың ойыншысы күлгін деп атайды, командалық ойыншының ойыншысына бейсбол түсіріп, маяк деп атайды. Дайындаушы ойыншының қолы жетпейтін жерде орналасқан ағаштан жасалған таяқшаны (жарқыл деп аталады) пайдаланып, допты соғуға тырысады. Допты соққызып, маятник далада жатқан төрт негізді жүгіруге мүмкіндік алады. Егер ойыншы барлық базаны айналдырса, ол жүгірді. Егер шайқаушы шабуылға ұшырататын немесе ол бірінші базаға тасталуы мүмкін болса, онда ол сол жерден шығып кетеді деп есептеледі, ал жүгіріп өту мүмкін емес. Сондай-ақ, ол үш рет бейсбольге соғылмаса немесе үш жақсы соққыны (ереуіл деп аталады) тастаса, ақыры да шығады. Винт-шабыспен айналысатын топтың мақсаты – үш жаттығуды алудың алдында мүмкіндігінше көп ұпай жинау.

Негізгі витраж статистикасы

Бейсбол ойынының маңызды аспектісі – ойын туралы жазылған сандық ақпараттың байлығы. Партер мен сүңгімшенің тиімділігі әдетте нақты сандық шаралармен бағаланады. Ойыншы үшін тиімділікке қол жеткізудің әдеттегі шарасы – соққылардың санын атбаттылық санына бөлу арқылы есептелетін ваттинг орташа мәні. Бұл статистика мүмкіндіктері (баттлер), онда миксер табысты орындалады (шабуылға ұшырайды). Бесстад маусымы кезінде ең көп ваттмен орташа мәні бар шайқаушы сол жылы үздік шабуылшы деп аталады. Батареялар бір-ақ соққы бойынша бір, екі, үш немесе төрт негізге жету қабілеті бойынша бағаланады; бұл хиттар синглы, жұптастар, үш есе және үйге жүгіру деп аталады. Қысқартылған орташа мәндер базалардың жалпы санын (қысқаша айтқанда, жалпы негіздер) мүмкіндіктердің саны бойынша бөлу арқылы есептеледі. Ол қол жеткізілген базалардың санына қарай соққы беретіндіктен, бұл шара баттердің қашықтыққа ұзын допқа соғу қабілетін көрсетеді. Бейсболдағы ең қымбат хит – бұл ойыншы бір шабуылда төрт негізге жететін үй. Үй тапсырмалары саны барлық ойыншыларға жазылады және маусымның соңында ең көп үйде жұмыс істейтін мүкәммәт айрықша танылады.

Негізгі статистика статистикасы

Кеуекті бағалау кезінде статистикалық көрсеткіштер де қолданылады. Белгілі бір құмыра үшін, ол жеңімпаз немесе жеңімпаз деп жарияланған ойындар саны мен санына рұқсат береді. Құмыралар, әдетте, тоғыз ойыншы ойынға рұқсат етілген «табысталған» жұмысшылардың орташа саны бойынша бағаланады, ал басқа статистика питчинг қабілеттілігін түсіну үшін пайдалы. Балкер далада допты соғып алмаған кезде, төрт детальды (шарларды) шайқауға тастаған кезде серуендеу, допты өте тез лақтыра алатын кедір-бұдырлы соққылардың үлкен санын жазуы мүмкін. Қорғаушы «жабайы» немесе салыстырмалы түрде дұрыс емес соққылар көп санда жүреді .

Ұшу қабілетінің жақсы көрсеткіштері – жұмыс жасайды

Саберметриканың бір мақсаты – соққылар мен соққылардың жақсы көрсеткіштерін табу. Билл Джеймс (1982) 1960 жылдарда ойнаған екі ойыншы Джонни Пески мен Дик Стюарттың ноталарын салыстырады. Пески – бұл өте көп шайқасқа қол жеткізген соққыға ұшыраған, бірақ бірнеше үйге жүгірген. Стюарт, керісінше, қарапайым ваттингтік ортада болды, бірақ үйде көп жұмыс істеді. Ең құнды шабуылшы кім еді? Джеймс шабуылшы өзінің командасы үшін жұмыс жасау мүмкіндігімен бағалануы керек деп бекітеді. Команданың деректерді жинаған үлкен жинағын эмпирикалық зерттеуден ол маусымда жазылған соққылар саны, серуендеу, атбелгілер мен жиынтық базалар негізінде маусымда жиналған жүгірістердің санын болжау үшін келесі формуланы жасады.

       (ҰРУ + ЖОЛДАР) (ЖАЛПЫ НЕГІЗДЕР)
ІСКЕ
ҚОСЫЛАДЫ = ----------------------------
             АТБАЛДАР + ЖОЛДАР

Бұл формулада бейсболдағы жүгірістерде екі маңызды аспект көрсетіледі. Команданың соққылар мен серуендерінің саны команданың жүгірушілерді базада алуға қабілеттілігін көрсетеді. Топтың жалпы негіздерінің саны команданың базада орналасқан жүгірушілерді ауыстыруға қабілеттілігін көрсетеді. Бұл іске қосылған формуланы ойыншы өз командасы үшін жасайтын іске қосу санын есептеу үшін жеке деңгейде пайдалануға болады. 1942 жылы Джонни Пески 620 атборды, 205 хит, 42 серуен және 258 базаны құрады; формуланы пайдаланып, оның командасы үшін 96 жұмыс жасады. Дик Стюарт 1960 жылы 532 атбарды, 160 атбалы, 34 серуендеп, және 106 рингке 309 толық базаны құрды. Қорытынды: 1942 жылы Стюарт 1942 жылы Пескиден гөрі әлдеқайда жақсы шабуылшы еді.

Сызықтық салмақ

Ваттингтің тиімділігін бағалаудың баламалы тәсілі сызықты салмақ формуласына негізделген. Джордж Линдси (1963) командалар шайқас кезінде орын алуы мүмкін әрбір оқиғаның мәнін тағайындаған бірінші адам болды. Бейсбол ойындары мен ықтималдық теориясынан жазылған деректерді пайдаланып, ол формуланы жасады

ІСКЕ
ҚОСЫЛАДЫ = (.41) 1B + (.82) 2B + (1.06) 3B + (1.42)  HR

онда 1B, 2B, 3B және HR сәйкесінше, синглы, дубль, үш есе және ойынға түсетін үйдегі соққылар саны. Бұл формуланың бір маңызды аспектісі – бұл миксердің үш жолды жасайтынын мойындайды. Шұңғылшының шабуылға ұшырап, базаға түсуі кезінде тікелей іске қосу әлеуеті бар. Бұдан басқа, маятник базада тұрған жүгірушілерді көтере алады. Сондай-ақ, сыртқа шықпастан, шабуылшы жаңа шайқауға хитке ие болу мүмкіндігін береді, бұл жанама жұмыс әлеуетін тудырады. Торн және Палмер (1993) ойын барысында жазылған барлық шабуыл оқиғаларына негізделген орташа бейсбол командасы шығарған жүгіру санын болжайтын сызықты салмақ формуласының неғұрлым күрделі нұсқасын ұсынады. Джеймс сияқты құрылған формуланы іске қосқан сияқты, сызықты салмақ ережесі ойыншының ваттинг өнімділігін бағалау үшін пайдаланылуы мүмкін.

Жеңіске жетеді

Бейсболда ұпай жинау маңызды болса да, оның негізгі мақсаты – қарсыласынан гөрі көп ұпай жинауға арналған команда. Джеймс (1982) қойылған жүгірулер мен жеңістердің арасындағы қатынас туралы білу үшін шығарылған жүгірулердің санын, рұқсат етілген саны, жеңістер саны мен маусымның көптеген кезеңдерінде шығындардың санын қарап шығарды. Iрі лига командалары. Джеймс команданың ұтылыстарының шығындарға қатынасы, регламенттелген жүгірулердің соқтығысу коэффициентіне шамамен тең болғанын атап өтті. Сонымен қатар,

            ЖЕҢЕДІ                    ІСКЕ ҚОСЫЛАДЫ^2
ІСКЕ
ҚОСЫЛАДЫ = --------------   =   ----------------------------------------- .
        ЖЕҢЕДІ + ЗАЛАЛ        ІСКЕ ҚОСЫЛАДЫ^2 + ҚАРСЫЛЫҚ ІСКЕ ҚОСЫЛАДЫ^2

Бұл қарым-қатынас, оның командамыз үшін жасаған жеңістер саны бойынша маркердің өнімділігін өлшеу үшін пайдаланылуы мүмкін.

Қабаттылықты жақсартудың жақсы шарты

Саберметика ақ питчинг қабілеттілігін бағалаудың жақсы әдістерін әзірледі. Стандартты питтинг статистикасы, жеңіс саны және ойынға кірісілген жұмыс (ERA) кемістігі бар. Құмырадағы жеңістердің саны жақсы шабуылға (командалық есепте) қатысатын команданың шабуылын көрсетеді. ERA кәстрөлдердің тиімділігін өлшейді, бірақ бұл сізге осы күлдің барлық маусымы бойынша нақты пайдасы туралы айтпайды. Торн және Палмер (1993) пирсингтік формулаларды әзірледі

                                  League ERA
ШЕШІМДЕР = Иннинг ұйыған x -------------------  - ER.
                                      9

Фактор (League ERA/9) лигасының барлық командалары үшін иннингке рұқсат етілген орташа есептеулерді өлшейді. Бұл мән кептеліп салынған кірулердің санына көбейтіледі – бұл өнім орташа болған жағдайда кеудеге маусымның ішінде мүмкіндік беретін жүгірістердің санын білдіреді. Ақырында, біреуі осы маусымға рұқсат етілген шырын сығындыларын (ER) шығарып тастайды. Егер пиджингтің жұмысы 0-ден жоғары болса, онда бұл кәстрөл орташадан жақсы. Бұл жаңа шара құмыраның тиімділігі мен ұзақмерзімділігін өлшеуде пайдалы болып көрінеді.

Ойыншы пайызы

Бейсбол ойыншылардың соққылар, соққылар және далалық жұмыстарының жақсы шаралары әзірленді. Дегенмен, бұл статистика ойыншының өз командасына жеңіске деген үлесін тікелей өлшейді. Беннетт және Флук (1984) екі бейсбол маусымының деректерін пайдаланып, үй команданың жүгіру дифференциалын (үй командасы минус бару командасын басқарады), ойынның жартысын (кірістің жоғарғы немесе төменгі бөлігін), шығындардың саны және базалық жағдай. Осы болжамды ықтималдығын пайдалана отырып, әрбір ойын оқиғасы үшін өзгерістерді жеңу ықтималдығын көре аласыз. Ойыншы қатысқан әрбір ойын үшін ықтимал ұтып алудағы өзгерістерді қосу арқылы ойынға ұтыс үшін ойыншының үлесін өлшеуге болады. Бұл статистика, Ойыншы ойын пайызы деп аталды, Беннетт (1993) Джо Джексонның баттинг өнімділігін бағалау үшін пайдаланған. Бұл ойыншы 1919 жылғы Әлемдік серияны лақтырғаны үшін бейсболдан қуылды. Ойыншының Ойын пайызын пайдаланатын статистикалық талдау көрсеткендей, Джексон осы серияда өзінің толық әлеуетін ойнады.

Өзгерістер енгізу

Адамдар әртүрлі дәуірлерден баттерлерді немесе құмыраларды салыстыру үшін жиі қызықтырады. Осы салыстыруды жасау кезінде, олар қол жеткізілген контекстте витамин немесе статистика статистикасын көру маңызды. Мысалы, Билл Терри 1930 жылы Ұлттық Лиганы басқарып, 401-ні орташа есеппен алды, бұл тек бір шабуылшыдан асып түсті. 1968 жылы Карл Ястрзамский американдық лигаға орташа есеппен 301 ұпай соқты. Ол Terry-нің жоғары деңгейдегі шағып тұрған жерінде көрінеді. Дегенмен, бір уақытта ойнаған шабуылшыларға қарағанда, екі шабуылшы да орташа жарқырағаннан шамамен 27 пайызға жақсырақ (Торн және Палмер, 1993). 1930 жылы Терра жетістіктері мен 1968 жылы Ястжемскийдің қол жеткізген жетістіктері іс жүзінде өте ұқсас. Сондай-ақ, әртүрлі бал саябақтарында соққыға елеулі айырмашылықтар бар, және ойыншылар арасында дәл салыстыру үшін бал саябағында ойнау үшін статистиканы нақтылау қажет.

Таңдалған деректерден үйрену

Бейсбол ойынын көру қызықты статистикалық талдауды ынталандыратын сұрақтар туғызады. Ойындарды тарату кезінде, бейсбол дикторы әдетте ойыншыға таңдалған соққы деректерін хабарлайды. Мысалы, Барри облигацияларының соңғы 20 атбелгісінде 10 рет бар екендігі туралы хабарлауы мүмкін. Осы ақпараттар негізінде облигациялардың орташа бағасы туралы не білдіңіз? Әрине, облигациялардың ваттинг орташа мәні 10/20 = .500 дейін болуы мүмкін емес, себебі бұл деректер есептелген пайызды барынша арттыру үшін таңдалған. Каселла және Бергер (1994) осы таңдалған ақпарат негізінде ойнатқыштың шын мәніндегі орташа мәніне ықтималдық функциясын жасап, барынша ықтималдық бағалауын табады. Олар бұл таңдалған деректер тек «толығымен деректер» ваттингінің орташа мәнін біршама түсінуді қамтамасыз етеді, ол барлық маусымда жазылған материалдардан алынған.

Сәттілік?

Тағы бір қызықты мәселе – деректерді ұрлаудағы тұрақтылық. Маусымдарда бірнеше ойыншылардың «ыстық» кезеңдер басталатынын байқауға болады, онда олар хиттердің үлкен үлесін алады, басқа шабуылшылары өте аз соққылармен соққылармен немесе соққыларымен өтеді, бірақ бұл кезеңдер ыстық және суық соққылар монета соққысынан байқалатын табиғи өзгермеліліктің көрінісі ғана болуы мүмкін.Соңғы шабуылдардың ықтималдығы жақын арада жарақаттарға байланысты бейсбол шабуылшылары арасында «ыстық қол» үшін статистикалық деректер бар ма? Олбрайт (1993) бейсболдың соққы деректерінің үлкен жиынтығын қарап, деректерді соққыларда сызықтықты анықтау үшін жүгірудің саны сияқты бірнеше статистиканы пайдаланды. Оның негізгі қорытындысы бейсболда соққылар үшін ыстық қол үшін статистикалық деректердің аз екендігі болды.

Ситуациялық деректер

Қазіргі уақытта әуесқойлар мен бұқаралық ақпарат құралдарының арасында жағдайлық бейсбол туралы деректер үлкен қызығушылық тудырады. Шұңқырлардың соққыларының өнімділігі күндізгі және кешкі ойындар, шөптер мен жасанды шөптер сияқты, әртүрлі жағдайлар үшін жазылған, үйде және сыртындағы ойындарда оң және қолмен тастайтын құмыраларға қарсы. Бұл деректердің статистикалық талдауында екі негізгі сұрақ бар. Біріншіден, соққы деректерінде айтарлықтай вариацияны түсіндіруге болатын нақты жағдайлар бар ма? Екіншіден, белгілі бір жағдайда жақсы немесе нашар орындаушылар бар ма? Альберт (1994) жарияланған ситуациялық мәліметтердің үлкен бөлігін талдап, деректерді үлкен ойыншылардан біріктіру үшін Баесиан иерархиялық үлгілерін пайдаланды. Оның негізгі қорытындысы – кейбір маңызды жағдайлар бар. Мәселен, қарама-қарсы қарама-қарсы қарама-қарсы жаққа қараған кезде, шайқастар орташа алғанда 20 балл жоғарылап, үйде ойнап жүргенде 8 ұпайға жетеді. Алайда, бұл ситуациялық әсерлерде жеке айырмашылықтар үшін әдеттегі статистикалық деректер жоқ.

Болжау

Қазіргі уақытта негізгі лигалық бейсбол алты бөлікке бөлінген және кез-келген команданың бір мақсаты – бірінші бөлімді аяқтау. Мысалы, маусымның бір бөлігі аяқталды. Командалардың жазбаларын осы ішінара маусымнан пайдалану бөлімшелердің жеңімпаздарын нақты болжауға болады ма? Барри және Хартиэн (1993) команданың жеке ойынын жеңіп алу ықтималдығы үшін таңдау үлгісін пайдаланады. Бұл модель командалар арасындағы айырмашылықтарға, түрлі үйдегі артықшылықтарға және уақыттың кездейсоқ өзгеруі мүмкін күштерге мүмкіндік береді. Авторлар бұл модельді болашақ бейсбол ойындарының нәтижелерін имитациялау үшін пайдаланады және әрбір команда өздерінің тиісті бөлімшелерін жеңе алатын ықтималдығын бағалайды.

Қазіргі уақытта негізгі лигалық бейсбол ойындары өте мұқият жазылған. Бейсбол статистикасының үлкен дерекқорын жасай отырып, ойында ойнап, соқтығысып, соқтығысқан әрбір шар туралы ақпарат бар. Бұл дерекқор бірнеше жолмен қолданылады. Командалармен жұртшылықпен байланыс бөлімдері өздерінің ойыншылар туралы арнайы статистиканы жариялау үшін деректерді пайдаланады. Статистикалық мәліметтер негізгі лига лигасының ойыншыларының жалақысын анықтауға көмектеседі. Атап айтқанда, статистикалық ақпарат жалақының арбитражында дәлел ретінде пайдаланылады, жалақы белгілейтін сот ісін жүргізу. Бірқатар командалар күндізгі кәсіби статистикалық аналитиктерді пайдаланды және кейбір менеджерлер ойын кезінде стратегияны шешуде статистикалық ақпаратты пайдаланады. Билл Джеймс және басқа бейсбол статистиктері статистикалық талдау арқылы бейсбол ойыны туралы көптеген сұрақтарға жауап беруге болатындығын көрсетті.

Әдебиеттер

  1. Albert, J. (1994), “`Exploring baseball hitting data: what about those breakdown statistics?”, Journal of the American Statistical Association , 89, 1066-1074.
  2. Albright, S. C. (1993), “A statistical analysis of hitting streaks in baseball,” Journal of the American Statistical Association , 88, 1175-1183.
  3. Barry, D., and Hartigan, J. A. (1993), “Choice Models for Predicting Divisional Winners in Major League Baseball,” Journal of the American Statistical Association , 88, 766-774.
  4. Bennett, J. M. (1993), “Did Shoeless Joe Jackson Throw the 1919 World Series?”, The American Statistician, 47, 241-250.
  5. Bennett, J. M. and Flueck, J. A. (1984), “Player Game Percentage”, in Proceedings of the Social Statistics Section, American Statistical Association, 378-380.
  6. Casella, G. and Berger, R. (1993), “Estimation With Selected Binomial Information or Do You Really believe that Dave Winfield is Batting .471?”, Journal of the American Statistical Association , 89, 1080-1090.
  7. James, B. (1982), The Bill James Baseball Abstract, New York: Ballantine Books.
  8. Lindsey, G. (1963) “An Investigation of Strategies in Baseball,” Operations Research, 11, 447-501.
  9. Thorn, J. and Palmer, P. (1993), Total Baseball, New York: Harper Collins.