Гипотезаны тестілеу

Python көмегімен гипотезаны тексеру бойынша қарапайым және қысқаша нұсқаулық

Сурет: http://www.advanceinnovationgroup.com/blog/median-based-hypothesis-testing

Бұл блогта мен Python-да статистикалық әдістерді қолдана отырып, гипотезаларды тестілеудің қысқаша нұсқауын беремін. Гипотезаны тестілеу - бұл біз білетін ғылыми әдістің бөлігі, біз оны алғашқы білім беру жылдарында білген болармыз. Алайда статистика бойынша көптеген эксперименттер популяцияның үлгісінде жасалады.

«Бақылаудың таңдамалы жиынтығы бізге ұсынылған түсініктеме туралы не айтатындығын анықтау, әдетте, біз түсініктеме беруді талап етеді, немесе біз оны статистика мамандары« белгісіздіктің себептері »деп атайды. Белгісіздікпен дәлелдеу статистикалық анықтаманың негізі болып табылады және әдетте Null гипотезаның маңыздылығын тексеру әдісі арқылы жасалады. » -Мұғалімдер.

Осы блогқа мысал ретінде мен Kaggle-де табылған еуропалық футбол туралы мәліметтер жиынтығын қолданамын және гипотезаны тестілеуден өткіземін. Дерекқорды мына жерден табуға болады.

1-қадам

Бақылау жасаңыз

Бірінші қадам - ​​құбылыстарды байқау. Бұл жағдайда болады: қорғаныс агрессиясының орташа рұқсат етілген мақсаттарға әсері бар ма?

2-қадам

Зерттеуді тексеріңіз

Жақсы ойлау - бұл оңайырақ жұмыс емес. Бір жақсы нәрсе - сіздің бақылауыңызға қатысты зерттеулердің бар-жоғын білу. Олай болса, бұл біздің сұрағымызға жауап беруге көмектеседі. Қазірдің өзінде бар зерттеулер мен тәжірибелер туралы білу бізге экспериментті жақсырақ құрылымдауға көмектеседі немесе мүмкін біздің сұрағымызға жауап беріп, экспериментті бірінші кезекте өткізудің қажеті жоқ.

3-қадам

Нул гипотезасын және балама гипотезаны жасаңыз

Балама гипотеза - бұл біздің білімді болжамымыз, ал нөлдік гипотеза - керісінше. Егер балама гипотеза екі айнымалының арасында елеулі байланыс бар болса, нөлдік гипотезада ешқандай маңызды байланыс болмайды.

Біздің нөлдік гипотезамыз: 65-тен төмен командаларға қарағанда 65-тен жоғары немесе оған тең қорғаныс агрессиялық рейтингісі бар командалар арасындағы голдарда статистикалық айырмашылық жоқ.

Альтернативті гипотеза: Қорғаныс агрессиясының рейтингі 65-тен төмен немесе оған тең болған командалармен 65-тен төмен командаларға рұқсат етілген голдардың статистикалық айырмашылығы бар.

4-қадам

Біздің гипотезамыз бір жақты немесе екі құйрықты сынақ екенін анықтаңыз.

Бір жақты тест

«Егер сіз 0,05 деңгейінің маңыздылығын қолдансаңыз, бір жақты тест барлық альфа альбомдарыңызды қызығушылықтың бір бағыты бойынша тексеруге мүмкіндік береді.» Бір реттік тесттің мысалы ретінде «65-тен төмен агрессиялық рейтингі бар футбол командалары, рейтингі 65-тен төмен командаларға қарағанда статистикалық тұрғыдан едәуір көп гол жіберуге болады» болады.

Екі жақты тест

«Егер сіз 0,05 мәнділік деңгейін қолдансаңыз, екі жақты тест сіздің альфаңыздың жартысына статистикалық мәнді бір бағытта, ал альфаңыздың жартысын басқа бағытта тексеруге мүмкіндік береді. Бұл сіздің тест статистикалық мәліметтеріңізді таратудың әр жағында 0.025 дегенді білдіреді. »

Екі жақты тестпен сіз екі бағытта да статистикалық маңыздылықты тексересіз. Біздің жағдайда біз статистикалық маңыздылығын екі бағытта да тексеріп жатырмыз.

5-қадам

Шектік маңыздылық деңгейін орнатыңыз (альфа)

(альфа мәні): нөлдік гипотезаны қабылдамай, шекті деңгей. Альфа мәні 0 мен 1 аралығындағы кез келген мән болуы мүмкін. Алайда, ғылымдағы ең көп кездесетін альфа мәні - 0,05. 0,05-ке тең альфа нәтиже кездейсоқтықтың салдарынан 5% немесе одан да аз мүмкіндік болса да, нөлдік гипотезадан бас тартқанымызды білдіреді.

P-мәні: Бұл деректерге кездейсоқ келудің есептелген ықтималдығы.

Егер біз p-мәнін есептесек және ол 0,03-ке тең болса, біз мұны: «Мен көрген нәтижелер кездейсоқтық немесе таза сәттілікке байланысты 3% мүмкіндік бар» деп түсіндіруге болады.

Сурет Learn.co сайтынан алынды

Біздің мақсатымыз p мәнін есептеп, оны альфамен салыстыру. Альфа неғұрлым төмен болса, соғұрлым қатаң сынақ болады.

6-қадам

Іріктеуді орындаңыз

Мұнда бізде футбол деп аталатын мәліметтер жинақталған. Біздің тест үшін бізге деректер жиынтығында тек екі баған қажет: команда_def_aggr_rating және мақсаттар_қосылған. Біз оны осы екі бағанға сүзіп шығарамыз, содан кейін қорғаныс агрессиясының рейтингі 65-тен жоғары немесе оған тең командаларға және 65-тен төмен қорғаныс агрессиясы бар командаларға екі жиынтық жасаймыз.

Біздің гипотезаны тексеруге дайын болу үшін:

Қорғаныс агрессиясының орташа рұқсат етілген мақсаттарға әсері. Нөлдік гипотеза: қорғаныс агрессиясының рейтингі 65-тен төмен командаларға қарағанда 65-тен жоғары немесе оған тең командаларда рұқсат етілген голдарда статистикалық айырмашылық жоқ. Балама гипотеза: Қорғаныс агрессиясының рейтингі жоғары командаларда рұқсат етілген статистикалық айырмашылық бар 65-тен төмен командаларға қарағанда немесе 65-ке тең. Екі жақты Альфа тесті: 0,05

Қазір бізде статистикалық сынақтарды жүргізе алатын үлгілердің екі тізімі бар. Осы қадамның алдында мен көрнекілікке қол жеткізу үшін екі үлестірімді жоспарлаймын.

7-қадам

Екі сынама Т-тестін орындаңыз

Екі таңбалы t-тест екі популяцияның тең екендігін анықтау үшін қолданылады. Ол үшін біз statsmodels деп аталатын Python модулін қолданамыз. Статистика модельдері туралы тым көп мәлімет бермеймін, бірақ құжаттаманы мына жерден көре аласыз.

8-қадам

Бағалап, қорытынды жасаңыз

Еске салсақ, біз орнатқан альфа а = 0.05 болды. Біздің сынақ нәтижелерімізден көріп отырғанымыздай, p-мәні біздің альфадан аз. Біз нөлдік гипотезамыздан бас тарта аламыз және 95% сенімділікпен біздің балама гипотезамызды қабылдаймыз.

Оқығаныңызға рахмет! Гипотезаны тестілеу туралы тереңірек білу үшін сіз GitHub I-де осы топтық жобаны гипотезаларды тексеруге қатысқан жерде біле аласыз.

Ресурстар:

Пештер, Матай. «Статистика және» ғылыми әдіс «YourStatsGuru сайтынан алынды. https://www.yourstatsguru.com/secrets/scimethod-stats/?v=4442e4af0916

SAS-қа кіріспе. UCLA: Статистикалық кеңес беру тобы. https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-are-the-d фарқияттар- айырмашылықтар- арасындағы- 16, 2019).

Инженерлік статистика жөніндегі анықтама. https://www.itl.nist.gov/div898/handbook/eda/section3/eda353.htm