Статистикалық гипотезаларды тексеру критерийлері мен әдістері, мысалдар

Мазмұны:

Статистикалық гипотезаларды тексеру критерийлері мен әдістері, мысалдар
Статистикалық гипотезаларды тексеру критерийлері мен әдістері, мысалдар
Anonim

Гипотезаны тексеру статистикадағы қажетті процедура. Гипотеза сынағы үлгі деректермен қай мәлімдемені жақсырақ қолдайтынын анықтау үшін бір-бірін жоққа шығаратын екі мәлімдемені бағалайды. Нәтиже статистикалық маңызды деп айтса, бұл гипотеза сынағымен байланысты.

Растау әдістері

Статистикалық гипотезаларды тексеру әдістері статистикалық талдау әдістері болып табылады. Әдетте статистиканың екі жинағы салыстырылады немесе таңдалған деректер жинағы идеалдандырылған үлгідегі синтетикалық деректер жиынтығымен салыстырылады. Деректер жаңа мағыналарды қосатындай етіп түсіндірілуі керек. Сіз оларды түпкілікті нәтиженің белгілі бір құрылымын қабылдау және болжамды растау немесе жоққа шығару үшін статистикалық әдістерді қолдану арқылы түсіндіре аласыз. Болжам гипотеза деп аталады, ал осы мақсатта қолданылатын статистикалық сынақтар статистикалық гипотеза деп аталады.

H0 және H1 гипотезалары

Екі негізгісі баргипотезаларды статистикалық тексеру ұғымдары – «негізгі, немесе нөлдік гипотеза» және «балама гипотеза» деп аталатындар. Оларды Нейман-Пирсон гипотезалары деп те атайды. Статистикалық сынақ болжамы нөлдік гипотеза, негізгі гипотеза немесе қысқаша Н0 деп аталады. Ол жиі әдепкі болжам немесе ештеңе өзгермеген деген болжам деп аталады. Сынақ болжамының бұзылуы жиі бірінші гипотеза, балама гипотеза немесе H1 деп аталады. H1 басқа гипотезаның стенограммасы, өйткені ол туралы біз тек H0 деректерін жоюға болатынын білеміз.

нөлдік гипотеза сынағы
нөлдік гипотеза сынағы

Нөлдік гипотезаны қабылдамау немесе қабылдамау алдында сынақ нәтижесін түсіндіру керек. Салыстыру статистикалық маңызды болып саналады, егер деректер жиыны арасындағы қатынас шекті ықтималдық – маңыздылық деңгейі бойынша нөлдік гипотезаны жүзеге асыру ықтималдығы аз болса. Сондай-ақ статистикалық гипотезаны тексеру үшін жарамдылық критерийлері бар. Бұл белгісіз үлестірудің болжамды заңымен байланысты гипотезаны тексеру критерийінің атауы. Бұл эмпирикалық және теориялық үлестірім арасындағы сәйкессіздіктің сандық өлшемі.

Статистикалық гипотезаларды тексеру тәртібі мен критерийлері

Ең көп тараған гипотезаны таңдау әдістері Akaike ақпараттық критерийіне немесе Байес коэффициентіне негізделген. Статистикалық гипотезаны тестілеу екі түрдің айтарлықтай айырмашылықтары бар болса да, қорытындыда да, Байездік қорытындыда да негізгі әдіс болып табылады. Статистикалық гипотеза тестілеріқате дефолт немесе нөлдік гипотеза бойынша қате шешім қабылдау ықтималдығын бақылайтын процедураны анықтау. Процедура оның жұмыс істеу ықтималдығына негізделген. Қате шешім қабылдаудың бұл ықтималдығы нөлдік гипотезаның ақиқат болуының және нақты балама гипотезаның болмауының ықтималдылығы. Сынақ оның шын немесе жалған екенін көрсете алмайды.

Статистикалық гипотезаларды тексеру әдістері
Статистикалық гипотезаларды тексеру әдістері

Шешім теориясының балама әдістері

Шешім теориясының балама әдістері бар, оларда нөлдік және бірінші гипотезалар тең дәрежеде қарастырылады. Шешім қабылдаудың басқа тәсілдері, мысалы, Байес теориясы, бір нөлдік гипотезаға назар аударудың орнына, барлық мүмкіндіктер бойынша қате шешімдердің салдарын теңестіруге тырысады. Гипотезалардың қайсысы дұрыс екенін анықтаудың бірқатар басқа амалдары деректерге негізделген, олардың қайсысы қажетті қасиеттерге ие. Бірақ гипотеза тестілеу ғылымның көптеген салаларында деректерді талдаудың басым тәсілі болып табылады.

Статистикалық гипотезаны тексеру

Нәтижелердің бір жинағы басқа жиыннан ерекшеленетін кезде, статистикалық гипотезаны тексеруге немесе статистикалық гипотеза сынақтарына сену керек. Оларды түсіндіру p-мәндері мен сыни мәндерді дұрыс түсінуді талап етеді. Сондай-ақ маңыздылық деңгейіне қарамастан, сынақтарда әлі де қателер болуы мүмкін екенін түсіну маңызды. Сондықтан қорытынды дұрыс болмауы мүмкін.

Тестілеу процесі мыналардан тұрадыбірнеше қадам:

  1. Зерттеу үшін бастапқы гипотеза құрылуда.
  2. Сәйкес нөлдік және балама гипотезалар көрсетілген.
  3. Сынақтағы үлгіге қатысты статистикалық болжамдарды түсіндіреді.
  4. Қай сынақ сәйкес келетінін анықтау.
  5. Нөлдік гипотеза қабылданбайтын маңыздылық деңгейін және ықтималдық шегін таңдаңыз.
  6. Нөлдік гипотезаны тексеру статистикасының таралуы нөлдік гипотеза қабылданбаған ықтимал мәндерді көрсетеді.
  7. Есептеу орындалуда.
  8. Баламаның пайдасына нөлдік гипотезаны қабылдамау немесе қабылдау туралы шешім қабылданады.

p-мәнін пайдаланатын балама бар.

Статистикалық гипотезаларды тексеру мысалдары
Статистикалық гипотезаларды тексеру мысалдары

Маңыздылық сынақтары

Таза деректер интерпретациясыз іс жүзінде қолданылмайды. Статистикада деректер туралы сұрақтар қоюға және нәтижелерді интерпретациялауға келгенде, жауаптардың дәлдігін немесе ықтималдығын қамтамасыз ету үшін статистикалық әдістер қолданылады. Статистикалық гипотезаларды тексеру кезінде әдістердің бұл класы статистикалық тестілеу немесе мәнділік сынақтары деп аталады. «Гипотеза» термині гипотезалар мен теориялар зерттелетін ғылыми әдістерді еске түсіреді. Статистикада гипотеза сынағы берілген болжамға сәйкес шаманы береді. Бұл болжамның растығын немесе бұзылғанын түсіндіруге мүмкіндік береді.

Тесттерді статистикалық түсіндіру

Гипотеза сынақтарықандай зерттеу нәтижелері алдын ала анықталған маңыздылық деңгейі үшін нөлдік гипотезаны жоққа шығаруға әкелетінін анықтау үшін қолданылады. Статистикалық гипотеза тестінің нәтижелері онымен жұмыс жалғастырылуы үшін түсіндірілуі керек. Статистикалық гипотезаны тексеру критерийлерінің екі жалпы түрі бар. Бұл p-мәні және критикалық мәндер. Таңдалған критерийге байланысты алынған нәтижелерді басқаша түсіндіру керек.

p-мәні дегеніміз не

Шығыс p-мәнін түсіндіру кезінде статистикалық маңызды деп сипатталады. Іс жүзінде бұл көрсеткіш нөлдік гипотеза қабылданбаған жағдайда қателік ықтималдығын білдіреді. Басқаша айтқанда, ол сынақ нәтижесін интерпретациялауға немесе сандық бағалауға және нөлдік гипотезаны жоққа шығарудағы қателік ықтималдығын анықтауға болатын мәнді атау үшін пайдаланылуы мүмкін. Мысалы, деректер үлгісінде қалыптылық сынағын орындап, шектен шығу мүмкіндігі аз екенін таба аласыз. Дегенмен, нөлдік гипотезаны жоққа шығарудың қажеті жоқ. Статистикалық гипотеза сынағы p-мәнін қайтаруы мүмкін. Бұл p мәнін маңыздылық деңгейі деп аталатын алдын ала анықталған шекті мәнмен салыстыру арқылы жасалады.

Нөлдік гипотезаларды статистикалық тексеру
Нөлдік гипотезаларды статистикалық тексеру

Маңыздылық деңгейі

Маңыздылық деңгейі көбінесе гректің «альфа» кіші әріпімен жазылады. Альфа үшін пайдаланылатын жалпы мән 5% немесе 0,05. Кішірек альфа мәні нөлдік гипотезаны неғұрлым сенімді түсіндіруді ұсынады. p-мәні салыстырыладыалдын ала таңдалған альфа мәні. Егер p-мәні альфадан аз болса, нәтиже статистикалық маңызды болады. Маңыздылық деңгейін бірден шегеру арқылы өзгертуге болады. Бұл бақыланатын үлгі деректерін ескере отырып, гипотезаның сенімділік деңгейін анықтау үшін жасалады. Статистикалық гипотезаларды тексерудің бұл әдісін пайдаланған кезде Р-мәні ықтималдық болып табылады. Бұл статистикалық тест нәтижесін түсіндіру барысында ненің шын немесе жалған екенін білмейтінін білдіреді.

Статистикалық гипотезаны тексеру теориясы

Нөлдік гипотезаны қабылдамау оның ықтимал болып көрінетіні туралы жеткілікті статистикалық дәлел бар екенін білдіреді. Әйтпесе, бұл оны жоққа шығаруға статистиканың жеткіліксіз екенін білдіреді. Нөлдік гипотезаны қабылдамау және қабылдау дихотомиясы тұрғысынан статистикалық сынақтар туралы ойлауға болады. Нөлдік гипотезаны статистикалық тексерудің қауіптілігі, егер қабылданған болса, ол шындық болып көрінуі мүмкін. Оның орнына, нөлдік гипотезаны жоққа шығармайды деп айту дұрысырақ болар еді, өйткені оны жоққа шығаруға статистикалық дәлелдер жеткіліксіз.

Сәйкестік критерийлерінің жақсылығын тексеретін статистикалық гипотеза
Сәйкестік критерийлерінің жақсылығын тексеретін статистикалық гипотеза

Бұл сәт жиі жаңадан келген қосымшаларды шатастырады. Мұндай жағдайда нәтиже ықтимал екенін және тіпті нөлдік гипотезаны қабылдаудың әлі де қате болу мүмкіндігі аз екенін еске түсіру маңызды.

Шын немесе жалған нөлдік гипотеза

p мәнін түсіндіру нөл дегенді білдірмейдігипотеза ақиқат немесе жалған. Бұл эмпирикалық деректер мен таңдалған статистикалық тест негізінде статистикалық маңыздылықтың белгілі бір деңгейінде нөлдік гипотезаны жоққа шығару немесе қабылдамау таңдауы жасалғанын білдіреді. Сондықтан, p-мәнін статистикалық сынақтарға енгізілген алдын ала анықталған болжам бойынша берілген деректердің ықтималдығы ретінде қарастыруға болады. p-мәні нөлдік гипотеза ақиқат болса, деректер үлгісінің байқалу ықтималдығының өлшемі болып табылады.

Критикалық мәндерді түсіндіру

Кейбір сынақтар б. қайтармайды. Оның орнына олар маңызды мәндердің тізімін қайтара алады. Мұндай зерттеудің нәтижелері ұқсас түрде түсіндіріледі. Алдын ала анықталған маңыздылық деңгейімен жалғыз p-мәнін салыстырудың орнына, сынақ статистикасы критикалық мәнмен салыстырылады. Егер ол аз болып шықса, бұл нөлдік гипотезаны жоққа шығару мүмкін болмады дегенді білдіреді. Егер одан үлкен немесе тең болса, нөлдік гипотеза қабылданбауы керек. Статистикалық гипотезаны тексеру алгоритмінің мағынасы және оның нәтижесін түсіндіру p-мәніне ұқсас. Таңдалған маңыздылық деңгейі деректер берілген негізгі сынақ болжамын қабылдамау немесе қабылдамау туралы ықтималдық шешімі болып табылады.

Статистикалық сынақтардағы қателер

Статистикалық гипотеза тестінің интерпретациясы ықтималдық болып табылады. Статистикалық гипотезаларды тексеру міндеті ақиқат немесе жалған мәлімдемені табу емес. Сынақ дәлелі қате болуы мүмкін. Мысалы, егер альфа 5% болса, бұл көп бөлігінде 20-дан 1-і дегенді білдіредінөлдік гипотеза қателікпен қабылданбайды. Немесе бұл деректер үлгісіндегі статистикалық шуға байланысты болмайды. Осы нүктені ескере отырып, нөлдік гипотезаны жоққа шығаруға болатын шағын p мәні оның жалған екенін немесе қате жіберілгенін білдіруі мүмкін. Егер қатенің бұл түрі жасалса, нәтиже жалған оң деп аталады. Ал мұндай қате статистикалық гипотезаларды тексеру кезіндегі бірінші түрдегі қателік болып табылады. Екінші жағынан, егер p-мәні нөлдік гипотезаны жоққа шығару үшін жеткілікті үлкен болса, бұл оның шындық екенін білдіруі мүмкін. Немесе дұрыс емес және қате жіберілген кейбір ықтималды оқиға орын алды. Қатенің бұл түрі жалған теріс деп аталады.

Нөлдік гипотезаларды статистикалық тексеру
Нөлдік гипотезаларды статистикалық тексеру

Қателердің ықтималдығы

Статистикалық гипотезаларды тексеру кезінде қателердің осы түрлерінің кез келгенін жасау мүмкіндігі әлі де бар. Жалған деректер немесе жалған қорытындылар болуы әбден мүмкін. Ең дұрысы, осы қателердің біреуінің ықтималдығын азайтатын маңыздылық деңгейін таңдау керек. Мысалы, нөлдік гипотезаларды статистикалық тексеру маңыздылықтың өте төмен деңгейіне ие болуы мүмкін. 0,05 және 0,01 сияқты маңыздылық деңгейлері ғылымның көптеген салаларында кең таралғанымен, ең жиі қолданылатын маңыздылық деңгейі 310^-7 немесе 0,0000003. Ол жиі «5-сигма» деп аталады. Бұл эксперименттердің 3,5 миллион тәуелсіз қайталануының 1 ықтималдығымен қорытынды кездейсоқ болғанын білдіреді. Статистикалық гипотезаларды тексеру мысалдары мұндай қателерді жиі қамтиды. Бұл тәуелсіз нәтижелерге қол жеткізудің маңызды себебі болып табылады.растау.

Статистикалық тексеруді пайдалану мысалдары

Тәжірибеде гипотезаны тексерудің бірнеше жалпы мысалдары бар. Ең танымалдарының бірі «Шәй дәмін тату» деп аталады. Биометриканың негізін қалаушы Роберт Фишердің әріптесі доктор Мюриэль Бристоль оның бір шыны шайға немесе сүтке қосылғанын нақты айта алатынын айтты. Фишер оған кездейсоқ сегіз кесе (әр сорттың төртеуі) беруді ұсынды. Сынақ статистикасы қарапайым болды: шыныаяқ таңдаудағы табыстар санын санау. Критикалық аймақ әдеттегі ықтималдық критерийіне (< 5%; 70-те 1 ≈ 1,4%) негізделген болуы мүмкін 4-тен жалғыз жетістік болды. Фишер балама гипотеза қажет емес деп есептеді. Ханым әрбір шыныаяқты дұрыс анықтады, бұл статистикалық маңызды нәтиже деп саналды. Бұл тәжірибе Фишердің Зерттеушілерге арналған статистикалық әдістер кітабына әкелді.

Айыпталушының мысалы

Статистикалық сот процесін сотталушы кінәсі дәлелденгенге дейін кінәсіз деп есептелетін қылмыстық сотпен салыстыруға болады. Прокурор сотталушының кінәсін дәлелдеуге тырысады. Айыптау үшін жеткілікті дәлелдер болған кезде ғана сотталушыны кінәлі деп тануға болады. Процедураның басында «Сотталушы кінәлі емес» және «Сотталушы кінәлі» деген екі гипотеза бар. Кінәсіздігі туралы гипотезаны тек кінәсіз сотталушыны айыптауды қаламағандықтан қателік өте екіталай болғанда ғана жоққа шығаруға болады. Мұндай қате I типті қате деп аталады және оның пайда болуысирек бақыланады. Бұл асимметриялық мінез-құлықтың салдарынан II типті қате, яғни қылмыскерді ақтау жиі кездеседі.

Статистикалық тексеру мысалдары
Статистикалық тексеру мысалдары

Статистика үлкен көлемдегі деректерді талдау кезінде пайдалы. Бұл ғылыми теория болмаса да, қорытындыларды негіздей алатын гипотезаларды тексеруге бірдей қатысты. Шай дәмін анықтау мысалында шайға сүт құю немесе сүтке шай құю арасында ешқандай айырмашылық жоқ екені "анық" болды.

Гипотезаны тексерудің нақты практикалық қолданылуы мыналарды қамтиды:

  • еркектер әйелдерге қарағанда қорқынышты түс көретінін тексеру;
  • құжат атрибуты;
  • Толық айдың мінез-құлыққа әсерін бағалау;
  • жарқанат жаңғырық арқылы жәндіктерді анықтай алатын диапазонды анықтау;
  • темекі шегуден бас тартудың ең жақсы әдісін таңдау;
  • Бампер стикерлерінің көлік иесінің мінез-құлқын көрсететінін тексеру.

Статистикалық гипотезаны тексеру жалпы статистикада және статистикалық қорытынды жасауда маңызды рөл атқарады. Құндылық тестілеу ғылыми әдістің негізінде болжамды мән мен эксперименттік нәтижені дәстүрлі салыстыруды алмастыру ретінде қолданылады. Теория тек қарым-қатынас белгісін болжауға қабілетті болған кезде, бағытталған гипотеза сынақтарын тек статистикалық маңызды нәтиже теорияны қолдайтындай етіп конфигурациялауға болады. Бағалау теориясының бұл түрі ең қатал болып табыладыгипотезаны тексеруді пайдалану сыны.

Ұсынылған: