Математикалық статистика – белгісіз шарттар жағдайында негізделген шешім қабылдауға мүмкіндік беретін әдістеме. Мәліметтерді жинау және жүйелеу әдістерін зерттеу, эксперименттер мен эксперименттердің соңғы нәтижелерін жаппай кездейсоқтықпен өңдеу және кез келген заңдылықтарды ашу математиканың бұл саласының айналысатын ісі. Математикалық статистиканың негізгі ұғымдарын қарастырыңыз.
Ықтималдық теориясымен айырмашылық
Математикалық статистика әдістері ықтималдықтар теориясымен тығыз қиылысады. Математиканың екі саласы да көптеген кездейсоқ құбылыстарды зерттеумен айналысады. Екі пән шектік теоремалар арқылы байланысқан. Дегенмен, бұл ғылымдардың арасында үлкен айырмашылық бар. Ықтималдық теориясы математикалық модель негізінде нақты дүниедегі процестің сипаттамаларын анықтаса, математикалық статистика керісінше жасайды - ол модельдің қасиеттерінбақыланатын ақпаратқа негізделген.
Қадамдар
Математикалық статистиканы қолдану тек кездейсоқ оқиғаларға немесе процестерге, дәлірек айтсақ, оларды бақылау нәтижесінде алынған деректерге қатысты жүзеге асырылуы мүмкін. Және бұл бірнеше кезеңде болады. Біріншіден, эксперименттер мен эксперименттердің деректері белгілі бір өңдеуден өтеді. Олар талдаудың анықтығы мен жеңілдігі үшін тапсырыс берілген. Содан кейін бақыланатын кездейсоқ процестің қажетті параметрлерінің дәл немесе жуық бағасы жасалады. Олар мыналар болуы мүмкін:
- оқиғаның ықтималдығын бағалау (оның ықтималдығы бастапқыда белгісіз);
- белгісіз үлестіру функциясының әрекетін зерттеу;
- күтілетін болжам;
- дисперсияны бағалау
- т.б.
Үшінші кезең – талдау алдында қойылған кез келген гипотезаны тексеру, яғни тәжірибе нәтижелері теориялық есептеулерге қаншалықты сәйкес келеді деген сұраққа жауап алу. Шын мәнінде, бұл математикалық статистиканың негізгі кезеңі. Мысал ретінде бақыланатын кездейсоқ процестің әрекетінің қалыпты үлестірім шегінде болуын қарастыруға болады.
Халық
Математикалық статистиканың негізгі ұғымдары жалпы және таңдамалы популяцияларды қамтиды. Бұл пән қандай да бір қасиетке қатысты белгілі бір объектілердің жиынтығын зерттеумен айналысады. Мысал ретінде такси жүргізушісінің жұмысын келтіруге болады. Мына кездейсоқ шамаларды қарастырыңыз:
- жүктеме немесе тұтынушылар саны: күніне, түскі асқа дейін, түскі астан кейін, …;
- орташа жол жүру уақыты;
- кірген өтініштер саны немесе олардың қала аудандарына тіркелуі және т.б.
Сондай-ақ байқауға болатын кездейсоқ шама болатын ұқсас кездейсоқ процестердің жиынтығын зерттеуге болатынын атап өткен жөн.
Сонымен, математикалық статистика әдістерінде зерттелетін объектілердің бүкіл жиынтығы немесе берілген объектіде бірдей жағдайда жүргізілетін әртүрлі бақылаулар нәтижелері жалпы жиынтық деп аталады. Басқаша айтқанда, математикалық тұрғыдан алғанда, бұл қарапайым оқиғалар кеңістігінде анықталған кездейсоқ шама, онда элементтерінің белгілі ықтималдығы бар ішкі жиындар класы белгіленген.
Үлгі топтама
Әр объектіні зерттеу үшін үздіксіз зерттеу жүргізу белгілі бір себептермен (құн, уақыт) мүмкін болмайтын немесе мүмкін болмайтын жағдайлар бар. Мысалы, оның сапасын тексеру үшін тығыздалған джемнің әрбір құтысын ашу - күмәнді шешім, ал әрбір ауа молекуласының текше метрдегі траекториясын бағалауға тырысу мүмкін емес. Мұндай жағдайларда таңдамалы бақылау әдісі қолданылады: жалпы жиынтықтан белгілі бір объектілер саны (әдетте кездейсоқ түрде) таңдалады және оларға талдау жүргізіледі.
Бұл ұғымдар бастапқыда күрделі болып көрінуі мүмкін. Сондықтан тақырыпты толық түсіну үшін В. Э. Гмурманның «Ықтималдықтар теориясы және математикалық статистика» оқулығын оқу керек. Осылайша, іріктеу жиыны немесе таңдау жалпы жиынтықтан кездейсоқ таңдалған объектілер қатары болып табылады. Қатаң математикалық терминдермен айтқанда, бұл әрқайсысы үшін үлестірім жалпы кездейсоқ шама үшін көрсетілгенмен сәйкес келетін тәуелсіз, біркелкі таралған кездейсоқ шамалардың тізбегі.
Негізгі ұғымдар
Математикалық статистиканың басқа да бірқатар негізгі ұғымдарына қысқаша тоқталайық. Жалпы жиынтықтағы немесе таңдамадағы объектілердің саны көлем деп аталады. Эксперимент кезінде алынған үлгі мәндері үлгіні жүзеге асыру деп аталады. Іріктемеге негізделген жалпы жиынтықты бағалау сенімді болу үшін репрезентативті немесе репрезентативті деп аталатын таңдаудың болуы маңызды. Бұл іріктеме жиынтықты толық көрсетуі керек дегенді білдіреді. Бұған жиынтықтың барлық элементтерінің үлгіде болу ықтималдығы бірдей болған жағдайда ғана қол жеткізуге болады.
Үлгілер қайтаруды және қайтаруды ажыратады. Бірінші жағдайда үлгінің мазмұнында қайталанатын элемент жалпы жиынға қайтарылады, екінші жағдайда олай емес. Әдетте, тәжірибеде ауыстырусыз сынама алу қолданылады. Сондай-ақ, жалпы халықтың мөлшері әрқашан іріктеу өлшемінен айтарлықтай асып түсетінін атап өткен жөн. Барсынама алу процесінің көптеген опциялары:
- қарапайым - элементтер бір уақытта кездейсоқ таңдалады;
- терілген - жалпы халық түрлерге бөлінеді және әрқайсысынан таңдау жасалады; мысал ретінде тұрғындар арасында жүргізілген сауалнама: ерлер мен әйелдер бөлек;
- механикалық - мысалы, әрбір 10-шы элементті таңдаңыз;
- сериялық - таңдау элементтер қатарында жасалады.
Статистикалық үлестірім
Гмурманның пікірінше, ықтималдықтар теориясы мен математикалық статистика ғылыми әлемде, әсіресе оның практикалық бөлігінде өте маңызды пәндер болып табылады. Үлгінің статистикалық таралуын қарастырыңыз.
Бізде математикадан сынақтан өткен студенттер тобы бар делік. Нәтижесінде бізде бағалаулар жинағы бар: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - бұл біздің негізгі статистикалық материалымыз.
Біріншіден, оны сұрыптау керек немесе рейтингтік операцияны орындау керек: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - және осылайша вариациялық қатарды аламыз. Бағалардың әрқайсысының қайталану саны бағалау жиілігі деп аталады, ал олардың таңдау көлеміне қатынасы салыстырмалы жиілік деп аталады. Іріктеменің статистикалық таралу кестесін немесе жай ғана статистикалық қатарды жасайық:
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1 | 1 | 2 | 4 | 3 |
немесе
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1/11 | 1/11 | 2/11 | 4/11 | 3/11 |
Кездейсоқ шама алайық, ол бойынша біз бірқатар эксперименттер жүргіземіз және бұл айнымалының қандай мән алатынын көреміз. Ол a1 мәнін алды делік - m1 рет; a2 - m2 рет, т.б. Бұл үлгінің өлшемі m1 + … + mk=m болады. i 1 мен k аралығында өзгеретін ai жиыны статистикалық қатар болып табылады.
Интервалды бөлу
В. Е. Гмурманның «Ықтималдықтар теориясы және математикалық статистика» кітабында интервалдық статистикалық қатар да берілген. Оны құрастыру зерттелетін белгінің мәні белгілі бір аралықта үздіксіз және мәндер саны көп болған кезде мүмкін болады. Оқушылар тобын, дәлірек айтсақ, олардың бойын алайық: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 111, 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - барлығы 30 оқушы. Адамның бойы – үздіксіз мән екені анық. Біз аралық қадамды анықтауымыз керек. Ол үшін Sturges формуласы пайдаланылады.
h= | макс - мин | = | 190 - 156 | = | 33 | = | 5, 59 |
1+журнал2m | 1+журнал230 | 5, 9 |
Осылайша, интервал өлшемі ретінде 6 мәнін алуға болады. Сондай-ақ 1+log2m мәні келесі формула үшін берілгенін айту керек.интервалдар санын анықтау (әрине, дөңгелектеумен). Осылайша, формулалар бойынша әрқайсысының өлшемі 6 болатын 6 интервал алынады. Ал бастапқы интервалдың бірінші мәні мына формуламен анықталатын сан болады: min - h / 2=156 - 6/2=153. Интервалдар мен өсімі белгілі бір интервалға түскен студенттердің санын қамтитын кесте құрайық.
H | [153; 159) | [159; 165) | [165; 171) | [171; 177) | [177; 183) | [183; 189) |
P | 2 | 5 | 3 | 9 | 8 | 3 |
P | 0, 06 | 0, 17 | 0, 1 | 0, 3 | 0, 27 | 0, 1 |
Әрине, бұл бәрі емес, өйткені математикалық статистикада формулалар әлдеқайда көп. Біз тек кейбір негізгі ұғымдарды қарастырдық.
Тарату кестесі
Математикалық статистиканың негізгі ұғымдары сонымен қатар анықтығымен ерекшеленетін таралудың графикалық көрінісін қамтиды. Графиктердің екі түрі бар: көпбұрыш және гистограмма. Біріншісі дискретті статистикалық қатар үшін қолданылады. Ал үздіксіз тарату үшін, тиісінше, екіншісі.