Статистикалық модель: әдістің мәні, құрылысы және талдауы

Мазмұны:

Статистикалық модель: әдістің мәні, құрылысы және талдауы
Статистикалық модель: әдістің мәні, құрылысы және талдауы
Anonim

Статистикалық модель – кейбір үлгі деректердің генерациясына қатысты әртүрлі болжамдар жиынын қамтитын математикалық проекция. Термин жиі идеалдандырылған түрде беріледі.

Статистикалық үлгіде көрсетілген болжамдар ықтималдық үлестірімдерінің жиынтығын көрсетеді. Олардың көпшілігі белгілі бір ақпарат жинағы алынатын үлестіруді дұрыс анықтауға арналған. Статистикалық модельдерге тән ықтималдық үлестірімдері проекцияны басқа математикалық модификациялардан ерекшелендіреді.

Жалпы проекция

статистикалық процесс үлгілері
статистикалық процесс үлгілері

Математикалық модель – белгілі бір ұғымдар мен тілдің көмегімен жүйенің сипаттамасы. Олар жаратылыстану ғылымдарына (физика, биология, жер туралы ғылым, химия сияқты) және инженерлік пәндерге (мысалы, информатика, электротехника), сондай-ақ әлеуметтік ғылымдарға (экономика, психология, әлеуметтану, саясаттану сияқты) қолданылады.

Модель жүйені түсіндіруге көмектеседі жәнетүрлі құрамдастардың әсерін зерттеп, мінез-құлыққа болжам жасаңыз.

Математикалық модельдер динамикалық жүйелерді, статистикалық проекцияларды, дифференциалдық теңдеулер немесе ойын-теориялық параметрлерді қоса алғанда, көптеген пішіндерді қабылдауы мүмкін. Осы және басқа түрлер бір-біріне сәйкес келуі мүмкін және бұл модель көптеген дерексіз құрылымдарды қамтиды. Жалпы, математикалық проекциялар логикалық құрамдастарды да қамтуы мүмкін. Көптеген жағдайларда ғылыми саланың сапасы теориялық тұрғыдан жасалған математикалық модельдердің қайталанатын тәжірибелердің нәтижелерімен қаншалықты сәйкес келетініне байланысты. Теориялық процестер мен эксперименттік өлшемдер арасында келісімнің болмауы жиі маңызды жетістіктерге әкеледі, өйткені жақсырақ теориялар әзірленеді.

Физика ғылымдарында дәстүрлі математикалық модель келесі элементтердің көп санын қамтиды:

  • Басқару теңдеуі.
  • Қосымша ішкі үлгілер.
  • Теңдеулерді анықтаңыз.
  • Құраушы теңдеулер.
  • Жорамалдар мен шектеулер.
  • Бастапқы және шекаралық шарттар.
  • Классикалық шектеулер және кинематикалық теңдеулер.

Формула

Статистикалық модель, әдетте, бір немесе бірнеше кездейсоқ шамаларды және, мүмкін, басқа да табиғи түрде кездесетін айнымалыларды біріктіретін математикалық теңдеулер арқылы орнатылады. Сол сияқты, проекция «ұғымның ресми тұжырымдамасы» болып саналады.

Барлық статистикалық гипотезаны тексеру және статистикалық бағалау математикалық үлгілерден алынады.

Кіріспе

статистикалық математикалық модельдер
статистикалық математикалық модельдер

Бейресми түрде статистикалық модельді белгілі бір қасиеті бар болжам (немесе жорамалдар жиынтығы) ретінде қарастыруға болады: ол кез келген оқиғаның ықтималдығын есептеуге мүмкіндік береді. Мысал ретінде кәдімгі алты қырлы сүйектерді қарастырайық. Сүйек туралы екі түрлі статистикалық болжамды зерттеу керек.

Бірінші болжам:

Әрбір сүйек үшін сандардың біреуін (1, 2, 3, 4, 5 және 6) алу ықтималдығы: 1/6.

Осы болжамнан біз екі сүйектің де ықтималдығын есептей аламыз: 1:1/6×1/6=1/36.

Толығырақ, кез келген оқиғаның ықтималдығын есептей аласыз. Дегенмен, басқа тривиальды емес оқиғаның ықтималдығын есептеу мүмкін емес екенін түсіну керек.

Тек бірінші пікір статистикалық математикалық модельді жинайды: тек бір болжаммен әрбір әрекеттің ықтималдығын анықтауға болатындығына байланысты.

Жоғарыдағы үлгіде бастапқы рұқсатпен оқиғаның болу мүмкіндігін анықтау оңай. Кейбір басқа мысалдармен есептеу қиын немесе тіпті шындыққа сәйкес келмейтін болуы мүмкін (мысалы, көптеген жылдар бойы есептеулер қажет болуы мүмкін). Статистикалық талдау үлгісін құрастырушы адам үшін мұндай күрделілік қолайсыз болып саналады: есептеулерді жүзеге асыру іс жүзінде мүмкін емес және теориялық мүмкін емес болуы керек.

Формальды анықтама

Математикалық терминдерде жүйенің статистикалық моделі әдетте жұп (S, P) ретінде қарастырылады, мұнда S -ықтимал бақылаулар жиыны, яғни үлгі кеңістігі және P - S бойынша ықтималдық үлестірімдерінің жинағы.

Бұл анықтаманың интуициясы келесідей. Белгілі бір деректерді генерациялайтын процестен туындаған "шын" ықтималдық үлестірімі бар деп есептеледі.

Орнату

Модельдің параметрлерін өзі анықтайды. Параметрлеу әдетте әртүрлі үлестірімдерді алу үшін әртүрлі мәндерді қажет етеді, яғни

Үлгі салдары
Үлгі салдары

ұстау керек (басқаша айтқанда, ол инъекциялық болуы керек). Талапқа сәйкес келетін параметрлеу анықталатын деп аталады.

Мысалы

Статистика графигі
Статистика графигі

Студенттердің жасы әртүрлі деп есептейік. Баланың бойы стохастикалық түрде туған жылымен байланысты болады: мысалы, мектеп оқушысы 7 жаста болғанда, бұл өсу ықтималдығына әсер етеді, тек адамның бойы 3 сантиметрден жоғары болады.

Бұл тәсілді түзу сызықты регрессия үлгісінде ресімдеуге болады, мысалы: биіктік i=b 0 + b 1agei + εi, мұндағы b 0 - қиылысу, b 1 - қай жаста болатын параметр биіктік мониторингін алу кезінде көбейтіледі. Бұл қате термині. Яғни, ол бойдың жас бойынша белгілі бір қателікпен болжанатынын болжайды.

Жарамды пішін барлық ақпарат нүктелеріне сәйкес келуі керек. Осылайша, түзу сызықты бағыт (i=b 0 + b 1agei деңгейі) деректер моделі үшін теңдеу бола алмайды - егер ол барлық нүктелерге нақты жауап бермесе. Яғниқоспағанда, барлық ақпарат желіде мінсіз жатыр. εi қателік шегін пішін ақпараттың барлық элементтеріне сәйкес келетіндей етіп теңдеуге енгізу керек.

Статистикалық қорытынды жасау үшін алдымен ε i үшін кейбір ықтималдық үлестірімдерін қабылдауымыз керек. Мысалы, ε i үлестірімінің орташа мәні нөлдік Гаусс пішіні бар деп болжауға болады. Бұл жағдайда модельдің 3 параметрі болады: b 0, b 1 және Гаусс үлестірімінің дисперсиясы.

Модельді ресми түрде (S, P) көрсетуге болады.

Бұл мысалда модель S көрсету арқылы анықталған, сондықтан P туралы кейбір болжамдар жасауға болады. Екі нұсқа бар:

Бұл өсуді жастың сызықтық функциясы арқылы жуықтауға болады;

Жақындаудағы қателер Гаусс ішіндегідей таратылады.

Жалпы ескертулер

Модельдердің статистикалық параметрлері математикалық проекцияның арнайы класы болып табылады. Бір түрдің екіншісінен айырмашылығы неде? Демек, статистикалық модель детерминирленген емес. Осылайша, онда математикалық теңдеулерден айырмашылығы, белгілі бір айнымалылар белгілі бір мәндерге ие емес, оның орнына мүмкіндіктердің таралуына ие. Яғни, жеке айнымалылар стохастикалық болып саналады. Жоғарыдағы мысалда ε стохастикалық айнымалы болып табылады. Онсыз проекция детерминирленген болар еді.

Статистикалық модель құру, тіпті егер материалдық процесс детерминирленген деп есептелсе де жиі пайдаланылады. Мысалы, тиын лақтыру, негізінен, алдын ала анықтау әрекеті болып табылады. Дегенмен, бұл әлі де көп жағдайда стохастикалық ретінде үлгіленген (Бернулли процесі арқылы).

Кониши мен Китагаваның айтуынша, статистикалық модель үшін үш мақсат бар:

  • Болжамдар.
  • Ақпаратты өндіру.
  • Стохастикалық құрылымдардың сипаттамасы.

Проекция өлшемі

Статистикалық болжау үлгісі бар делік, Модель параметрлік деп аталады, егер O соңғы өлшемі болса. Шешімде

деп жазу керек.

Модель айырмашылығы
Модель айырмашылығы

мұндағы k – натурал сан (R кез келген нақты сандарды білдіреді). Мұндағы k модельдің өлшемі деп аталады.

Мысал ретінде барлық деректер бір айнымалы Гаусс үлестірімінен келеді деп болжауға болады:

Статистика формуласы
Статистика формуласы

Бұл мысалда k өлшемі 2.

Тағы бір мысал ретінде деректер Гаусс қалдықтарымен (орташа нөлге тең) түзу сызықта таратылады деп есептелетін (x, y) нүктелерден тұрады деп болжауға болады. Сонда статистикалық экономикалық модельдің өлшемі 3-ке тең: түзудің қиылысуы, оның көлбеуі және қалдықтардың таралу дисперсиясы. Айта кету керек, геометрияда түзу сызықтың өлшемі 1.

Жоғарыда көрсетілген мән техникалық тұрғыдан k өлшемі бар жалғыз параметр болса да, ол кейде k түрлі мәндерді қамтиды деп есептеледі. Мысалы, бір өлшемді Гаусс үлестірімімен O өлшемі 2 болатын жалғыз параметр болып табылады, бірақ кейде екі параметрді қамтиды.жеке параметр - орташа мән және стандартты ауытқу.

Егер O мәндерінің жиыны шексіз өлшемді болса, статистикалық процесс үлгісі параметрлік емес. Ол сондай-ақ жартылай параметрлі болып табылады, егер оның соңғы өлшемді және шексіз өлшемді параметрлері болса. Ресми түрде, егер k - O өлшемі және n - үлгілер саны болса, жартылай параметрлі және параметрлік емес үлгілерде

болады.

Үлгі формуласы
Үлгі формуласы

сонда үлгі жартылай параметрлі болады. Әйтпесе, проекция параметрлік емес.

Параметрлік үлгілер ең жиі қолданылатын статистика болып табылады. Жартылай параметрлік және параметрлік емес проекцияларға қатысты сэр Дэвид Кокс былай деді:

"Әдетте, олар текстура мен таралу пішіні туралы ең аз гипотезаларды қамтиды, бірақ олар өзін-өзі қамтамасыз ету туралы күшті теорияларды қамтиды."

Кірістірілген үлгілер

Оларды көп деңгейлі проекциялармен шатастырмаңыз.

Екі статистикалық үлгі кірістіріледі, егер біріншінің параметрлеріне шектеулер қою арқылы біріншісін екіншісіне түрлендіру мүмкін болса. Мысалы, барлық Гаусс үлестірімдерінің жиынында нөлдік орташа үлестірімдердің кірістірілген жиыны бар:

Яғни, нөлдік ортасы бар үлестірімдерді алу үшін барлық Гаусс үлестірімдерінің жиынындағы ортаны шектеу керек. Екінші мысал ретінде y=b 0 + b 1 x + b 2 x 2 + ε, ε ~N (0, σ 2) квадраттық үлгісінде y=енгізілген сызықтық моделі бар. b 0 + b 1 x + ε, ε ~ N (0,σ 2) - яғни b2 параметрі 0-ге тең.

Осы мысалдардың екеуінде де бірінші үлгі екінші үлгіге қарағанда жоғары өлшемділікке ие. Бұл жиі кездеседі, бірақ әрқашан емес. Тағы бір мысал, 2 өлшемі бар оң ортасы бар Гаусс үлестірімдерінің жиыны.

Модельдерді салыстыру

статистикалық модель
статистикалық модель

Бақыланатын деректердің негізінде оны жасаған процесс индукциялаған "шын" ықтималдық үлестірімі бар деп есептеледі.

Сондай-ақ үлгілерді зерттеу немесе растау арқылы бір-бірімен салыстыруға болады. Барлау талдауында әртүрлі модельдер тұжырымдалады және олардың әрқайсысы деректерді қаншалықты жақсы сипаттайтынына баға беріледі. Растау талдауында бұрын тұжырымдалған гипотеза бастапқымен салыстырылады. Бұл үшін ортақ критерийлерге P 2, Байес факторы және салыстырмалы ықтималдық жатады.

Кониси мен Китагаваның ойы

“Статистикалық математикалық модельдегі есептердің көпшілігін болжамды сұрақтар ретінде қарастыруға болады. Олар әдетте бірнеше факторларды салыстыру ретінде тұжырымдалады.”

Сонымен қатар, сэр Дэвид Кокс: "Тақырыптың аудармасы ретінде статистикалық модельдегі мәселе көбінесе талдаудың ең маңызды бөлігі болып табылады."

Ұсынылған: