Статистикалық модельдеу: әдістері, сипаттамасы, қолданылуы

Мазмұны:

Статистикалық модельдеу: әдістері, сипаттамасы, қолданылуы
Статистикалық модельдеу: әдістері, сипаттамасы, қолданылуы
Anonim

Статистикалық модельдеуге енгізілген болжамдар ықтималдық үлестірімдерінің жиынтығын сипаттайды, олардың кейбіреулері үлестіруді барабар жақындатады деп болжанады. Анықтамадан белгілі бір деректер жинағы таңдалады. Статистикалық модельдеуге тән ықтималдық үлестірімдері статистикалық модельдерді басқа, статистикалық емес, математикалық үлгілерден ерекшелендіреді.

Image
Image

Математикамен байланыс

Бұл ғылыми әдіс негізінен математикаға негізделген. Жүйелерді статистикалық модельдеу әдетте бір немесе бірнеше кездейсоқ шамаларды және мүмкін басқа кездейсоқ емес айнымалыларды байланыстыратын математикалық теңдеулер арқылы беріледі. Осылайша, статистикалық модель «теорияның ресми көрінісі» болып табылады (Герман Адер, Кеннет Болленнің сөзін келтіреді).

Барлық статистикалық гипотеза сынақтары және барлық статистикалық бағалаулар статистикалық үлгілерден алынған. Жалпы алғанда, статистикалық модельдер статистикалық қорытындының негізінің бөлігі болып табылады.

Статистика әдістерімодельдеу

Бейресми түрде статистикалық модельді белгілі бір қасиеті бар статистикалық болжам (немесе статистикалық жорамалдар жиынтығы) ретінде қарастыруға болады: бұл болжам кез келген оқиғаның ықтималдығын есептеуге мүмкіндік береді. Мысал ретінде кәдімгі алты қырлы сүйектерді қарастырайық. Біз сүйекке қатысты екі түрлі статистикалық болжамды зерттейміз.

Бірінші статистикалық болжам статистикалық модельді құрайды, өйткені тек бір болжаммен біз кез келген оқиғаның ықтималдығын есептей аламыз. Балама статистикалық болжам статистикалық модель болып табылмайды, өйткені тек бір болжаммен біз әрбір оқиғаның ықтималдығын есептей алмаймыз.

Типтік статистикалық модель
Типтік статистикалық модель

Жоғарыдағы мысалда бірінші болжаммен оқиғаның ықтималдығын есептеу оңай. Дегенмен, кейбір басқа мысалдарда есептеу күрделі немесе тіпті мүмкін емес болуы мүмкін (мысалы, миллиондаған жылдар бойы есептеуді қажет етуі мүмкін). Статистикалық модельді құрайтын болжам үшін бұл қиындық қолайлы: есептеуді орындау іс жүзінде мүмкін емес, тек теориялық мүмкін.

Үлгілердің мысалдары

Бізде балалары біркелкі бөлінген мектеп оқушыларының саны бар делік. Баланың бойы стохастикалық түрде жасына байланысты болады: мысалы, баланың 7 жаста екенін білгенде, бұл баланың бойының 5 фут (шамамен 152 см) болу ықтималдығына әсер етеді. Біз бұл қатынасты сызықтық регрессия үлгісінде ресімдей аламыз, мысалы: өсу=b0 + b1agei+ εi, мұндағы b0 - қиылысу, b1 - өсу болжамын алу кезінде жас көбейтілетін параметр, εi - қателік термин. Бұл бойдың жасына байланысты қателікпен болжанатынын білдіреді.

Жарамды үлгі барлық деректер нүктелеріне сәйкес келуі керек. Сонымен түзу сызық (heighti=b0 + b1agei) деректер моделі үшін теңдеу бола алмайды - егер ол барлық деректер нүктелеріне дәл сәйкес келмесе, яғни барлық деректер нүктелері сызықта тамаша жатпаса. Үлгінің барлық деректер нүктелеріне сәйкес келуі үшін εi қате термині теңдеуде болуы керек.

гендерлік статистика
гендерлік статистика

Статистикалық қорытынды жасау үшін алдымен εi үшін кейбір ықтималдық үлестірімдерін қабылдау керек. Мысалы, εi үлестірімі нөлдік ортамен Гаусс болып табылады деп болжауға болады. Бұл жағдайда модельдің 3 параметрі болады: b0, b1 және Гаусс үлестірімінің дисперсиясы.

Жалпы сипаттама

Статистикалық модель – математикалық модельдің арнайы класы. Статистикалық модельдің басқа математикалық модельдерден ерекшелігі оның детерминирленген еместігі болып табылады. Ол статистикалық мәліметтерді модельдеу үшін қолданылады. Осылайша, математикалық теңдеулермен анықталған статистикалық модельде кейбір айнымалылар нақты мәндерге ие емес, олардың орнына ықтималдық үлестірімдері болады; яғни кейбір айнымалылар стохастикалық болып табылады. Жоғарыдағы мысалда ε – стохастикалық айнымалы; бұл айнымалысыз модель болдыдетерминистік болады.

Статистикалық модельдер, тіпті модельденетін физикалық процесс детерминирленген болса да, статистикалық талдау мен модельдеуде жиі пайдаланылады. Мысалы, монета лақтыру негізінен детерминирленген процесс болып табылады; бірақ ол әдетте стохастикалық ретінде үлгіленеді (Бернулли процесі арқылы).

жылыну статистикасы
жылыну статистикасы

Параметрлік үлгілер

Параметрлік модельдер ең жиі қолданылатын статистикалық модельдер болып табылады. Жартылай параметрлік және параметрлік емес модельдерге қатысты сэр Дэвид Кокс: «Олар әдетте таралу құрылымы мен пішіні туралы азырақ болжамдарды қамтиды, бірақ әдетте күшті тәуелсіздік жорамалдарын қамтиды». Барлық басқа аталған модельдер сияқты олар да математикалық модельдеудің статистикалық әдісінде жиі пайдаланылады.

Көпдеңгейлі үлгілер

Көпдеңгейлі үлгілер (сонымен қатар иерархиялық сызықтық модельдер, кірістірілген деректер үлгілері, аралас үлгілер, кездейсоқ коэффициенттер, кездейсоқ әсерлер үлгілері, кездейсоқ параметр үлгілері немесе бөлінген үлгілер ретінде белгілі) бір деңгейден көп өзгеретін статистикалық параметр үлгілері болып табылады. Мысал жеке оқушыларға арналған көрсеткіштерді, сондай-ақ оқушылар топтастырылған сыныптарға арналған көрсеткіштерді қамтитын оқушы жетістіктерінің үлгісі болып табылады. Бұл модельдерді сызықтық модельдердің жалпылауы ретінде қарастыруға болады (атап айтқанда, сызықтық регрессия), бірақ оларды сызықтық емес модельдерге де кеңейтуге болады. Бұл модельдер айналдыЖеткілікті есептеу қуаты мен бағдарламалық құрал қолжетімді болғаннан кейін әлдеқайда танымал болды.

Сегменттік статистика
Сегменттік статистика

Көпдеңгейлі үлгілер қатысушыларға арналған деректер бірнеше деңгейде ұйымдастырылған (яғни, кірістірілген деректер) зерттеу жобаларына әсіресе қолайлы. Талдау бірліктері әдетте мәтінмән/жиынтық бірлік ішінде (жоғары деңгейде) кірістірілген жеке тұлғалар (төменгі деңгейде) болып табылады. Көп деңгейлі модельдердегі деректердің ең төменгі деңгейі әдетте жеке болса да, жеке тұлғалардың қайталанатын өлшемдерін де қарастыруға болады. Осылайша, көп деңгейлі модельдер бір айнымалы немесе көп мәнді қайталанатын өлшемдерді талдау үшін талдаудың баламалы түрін қамтамасыз етеді. Өсу қисықтарының жеке айырмашылықтарын қарастыруға болады. Сонымен қатар, көп деңгейлі үлгілерді ANCOVA-ға балама ретінде пайдалануға болады, мұнда тәуелді айнымалы баллдар емдеу айырмашылықтарын тексеру алдында ковариаттар үшін түзетіледі (мысалы, жеке айырмашылықтар). Көпдеңгейлі үлгілер ANCOVA талап ететін біркелкі регрессия еңістерінсіз бұл эксперименттерді талдай алады.

Көпдеңгейлі үлгілерді көп деңгейлі деректер үшін пайдалануға болады, дегенмен екі деңгейлі үлгілер ең кең таралған және осы мақаланың қалған бөлігі осыларға арналған. Тәуелді айнымалы талдаудың ең төменгі деңгейінде зерттелуі керек.

Атмосфералық қысым графигі
Атмосфералық қысым графигі

Үлгі таңдау

Үлгі таңдаустатистикалық модельдеу шеңберінде жүзеге асырылатын мәліметтерді ескере отырып, үміткер модельдер жиынтығынан таңдау міндеті болып табылады. Ең қарапайым жағдайларда бұрыннан бар деректер жинағы қарастырылады. Дегенмен, тапсырма жинақталған деректер үлгі таңдау тапсырмасына жақсы сәйкес келетін эксперименттерді жобалауды да қамтуы мүмкін. Ұқсас болжау немесе түсіндіру күші бар үміткер үлгілерді ескере отырып, ең қарапайым үлгі ең жақсы таңдау болуы мүмкін (Оккам ұстарасы).

Кониши және Китагава былай дейді: «Статистикалық қорытынды есептердің көпшілігін статистикалық модельдеуге қатысты мәселелер деп санауға болады». Сол сияқты, Кокс: «Пәнді статистикалық модельге аудару әдісі көбінесе талдаудың ең маңызды бөлігі болып табылады»

Модельді таңдау белгісіздік жағдайында шешім қабылдау немесе оңтайландыру мақсатында есептеу үлгілерінің үлкен жинағынан бірнеше өкілдік үлгілерді таңдау мәселесіне де қатысты болуы мүмкін.

Графикалық үлгілер

Графикалық модель немесе ықтималдық графикалық модель, (PGM) немесе құрылымдық ықтималдық моделі - график кездейсоқ шамалар арасындағы шартты қатынас құрылымын білдіретін ықтималдық модель. Олар әдетте ықтималдықтар теориясында, статистикада (әсіресе Байес статистикасында) және машиналық оқытуда қолданылады.

Графигі бар статистикалық модель
Графигі бар статистикалық модель

Эконометриялық үлгілер

Эконометриялық модельдер – пайдаланылатын статистикалық модельдерэконометрика. Эконометриялық модель белгілі бір экономикалық құбылысқа қатысты әртүрлі экономикалық шамалар арасында бар деп есептелетін статистикалық байланыстарды анықтайды. Эконометриялық модель белгісіздікті ескеретін детерминирленген экономикалық модельден немесе өзі стохастикалық болып табылатын экономикалық модельден алынуы мүмкін. Дегенмен, қандай да бір нақты экономикалық теориямен байланысы жоқ эконометриялық үлгілерді де қолдануға болады.

Ұсынылған: