Логистикалық регрессия: моделі және әдістері

Мазмұны:

Логистикалық регрессия: моделі және әдістері
Логистикалық регрессия: моделі және әдістері
Anonim

Логистикалық регрессия және дискриминантты талдау әдістері респонденттерді мақсатты санаттар бойынша нақты саралау қажет болғанда қолданылады. Бұл жағдайда топтардың өздері бір нұсқалы параметрдің деңгейлері арқылы көрсетіледі. Логистикалық регрессия үлгісін толығырақ қарастырайық және оның не үшін қажет екенін білейік.

логистикалық регрессия
логистикалық регрессия

Жалпы ақпарат

Логистикалық регрессия қолданылатын мәселенің мысалы респонденттерді қыша сатып алатын және сатып алмайтын топтарға жіктеу болып табылады. Дифференциация әлеуметтік-демографиялық сипаттамаларға сәйкес жүзеге асырылады. Оларға, атап айтқанда, жасы, жынысы, туыстарының саны, табысы және т.б. жатады. Операцияларда саралау критерийлері мен айнымалы бар. Соңғысы респонденттерді бөлуге болатын мақсатты санаттарды кодтайды.

Нюанстар

Логистикалық регрессия қолданылатын жағдайлардың диапазоны дискриминантты талдауға қарағанда әлдеқайда тар екенін айту керек. Осыған байланысты соңғысын дифференциацияның әмбебап әдісі ретінде пайдалану қарастырыладыартықшылық береді. Сонымен қатар, сарапшылар дискриминантты талдау арқылы жіктеу зерттеулерін бастауды ұсынады. Ал нәтижелер белгісіз болған жағдайда ғана логистикалық регрессияны қолдануға болады. Бұл қажеттілік бірнеше факторларға байланысты. Логистикалық регрессия тәуелсіз және тәуелді айнымалылар түрі туралы нақты түсінік болған кезде қолданылады. Сәйкесінше, мүмкін болатын 3 процедураның бірі таңдалады. Дискриминантты талдауда зерттеуші әрқашан бір статикалық операциямен айналысады. Ол кез келген шкала түрі бар бір тәуелді және бірнеше тәуелсіз категориялық айнымалыларды қамтиды.

Көрулер

Логистикалық регрессияны қолданатын статистикалық зерттеудің міндеті белгілі бір респонденттің белгілі бір топқа тағайындалу ықтималдығын анықтау болып табылады. Дифференциация белгілі бір параметрлер бойынша жүзеге асырылады. Іс жүзінде бір немесе бірнеше тәуелсіз факторлардың мәндері бойынша респонденттерді екі топқа бөлуге болады. Бұл жағдайда екілік логистикалық регрессия орын алады. Сондай-ақ, көрсетілген параметрлерді екіден көп топтарға бөлу кезінде пайдалануға болады. Мұндай жағдайда мультиномды логистикалық регрессия орын алады. Нәтижедегі топтар бір айнымалы деңгейлерде көрсетіледі.

логистикалық регрессия
логистикалық регрессия

Мысалы

Мәскеу маңынан жер телімін сатып алу ұсынысына қызығушылық танытқаны туралы сұраққа респонденттердің жауаптары бар делік. Опциялар «жоқ»және иә. Потенциалды сатып алушылардың шешім қабылдауына қандай факторлардың басым әсер ететінін анықтау қажет. Ол үшін респонденттерге аумақтың инфрақұрылымы, астанаға дейінгі қашықтық, учаскенің ауданы, тұрғын үйдің болуы/болмауы және т.б. сұрақтар қойылады. Бинарлы регрессияны пайдалана отырып, бөлуге болады. респонденттерді екі топқа бөледі. Біріншісіне сатып алуға мүдделі адамдар – әлеуетті сатып алушылар, ал екіншісіне сәйкесінше мұндай ұсынысқа қызығушылық танытпайтындар болады. Әрбір респондент үшін бір немесе басқа санатқа тағайындалу ықтималдығы есептеледі.

Салыстырмалы сипаттамалар

Жоғарыдағы екі опциядан айырмашылығы – топтардың әртүрлі саны мен тәуелді және тәуелсіз айнымалылар түрі. Бинарлы регрессияда, мысалы, дихотомиялық фактордың бір немесе бірнеше тәуелсіз шарттарға тәуелділігі зерттеледі. Оның үстіне, соңғысы масштабтың кез келген түріне ие болуы мүмкін. Көпмүшелік регрессия классификацияның осы нұсқасының нұсқасы ретінде қарастырылады. Онда тәуелді айнымалыға 2-ден астам топ жатады. Тәуелсіз факторлардың реттік немесе номиналды шкаласы болуы керек.

Spss жүйесіндегі логистикалық регрессия

11-12 статистикалық пакетте талдаудың жаңа нұсқасы енгізілді - реттік. Бұл әдіс тәуелді фактор бір атаулы (реттік) шкалаға жататын кезде қолданылады. Бұл жағдайда тәуелсіз айнымалылар белгілі бір типтен таңдалады. Олар реттік немесе номиналды болуы керек. Бірнеше санаттарға жіктеу ең көп деп саналадыәмбебап. Бұл әдіс логистикалық регрессияны қолданатын барлық зерттеулерде қолданылуы мүмкін. Дегенмен, модельдің сапасын жақсартудың жалғыз жолы - барлық үш әдісті пайдалану.

барабар сапаны тексеру және логистикалық регрессия
барабар сапаны тексеру және логистикалық регрессия

Реттеу классификация

Бұрын статистикалық пакетте реттік шкаламен тәуелді факторларға мамандандырылған талдау жүргізудің әдеттегі мүмкіндігі болмағанын айту керек. 2-ден көп топтары бар барлық айнымалылар үшін көп номиналды нұсқа қолданылды. Салыстырмалы түрде жақында енгізілген реттік талдаудың бірқатар ерекшеліктері бар. Олар шкаланың ерекшеліктерін ескереді. Сонымен қатар, оқу құралдарында реттік логистикалық регрессия көбінесе жеке әдістеме ретінде қарастырылмайды. Бұл келесіге байланысты: реттік талдаудың көпмүшелікке қарағанда айтарлықтай артықшылығы жоқ. Зерттеуші соңғысын реттік те, номиналды да тәуелді айнымалы болған кезде қолдана алады. Сонымен қатар, жіктеу процестерінің өзі бір-бірінен ерекшеленбейді. Бұл реттік талдауды орындау ешқандай қиындық тудырмайтынын білдіреді.

Талдау опциясы

Қарапайым жағдайды қарастырайық – екілік регрессия. Маркетингтік зерттеулер барысында белгілі бір елордалық ЖОО түлектеріне деген сұраныс бағаланды делік. Сауалнамада респонденттерге сұрақтар қойылды, соның ішінде:

  1. Сіз жұмыссыз ба? (ql).
  2. Бітірген жылын енгізіңіз (21-q).
  3. Орташа көрсеткіш қандайбітіру баллы (орташа).
  4. Жынысы (22-q).

Логистикалық регрессия ql айнымалысына aver, q 21 және q 22 тәуелсіз факторларының әсерін бағалайды. Қарапайым тілмен айтқанда, талдаудың мақсаты мамандық, оқу жылы және GPA туралы ақпарат негізінде түлектердің ықтимал жұмысқа орналасу мүмкіндігін анықтау болады.

логистикалық сигма тәрізді регрессия көрсеткіші
логистикалық сигма тәрізді регрессия көрсеткіші

Логистикалық регрессия

Параметрлерді екілік регрессия арқылы орнату үшін Талдау►Регрессия►Екілік логистикалық мәзірді пайдаланыңыз. Логистикалық регрессия терезесінде сол жақтағы қолжетімді айнымалылар тізімінен тәуелді факторды таңдаңыз. Бұл ql. Бұл айнымалы мән Тәуелді өріске орналастырылуы керек. Осыдан кейін Ковариаттар сызбасына тәуелсіз факторларды енгізу қажет - q 21, q 22, aver. Содан кейін сіз оларды талдауыңызға қалай қосу керектігін таңдауыңыз керек. Егер тәуелсіз факторлардың саны 2-ден көп болса, онда әдепкі бойынша орнатылған барлық айнымалыларды бір мезгілде енгізу әдісі қолданылады, бірақ кезең-кезеңімен. Ең танымал әдіс - Backward:LR. «Таңдау» түймесін пайдаланып, зерттеуге барлық респонденттерді емес, тек белгілі бір мақсатты санатты қосуға болады.

Категориялық айнымалыларды анықтау

Санат түймешігін тәуелсіз айнымалылардың бірі 2 санаттан көп номиналды болғанда пайдалану керек. Бұл жағдайда «Категориялық айнымалыларды анықтау» терезесінде дәл осындай параметр «Категориялық айнымалылар» бөлімінде орналастырылады. Бұл мысалда мұндай айнымалы жоқ. Осыдан кейін ашылмалы тізімде Контраст келесідей боладыАуытқу элементін таңдап, Өзгерту түймесін басыңыз. Нәтижесінде әрбір номиналды фактордан бірнеше тәуелді айнымалылар қалыптасады. Олардың саны бастапқы шарт санаттарының санына сәйкес келеді.

Жаңа айнымалыларды сақтау

Зерттеудің негізгі диалогтық терезесіндегі Сақтау түймешігін пайдалану арқылы жаңа параметрлерді құру орнатылады. Олар регрессия процесінде есептелген көрсеткіштерді қамтиды. Атап айтқанда, мынаны анықтайтын айнымалы мәндерді жасауға болады:

  1. Арнайы жіктеу санатына жатады (Топқа мүшелік).
  2. Әрбір зерттеу тобына респондентті тағайындау ықтималдығы (Ықтималдықтар).

Параметрлер түймесін пайдаланған кезде зерттеуші маңызды опцияларды алмайды. Тиісінше, оны елемеуге болады. «OK» түймесін басқаннан кейін талдау нәтижелері негізгі терезеде көрсетіледі.

логистикалық регрессия коэффициенті
логистикалық регрессия коэффициенті

Сәйкестікті және логистикалық регрессияны тексеру

Модель коэффициенттерінің Омнибус сынақтары кестесін қарастырыңыз. Ол модельдің жуықтау сапасының талдау нәтижелерін көрсетеді. Қадамдық опция орнатылғандықтан, соңғы кезеңнің нәтижелерін қарау керек (2-қадам). Маңыздылық дәрежесі жоғары келесі кезеңге өту кезінде Хи-квадрат көрсеткішінің жоғарылауы анықталса, оң нәтиже қарастырылады (< 0,05 сиг.). Үлгінің сапасы Үлгі жолында бағаланады. Егер теріс мән алынса, бірақ ол модельдің жалпы жоғары маңыздылығымен маңызды болып саналмаса, соңғыіс жүзінде қолайлы деп санауға болады.

Кестелер

Үлгі жиыны құрастырылған модель (R шаршы индексі) арқылы сипатталатын жалпы дисперсия индексін бағалауға мүмкіндік береді. Нагелькер мәнін пайдалану ұсынылады. Nagelkerke R Square параметрі 0,50-ден жоғары болса, оң көрсеткіш деп санауға болады. Осыдан кейін жіктеу нәтижелері бағаланады, онда зерттелетін сол немесе басқа санатқа жататын нақты көрсеткіштер регрессиялық модель негізінде болжанғандармен салыстырылады. Ол үшін классификациялық кесте қолданылады. Ол сондай-ақ қарастырылып отырған әр топ үшін саралаудың дұрыстығы туралы қорытынды жасауға мүмкіндік береді.

логистикалық регрессия моделі
логистикалық регрессия моделі

Келесі кесте талдауға енгізілген тәуелсіз факторлардың, сондай-ақ әрбір стандартталмаған логистикалық регрессия коэффициентінің статистикалық маңыздылығын білуге мүмкіндік береді. Осы көрсеткіштерге сүйене отырып, іріктеудегі әрбір респонденттің белгілі бір топқа жататынын болжауға болады. Сақтау түймешігін пайдаланып жаңа айнымалыларды енгізуге болады. Олар белгілі бір жіктеу санатына жататындығы (болжалды санат) және осы топтарға қосылу ықтималдығы (болжалды ықтималдықтардың мүшелігі) туралы ақпаратты қамтиды. «OK» түймесін басқаннан кейін есептеу нәтижелері Multinomial Logistic Regression негізгі терезесінде пайда болады.

Зерттеуші үшін маңызды көрсеткіштерді қамтитын бірінші кесте – Үлгіні орнату туралы ақпарат. Статистикалық маңыздылықтың жоғары деңгейі жоғары сапаны жәнепрактикалық есептерді шешуде модельді қолданудың қолайлылығы. Тағы бір маңызды кесте - Pseudo R-Square. Ол талдау үшін таңдалған тәуелсіз айнымалылар арқылы анықталатын тәуелді фактордағы жалпы дисперсияның үлесін бағалауға мүмкіндік береді. Ықтималдылық қатынасының сынақтары кестесіне сәйкес соңғысының статистикалық маңыздылығы туралы қорытынды жасауға болады. Параметр Бағалары стандартталмаған коэффициенттерді көрсетеді. Олар теңдеу құруда қолданылады. Сонымен қатар, айнымалылардың әрбір комбинациясы үшін олардың тәуелді факторға әсер етуінің статистикалық маңыздылығы анықталды. Сонымен қатар, маркетингтік зерттеулерде респонденттерді санат бойынша жеке емес, мақсатты топтың бөлігі ретінде саралау қажет болады. Ол үшін бақыланатын және болжамды жиіліктер кестесі пайдаланылады.

Практикалық қолданба

Трейдерлердің жұмысында қарастырылған талдау әдісі кеңінен қолданылады. 1991 жылы логистикалық сигма тәрізді регрессия көрсеткіші әзірленді. Бұл ықтимал бағаларды «қызып кетуден» бұрын болжауға арналған пайдалану оңай және тиімді құрал. Көрсеткіш диаграммада екі параллель сызықтан құрылған арна ретінде көрсетілген. Олар трендтен бірдей қашықтықта орналасқан. Дәліздің ені тек уақыт аралығына байланысты болады. Көрсеткіш барлық дерлік активтермен жұмыс істеу кезінде пайдаланылады - валюталық жұптардан бағалы металдарға дейін.

spss ішіндегі логистикалық регрессия
spss ішіндегі логистикалық регрессия

Тәжірибеде құралды пайдаланудың 2 негізгі стратегиясы әзірленді: үзіліс үшін жәнебұрылыс үшін. Соңғы жағдайда трейдер арна ішіндегі бағаның өзгеру динамикасына назар аударады. Мән қолдау немесе қарсылық сызығына жақындаған кезде, қозғалыстың қарсы бағытта басталу ықтималдығына ставка қойылады. Егер баға жоғарғы шекараға жақындаса, онда активтен құтылуға болады. Егер ол төменгі шекте болса, сатып алу туралы ойлану керек. Бөлу стратегиясы тапсырыстарды пайдалануды қамтиды. Олар салыстырмалы түрде шағын қашықтықта шектен тыс орнатылады. Кейбір жағдайларда баға оларды қысқа уақытқа бұзатынын ескере отырып, сіз оны қауіпсіз ойнап, жоғалтуды тоқтатуыңыз керек. Бұл ретте, әрине, таңдалған стратегияға қарамастан, трейдер нарықта туындаған жағдайды мүмкіндігінше сабырлы түрде қабылдауы және бағалауы керек.

Қорытынды

Осылайша, логистикалық регрессияны пайдалану респонденттерді берілген параметрлер бойынша санаттарға жылдам және оңай жіктеуге мүмкіндік береді. Талдау кезінде сіз кез келген нақты әдісті пайдалана аласыз. Атап айтқанда, көпмүшелік регрессия әмбебап болып табылады. Дегенмен, сарапшылар жоғарыда сипатталған барлық әдістерді біріктіріп пайдалануды ұсынады. Бұл бұл жағдайда модельдің сапасы айтарлықтай жоғары болатындығына байланысты. Бұл өз кезегінде оның қолдану аясын кеңейтеді.

Ұсынылған: