Статистикалық ақпарат: жинау, өңдеу, талдау

Мазмұны:

Статистикалық ақпарат: жинау, өңдеу, талдау
Статистикалық ақпарат: жинау, өңдеу, талдау
Anonim

Статистика тарихында өлшеу деңгейлерінің таксономиясын құруға әртүрлі әрекеттер жасалды. Психофизик Стэнли Смит Стивенс номиналды, реттік, интервалдық және пропорционалдық шкалаларды анықтады.

Номиналды өлшемдердің мәндер арасындағы дәрежелердің маңызды реті жоқ және кез келген бір-бір түрлендіруге мүмкіндік береді.

Тұрақты өлшемдерде дәйекті мәндер арасында дәл емес айырмашылықтар бар, бірақ сол мәндердің арнайы реті бар және кез келген ретті сақтайтын түрлендіруге мүмкіндік береді.

Аралық өлшемдердің нүктелер арасындағы мәнді қашықтықтары бар, бірақ нөлдік мән ерікті (Цельсий немесе Фаренгейттегі бойлық пен температураны өлшеу жағдайында сияқты) және кез келген сызықтық түрлендіруге мүмкіндік береді.

Ратиция өлшемдері мағыналы нөлдік мәнге және әртүрлі өлшемдер арасындағы қашықтыққа ие және кез келген масштабтауды өзгертуге мүмкіндік береді.

Image
Image

Айнымалылар және ақпараттың жіктелуі

Себебі айнымалыларноминалды немесе реттік өлшемдерге ғана сәйкес келетіндерді сандық түрде өлшеу мүмкін емес және кейде категориялық айнымалылар ретінде топтастырылады. Қатынас пен интервал өлшемдері сандық сипатына байланысты дискретті немесе үздіксіз болуы мүмкін сандық айнымалылар ретінде топтастырылған. Мұндай айырмашылықтар көбінесе информатикадағы деректер түрімен еркін байланысты, өйткені дихотомиялық категориялық айнымалылар логикалық мәндермен, интегралды деректер түріндегі ерікті бүтін сандары бар политомиялық категориялық айнымалылар және өзгермелі нүктелерді есептеуді қамтитын нақты құрамдастары бар үздіксіз айнымалылар арқылы ұсынылуы мүмкін. Бірақ статистикалық ақпарат түрлерінің көрсетілімі қандай жіктеу қолданылатынына байланысты.

Жұмысшылар туралы статистикалық ақпарат
Жұмысшылар туралы статистикалық ақпарат

Басқа классификациялар

Статистикалық деректердің (ақпараттың) басқа классификациялары да жасалды. Мысалы, Мостеллер мен Тукей бағаларды, дәрежелерді, есептелген акцияларды, сандарды, сомалар мен баланстарды ажыратты. Нелдер бір уақытта үздіксіз санауларды, үздіксіз арақатынастарды, санақтардың корреляциясын және деректерді берудің категориялық тәсілдерін сипаттады. Барлық осы жіктеу әдістері статистикалық ақпаратты жинауда қолданылады.

Мәселелер

Әртүрлі өлшеу (жинау) процедуралары арқылы алынған деректерге статистикалық әдістердің әртүрлі түрлерін қолдану орынды ма деген сұрақ айнымалыларды түрлендіруге және сұрақтарды дәл түсіндіруге қатысты мәселелермен қиындайды.зерттеу. «Деректер мен оның сипаттайтыны арасындағы байланыс жай ғана статистикалық мәлімдемелердің белгілі бір түрлерінің белгілі бір түрлендірулер кезінде өзгермейтін ақиқат мәндеріне ие болуы мүмкін екендігін көрсетеді. Трансформацияны қарастыру керек пе, ол жауап беруге тырысып жатқан сұраққа байланысты.

Статистикалық ақпараттың мысалы
Статистикалық ақпараттың мысалы

Дерек түрі дегеніміз не

Дерек түрі айнымалының семантикалық мазмұнының негізгі құрамдас бөлігі болып табылады және айнымалыны сипаттау үшін қандай ықтималдық үлестірімдерін логикалық түрде пайдалануға болатынын, онда рұқсат етілген операцияларды, оны болжау үшін қолданылатын регрессиялық талдау түрін басқарады., және т.б. Деректер түрінің тұжырымдамасы өлшем деңгейі тұжырымдамасында ұқсас, бірақ нақтырақ – мысалы, деректерді санау теріс емес нақты мәндерге қарағанда басқа бөлуді (Пуассон немесе биномдық) талап етеді, бірақ екеуі де бірдей өлшем деңгейі (коэффициент шкаласы).

Судьялар туралы статистикалық ақпарат
Судьялар туралы статистикалық ақпарат

Таразы

Статистикалық ақпаратты өңдеуге арналған өлшем деңгейлерінің таксономиясын жасауға әртүрлі әрекеттер жасалды. Психофизик Стэнли Смит Стивенс номиналды, реттік, интервалдық және пропорционалдық шкалаларды анықтады. Номиналды өлшемдер мәндер арасында дәрежелердің маңызды тәртібіне ие емес және кез келген бір-бір түрлендіруге мүмкіндік береді. Кәдімгі өлшемдер дәйекті мәндер арасында нақты емес айырмашылықтарға ие, бірақ бұл мәндердің маңызды тәртібінде ерекшеленеді және мүмкіндік бередікез келген тәртіпті сақтайтын түрлендіру. Интервалдық өлшемдердің өлшемдер арасындағы мағыналы арақашықтықтары бар, бірақ нөлдік мән ерікті (Цельсий немесе Фаренгейт бойынша бойлық пен температураны өлшеу жағдайында сияқты) және кез келген сызықтық түрлендіруге мүмкіндік береді. Қатынас өлшемдерінің мағыналы нөлдік мәні мен әртүрлі анықталған өлшемдер арасындағы қашықтықтары бар және кез келген масштабтауды түрлендіруге мүмкіндік береді.

Диаграммалық модель
Диаграммалық модель

Бір санды пайдаланып сипаттауға болмайтын деректер жиі нақты кездейсоқ шамалардың кездейсоқ векторларына қосылады, дегенмен оларды өзіңіз өңдеу үрдісі өсуде. Мұндай мысалдар төменде талқыланады.

Кездейсоқ векторлар

Жеке элементтер өзара байланысты болуы немесе болмауы мүмкін. Корреляциялық кездейсоқ векторларды сипаттау үшін қолданылатын үлестірім мысалдары көп айнымалы қалыпты таралу және көп айнымалы t-таралу болып табылады. Жалпы алғанда, кез келген элементтер арасында ерікті корреляция болуы мүмкін, бірақ бұл көбінесе белгілі бір өлшемнен жоғары реттелмейтін болады, бұл өзара байланысты құрамдастарға қосымша шектеулерді талап етеді.

статистикалық атрибуттар
статистикалық атрибуттар

Кездейсоқ матрицалар

Кездейсоқ матрицаларды сызықты түрде орналастыруға және кездейсоқ векторлар ретінде қарастыруға болады, бірақ бұл әртүрлі элементтер арасындағы корреляцияны көрсетудің тиімді жолы болмауы мүмкін. Кейбір ықтималдық үлестірімдері қалыпты матрица сияқты кездейсоқ матрицалар үшін арнайы жасалғантарату және Wishart тарату.

Кездейсоқ реттілік

Кейде олар кездейсоқ векторлар ретінде қарастырылады, бірақ басқа жағдайларда бұл термин әрбір кездейсоқ шама жақын маңдағы айнымалылармен ғана корреляцияланатын жағдайларға арнайы қолданылады (Марков үлгісіндегідей). Бұл Байес желісінің ерекше жағдайы және гендік тізбектер немесе ұзын мәтіндік құжаттар сияқты өте ұзақ тізбектер үшін пайдаланылады. Бірқатар үлгілер жасырын Марков тізбегі сияқты реттіліктер үшін арнайы әзірленген.

Типтік диаграмма
Типтік диаграмма

Кездейсоқ процестер

Олар кездейсоқ реттіліктерге ұқсайды, бірақ реттілік ұзындығы анықталмаған немесе шексіз болғанда және реттіліктегі элементтер бір-бірден өңделген кезде ғана. Бұл уақыт қатарлары ретінде сипатталатын деректер үшін жиі пайдаланылады. Бұл, мысалы, келесі күнгі акция бағасына қатысты дұрыс.

Қорытынды

Статистикалық ақпаратты талдау толығымен оны жинау сапасына байланысты. Соңғысы, өз кезегінде, оның жіктелу мүмкіндіктерімен тығыз байланысты. Әрине, статистикалық ақпаратты жіктеудің көптеген түрлері бар, оны оқырман осы мақаланы оқығанда өзі көре алады. Осыған қарамастан, тиімді құралдардың болуы және математиканы жақсы меңгеру, сондай-ақ әлеуметтану саласындағы білім өз жұмысын жасайды, бұл қатені елеулі түзетусіз кез келген сауалнаманы немесе зерттеуді жүргізуге мүмкіндік береді. Формадағы статистикалық ақпарат көздеріадамдар, ұйымдар және әлеуметтанудың басқа да субъектілері, бақытымызға орай, үлкен көлемде ұсынылған. Шынайы зерттеушінің жолына ешбір қиындық кедергі бола алмайды.

Ұсынылған: