Көп нұсқалы масштабтау (MDS) – деректер жиынындағы жеке істердің ұқсастық деңгейін визуализациялауға арналған құрал. Ол ақпаратты визуализациялауда, атап айтқанда, қашықтық матрицасында қамтылған ақпаратты көрсету үшін қолданылатын байланысты тағайындау әдістерінің жиынтығына жатады. Бұл сызықты емес өлшемді азайтудың бір түрі. MDS алгоритмі әрбір нысанды N-өлшемді кеңістікте нысандар арасындағы қашықтық барынша жақсы сақталғандай етіп орналастыруға бағытталған. Әр нысанға N өлшемдердің әрқайсысында координаттар тағайындалады.
MDS графигінің өлшемдерінің саны 2-ден асуы мүмкін және априори көрсетілген. N=2 параметрін таңдау 2D шашырау сызбасы үшін нысанды орналастыруды оңтайландырады. Көпөлшемді масштабтау мысалдарын мақаладағы суреттерден көруге болады. Орыс тіліндегі таңбалары бар мысалдар әсіресе көрнекі.
Эссенция
Көпөлшемді масштабтау әдісі (MMS,MDS) - жоғалту функцияларының және салмақтары бар белгілі қашықтықтардың кіріс матрицаларының жиынын оңтайландыру процедурасын жалпылайтын классикалық құралдардың кеңейтілген жиынтығы және т.б. Осы контекстте пайдалы жоғалту функциясы стресс деп аталады, ол көбінесе стресстің негізгі бөлігі деп аталатын процедура арқылы азайтылады.
Нұсқаулық
Көпөлшемді масштабтаудың бірнеше нұсқасы бар. MDS бағдарламалары шешімді алу үшін жүктемені автоматты түрде азайтады. Метрикалық емес MDS алгоритмінің негізі екі жақты оңтайландыру процесі болып табылады. Біріншіден, оңтайлы монотонды жақындық түрлендіруін табу керек. Екіншіден, конфигурация нүктелері олардың қашықтығы масштабталған жақындық мәндеріне барынша сәйкес келетіндей етіп оңтайлы орналасуы керек.
Кеңейту
Мақсат кеңістігі ерікті тегіс евклидтік емес кеңістік болып табылатын статистикадағы метрикалық көпөлшемді масштабтаудың кеңейтімі. Мұндағы айырмашылықтар беттегі қашықтық және мақсатты кеңістік басқа бет болып табылады. Тақырыптық бағдарламалар бір бетінің екіншісіне аз бұрмалануы бар қондырманы табуға мүмкіндік береді.
Қадамдар
Көп нұсқалы масштабтауды пайдаланып зерттеу жүргізудің бірнеше қадамдары бар:
- Мәселені тұжырымдау. Қандай айнымалыларды салыстырғыңыз келеді? Сіз қанша айнымалыны салыстырғыңыз келеді? Зерттеу қандай мақсатта пайдаланылады?
- Енгізілген деректер алынуда. Респонденттерге бірқатар сұрақтар қойылады. Өнімдердің әрбір жұбы үшін олардан ұқсастықты бағалау сұралады (әдетте 7 балдық Лайкерт шкаласы бойынша өте ұқсастан өте ұқсамайтынға дейін). Бірінші сұрақ Coca-Cola/Pepsi үшін болуы мүмкін, мысалы, келесісі сыраға, келесісі Доктор Пеперге және т.б. Сұрақтар саны брендтер санына байланысты.
Балама тәсілдер
Тағы екі тәсіл бар. Өнімдер атрибуттарға ыдырайтын және бағалау семантикалық дифференциалды шкала бойынша жүзеге асырылатын «Перцептивті деректер: туынды тәсіл» деп аталатын әдістеме бар. Тағы бір әдіс респонденттерден ұқсастықтар емес, қалаулар туралы сұралатын "артықшылықтар туралы деректер тәсілі".
Ол келесі қадамдардан тұрады:
- MDS статистикалық бағдарламасы іске қосылуда. Процедураны орындауға арналған бағдарламалық қамтамасыз ету көптеген статистикалық бағдарламалық пакеттерде бар. Көбінесе метрикалық MDS (аралық немесе қатынас деңгейі деректерімен айналысады) және метрикалық емес MDS (реттік деректермен айналысады) арасында таңдау болады.
- Өлшемдер санын анықтау. Зерттеуші компьютерде жасағысы келетін өлшемдер санын анықтауы керек. Өлшемдер неғұрлым көп болса, статистикалық сәйкестік соғұрлым жақсы болады, бірақ нәтижелерді түсіндіру қиынырақ болады.
- Нәтижелерді көрсету және өлшемдерді анықтау - статистикалық бағдарлама (немесе қатысты модуль) нәтижелерді көрсетеді. Карта әрбір өнімді көрсетеді (әдетте 2D).ғарыш). Өнімдердің бір-біріне жақындығы қандай тәсіл қолданылғанына байланысты олардың ұқсастығын немесе артықшылығын көрсетеді. Дегенмен, өлшемдердің шын мәнінде жүйе әрекетінің өлшемдеріне қалай сәйкес келетіні әрқашан анық емес. Сәйкестік туралы субъективті пікірді осы жерден жасауға болады.
- Нәтижелерді сенімділік пен негізділікке тексеру - MDS процедурасы арқылы есепке алынатын масштабталған деректер дисперсиясының үлесін анықтау үшін R-квадратты есептеңіз. Шаршы R 0,6 ең төменгі рұқсат етілген деңгей болып саналады. R квадраты 0,8 метрикалық масштабтау үшін жақсы, ал 0,9 метрикалық емес масштабтау үшін жақсы деп саналады.
Әртүрлі сынақтар
Басқа ықтимал сынақтар: Kruskal түріндегі стресс-тесттер, бөлінген деректер сынақтары, деректер тұрақтылығы сынақтары және сенімділік сынақтарын қайталау. Тест нәтижелері туралы егжей-тегжейлі жазыңыз. Картамен бірге қашықтықтың кем дегенде өлшемі (мысалы, Соренсон индексі, Жаккар индексі) және сенімділік (мысалы, кернеу мәні) көрсетілуі керек.
Егер сіз бастапқы конфигурацияны берген болсаңыз немесе кездейсоқ таңдау болса, жиі пайдаланылатын бағдарламамен анықталатын алгоритмді (мысалы, Kruskal, Mather) берген жөн (кейде алгоритм есебін ауыстырады). өлшемді орындау, Монте-Карло нәтижелері, итерациялар саны, тұрақтылық ұпайы және әрбір осьтің пропорционалды дисперсиясы (r-квадрат).
Көрнекі ақпарат және деректерді талдау әдісікөпөлшемді масштабтау
Ақпараттық визуализация – адамның танымдылығын арттыру үшін дерексіз деректердің интерактивті (визуалды) көрсетілімдерін зерттеу. Абстрактілі деректерге мәтіндік және географиялық ақпарат сияқты сандық және сандық емес деректер кіреді. Дегенмен, ақпараттық визуализацияның ғылыми визуализациядан айырмашылығы: «бұл кеңістіктік кескін таңдалғанда ақпараттық (ақпараттық визуализация) және кеңістіктік кескін берілгенде scivis (ғылыми визуализация) болып табылады.»
Ақпаратты визуализациялау саласы адам мен компьютердің өзара әрекеттесуі, информатика қолданбалары, графика, визуалды дизайн, психология және бизнес әдістерін зерттеу нәтижесінде пайда болды. Ол ғылыми зерттеулерде, цифрлық кітапханаларда, деректерді өңдеуде, қаржылық деректерде, нарықты зерттеуде, өндірісті бақылауда және т.б. маңызды құрамдас ретінде көбірек қолданылуда.
Әдістер мен принциптер
Ақпараттық визуализация визуализация және өзара әрекеттесу әдістері пайдаланушыларға үлкен көлемдегі ақпаратты бір уақытта көруге, зерттеуге және түсінуге мүмкіндік беретін адам қабылдауының байлығын пайдалануды ұсынады. Ақпаратты визуализация дерексіз деректерді, ақпаратты интуитивті түрде жеткізу тәсілдерін жасауға бағытталған.
Деректерді талдау барлық қолданбалы зерттеулердің және өнеркәсіптегі мәселелерді шешудің ажырамас бөлігі болып табылады. КөпшілігіДеректерді талдаудың іргелі тәсілдері визуализация (гистограммалар, шашыраңқы графиктер, беттік графиктер, ағаш карталары, параллель координаталар сызбалары және т.б.), статистика (гипотезаны тексеру, регрессия, РҚА және т.б.), деректерді талдау (сәйкестендіру және т.б.)..d.) және машиналық оқыту әдістері (кластерлеу, жіктеу, шешім ағаштары, т.б.).
Осы тәсілдердің ішінде ақпаратты визуализациялау немесе визуалды деректерді талдау аналитикалық қызметкерлердің когнитивтік дағдыларына ең тәуелді және адам қиялымен және шығармашылығымен ғана шектелетін құрылымдалмаған әрекетке қабілетті түсініктерді ашуға мүмкіндік береді. Деректердің визуализациясын түсіндіре алу үшін талдаушыға қандай да бір күрделі әдістерді үйрену қажет емес. Ақпаратты визуализациялау сонымен қатар статистикалық гипотезаны сынау сияқты аналитикалық немесе ресми талдаумен сүйемелденетін гипотезаны құру схемасы болып табылады.
Оқу
Визуализацияны заманауи зерттеу компьютерлік графикадан басталды, ол «әу бастан ғылыми мәселелерді зерттеу үшін пайдаланылды. Дегенмен, алғашқы жылдары графикалық қуаттың болмауы оның пайдалылығын жиі шектеді. Визуализацияға басымдық беріле бастады. 1987 жылы ғылыми есептеулердегі компьютерлік графика мен визуализацияға арналған арнайы бағдарламалық қамтамасыз етуді шығарумен әзірлеу үшін содан бері IEEE компьютерлік қоғамы мен ACM SIGGRAPH бірлесіп ұйымдастырған бірнеше конференциялар мен семинарлар өтті.
Олар деректерді визуализацияның, ақпаратты визуализацияның және ғылыми визуализацияның жалпы тақырыптарын қамтыды,дыбысты көрсету сияқты нақтырақ аймақтар.
Қорытынды
Жалпыдандырылған көпөлшемді масштабтау (GMDS) – мақсатты кеңістік евклидтік емес метрикалық көпөлшемді масштабтаудың кеңейтімі. Айырмашылықтар беттегі қашықтық болса, ал мақсатты кеңістік басқа бет болса, GMDS минималды бұрмалаумен бір беттің екіншісіне ұя салуын табуға мүмкіндік береді.
GMDS – зерттеудің жаңа бағыты. Қазіргі уақытта негізгі қолданбалар деформацияланатын нысанды тану (мысалы, 3D бетті тану үшін) және текстураны бейнелеу болып табылады.
Көпөлшемді масштабтаудың мақсаты көпөлшемді деректерді көрсету болып табылады. Көпөлшемді деректерді, яғни көрсету үшін екі немесе үш өлшемнен артық қажет деректерді түсіндіру қиын болуы мүмкін. Жеңілдету тәсілдерінің бірі қызықтыратын деректер жоғары өлшемді кеңістіктегі кірістірілген сызықты емес коллекторда жатыр деп болжау болып табылады. Коллектордың өлшемі жеткілікті төмен болса, деректерді кіші өлшемді кеңістікте көрсетуге болады.
Сызықтық емес өлшемді азайту әдістерінің көпшілігі сызықтық әдістермен байланысты. Сызықты емес әдістерді екі топқа бөлуге болады: салыстыруды қамтамасыз ететіндер (жоғары өлшемді кеңістіктен кіші өлшемді ендіруге дейін немесе керісінше) және жай визуализацияны қамтамасыз ететіндер. Машиналық оқыту контекстінде карта жасау әдістерін қарастыруға боладымүмкіндікті алудың алдын ала кезеңі, одан кейін үлгіні тану алгоритмдері қолданылады. Әдетте жай ғана визуализация беретіндер жақындық деректеріне негізделген, яғни қашықтықты өлшеу. Көпөлшемді масштабтау психологияда және басқа гуманитарлық ғылымдарда да жиі кездеседі.
Атрибуттар саны үлкен болса, бірегей мүмкін жолдардың кеңістігі де экспоненциалды түрде үлкен болады. Осылайша, өлшем неғұрлым үлкен болса, кеңістікті бейнелеу қиынырақ болады. Бұл көптеген проблемаларды тудырады. Жоғары өлшемді деректерде жұмыс істейтін алгоритмдер өте жоғары уақыт күрделілігіне ие. Деректерді аз өлшемдерге дейін азайту көбінесе талдау алгоритмдерін тиімдірек етеді және машиналық оқыту алгоритмдеріне дәлірек болжау жасауға көмектесуі мүмкін. Сондықтан көпөлшемді деректерді масштабтау өте танымал.