змінної. Однак роль викидів для набору незалежних змінних часто упускається з виду. З боку незалежних змінних, є список змінних, що бере участь з різними вагами (регресійні коефіцієнти) в прогнозі залежною змінною. Незалежні змінні можна уявити собі у вигляді точок деякого багатовимірного простору, в якому може розташовуватися кожне спостереження. Наприклад, якщо ви маєте дві незалежні змінні з рівними регресійний коефіцієнтами, то можна побудувати діаграму розсіювання цих двох змінних і розташувати кожне спостереження на цьому графіку. Ви можете потім намалювати точку середніх значень обох змінних і обчислити відстані від кожного спостереження до цього середнього (званого тепер центроїдом) в цьому двовимірному просторі; в цьому полягає концептуальна ідея, що стоїть за обчисленням відстаней Махаланобіса. Тепер подивимося на ці відстані, відсортовані за величиною, з метою ідентифікації екстремальних спостережень із незалежним змінним. У полі Тип викидів відзначте опцію відстаней Махаланобіса і натисніть кнопку Порядковий графік викидів. Отриманий графік показує відстані Махаланобіса, відсортовані в порядку убування. br/>В
Зазначимо, що округ Shelby виявляється у чомусь виділяється в порівнянні з іншими округами на графіку. Якщо подивитися на вихідні дані, можна виявити, що насправді округ Shelby - значно більший за розміром округ з великим числом людей, зайнятих сільським господарством (змінна N_Empld), і набагато більш вагомою популяцією афроамериканців. Ймовірно, було б розумно виражати ці числа у відсотках, а не в абсолютних значеннях, в цьому випадку відстань Махаланобіса округу Shelby від інших округів в даному прикладі не було б настільки велике. Однак ми здобули, що округ Shelby виявляється явним викидом. p align="justify"> Дистанційні залишки. Інший дуже важливою статистикою, що дозволяє оцінити масштаб проблеми викидів, є віддалені залишки. Вони визначаються як стандартизовані залишки для відповідних спостережень, які вийшли б при виключенні відповідних спостережень з аналізу. Нагадаємо, що процедура множинної регресії підбирає пряму лінію для вираження взаємозв'язку між залежною і незалежними змінними. Якщо одне зі спостережень є очевидним викидом (як округ Shelby в цих даних), то лінія регресії прагнути "наблизиться" до цього викиду, з тим щоб врахувати його, наскільки це можливо. В результаті, при виключення відповідного спостереження, виникне абсолютно інша лінія регресії (і B-коефіцієнти). Тому, якщо віддалений залишок сильно відрізняється від стандартизованого залишку, у вас є підстави вважати, що результати регресійного аналізу істотно зміщені відповідним наглядом. У даному прикладі віддалений залишок для округу Shelby є викидом, який суттєво впливає на аналіз. Ви можете побудувати діаграму розсіювання залишків щодо видалених залишків за допомогою опції Залишки і видал. залишки в закладці Діаграми розсіювання. Нижче на діаграмі розсіювання явно помітний викид. br/>В
Схожі реферати:
Реферат на тему: Розсіювання в атмосфері викидів електростанційРеферат на тему: Розсіювання шкідливих викидів від атомної електростанції Реферат на тему: Аналіз функції двох зміннихРеферат на тему: Особливості аналізу змінних і постійних витрат Реферат на тему: Аналіз суспільних відносин, що складаються у сфері реалізації права на судо ...