адовольняє нерівності 0 lt; R lt; 1.
Відзначимо можливість застосування даної величини для багатовимірної і нелінійної залежності, наприклад, у випадку
вираз для кореляційного відношення прийме вигляд:
(2.3)
До недоліків оцінки сили зв'язку за допомогою кореляційного відносини R слід віднести необхідність попереднього побудови моделі для визначення постійних, що входять у формулу його обчислення.
У сучасних пакетах програм, орієнтованих на статистичний аналіз даних, у тому числі Statistica 6, вже вбудована лінійна, параболічна, логарифмічна та інші види апроксимації, що дозволяє активно використовувати кореляційне відношення в якості оцінки сили зв'язку як за наявності одного, так і декількох аргументів.
. 3 Коефіцієнт детермінації
Реальність і тіснота стохастичною зв'язку характеризується показником визначеності, або коефіцієнтом детермінації, який визначається як відношення дисперсії залежної змінної y , пояснений моделлю, до загальної дисперсії цієї змінної.
Іншими словами, коефіцієнт детермінації є частка дисперсії, пояснений моделлю, в загальній дисперсії залежної змінної і виражається в%.
Формально коефіцієнт детермінації дорівнює квадрату несмещённого значення кореляційного відношення, тобто в разі розглянутої вище лінійної залежності коефіцієнт детермінації може бути представлений як
(2.4)
3. Парна лінійна кореляція
Центральне місце в кореляційному аналізі займає парна лінійна кореляція. Як було зазначено вище, якщо є пара змінних, то кореляція між ними - це міра зв'язку (залежності) саме між цими змінними.
На перший погляд більшість нелінійних парних зв'язків, тобто зв'язків, що не задовольняють формулою можна, трансформуючи змінні, замінити лінійними залежностями. У цьому випадку вони стали б доступними для простого у використанні інструментарію, застосовуваного тільки для дослідження лінійних кореляцій.
Скажімо, нелінійну залежність типу
можна перетворити за допомогою логарифмування так:
якщо, то отримаємо лінійну залежність наступного виду. Аналогічно нелінійну функцію можна виразити за допомогою логарифмів так:
Якщо, то отримаємо залежність, яка також лінійна.
Проте слід враховувати, що необхідною умовою істинності лінійного зв'язку (і її оптимальності) є адекватність математичним властивостям емпіричної залежності. Практично це означає, що область визначення і нульові значення лінійної моделі повинні відповідати шуканої істинної залежності та їх проявам у емпіричних даних, які можуть мати своєї асимптотой тільки саму аппроксимирующую пряму.
Неважко помітити, що при переході до логарифмам дана умова не виконується, а значить, дослідження нелінійних і багатовимірних кореляцій вимагає своїх, звичайно більш складних методів.
Аналіз же лінійної кореляції між двома змінними спирається на наступні інструменти математичної статистики.
.1 Коваріація
Коваріація є другим змішаним центральним моментом випадкових величин x і y , який характеризує їх зв'язок.
Коваріація або коефіцієнт коваріації визначається як
(3.1)
де M - оператор математичного очікування.
Так як математичне очікування і, аналогічно,, то праву частину коваріації можна спростити:
(3.2)
Змішані твори в обох формулах можуть мати різні знаки відповідно монотонного зростанням або спаданням залежності:
· знак плюс, коли знаки співмножників однакові (залежність між змінними є монотонно зростаючою)
· знак мінус при різних знаках (залежність між змінними є монотонно спадною).
Якщо змінні x і y незалежні, то справедлива наступна теорема.
Теорема. Математичне сподівання добутку незалежних випадкових величин x і y дорівнює добутку їх математичних очікувань, тобто
Приймемо без доведення.
На підставі цієї теореми ковариация двох незалежних величин x і y дорівнює нулю.
Очевидно, що якщо, то випадкові величини x і y залежні:
· при залежність вміє вид монотонного зростання;
· при залежність вміє вид монотонного убування.
ковариацию інакше називають кореляційним моментом або моментом зв'язку, вона є ознакою існування залежності між випадковими величинами і її виду. Однак на практи...