у оцінюють за допомогою середньої квадратичної помилки. За допомогою роблять оцінку надійності коефіцієнта кореляції, побудувавши довірчі інтервали для різних обсягів вибірки. Нехай число n спостережень пар чисел менше 50. У цьому випадку середня квадратична помилка обчислюється за формулою:
, (2.12)
де - коефіцієнт парної лінійної кореляції, - обсяг вибірки.
Довірчий інтервал для оцінки знаходять за формулою:
, (2.13)
де знаходять по таблиці значень функції Лапласа.
Якщо задати надійність, то й.
Якщо обсяг вибірки, то похибка для коефіцієнта кореляції знаходять також за формулою (2.13). Потім обчислюють відношення. Якщо це відношення більше 3, то можна вважати, що знайдений коефіцієнт кореляції відображає справжню залежність між ознаками і.
Величина є гарантійним мінімумом, а величина гарантійним максимумом коефіцієнта кореляції і довірчий інтервал для оцінки запишеться у вигляді:
. (2.14)
Лінійний коефіцієнт кореляції показує, чи є цей зв'язок прямої або зворотної, а так само оцінює тісноту взаємозв'язку між ознаками. Однак поняття тісноти взаємозв'язку буває недостатньо при змістовному аналізі взаємозв'язків. Коефіцієнт кореляції не відображає ступінь впливу факторного ознаки на результативний. Ступінь впливу факторного ознаки на результативний показує коефіцієнт детермінації.
Нехай по досвідченим даним для ознак і отримані рівняння регресій і. Величину називають коефіцієнтом детермінації. Цей коефіцієнт детермінації можна знаходити і за формулою:
, (15)
де - досвідчені значення ознаки, - значення, знайдені по рівнянню регресії, - середня ознаки.
Формулою (2.15) користується тоді, коли загальна кількість значень дорівнює числу значень ознаки.
Коефіцієнт детермінації використовується, по-перше, для контролю обчислень, проведених при отриманні рівнянь регресій і, по-друге, він показує, яку частину розсіювання результативної ознаки можна пояснити прийнятої регресійної моделлю.
Для перевірки відповідності рівняння регресії досвідченим даними застосовують критерій Фішера - Снедекора. Обчислюють статистику за формулою:
, (2.16)
де - коефіцієнт детермінації, - обсяг вибірки.
Чим ближче значення до одиниці, тим краще модель узгоджується з дослідними даними. Потім при заданому рівні значимості і числах ступенів свободи, знаходять по таблиці критичних точок розподілу Фішера - Снедекора.
Якщо виявиться, що, то отримане рівняння лінійної регресії узгоджується з дослідними даними. Якщо, то модель регресії не узгоджується з даними досвіду.
Формулою (2.16) користуються тоді, коли вихідні дані задані не у вигляді кореляційної таблиці. Якщо досвідчені дані задані у вигляді кореляційної таблиці, то перевірку моделі на адекватність можна виконати тоді, коли загальна кількість значень більше числа значень. У цьому випадку знаходять залишкову суму квадратів, що характеризує вплив неврахованих в моделі факторів, за формулою:
, (2.17)
де - сума квадратів відхилень значень від середньої, - сума квадратів відхилень умовних середніх від середньої.
Потім обчислюєся статистика за формулою:
. (2.18)
По таблиці критичних точок розподілу Фішера - Снедекора при заданому рівні значимості і числах ступенів свободи, знаходять. Якщо, то модельне рівняння регресії значимо описує досвідчені дані, в іншому випадку - ні.
Після перевірки модельного рівняння лінійної регресії на адекватність знаходять відносну похибку рівняння за формулою:
, (2.19)
де, - стандартна помилка рівняння регресії,
- залишкова дисперсія,
, - дослідні значення,
- значення, отримані з рівнянню регресії,
- середнє значення,
- обсяг вибірки.
Якщо величина мала, то прогнозні якості оціненого регресійного рівняння високі. Одночасно роблять оцінку коефіцієнтів рівняння регресії. Нехай і - стандартні помилки відповідно коефіцієнтів і рівняння регресії. Їх обчислення виробляють за формулами:
, (2.20)
. (2.21)
Коефіцієнти і вважаються значущими, якщо. Якщо ж коефіцієнти і незначущі, то ситуацію можна поправити шляхом збільшення обсягу вибірки, збільшення числа факторів, що включаються в модель або зміни форми рівняння зв'язку.
. ПОБУДОВА регресійній моделі ТЕРМОСОЛЕСТОЙКОГО бурового розчину
Проведемо статистичний аналіз і побудуємо регресійну модель термосолевого бурового розчину. До складу термосолестойкого бурового розчину входить крім стандартних добавок акрилова кислота та захисний реагент. Залежність зміни в масових відсотках акрилової кислоти X (мас%) до масового змістом захисного реагенту Y (мас.%) Характеризується такими да...