льним.
Швидку перевірку гіпотези нормального розподілу проведемо за допомогою R/S?- Критерію, де R - розмах вибірки. Для цього обчислимо відношення
/S?=(116319- 42922)/22173,0=3,310197
Зіставимо отримане значення з критичними межами цього відношення, наведеними у відповідній таблиці, при ймовірності помилки 5%./S? Ниж=3,83, R/S? Верх=5,35: розраховане нами значення НЕ потрапляє в зазначений інтервал, отже, відкидається гіпотеза про нормальний розподіл.
Судити про близькість розподілу до нормального можна також по значення коефіцієнтів асиметрії і ексцесу.
Гіпотезу про нормальний розподіл не слід відкидати, якщо
і, де
Для нашої вибірки As=0,219750, Ex=- 1,29288,
? As=0,336600709,? Ex=0,661908375.
При As /? As=1,531743839, Ex /? Ex=- 0,511964277
і, отже, підтверджується нульова гіпотеза про нормальний розподіл.
Далі проведемо більш сувору перевірку розподілу за допомогою критерію? 2.
. 2 Формування моделі
Роботу над завданням III «Побудова моделі» проведемо наступним чином:
Визначимо загальну форму моделі;
Статистично досліджуємо взаємозв'язку між ознаками за допомогою процедур кореляційного аналізу.
Почнемо роботу над формуванням моделі.
). Визначення загальної форми моделі.
Визначимо статус змінних і введемо символьну запис:
Ціна (у, price) - залежна змінна, незалежні змінні:
Клас готелю (х1, hotel);
Тривалість відпочинку (х2, duration);
Тип пиття в готелі (х3, meal);
Категорія номера (х4, room);
Розташування готелю щодо моря (х5, line);
Курортна зона (х6, place);
Гаряча путівка (х7, last_minuit);
Пляж (х8, beach).
За змістом досліджуваного нами явища можна припустити, що зв'язок між ознаками буде лінійною. Переваги лінійної форми зв'язку полягає в простоті інтерпретації моделі і в отриманні надійних оцінок параметрів, завдяки процедурам оцінювання, більш доступним і надійним саме для лінійних моделей.
б). Статистичне дослідження взаємозв'язку між ознаками за допомогою процедури кореляційного аналізу.
Побудуємо кореляційну матрицю.
Таблиця 3 - Кореляційна матриця
hoteldurationmealroomlineplacelast_minbeachprice1-0,35420,15070,4033-0,22030,0823-0,13960,26480,59511-0,1736-0,3491-0,0192-0,0370-0,0252-0,0939-0,190710,00080,1201-0,02580,0310-0,04780,43201-0,1637-0,0097-0,2936-0,00210,509310,09970,0551-0,3481-0,10071-0,1330- 0,17800,240710,1128-0,432510,00571
Як бачимо, найбільший вплив на результуючий ознака надає х1, клас готелю. Також надаю значний вплив х4, х3 і х7: тип харчування, категорія номера і час від покупки путівки до вильоту на курорт.
Перевіримо значущість коефіцієнтів.
Сформулюємо дві гіпотези:
Н0:? ху=0 про те, що генеральний коефіцієнт кореляції дорівнює нулю, а значить статистично істотного зв'язку між результуючої змінної і фактором немає.
Н1:? ху? 0, слідство з якої - існування зв'язку між ознаками.
В якості статистичного критерію будемо використовувати t-статистику Стьюдента:
Зіставимо дане значення з табличним критичним значенням розподілу Стьюдента.
Якщо tрасч gt; tтабл, то підтверджується гіпотеза Н1 і робиться висновок про наявність статистично істотного зв'язку між досліджуваними ознаками.
Якщо tрасч? tтабл, то підтверджується Н0, і ми можемо говорити про відсутність зв'язку між ознаками.
Розглянемо процедуру перевірки значимості для одного коефіцієнта кореляції, для решти занесемо результати обчислення в таблицю (зробимо всі розрахунки в MS Office Excel).
Для коефіцієнт rx1, y=0,5951, що описує зв'язок між ціною путівки і класом готелю, tрасч=5,130299543. Критичне значення при?=48 (число ступенів свободи), р=5% визначимо по таблиці Процентні точки розподілу Стьюдента: табл=1,6772, що менше tрасч отже, коефіцієнт є значимим при 95% рівні довірчої ймовірності. Побудуємо довірчий інтервал:
, 441906365? ? x1y? 0,748293635
Таблиця 4 - Перевірка значущості коефіціє...