га помилки були малі, однак більш важливим є контроль рівня. Імовірність задається заздалегідь, зазвичай малим числом, оскільки це - ймовірність помилкового висновку. [4, c. 289]
Наприклад, рівень значимості=0,05 означатиме, що при перевірці гіпотези в середньому в 5 з 100 випадків ми зробимо помилку першого роду.
Таблиця 5. Таблиця прийняття рішення при помилках 1-го і 2-го роду
Статистичне решеніеРеальная ситуація вірна помилкова відкидається не відкидається
Безліч значень критерію, за яких нульова гіпотеза відхиляється, називається областю критичних значень (позначимо). Для критеріїв перевірки гіпотез вибираються належні «рівні значущості» (0,01; 0,05; та ін.), Які вважаються практично неможливими (з деяким ризиком).
Критична область даного критерію - це така область, вірогідність попадання в яку в разі, коли гіпотеза вірна, в точності дорівнює рівню значущості. [4, c.293]
Під потужністю критерію (позначимо) розуміється ймовірність не зробити помилку другого роду.
Чим більше потужність критерію, тим ймовірність помилки другого роду менше. Також варто відзначити, що одночасне зменшення помилок 1-го і 2-го роду можливо тільки при збільшенні обсягу вибірок. Тому зазвичай при заданому рівні значимості відшукується критерій з найбільшою потужністю.
2.2 Схема перевірки статистичної гіпотези
1) Для основної гіпотези формуються альтернативні гіпотези.
2) Здається значення рівня значущості.
3) Розглядаються теоретичні вибірки значень випадкових величин, про яких сформульована гіпотеза, і формулюється випадкова величина T. Значення і розподіл T визначається по вибірках при припущенні про вірність гіпотези. Т - статистика критерію.
4) Здається область критичних значень і область прийняття гіпотези (область прийняття рішення D - це область, вірогідність попадання в яку статистики T визначається як).
5) Обчислюються спостережувані значення статистики критерію, і перевіряється попадання статистики критерію в одну з областей. Якщо статистика потрапила в область прийняття гіпотези, то приймається, в іншому випадку - відкидається.
2.3 Р-значення критерію
У своїй роботі я буду використовувати таке поняття як Р-значення, тому варто дати визначення цьому поняттю.
Для фіксованої реалізації випадкової вибірки Р-значенням статистичного критерію називається таке число для будь-якого рівня значущості, при якому гіпотеза приймається, і для будь-якого рівня значущості, при якому гіпотеза відкидається.
Нехай - спостережуване фіксоване значення статистики критерію, а - спостережувані значення статистики критерію для випадкової вибірки, тоді Р-значення задовольняє співвідношенню:
) Якщо критична область представлена ??у вигляді, де - безперервно спадна функція, то
2) Якщо критична область представлена ??у вигляді, де - безперервно зростаюча функція, то
P-значення з набагато більшою точністю, ніж звичайні способи перевірки статистичних гіпотез, дозволяє встановити, чи приймається гіпотеза або відкидається.
2.4 Критерій -Пірсона
Для початку варто відзначити, що я застосовую критерій Пірсона для перевірки незалежності логарифмічних доходностей, тому теоретична довідка стосуватиметься безпосередньо перевірки незалежності за даним критерієм.
Нехай є випадкова вибірка з генеральної сукупності двовимірної дискретної випадкової величини, де випадкова величина може приймати значення, а випадкова величина - значення. Визначимо випадкову величину, реалізація якої дорівнює кількості елементів вибірки, що збігаються з елементом
Визначимо випадкові величини
При цьому - кількість елементів вибірки, в яких зустрілося значення, а - кількість елементів вибірки, в яких зустрілося значення, крім того, є очевидні рівності
Результати спостережень зручно оформляти у вигляді таблиці, званої таблицею спряженості ознак.
Таблиця 6. Спряженість ознак
XY ... ... ... .................. ... ...
Нехай далі
,.
Дискретні випадкові величини і незалежні тоді і тільки тоді, коли,
Тому основна гіпо...