овірність отримання певної суми
S при одному киданні гральних кісток:
Значення S 23456789101112Вероятн. P S
Маємо всього 36 можливих результатів кидання. Розглянемо результати кидання. Наприклад, величина 4 може бути отримана трьома способами: 1 + 3, 2 + 2, 3 + 1 . Це становить. Аналогічно визначаються залишилися ймовірності P S . Якщо кидати гральну кістку n раз, то в середньому ми повинні отримати величину S приблизно n ? P S раз, але це не зовсім так. Наприклад, при 144 киданнях були отримані наступні результати:
Таблиця 4.1
Величина S 23456789101112Наблюдаемое число, Y S 241012222921151496 Очікуване число, np S 481216202420161284
Зауважимо, що у всіх випадках спостережуване число відрізняється від очікуваного. Введемо в розгляд число:
(4.6)
Ця статистика називається статистикою хі - квадрат спостережуваних значень Y 2 ... Y 12 при киданні гральних кісток. Використовуючи табл.4.1, одержимо:
.
Формулу (4.6) перепишемо таким чином:
, (4.7)
Так як
,
Y 1 + Y 2 + ... + Y k =n , p 1 + p 2 + ... + p k =1 .
Щоб скористатися c2 - статистикою проводять кілька експериментів, потім обчислюють числа. Далі використовують відомі таблиці c2-розподілу мають вигляд [4]: ??
Таблиця 4.2
p=99% p=95% p=75% p=50% p=25% p=5% p=1% ... 2,5583,9406,7379,34212,5518,3123 , 21 ...
Тут p - процентні точки c2 - розподілу; m =k - 1 - число ступенів свободи, що на одиницю менше, ніж число категорій. Усередині клітин таблиці стоять числа.
Припустимо, що були зроблені три експерименти з генеруванням випадкових послідовностей і отримані числа:
,,.
Порівнюючи ці величини зі значеннями таблиці 4.2 при 10 ступенях свободи, ми бачимо, що 1 набагато більше, ніж 23.21, а це може відбутися тільки?? 1% випадків. У зв'язку з цим експеримент 1 демонструє значне відхилення від випадкового поведінки. 2 показує не кращі властивості, так як результати занадто близькі до очікуваних. Нарешті, значення 3 знаходиться між 75 і 50 - процентної точками. Таким чином, спостереження є задовільно випадковим по відношенню до цього критерію.
Відзначимо, таблиця 4.2 - це тільки наближені значення c2 розподілу, який є граничним розподілом випадкової величини формули (4.7).
Тому табличні значення близькі до реальних тільки при великих n .
Наскільки великими повинні бути n ? Емпіричне правило говорить: потрібно взяти n настільки великим, щоб всі значення np S були більші або рівні п'яти.
Емпіричні критерії
Емпіричні критерії традиційно застосовуються для перевірки, чи буде послідовність випадковою.
Зазвичай кожен такий критерій застосовується до послідовності
{U n }=U 0 , U 1 , U < i align="justify"> 2 , ... (4.8)
дійсних чисел, які передбачаються незалежними і рівномірно розподіленими в інтервалі (0,1).
Якщо критерії використовуються для цілочисельних послідовностей, то використовується допоміжна послідовність
{Y n }=Y 0 , Y 1 , Y < i align="justify"> 2 , ..., (4.9)
певна правилом
Y n =[d ? U n ] ( 4.10)
Це послідовність цілих чисел, розподілених в інтервалі ( 0, d - 1). Кількість