Оцінка називається спроможною оцінкою параметра, якщо
, тобто.
3. Ефективність оцінки;
Оцінка називається ефективної оцінкою, якщо вона має найменшу дисперсію серед всіх незміщене оцінок даного параметра.
Нехай - статистика, де - точкова оцінка невідомого параметра. Чим менше абсолютна величина різниці, тим оцінка точніше. Тобто співвідношення визначає наступне: - називається точністю оцінки. Чим менше - тим оцінка точніше.
довірчою ймовірністю (надійністю оцінки) називається ймовірність, з якою виконується співвідношення
. [1, с. 22].
Статистичні методи не дозволяють категорично стверджувати, що оцінка задовольняє нерівності. Можна лише говорити про ймовірність, з якою це співвідношення виконується. Зазвичай визначається в статистичних таблицях () і задається в задачах заздалегідь.
Довірчим інтервалом називається інтервал який покриває невідомий параметр з надійністю. Число називають рівнем значущості.
. 2 Побудова довірчого інтервалу. Нехай отримані при n незалежних спостережень, проведених при однакових умовах над генеральною сукупністю.
Математичне сподівання
Звідси випливає що довірчий інтервал для невідомого математичного очікування дорівнює
(.
2. Бутстрапа ЯК МЕТОД ВИЗНАЧЕННЯ СТАТИСТИК імовірнісний розподіл
2.1 Виникнення бутстрапа
В інститутах студентів навчають інтегрувати аналітично, а потім виявляється, що на практиці інтеграли майже всі вважають чисельними методами або перевіряють, таким чином, аналітичне рішення. У статистиці теж є «нечесний» метод, який дозволяє отримати приблизний відповідь на багато практичних питань без аналізу, грубої комп'ютерною потугою: бутстрап. Придумав і опублікував його в 1979 році Бредлі Ефрон.
Суть методу: Припустимо, є у нас інтернет-магазин, де ми торгуємо різним крамом і залучаємо клієнтів різними способами. Ясна річ, що ми постійно щось тестуємо - розташування картинок і кнопок на сторінці, рекламний текст, банери на сайтах партнерів і так далі. У кінцевому рахунку, ми отримуємо свіжі результати - в тестовій групі з 893 прийшли у нас щось купили 34, а в контрольній групі з 923 прийшли щось купили 28.
Виникає питання - йти до начальства і говорити: «в тестовій групі співвідношення числа що купили у нас що-небудь до числа всіх відвідали - 3.81%, в контрольній групі - 3.03%, в наявності поліпшення на 26%, де моя премія? »або продовжувати збір даних, тому що різниця в 6 осіб - ще не статистика?
Цю задачу нескладно вирішити аналітично. Бачимо дві випадкові величини (відсотки в тестовій і контрольній групах). При великій кількості спостережень біноміальний розподіл схоже на нормальне. Нас цікавить різниця. Нормальний розподіл нескінченно ділимо, віднімаємо математичні очікування і складаємо дисперсії, отримуємо:
. математичне очікування: 34/893-28/923=0.77%;
. дисперсію (34/893) * (1-34/893)/893 + (28/923) * (1-28/923)/923.
Стандартне відхилення дорівнює кореню з дисперсії, в нашому випадку 0.85%. Істинне значення з 95% вірогідністю лежить в межах плюс-мінус двох стандартних відхилень від математичного очікування, тобто між - 0.93% і 2.48%. Так що премія поки не буде, треба продовжувати збирати дані.
Тепер вирішимо цю ж задачу методом бутстрапа. Основна ідея така: добре б повторити наш експеримент багато разів і подивитися на розподіл результатів. Але ми це зробити не можемо, тому будемо діяти «нечесно» - «надёргаем» вибірок з наявних даних і зробимо вигляд, що кожна з них - результат повторення нашого експерименту.
2.2 Алгоритм бутстрапа
1. Вибираємо навмання одне спостереження з наявних.
. Повторюємо пункт 1 стільки разів, скільки у нас є спостережень. При цьому деякі з них ми виберемо кілька разів, деякі не виберемо взагалі - це нормально.
. Вважаємо цікавлять нас метрики по цій новій вибірці. Запам'ятовуємо результат.
Повторюємо пункти 1-3 багато разів. Наприклад, 10000. Можна менше, але точність буде гірше. Можна більше, але довго буде рахувати.
Тепер у нас є розподіл, на яке ми можемо подивитися або щось по ньому порахувати. Наприклад, довірчий інтервал, медіану або стандартне відхилення.
Слід звернути увагу на те, що ми не робимо ніяких припущень про розподіл чого-небудь. Роз...