нших.
Нехай випадкова величина така, що її розподіл задається рівністю:
, (1)
де. Тоді кажуть, що має розподіл Парето з параметрами і. Щільність розподілу Парето має вигляд:
(2)
Моменти випадкової величини, що має розподіл Парето, задаються формулою:
, (3)
звідки зокрема:
, (4)
. (5)
Вілфредо Парето спочатку використовував цей розподіл для опису розподілу добробуту, а також розподілу доходу. Його правило 20 до 80 (яке свідчить: 20% популяції володіє 80% багатства) проте залежить від конкретної величини k, і стверджується, що фактично зустрічаються істотні кількісні відхилення, наприклад, дані самого Парето по Британії кажуть, що там приблизно 30% населення володіє 70% загального доходу.
При цьому розподіл Парето зустрічається не тільки в економіці. Можна навести такі приклади:
в лінгвістиці розподіл Парето відомо під ім'ям закону Ципфа (для різних мов показник ступеня може дещо відрізнятися, також існує невелике відхилення від простої статечної залежності у самих частотних слів, проте в цілому статечної закон описує цей розподіл досить добре );
залежність абсолютної частоти слів (скільки всього раз кожне конкретне слово зустрілося) в досить довгому тексті від рангу (порядкового номера при упорядкуванні слів за абсолютною частоті). Степенній характер залишається незалежно від того, наводяться Чи слова до початкової форми або беруться з тексту як є;
аналогічна крива для популярності імен;
розподіл розміру населених пунктів;
розподіл розміру файлу в інтернет-траффике по TCP-протоколу [2].
Статечні розподілу - унікальне статистичне властивість фрактальних структур, їх характерна ознака. Всякий раз, коли в якихось дослідних даних ми бачимо статечні розподілу, у нас повинно виникати обгрунтована підозра, що ми маємо справу з явною або прихованою фрактальної структурою, а значить, ймовірно, і з результатом взаємодії свідомості і матерії.
Статечні розподілу відомі своєю парадоксальністю, а також несподівано широкою поширеністю в самих різних природних і соціальних явищах. При цьому часто їх походження залишається загадкою, яку багато намагалися і намагаються вирішити.
Особливу увагу варто приділити процесу Юла lt; # justify gt; Малюнок 1. Графік частотного розподілу населення
Звернемо увагу, що по осі Y ми відзначаємо просто кількість міст, що потрапили у відповідну корзину. Але ми могли б відзначати не кількість, а відносну частку, що становить зміст кожної корзини до загального числа міст - для цього поділимо кожне значення шкали Y на 4718 (стільки у нас найбільше міст) (рис. 2).
Малюнок 2. Графік частотного розподілу населення (в долях)
На такий модифікованої гістограмі видно, що в першу корзину (населення від 0 до 5000 чоловік) потрапило 0,42 всіх населених пунктів, тобто, 42%. Ми можемо також сказати, що якийсь конкретний населений пункт Росії з імовірністю 42% виявиться в першому кошику, тому такі розподілу ще називають розподілами щільності ймовірності.
Для того щоб з'ясувати чи є дана залежність статечної, відобразимо гістограму в подвійній логарифмічній шкалі (рис. 3).
Малюнок 3. Графік частотного розподілу в подвійних логарифмічних осях
У цілому пряма лінія, навколо якої групуються точки, цілком проглядається (істотно випадають лише крайні справа дві точки, вони відповідають Санкт-Петербургу і Москві). Її нахил відповідає приблизно K (freq)=- 1,7 - - 1,9 (точніше визначити важко). Однак видно, що права частина розподілу зашумлена. Ця борода виникає через те, що в області високих значень статистичного параметра перестає діяти усереднення, що ефективно згладжує криву в області низьких значень. Попросту, в кошики, розташовані на початку шкали потрапляє багато міст і випадкові варіації усереднюються. А ось в кошики, розташовані в кінці шкали міст потрапляє мало і випадкові варіації стають дуже помітними.
Рангове статечне розподіл. Цей тип розподілів пов'язують з ім'ям лінгвіста Джорджа Зіпфа, який у середині 20-го століття виявив, що частота вживання слів у природних мовах відповідає статечному закону. Однак, у своєму аналізі Зіпф використав не частотний розподіл, а рангове.
Ми беремо дані по населенню міст і просто сортуємо міста в порядку убування їх населення. Номер, який отримує в цьому списку кожне місто, назива...