вних компонент, вибраних для проектування);
Матриця рахунків (Scores)
,
де кожен рядок - проекція вектора даних на k головних компонент; число строк - m (кількість векторів даних), число стовпців - k (кількість векторів головних компонент, вибраних для проектування);
Матриця Z-рахунків (Z-scores)
,
де кожен рядок-проекція вектора даних на k головних компонент, нормована на одиничну вибіркову дисперсію; число строк - m (кількість векторів даних), число стовпців - k (кількість векторів головних компонент, вибраних для проектування) ;
Матриця помилок ( залишків ) (Errors or residuals)
.
Основна формула:
В
Таким чином, Метод головних компонент, один з основних методів математичної статистики. Основним призначенням його є розмежування між необхідністю дослідження масивів даних при мінімумі їх використання. br/>
2.3 Застосування Методу головних компонент
Метод головних компонент застосуємо завжди . Твердження про те, що він застосовний тільки до нормально розподілених даних (або для розподілів, близьких до нормальних) багатьма математиками вважається неправильним, оскільки в вихідного формулювання К. Пірсона ставиться завдання про апроксимації кінцевого безлічі даних та відсутня навіть гіпотеза про їх статистичному породженні, не кажучи вже про розподіл.
<# "justify"> 2.4 Закон великих чисел
Закон великих чисел має важливе значення для статистки. Відповідно до нього, в масі явищ взаїмопогашаются випадкові відхилення від основної лінії розвитку. Відповідно до теорії ймовірностей Закон великих чисел стверджує, що середнє арифметичне (або емпіричне середнє) при досить великій кінцевої вибірці з фіксованого розподілу близько до теоретичного середньому показнику. Залежно від виду збіжності розрізняють слабкий закон великих чисел, коли має місце збіжність за ймовірністю, і посилений закон великих чисел, коли має місце збіжність майже по всюди . p>
Слабкий закон великих чисел можна уявити прикладом такого роду - В«Нехай є нескінченна послідовність однаково розподілених і некорельованих випадкових величин , визначених на одному вероятностном просторі . Тобто їх...