ify"> i ) зберігається в списку головних компонент, якщо
В
На малюнку вище наведено приклад для 5-мірного випадку:
1 = (1 +1/2 +1/3 +1/4 +1/5)/5; l 2 = (1/2 +1/3 +1/4 +1/5)/5; l 3 = (1/3 +1/4 +1/5)/5; 4 = (1/4 +1/5)/5; l 5 = (1/5) /5.
Для прикладу обрано
= 0.5; = 0.3; = 0.1; = 0.06; = 0.04.
За правилом зламаною тростини в цьому прикладі слід залишати 2 головних компоненти:
В
Слід тільки мати на увазі, що правило зламаною тростини має тенденцію занижувати кількість значущих головних компонент.
Після проекції на перші k головних компонент з зручно провести нормировку на одиничну (вибіркову) дисперсію по осях. Дисперсія вздовж iй головної компоненти дорівнює ), тому для нормировки треба розділити відповідну координату на . Це перетворення не є ортогональним і не зберігає скалярного твору. Коваріаційна матриця проекції даних після нормировки стає одиничної, проекції на будь-які два ортогональних напрямки стають незалежними величинами, а будь-який ортонормованій базис стає базисом головних компонент (нагадаємо, що нормировка змінює ставлення ортогональності векторів). Відображення з простору вихідних даних на перші k головних компонент разом з нормуваннями задається матрицею
.
Саме це перетворення найчастіше називається перетворенням Кархунена-Лоева, тобто власне методом головних компонент. Тут a i - вектори-стовпці, а верхній індекс T означає транспонування.
У статистиці при використанні методу головних компонент використовують кілька спеціальних термінів.
Матриця даних , де кожен рядок - вектор предобработанних даних (центрованих і правильно нормованих ), число рядків - m (кількість векторів даних), число стовпців - n (розмірність простору даних);
Матриця навантажень (Loadings) , де кожен стовпець - вектор головних компонент, число рядків - n (розмірність простору даних), число стовпців - k (кількість векторів голо...