Завдання аналізу головних компонент має своєю метою апроксимувати (наблизити) дані лінійними різноманітті меншої розмірності; знайти підпростору меншої розмірності, в ортогональній проекції на які розкид даних (тобто середньоквадратичне відхилення від середнього значення) максимальний; знайти підпростору меншої розмірності, в ортогональній проекції на які середньоквадратичне відстань між точками максимально. У цьому випадку оперують кінцевими множинами даних. Вони еквівалентні і не використовують ніякої гіпотези про статистичний породженні даних. p align="justify"> Крім того завданням аналізу головних компонент може бути мета побудувати для даної багатовимірної випадкової величини таке ортогональное перетворення координат, що в результаті кореляції між окремими координатами звернуться в нуль. Ця версія оперує випадковими величинами. br/>
<# "justify"> На наведеному вище малюнку дано точки P i на площині, p i - відстань від P i до прямої AB. Шукається пряма AB, що мінімізує суму
Метод головних компонент починався з задачі найкращої апроксимації (наближення) кінцевого безлічі точок прямими і площинами. Наприклад, дано кінцеве безліч векторів . Для кожного k = 0,1, ..., n? 1 серед всіх k-мірних лінійних різноманіть в знайти таке , що сума квадратів ухилень x i від L k мінімальна:
,
де ? евклідова відстань від точки до лінійного різноманіття.
Всяке k-мірний лінійне різноманіття в може бути задане як безліч лінійних комбінацій , де параметри < span align = "justify">? i пробігають речову пряму , а ? ортонормованій набір векторів
,
де евклидова норма, ? евклидово скалярний твір, або в координатної формі:
.
Рішення завдання апроксимації для k = 0,1, ..., n? 1 дається набором вкладених лінійних різноманіть
,
.
Ці лінійні різноманіття визначаються ортонормированного на...