икидами, а, значить, такі спостереження мають бути видалені з вибірки.
Після цензурування вибірки всі її значення наводяться до відрізка [0,1] за формулою
(3.1)
Необхідність такого приведення викликана великим числом арифметичних операцій на елементах вибірки в МГУА, що при різних порядках чисел веде до накопичення великих похибок і поганий збіжності методу.
Для відновлення залежності використовується поліноміальний ітераційний алгоритм МГУА, в результаті роботи якого повинна бути отримана залежність
(3.2)
де l - число елементів у вихідному базисі факторів;
m - число доданків моделі з ненульовими значеннями коефіцієнтів, зване складністю моделі.
Перед початком роботи алгоритму вибірка ділиться на дві частини: робочу, по якій модель будується, і екзаменаційну - на ній вона перевіряється.
Одна з основних труднощів при застосуванні методів перехресного обгрунтування, окремим випадком яких є МГУА, пов'язана з розбиттям вибірки на дві підмножини - робочу і екзаменаційну частини. Оскільки модель значною мірою визначається робочою частиною вибірки, необхідно, щоб обсяг робочої частини був більше, і щоб і в робочу, і в екзаменаційну частину потрапляли спостереження з усього інтервалу безлічі значень, тому перед запуском алгоритму МГУА, корисно впорядкувати спостереження у вибірці по зростанню відгуку, а, потім, вибирати дані для екзаменаційної частини через деякий однакове число спостережень.
Розглянемо докладніше процедуру МГУА.
В якості нульового наближення береться безліч моделей складності 1, це самі значення факторів. Таким чином, первісна модель має вигляд де коефіцієнт визначається ітераційним методом найменших квадратів (МНК) за робочої частини вибірки, після цього по екзаменаційної частини вибірки визначається F найкращих моделей за допомогою зовнішнього критерію регулярності - мінімуму евклідової норми вектора нев'язки між реальним значенням відгуку і значенням, отриманим по перевіреній моделі
, (3.3)
де - число елементів в екзаменаційній частині вибірки.
Для формування базису змінних подальших кроків ітераційної процедури використовується функція, яка з F кращих моделей попереднього кроку і l вихідних змінних формує базисні змінні наступного кроку, наприклад,
. (3.4)
Число F переданих від кроку до кроку найкращих моделей називається свободою вибору методу.
При формуванні базису r-го кроку враховується той факт, що на r-му кроці складність моделі не повинна перевищувати r. Паралельно з процесом побудови базису йде побудова набору коефіцієнтів для цього базису ітераційним МНК по робочій частині вибірки і обчислення критерію регулярності по екзаменаційної частини. У пам'яті ЕОМ у кожен момент часу зберігаються тільки F кращих моделей. При вичерпанні безлічі базисів r-го кроку здійснюється перехід до наступного (r +1)-му кроці.
Процес зупиняється при виконанні наступного нерівності:
(3.5)
і за результат приймається краща модель (r - 1) кроку.
Тепер розглянемо докладніше процедуру добору коефіцієнтів моделі по заданій структурі моделі ітераційним МНК.
Нехай задана структура моделі складності, необхідно підібрати коефіцієнти, щоб наблизити значення відгуку з робочої частини вибірки:
(3.6)
з точністю до за...