в потрібно розширити початковий набір базисних спектрів. В результаті виникає при цьому надмірності початкових даних звичайний метод найменших квадратів стає нестійким до експериментальної помилку і призводить до свідомо невірних результатів. Застосування методу "еталонних спектрів "в тому вигляді, як він описаний у попередньому пункті, на превеликий базисного набору спектрів виявляється, по суті, некоректним.
Цю проблему частково можна вирішити, замінивши метод найменших квадратів моделлю, застосування якої, на перший погляд, не цілком виправдано і адекватно, але зате призводить до стійкого до експериментальної помилку результату навіть у разі великого числа параметрів. Застосування такої стабілізуючою моделі дозволяє підійти до аналізу спектрів КД з іншого боку. А саме, з'являється можливість прямого подання спктра КД досліджуваного білка у вигляді лінійної комбінації базисних спектрів. Таким чином вдається повністю уникнути проблеми, пов'язаної з визначенням еталонних спектрів окремих структурних класів і проводити більш гнучкий і точний аналіз з використанням реальних білкових спектрів.
Розглянемо даний метод більш докладно. Припустимо, що нам вдалося представити спектр КД досліджуваного білка у вигляді лінійної комбінації спектрів базисних білків, структура яких відома з рентгеноструктурного аналізу. Позначимо число цих спектрів через (в даному методі = 16). Тоді можемо записати:
, (1.2.9)
де - спектр КД (еліптичність) досліджуваного білка.
Позначимо частку амінокислот j -ого базисного білка в i -му структурному класі через, тоді базисні спектри можуть бути представлені у вигляді суперпозиції ідеалізованих еталонних спектрів, відповідних окремим структурним класах:
. (1.2.10)
Аналогічно для спектру КД досліджуваного білка:
. (1.2.11)
Підставляючи рівності (1.2.10) і (1.2.11) у рівняння (1.2.9), отримаємо зв'язок шуканих коефіцієнтів з відомими (з рентгеноструктурного аналізу) коефіцієнтами : br/>
. (1.2.12)
Проблема полягає у визначенні коефіцієнтів в розкладанні (1.2.9). У подібних завданнях широко застосовується метод найменших квадратів, що визначає коефіцієнти з наступної умови:
minimum (1.2.13)
з обмеженнями
і. (1.2.14)
Тут і - експериментальне і розраховане за формулою (1.2.9) значення для еліптичності на довжині хвилі, - число точок у спектрі.
Згідно з теоремою Гауса-Маркова, серед лінійних незміщене оцінок оцінка, що отримується за допомогою методу найменших квадратів, є найбільш ефективною в тому сенсі, що розраховані з його допомогою коефіцієнти найбільш близькі до своїх істинним значень. Однак, при великих значеннях метод найменших квадратів стає вкрай нестійким до експериментальної помилку. Підвищення стабільності методу за рахунок зниження величини , У свою чергу, також призводить до помітної помилку.
Автори методу [4] знайшли вихід у використанні замість методу найменших квадратів лінійної зміщеною оцінки, яка визначається наступною умовою:
minimum. (1.2.15)
Ця оцінка є зміщеною і, отже, призводить до систематичної помилку. Проте при великих значеннях вона дає значення більш близькі реальним, ніж одержувані за допомогою методу найменших квадратів. Очевидно, що рівняння (1.2.15) також необхідно доповнити умовами (1.2.14).
Розглянемо критерій (1.2.15) більш докладно. При a = 0 ми отримуємо звичайний метод найменших квадратів, не придатні в нашому випадку. При a> 0 другий член в лівій частині (1.2.15) є регуляризатора. Він стабілізує рішення, підтримуючи коефіцієнти малими (близькими до 1 /). Проте, якщо деякий спектр містить компоненти, які добре апроксимують, це обмеження не буде мати такої сили, так як мінімізація лівій частині рівняння (1.2.15) зможе бути досягнута в більшій мірі зменшенням першого члена, ніж другого, що призводить до найбільш оптимального значення . Таким чином виходить дуже гнучка, але стабільна модель, яка самостійно вибирає з великого набору базисних спектрів ті, які апроксимують дані найкращим чином. У разі аналізу спектрів КД білків рівнянню (1.2.15) можна дати наступну інтерпретацію. Оскільки апріорі не можна сказати, який з спектрів буде апроксимувати краще, жоден з них не має переваги, і всі коефіцієнти покладаються приблизно рівними, близькими до 1/(дивись умови (1.2.14)).
При зростанні параметра a точність апроксимації експериментальних даних падає за рахунок зменшення ефективного числа ступенів свободи, відповідного числа вільних параметрів у звичайному методі найменших квадратів. Зазвичай при малих a це відбувається повільно, але коли цей параметр стає занадто великим, число ступенів свободи стає таким малим, що коефіцієнти стають рівними 1 /, і метод повністю втрачає свою гнучкість. Вибір параметра a визначається оптимальним компромісом між гнучкістю і ста...