інформативність:
Перший етап обробки полягає в обчисленні множин і побудові підобласті допустимих значень. Щоб розбити на підобласті, для кожної q-ой функції був виконаний наступний алгоритм:
. Знаходимо підобласті, де m - мінімальне значення функції для множин температурних даних пацієнток, визначається за формулою:, де M - максимальне значення функції для множин температурних даних пацієнток.
2. На кожній підобласті фіксуємо кількість векторів такі, що.
. Обчислюємо статистичну інформативність [3] за формулою (1).
. Обчислюємо евристичну інформативність за формулою (2).
. Обчислюємо комбіновану інформативність за формулою (3).
. Знаходимо максимум серед:
який досягається на безлічі.
7. Отримуємо ознака:.
Використання в даному алгоритмі середнього геометричного значення статистичної та евристичної інформативність обумовлено рядом причин. А саме: статистична інформативність відокремлює досить великі групи досліджуваних об'єктів, але при цьому втрачається точність, евристична ж інформативність досить точна, але при цьому відокремлює маленька кількість досліджуваних об'єктів.
Розглянемо приклад пошуку високоінформативних ознак для функції (див. Таблиця 11).
Таблиця 11 - Пошук високоінформативних ознак
№ПрізнакСтатістіческая інформатівностьЕврістіческая інформатівностьКомбінірованная інформатівность1 0,810,19,09,52 0,912,67,79,83 19,63,25,64 1,111,32,85,65 1,213,12,65,86 1,315, 12,76,37 1,416,32,56,48 1,516,52,36,29 1,615,225,5
У розглянутому прикладі в якості ознаки вибираємо інтервал №2, так як комбінована інформативність, відповідна йому, максимальна. Хоча статистична та евристична інформативності досягають своїх максимальних значень на інших інтервалів, але виходячи з наведеного алгоритму, ці інтервали не вибирають в якості ознак.
У результаті обчислювальних експериментів було запропоновано в якості порога взяти, і для подальшого розгляду залишати тільки ознаки, що задовольняють умові. Таким чином, були отримані конкретні інтервали для ознак (див. Додаток, Таблиця 1).
Як приклад наведено деякі високоінформативні ознаки (див. Таблиця 12).
Таблиця 12 - Приклад високоінформативних ознак
№ПрізнакДіапазон ізмереніяДоля молочних залоз класу Здорові raquo ;, у яких спостерігається прізнакДоля молочних залоз класу Хворі raquo ;, у яких спостерігається прізнакКомбінірованная інформатівность1 - 0,75РТМ11512,22 - 0,55РТМ32410,33 0, 93239,84 1,2РТМ1129,75 - 0,75РТМ2179,06 1,3РТМ2179,07 0,41РТМ8368,58 - 0,6РТМ2168,59 - 0,95РТМ2168,310 0,67РТМ2157,7
Глава 6. Характеристичні ознаки захворювань молочної залози
Пошук характеристичних ознак полягав у знаходженні подобластей, яким належать значення функції, відповідні молочним залозам одного класу, але не належать значення функції, відповідні молочним залозам іншого.
Знаходилися підобласті, на яких безліч значень функцій, відповідні безлічі векторів, буде порожнім, тобто відповідна евристична інформативність нескінченна. З цих підобластей вибирала?? ь підобласть, що містить безліч значень функцій, якому відповідає найбільша кількість векторів.
Розглянемо приклад пошуку характеристичних ознак для функції (див. Таблиця 13).
Таблиця 13 - Пошук характеристичних ознак
№ПрізнакДіапазонКолічество молочних залоз класу Здорові raquo ;, у яких спостерігається прізнакКолічество молочних залоз класу Хворі raquo ;, у яких спостерігається прізнак1 - 1,95РТМ042 - 1,85РТМ043 - 1,75РТМ084 - 1,65РТМ0125- 1,55РТМ0126 - 1,45РТМ0147 - 1,35РТМ0178 - 1,25РТМ0269 - 1,15РТМ04010 - 1,05РТМ04711 - 0,95РТМ155
Як видно з наведеної таблиці, перший 10 інтервалам належать значення, відповідні молочним залозам тільки класу Хворі raquo ;. У інтервал №11 потрапляють значення, відповідні молочним залозам обох класів, тому зупиняємо пошук і вибираємо попередній інтервал як характеристичний ознака.
Таким чином, були отримані конкретні інтервали для ознак (див. Додаток, Таблиця 2).
Як приклад наведено деякі характеристичні ознаки (див. Таблиця 14).
Таблиця 14 - Найбільш значимі характеристичні ознаки
№ПрізнакДіапазонКолічество молочних залоз класу Здорові raquo ;, у яких спостерігається прізнакКолічество молочних залоз класу Хво...