p align="justify"> Знайдені алгоритми перевірялися на навчальній вибірці з 550 молочних залоз (80 молочних залоз пацієнток здорових і 470 молочних залоз пацієнток із захворюваннями молочних залоз). При перевірці була досягнута точність - 89,5%, специфічність - 75% і чутливість - 91,9%.
7.2. Мінімізація набору високоінформативних ознак для першого алгоритму
Отримавши критерій діагностики, варто відзначити, що точність діагностики здорових пацієнток (специфічність) залишає бажати кращого. Однією з причин останнього є недостатньо оптимальний вибір використовуваних діагностичних ознак. Було вирішено, за допомогою обчислювальних експериментів зробити пошук більш ефективного набору ознак.
При використанні первинного набору високоінформативних ознак з обраним критерієм класифікації, в результаті діагностики була досягнута точність у 89,5%, специфічність - 75%, чутливість - 91,9%.
Мінімізація набору відбувалася наступним чином:
Крок 1. Беремо дві високоінформативних ознаки.
Крок 2. Проводимо за обраними ознаками діагностику.
Крок 3. Фіксуємо специфічність і чутливість, отримані в результаті діагностики. Обчислюємо.
Крок 4. До обраними ознаками додаємо наступний по інформативності ознака.
Крок 5. Проводимо діагностику.
Крок 6. Фіксуємо специфічність і чутливість. Обчислюємо.
Крок 7. Якщо, то ознака залишається в наборі, інакше ознака виключається.
Крок 8. Повторюються кроки з 4-7.
В результаті застосування зазначеного вище алгоритму був отриманий наступний набір ознак.
Таблиця 16 - Ознаки для алгоритму класифікації
№ПрізнакДіапазон ізмереніяКомбінірованная інформатівность1 - 0,75РТМ12,22 - 0,55РТМ10,33 0,99,84 1,2РТМ9,75 - 0,75РТМ9,06 1,3РТМ9,07 0,41РТМ8,58- 0,6РТМ8,59 - 0,95РТМ8,310 0,69РТМ7,111 16,112 0,36ІК6,113 0,86ІК6,014 0,9ІК5,915 - 0,65ІК5,316 - 0,71ІК4,417 1,25ІК4,218 0,73,819 0,83,820 - 0,39РТМ3,821 - 0,62ІК3,6
Потім, за допомогою алгоритму описаного в попередньому параграфі, був знайдений новий критерій. Таким чином, при виконанні нерівності молочна залоза буде ставитися до класу Хворі raquo ;, в іншому випадку - до класу Здорові raquo ;.
При перевірці на навчальній вибірці з 550 молочних залоз пацієнток (80 молочних залоз здорових пацієнток і 470 молочних залоз пацієнток із захворюваннями молочних залоз) на основі 21 ознаки, була досягнута точність - 90,9%, специфічність -85% і чутливість - 91,9%.
. 3 Перевірка алгоритму діагностики на тестових вибірках
Алгоритм з використанням минимизированного набору ознак був перевірений на тестових вибірках.
У зв'язку з малою кількістю даних вибірка була поділена на навчальну і тестову (тестова вибірка 1) випадковим чином. Вибірка була розділена таким чином: у навчальну вибірку були включені молочні залози двох класів: молочні залози здорових пацієнток (40 молочних залоз) і молочні залози хворих пацієнток (234 молочних залози). У тестову вибірку 1 віднесли молочні залози, які не були включені в навчальну.
Тестову вибірку 1 становлять молочні залози двох класів: здорові молочні залози здорових пацієнток (40 молочних залоз) і молочних залоз хворих пацієнток (236 молочних залоз).
Для ознак з минимизированного набору були розраховані нові інтервали і, відповідні їм, інформативності за допомогою алгоритму діагностики, описаного в параграфі 7.1.
У результаті було отримано наступний набір ознак.
Таблиця 17 - Ознаки для алгоритму класифікації
№ПрізнакДіапазон ізмереніяКомбінірованная інформатівность1 - 0,88РТМ9,82 1,1РТМ8,43 17,84 2,15,95 1,2РТМ5,96 - 0,65ІК5,37 1,84,68 1,94 , 59 1,05РТМ4,110 2,2ІК4,011 0,44РТМ3,912 0,55ІК3,813 0,71РТМ3,214 0,8РТМ3,115 0,48ІК3,116 - 0,75ІК3,017 - 0,5РТМ2,618 -0,66ІК2,619 - 0,19РТМ2,520 - 0,55РТМ2,421 0,75РТМ2,422 0,32РТМ2,323 - 0,5РТМ2,2
Також був знайдений новий критерій.
У результаті діагностики на тестовій вибірці 1 була отримана точність 87,6%, специфічність - 85% і чутливість 88%.
Ближче до кінця дослідження була отримана база даних хворих пацієнток. У результаті аналізу була сформована незалежна тестова вибірка (тестова вибірка 2). Вона включає в себе інформацію про +1148 молочних залозах хворих пацієнток. Дані тестової вибірки 2 діляться відповідно до переважанням того чи іншого порушення наступним чином:
· дані здорових молочних зало...