ікації в результаті його застосування до даного конкретного об'єкту.
У машинному навчанні завдання класифікації відноситься до розділу навчання з учителем. Існує також навчання без вчителя, коли поділ об'єктів навчальної вибірки на класи не запитує, і потрібно класифікувати об'єкти тільки на основі їх подібності один з одним. У цьому випадку прийнято говорити про завдання кластеризації або таксономії, і класи називати, відповідно, кластерами або таксонами. p align="justify"> Типи вхідних даних
прізнаковая опис - найбільш поширений випадок. Кожен об'єкт описується набором своїх характеристик, званих ознаками. Ознаки можуть бути числовими або нечисловими. p align="justify"> Матриця відстаней між об'єктами. Кожен об'єкт описується відстанями до всіх інших об'єктів навчальної вибірки. З цим типом вхідних даних працюють небагато методи, зокрема, метод найближчих сусідів, метод парзеновского вікна, метод потенційних функцій. p align="justify"> Часовий ряд або сигнал являє собою послідовність вимірювань в часі. Кожен вимір може представлятися числом, вектором, а в загальному випадку - прізнаковая описом досліджуваного об'єкта в даний момент часу. p align="justify"> Зображення або відеоряд.
Зустрічаються і більш складні випадки, коли вхідні дані представляються у вигляді графів, текстів, результатів запитів до бази даних, і т. д. Як правило, вони приводяться до першого або другого нагоди шляхом попередньої обробки даних і вилучення ознак.
Типи класів
Двухклассовая класифікація. Найбільш простий в технічному відношенні випадок, який служить основою для вирішення більш складних завдань. p align="justify"> Многоклассовая класифікація. Коли число класів досягає багатьох тисяч (наприклад, при розпізнаванні ієрогліфів або злитий мови), завдання класифікації стає істотно більш важкою. p align="justify"> Непересічні класи.
Пересічні класи. Об'єкт може відноситися одночасно до декількох класів. p align="justify"> Нечіткі класи. Потрібен визначати ступінь належності об'єкта кожному з класів, зазвичай це дійсне число від 0 до 1. p align="justify"> Постановка завдання класифікації. Нехай - безліч описів об'єктів, - кінцеве безліч номерів (імен, міток) класів. Існує невідома цільова залежність - відображення , значненія якої відомі тільки на об'єктах кінцевої навчальної вибірки . Потрібно побудувати алгоритм , здатний класифікувати довільний об'єкт .
Імовірнісна постановка завдання
Більш загальною вважається імовірнісна постановка задачі. Передбачається, що безліч пар В«об'єкт, класВ» є імовірнісним...