ілу науки про нейросетях на методи навчання мереж і види топологій архітектури мереж, а з іншого, увібрав в себе методи математичної статистики. Подібна різноманітність дозволяє нам підібрати інструмент для вирішення озвученої завдання з пошуку подій, що викликали зміни в динаміці систем.
Отже, є набір даних про ціни на цінні папери і про корпоративні події (таких як виплата дивідендів, зміни рейтингу компаній, зборах акціонерів) які зберігаються в базі даних MS SQL Server.
Завдання ділиться на три частини:
) Витягти з інформації про ціни дані про те, для яких цінних паперів коли спостерігалася зміна в тренді в ціні (якщо ціна на папір росла деякий час, то в який момент вона почала знижуватися або стала незмінною).
2) Розробити систему, яка зможе навчитися на інформації про попередні події та зміни в трендах
) Після навчання система отримавши на вхід інформацію про деякій зміні в динаміці ціни якої-небудь цінного паперу повинна буде надавати інформацію про те, яка подія найймовірніше викликало дана зміна (якими характеристиками має володіти така подія).
З урахуванням цього опису та аналізу наявної літератури в даній області визначимо напрямки роботи:
) Розробка програми, яка буде перетворювати інформацію про ціни на цінні папери в інформацію про зміни в трендах цін на цінні папери.
2) Розгляд різних методів машинного навчання, вибір найбільш підходящого алгоритму машинного навчання з погляду його математичної моделі
) Реалізація обраних алгоритмів в коді
) Перевірка роботи системи на тестових даних
Система повинна бути здатна до масштабованості, а її архітектура повинна бути легко змінюваної. Найлегше цього домогтися використовую бібліотеку scikit-learn, яка надає велику кількість різних модулів, які можна легко використовувати в інших системах.
1. Методи машинного навчання та алгоритми машинного навчання
Завдання, що стоїть перед нами, можна віднести до задачі класифікації, де у відповідь на набір значень параметрів (країна, тип паперів, тип зміни в динаміці) система повинна повертати кілька міток класів, які описують подію, яка імовірно викликало дана зміна в динаміці. Нижче проводиться інформація про завдання класифікацію та її підвидах.
.1 Завдання класифікації
Завдання класифікації - формалізована задача, в якій є безліч об'єктів (ситуацій), розділених деяким чином на класи. Задано кінцеве безліч об'єктів, для яких відомо, до яких класів вони відносяться. Це безліч називається вибіркою. Класова приналежність інших об'єктів невідома. Потрібно побудувати алгоритм, здатний класифікувати (див. Нижче) довільний об'єкт з вихідного безлічі.
Класифікувати об'єкт - значить, вказати номер (або найменування) класу, до якого належить цей об'єкт.
Класифікація об'єкта - номер або найменування класу, що видається алгоритмом класифікації в результаті його застосування до даного конкретного об'єкту.
У машинному навчанні завдання класифікації вирішується, як правило, за допомогою методів штучних нейронних мереж при постановці експерименту у вигляді навчання з учителем.
Математично дану задачу можна описати таким чином:
Нехай - безліч описів об'єктів, - безліч номерів (або найменувань) класів. Існує невідома цільова залежність - відображення, значення якої відомі тільки на об'єктах кінцевої навчальної вибірки. Потрібно побудувати алгоритм, здатний класифікувати довільний об'єкт.
Більш загальною вважається імовірнісна постановка завдання. Передбачається, що безліч пар «об'єкт, клас» є імовірнісним простором з невідомою ймовірнісної заходом. Мається кінцева навчальна вибірка спостережень, згенерувала згідно ймовірнісної мірою. Потрібно побудувати алгоритм, здатний класифікувати довільний об'єкт.
Ознакою називається відображення, де - безліч допустимих значень ознаки. Якщо задані ознаки, то вектор називається ознаковими описом об'єкта. Прізнаковие опису допустимо ототожнювати з самими об'єктами. При цьому безліч називають просторі ознак.
У залежності від безлічі ознаки поділяються на такі типи:
. Бінарний ознака:
2. Номінальний ознака: - кінцеве безліч
. Порядковий ознака: - кінцеве впорядкована множина
. Кількісний ознака: - множина дійсних чисел
Часто зустрічаються прикладні задачі з різнотипними ознаками, для їх вирішення походять далеко н...