gn="justify"> В якості об'єкта дослідження розглядається мережа магазинів aliexpress.
В якості результату дослідження необхідно отримати методику та програмне забезпечення вилучення товарних позицій, збереження їх у базу даних і складання на основі їх груп однакових. p align="center"> 1. Огляд об'єкта і методів дослідження
1.1 Опис об'єкта дослідження
Специфікою роботи є об'єкт дослідження - мережа магазинів aliexpress. Тут вихідними даними є товарні позиції. Серед вихідних даних основними є назва товару, зображення товару, його ціна, ціна доставки та відгуки російських покупців. p align="justify"> На даному сайті не існує поділу на групи однакових товарів изза великої їх кількості. На допомогу користувачам існує лише класифікація товарів за категоріями. А так само пошук за назвами, в якому однак не існує сортування за ціною. p align="justify"> Сайт aliexpress являє собою, по суті, мережа електронних магазинів. Однак наступною проблемою є відсутність їхнього списку. Тому в ході моєї роботи стоїть завдання його визначення шляхом перебору id цих магазинів. Посилання на магазини мають певний вид, тому досить підставляти згідно з цим правилом значення і перевіряти чи існує магазин з таким id чи ні. p align="justify"> Наступною проблемою є те, що назви для товарів придумує власник магазину і у кожного магазину однакові товарні позиції можуть мати або сильно відрізняються, або зовсім різні назви. Однак при цьому зображення самих товарних позицій часто однакові або, відрізняються логотипом магазинів. У зв'язку з цим для визначення однаковості доцільніше використовувати метод порівняння по зображеннях, при чому метод не повинен звертати великої уваги на дрібні відмінності в зображеннях. p align="justify"> алгоритм дескриптор зображення програмний
1.2 Опис залучаються методів
Метод SURF
SURF вирішує два завдання - пошук особливих точок зображення і створення їх дескрипторів, інваріантних до масштабу і обертанню. Це означає, що опис ключової точки буде однаково, навіть якщо зразок змінить розмір і буде повернутий (тут і далі ми будемо говорити тільки про обертання в площині зображення). Крім того, сам пошук ключових точок теж повинен володіти инвариантностью. Так, що б повернений об'єкт сцени мав той же набір ключових точок, що і зразок. p align="justify"> Метод шукає особливі точки за допомогою матриці Гессе. Детермінант матриці Гессе (т. зв. Гессіан) досягає екстремуму в точках максимальної зміни градієнта яскравості. Він добре детектирует плями, кути і краю ліній. p align="justify"> гессіан інваріантний щодо обертання. Але не інваріантний масштабом. Тому SURF використовує різномасштабні фільтри для знаходження гессіанов. p align="justify"> Для кожної ключової точки вважає...