/>
3.5 Особливості пошуку графічної інформації
Сучасні пошукові системи здатні проводити пошук також і графічної інформації. На відміну від текстової інформації, пошук графічних документів утруднений хоча б тим, що графічні документи можна перетворювати в різні формати і змінювати їх розміри, що робить скрутним їх прямий і індексний пошук зважаючи на відмінність в низкоуровневой організації.
Так наприклад, будь-яке зображення зберігається без будь-якого стиснення можливо перетворити в стислий, тим самим змінивши місце, займане документом на жорсткому диску і, можливо, видаливши частину незначною інформації (при стисненні алгоритмами, що передбачають втрати) . З точки зору «анатомії» ці графічні файли хоч і не мають (а якщо і мають то незначні) візуальних відмінностей, але їх структура буде кардинально відрізнятися.
Візуальне і внутрішньо порівняння графічних файлів у форматах jpeg (ліворуч) і bmp (праворуч)
Справа йде інакше, у разі, коли графічні файли мають деяку додаткову інформацію (метадані або EXIF). Такою інформацією може бути:
· Дата і час створення зображення;
· Ім'я автора;
· Параметри зйомки і найменування цифрової апаратури (програми) за допомогою якої було отримано зображення;
· Координати місця, де було отримано зображення (геометкі);
· Інша інформація.
Також допускається внесення додаткової інформації безпосередньо на веб-сторінках без внесення оной безпосередньо в графічний документ (контекстуальна інформація).
Таку інформацію досить легко можна отримати з графічного документа і занести її в базу даних і тим самим здійснювати пошук зображення аналогічно пошуку текстової інформації.
Вищевказаний спосіб пошуку називається прямим, тобто ми шукаємо безпосереднє зображення по ключових ознаках. Існує також т. н. реверсивний пошук зображень, який полягає як у пошуку подібних зображень, так і в пошуку метаданих про зображення.
На даний момент існує досить багато сервісів, що забезпечують таку можливість. У загальному випадку принцип таких систем не відрізняється від принципу роботи тестових пошукових систем. Уся різниця полягає в алгоритмах індексації та пошуку, які, знову ж, найчастіше є закритими.
В загальному випадку не важко уявити, яким чином проводиться реверсивний пошук зображень. Як і у випадку з текстовими пошуковими системами, пошукові роботи досліджують простори інтернету з метою знаходження різних зображень. Також, для прискорення пошуку відбувається індексація знайдених зображень, однак даними для індексації є вже не слова (тобто визначення), а ознаки, застосовні виключно до графічним документам. Такими ознаками можуть бути: колірна гамма зображення, параметри аналізу кольорового контрасту і пр. Тобто формується скелет зображення або, краще сказати, його відбиток.
Приклад витягу ознак
Далі користувач завантажує необхідне йому зображення, тим самим формуючи пошуковий запит. Пошуковий движок за тим же принципом, за яким здійснювалося витяг ознак у зображень підлягають індексації, отримує ознак...