и завантаженого користувачем зображення, після чого відбувається пошук варіантів аналогічно пошуку текстової інформації.
Такий спосіб пошуку також іноді називають комп'ютерним зором.
Також іноді пошукова система дозволяє комбінувати прямий і реверсивний способи пошуку для більш точного результату.
Приклади результатів пошуку: зліва - реверсивний, праворуч комбінований
3.6 Особливості пошуку аудіо інформації
Кожен з нас бував в такій ситуації, коли в голові крутиться якась мелодія, але назва ніяк не згадувати. Або композиція була почута по радіо або просто на вулиці, а хто співає і як називається - не відомо. У таких випадках дуже до речі доводяться пошукові системи, здатні проводити пошук аудіо інформації.
Аналогічно пошуку графічної інформації, існує декілька технік в упізнанні пісні, застосування кожної з них залежить від того, що, власне, знає людина про шуканої композиції.
У кожного аудіофайлу є два головних ідентифікатора - назва і виконавець.
Приклад метаданих аудіофайлу
Інша справа, що з комбінацією «назва і виконавець» далеко не завжди все ясно. Навіть цілком офіційні джерела деколи плутаються в правильному написанні назв музичних груп або їхніх пісень. Чого вже говорити про звичайних людей.
Найпростіший випадок - людина пам'ятає назву пісні, але не пам'ятає виконавця. Або навпаки. У цьому випадку пошукова система повинна мати доступ до баз даних за виконавцями та їх творчості. Виробляється звичайний тестовий пошуковий запит. Користувач подивиться запропоновані варіанти, послухає їх фрагменти в потоковому форматі і вибере потрібне.
Приклад результату пошуку за назвою композиції
Для створення подібної бази точкою опори поки навіть в Інтернеті залишаються музичні CD. Адже переважна кількість аудіозаписів раніше виходить в першу чергу в цьому форматі. Всі випущені диски каталогізуються, заносяться до класифікаторів з відповідними індексами.
З технічної точки зору, у пошукових систем, що працюють з аудіо інформацією структура індексу трохи різниться і найчастіше представляється у вигляді N-грам. З семантичної точки зору, це може бути послідовність звуків, складів, слів або букв. На практиці частіше зустрічається N-грами як ряд слів. Метою побудови N програмних моделей є визначення ймовірності вживання заданої фрази. Цю ймовірність можна задати формально як ймовірність виникнення послідовності слів у деякому корпусі (наборі текстів). Наприклад, ймовірність фрази «щастя є задоволення без каяття» можна обчислити як добуток ймовірностей кожного зі слів цієї фрази:
=P (щастя) * P (є | щастя) * P (задоволення | щастя є) * P (без | щастя є задоволення) * P (каяття | щастя є задоволення без)
Розрахувати ймовірність P (щастя) справа нехитра: потрібно всього лише порахувати скільки разів це слово зустрілося в тексті і поділити це значення на загальне число слів. Але розрахувати ймовірність P (каяття | щастя є задоволення без) вже не так просто. На щастя, ми можемо спростити цю задачу.
Приймемо, що йм...