ку.
Використовує власну технологію посилання ранжирування, засновану на нейронної мережі. Ця технологія називається Neo Popularity Rank (вимовляється «Нио Попьюларіті Ранк»). Результати пошуку можуть сортуватися за релевантністю, популярності, датою останньої зміни і по важливості (твору релевантності на популярність).
Для уточнення ранжирування сайтів може автоматично будувати реферати індексованих сторінок, які з трьох найбільш важливих пропозицій. [20] (від англ. SQL Phrase Index - індекс фраз (фразовий індекс) SQL) - система повнотекстового пошуку, розроблена Андрієм Аксьоновим і поширювана за ліцензією GNU GPL. Відмінною особливістю є висока швидкість індексації та пошуку, а також інтеграція з існуючими СУБД (MySQL, PostgreSQL) і API для поширених мов веб-програмування (офіційно підтримуються PHP, Python, Java; існують реалізовані спільнотою API для Perl, Ruby,. Net і C + + ).
За технологією SphinxSE здійснюється пошук на популярному блозі Хабрахабр, проект Вікімапія, популярному книжковому інтернет-магазині Буквоїд, BitTorrent-трекері Піратська бухта та інших високонавантажених проектах. [21]
The Apache Lucene (вимовляється «Апач Люценом») - це вільна бібліотека (не система) для високошвидкісного повнотекстового пошуку, написана на Java. Може бути використана для пошуку в інтернеті та інших областях комп'ютерної лінгвістики (аналітична філософія). Наприклад, Lucene використовується як компонента в децентралізованої пошуковій системі YaCy. [22]
Можливості:
· Масштабована і високошвидкісна індексація
· понад 95GB на годину на сучасному об?? Рудованії;
· потрібно малий обсяг оперативної пам'яті - розмір поджкачкі всього 1MB;
· розмір індексу приблизно 20-30% від розміру початкового тексту.
· Потужний, точний і ефективний пошуковий алгоритм
· ранжований пошук - найкращі результати показуються першими;
· безліч потужних типів запитів: запит фрази, шаблонні запити, пошук інтервалів і т.д.;
· пошук заснований на «полях» (Таких як заголовок, автор, текст);
· можливість сортувати по різних полях;
· множинний індексний пошук з можливістю об'єднання результатів;
· можливість одночасного пошуку та оновлення індексу.
· Кроссплатформное рішення
· вихідний код повністю написаний на Java;
· наявність портів на інші мови програмування (С, С + +, Perl та ін.)
Таблиця
Найменування пошукової системи (движка) ТіпЛіцензіяНазначеніеТіпи індексованих документовТіп індексаAPI / протоколиВаріанти поіскаПроізводітельность (передбачувана) GoogleПоісковая системаПроприентарнаяИнтернет поіскHtml, xml, PDF, RTF, PostScript, doc (x), xls (x), ppt (x) та ін Інформація закритаОткритий API, можливо вбудовування в сайтСобственний потужний мову запросовІндексірует> 45 млрд сторінок, середній час виведення 0.12 сек./Терм. BingПоісковая системаПроприентарнаяИнтернет поіскHtml, xml, PDF, RTF, PostScript, doc (x), xls (x), ppt (x) і ін Інформація закритаЗакритий APIУпрощенний мову запросовІндексірует> 18 млр...