="justify"> Малюнок 2.9 - Схема роботи пошукового робота
Користувачем задається початкова кількість посилань, а робот повинен їх обійти і повністю завантажити потрібну сторінку. Далі за ключовими словами в HTML-тегах або в текстах аналізується шукане, і з нього вибирається необхідне. Інформація, яку витягли, зберігається в сховище, Хатем з початкової кількості посилань видаляється знайдена і в нього додаються посилання на контакти. Робот по множинам посилань продовжує закачувати сторінку, поки це безліч не порожньо
. 3 Запити до збережених даних
Оскільки соціальна мережа «Білоруси» являє собою граф, то для аналізу потрібно спеціальний декларативний мова для запитів, так як:
аналітикам потрібно виконувати пошук за значенням (семантичний) і проводити багатокроковий аналіз у великих графах;
має бути реалізовано просте переміщення функцій графа в себе;
потрібно використовувати ключові слова в тексті або в html-тегах для збільшення кількості запитів.
Всім цим вимогам відповідає мову SPARQL. Основні характеристики цієї мови:
здійснення підтримки в роботі з шляхами в графі;
функції середнє, мінімум, максимум, сума;
функції доповнення, об'єднання і перетин;
підтримка функцій для користувача;
виконання пошукових запитів за допомогою груп символів.
Бібліотека Jena використовує свої функції для робіт з онтологіями (ключовими словами).
Малюнок 2.10 - Схема роботи підсистеми запитів
Підсистема отримує запит на якусь інформацію, після переводить її на спеціальний мова запитів, далі йде передача на виконання та отримання результату.
. 4 Інтерактивна візуалізація даних
За результатами дослідницьких центрів по когнітивним наукам, процеси аналізу та синтезу інформації нерозривно пов'язані з її візуалізацією. З'ясувалося, що отримання і засвоєння нового знання в глибоких шарах закладено образно. Тому дуже важливо правильно передати інформацію користувачеві, щоб він міг її краще сприймати в процесі використання соціальної мережі.
Малюнок 2.11 - Процес інтерактивної візуалізації
Переваги даної системи:
користувач може сам налаштувати розмір, колір і форму візуаліціонних параметрів або, наприклад, накласти обмеження на виведення деяких граф безпосередньо за допомогою фільтрів;
взаємодія з об'єктом за допомогою пристрою введення (миша, клавіатура) на базі основних дій: вибір, переміщення, навігація, масштабування, обертання, зсуву;
зміна даних за допомогою редагування, створення і видалення;
Підсистема інтерактивної візуалізації включає в себе три модулі: модуль відображення, що відповідає за перетворення даних; модуль компоновки - розташування ребер і вершин на екрані; модуль рендеринга - промальовує елементи за допомогою функції Java2D.
3 ОБГРУНТУВАННЯ ВИБОРУ ЗАСОБІВ ТА СЕРЕДОВИЩА РОЗРОБКИ ПРОГРАМНОГО ЗАСОБУ
. 1 середу розробки програмного засобу
Для оптимальної розробки середовища програмного засобу необхідно комбінувати різні мови програмування, так як кожен з них спрямований на виконання певних цілей і завдань. Як, наприклад, кілька команд PHP дозволяють створити цілу Web-сторінку, але на практиці майже завжди скрипт використовується спільно з HTML, і зазвичай вихідний текст скрипта містить велику кількість рядків. Але, не дивлячись на це, слід зазначити, що код на PHP може знаходитися в будь-якому місці HTML-документа, однак він не обов'язково повинен використовувати HTML. Необхідно лише забезпечити, щоб PHP-код створював коректний HTML-код, який потім буде правильно відображений Web-браузером.
HTML - гіпертекстова мова розмітки, який використовується для створення документів в Інтернет. За допомогою нього створюється необхідна структура і сітка сторінки, зовнішній вигляд якої надалі вдосконалюється CSS і JavaScript. На даний момент останньою версією є HTML5, якій передувала HTML4.01. Більшість Web-ресурсів побудовані на основі саме цієї мови.
На відміну від HTML 4, у якого 3 валідатора, у HTML 5 валідатор один: lt;! DOCTYPE html gt ;. HTML 5 підтримує MathML і SVG.
Нові теги: section, article, aside, hgroup, header, footer, nav, dialog, figure, video, audio, source, embed для вставки контенту з плагіном (тільки), mark, progress, meter , time, ruby, rt, rp, ca...