Введення
Браузер (Веб-оглядач) (від англ. Web browser) - програмне забезпечення для перегляду веб-сайтів, тобто для запиту веб-сторінок (переважно з Мережі), їх обробки, виведення і переходу від однієї сторінки до іншої.
Частина браузерів підтримують крім онлайн-режиму, коли браузер намагається отримати сторінки з веб-сервера, оффлайн-режим, при якому можна переглядати збережені копії раніше відвіданих сторінок. Оффлайн-режим корисний, коли з якоїсь причини немає з'єднання з інтернетом. Сторінки або неявно зберігаються в кеші браузера при відвідуванні веб-сервера, або браузер спеціально налаштовується на збереження і підтримку локальних копій певних сайтів. Копії оновлюються або при відновленні з'єднання, або за розкладом.
Метою завдання даної роботи є створення оффлайн-браузера, здатного зберігати HTML сторінки з усім їх вмістом з Мережі. Однією з особливостей програми буде завантаження сторінок із заданим рівнем вкладеності, тобто з заданим кількістю переходів по посиланнях «вглиб». Таким чином, при необхідності, можна буде зберегти не одну сторінку, а всі сторінки, до яких ми можемо отримати доступ, переходячи по посиланню з попередньої. У результаті у нас буде можливість зберігати весь сайт цілком.
У разі ж, коли на сторінці присутній контент, що вимагає для своєї роботи подгрузку додаткових елементів, програма буде завантажувати і їх.
Нижче наведена схема, що показує принцип роботи програми:
1. HTML
1.1 Загальні відомості по HTML
(HyperText Mark-up Language / мова гіпертекстової розмітки) - це мова, яка дозволяє представляти інформацію в Internet. Те, що ви бачите при перегляді сторінки в Internet, це інтерпретація вашим браузером HTML-тексту.
· Hyper протилежно linear / построчно. Раніше комп'ютерні програми працювали построчно: програма виконувала один рядок, потім переходила до виконання наступної, і т.д. Але HTML працює по-іншому - ви можете перейти куди і коли захочете.
· Text - власне, текст.
· Mark-up - це розмітка, то, що ви можете робити з текстом. Розмічається текст так само, як це робиться в текстових редакторах: виставлення заголовка, списків, виділення тексту жирним шрифтом і т.д.
· Language - це мова HTML. У ньому використовується багато англійських слів, що помітно полегшує роботу з ним.
Спочатку мова HTML був задуманий і створений як засіб структурування та форматування документів без їх прив'язки до засобів відтворення (відображення). В ідеалі, текст з розміткою HTML повинен був без стилістичних та структурних спотворень відтворюватися на обладнанні з різною технічною оснащеністю. Проте сучасне застосування HTML дуже далеко від його початкової задачі.
.2 Структура HTML-документа
- тегів мова розмітки документів. Будь-який документ на мові HTML являє собою набір елементів, причому початок і кінець кожного елемента позначається спеціальними позначками - тегами. Елементи можуть бути порожніми, тобто не містять ніякого тексту т...