Главная страница / 37. Сервисы Интернета: 37.3. Протокол HTTP

37.3. Протокол HTTP

От обычных текстовых документов веб-страницы отличаются тем, что они оформлены без привязки к конкретному носителю. Электронные веб-документы предназначены для просмотра на экране компьютера, причем заранее не известно, на каком. Не известны ни размеры экрана, ни параметры цветового и графического разрешения, не известна даже операционная система, с которой работает компьютер клиента. Поэтому веб-документы не могут иметь «жесткого» форматирования. Оформление выполняется непосредственно во время их воспроизведения на компьютере клиента и происходит оно в соответствии с настройками программы, выполняющей просмотр.

Программы для просмотра веб-страниц называют браузерами.

Информационный WWW-сервер использует гипертекстовую технологию. Для записи документов в гипертексте используется специальный, но очень простой язык HTML (Hypertext Markup Language – язык разметки гипертекста), который позволяет управлять шрифтами, отступами, вставлять гиперссылки, цветные иллюстрации, поддерживает вывод звука и анимации (средства мультимедиа). Для этого он использует специальные команды-теги. В стандарт языка также входит поддержка математических формул.

веб-документ представляет собой обычный текстовый документ, размеченный тегами. Большинство тегов используются парами: открывающий тег и закрывающий. Закрывающий тег начинается с символа «/»:

<CENTER>Текст</CENTER>

Сложные теги имеют кроме ключевого слова дополнительные атрибуты и параметры, детализирующие способ их применения. При отображении документа на экране с помощью браузера теги не показываются, и мы видим только текст, составляющий документ.

Внешне гипертекст отличается от обычного текста тем, что часть слов или целые строки в нем, будучи выделены особым шрифтом или цветом, оказываются чувствительными к появлению на них указателя манипулятора «мышь». Щелчок мыши приводит к инициированию какого-либо события, чаще всего к загрузке в программу просмотра нового документа, привязанного так называемой гипертекстовой ссылкой к выделенной строке текста. В результате у пользователя появляется возможность самому выбирать порядок просмотра тех или иных страниц, двигаясь по перемежающимся между собой нитям – паутинкам ссылок. В сценарий просмотра могут входить ресурсы всего мира, доступ к которым происходит по протоколу работы с гипертекстом HTTP (Hyper Text Transfer Protocol).

Благодаря удобному интерфейсу браузеров работа в Web не представляет особых трудностей.

Современные стандарты языка разметки.

XML

XML (англ. eXtensible Markup Language – расширяемый язык разметки) – рекомендованный Консорциумом Всемирной паутины язык разметки, фактически представляющий собой свод общих синтаксических правил. XML – текстовый формат, предназначенный для хранения структурированных данных для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки (например, XHTML).

Целью создания XML было обеспечение совместимости при передаче структурированных данных между разными системами обработки информации, особенно при передаче таких данных через Интернет. Словари, основанные на XML (например, RDF, RSS, MathML, XHTML, SVG), сами по себе формально описаны, что позволяет программно изменять и проверять документы на основе этих словарей, не зная их семантики, т. е. не зная смыслового значения элементов. Важная особенность XML – применение так называемых пространств имен (англ. namespace).

XHTML

XHTML (англ. Extensible Hypertext Markup Language  – расширяемый язык разметки гипертекста) – язык разметки веб-страниц, по возможностям сопоставимый с HTML, созданный на базе XML.

Различия между XHTML и HTML

  • Все элементы должны быть закрыты. Теги, которые не имеют закрывающего тега (например, <img> или <br>), должны иметь на конце знак «/» (например, <br />).
  • Булевы атрибуты записываются в развернутой форме. Например, следует писать <option selected="selected"> или <td nowrap="nowrap">.
  • Имена тегов и атрибутов должны быть записаны строчными буквами (например, <img alt="" /> вместо <IMG ALT="" />).
  • XHTML гораздо строже относится к ошибкам в коде; < и & везде, даже в URL, должны замещаться &lt; и &amp; соответственно. По рекомендации W3C браузеры, встретив ошибку в XHTML, должны сообщить о ней и не обрабатывать документ. Для HTML браузеры должны были попытаться понять, что хотел сказать автор.
  • Кодировкой по умолчанию является UTF-8 (в отличие от HTML, где кодировкой по умолчанию является ISO 8859-1).