Сети и системы телекоммуникаций. Погонин В.А - 81 стр.

UptoLike

запроса слишком длинный, Request-URI Too Long), если URI длиннее, чем сервер в состоянии об-
работать.
Серверы должны обращать внимание на URI, которые имеют длину более 255 байтов, потому
что некоторые старые клиенты или прокси-сервера могут неправильно поддерживать эти длины.
"Http" схема используется для доступа к сетевым ресурсам при помощи протокола HTTP.
Этот раздел определяет схемо-определенный синтаксис и семантику для HTTP URL:
http_URL = "http:" "//" host [ ":" port ] [ abs_path ]
host = <допустимое доменное имя машины или IP адрес
(в точечно десятичной форме), как определено в разделе 2.1
RFC 1123>
port = *DIGIT
Если порт пуст или не задан – используется порт 80. Это означает, что идентифицированный
ресурс размещен в сервере, ожидающем TCP соединений на специфицированном порте port, ком-
пьютера host, и запрашиваемый URI ресурса – abs_path. Использования IP адресов в URL следует
избегать, насколько это возможно (RFC 1900). Если abs_path не представлен в URL, он должен
рассматриваться как "/" при вычислении запрашиваемого URI (Request-URI) ресурса.
При сравнении двух URI, чтобы решить соответствуют ли они друг другу или нет, клиенту
следует использовать чувствительное к регистру пооктетное (octet-by-octet) сравнение этих URI,
со следующими исключениями:
порт, который пуст или не указан, эквивалентен заданному по умолчанию порту для этого
URI;
сравнение имен хостов должно производиться без учета регистра;
сравнение имен схем должно производиться без учета регистра;
пустой abs_path эквивалентен "/";
символы, отличные от тех, что находятся в "зарезервированных" ("reserved") и "опасных"
("unsafe") наборах эквивалентны их представлению как ""%" HEX HEX ".
Например, следующие три URI эквивалентны:
http://abc.com:80/~smith/home.html
http://ABC.com/%7Esmith/home.html
http://ABC.com:/%7esmith/home.html
HTTP использует то же самое определение термина "кодовая таблица", которое определено
для MIME:
Термин "кодовая таблица" используется, чтобы сослаться на метод, использующий одну или
несколько таблиц для преобразования последовательности октетов в последовательность симво-
лов. Стоит отметить, что однозначное преобразование в обратном направлении не требуется, и
что не все символы могут быть доступны в данной кодовой таблице, и что кодовая таблица может
обеспечивать более чем одну последовательность октетов для представления специфических сим-
волов. Это определение допускает различные виды кодирования символов, от простых однотаб-
личных отображений типа US-ASCII до сложных методов, переключающих таблицы, наподобие
тех, которые используют методики ISO 2022. Однако определение, связанное с именем кодовой
таблицы MIME должно полностью определять отображение, которое преобразует октеты в сим-
волы. В частности, использование внешней информации профилирования для определения точ-
ного отображения не разрешается.
Кодовые таблицы HTTP идентифицируются лексемами, не чувствительными к регистру.
Полный набор лексем определен реестром кодовых таблиц IANA [19]:
charset = token
Хотя HTTP позволяет использовать в качестве значения charset произвольную лексему, лю-
бая лексема, которая имеет предопределенное значение в реестре кодовых таблиц IANA, должна
представлять набор символов, определенный в данном реестре. Приложениям следует ограни-
чить использование символьных наборов теми, которые определены в реестре IANA.
Значение кодирования содержимого указывает какое преобразование кодирования было или
будет применено к объекту. Кодирование содержимого используется, прежде всего, для сжатия