URL (от Uniform Resource Locator)- универсальный (единообразный) формат записи адреса ресурса, обозначающий его местоположение в сети. Может использоваться русскоязычный вариант – УРЛ.

Историческая справка

Изобретатель URL - Тим Бернерс-Ли, предполагал использовать такую адресацию для документов (файлов), расположенных на компьютерах, которые подключены к интернету. Позднее эта инновация стала стандартом для всех ресурсов в интернете. Стандарт URL закреплен документально и имеет обозначение RFC 1738.

Структура

Предполагалось, что структура адреса должна быть легко расширяемой, использовать определенные символы и естественно указывать местоположение документа. Исходя из этого, закрепился такой формат записи:

 <протокол>://<логин>:<пароль>@<имя-домена>:<порт>/<путь>?<параметры>#<якорь>

Каждая составная часть обозначает следующее:

  • протокол – сетевой протокол или схема обращения к документу (ресурсу). Могут использоваться значения http — простой текст, https —защищенный текст , mailto — электронная почта (адрес), ftp — передачи файлов;
  • логин - имя, которое используется пользователем при доступе к ресурсу;
  • пароль – пользовательский пароль;
  • имя-домена - хост (его полное доменное имя в структуре DNS).Возможно использование IP-адреса;
  • порт - номер порта хоста, используемый для подключения;
  • путь – дополнительная информация о местонахождении ресурс (URL);
  • параметры - строка передаваемых на сервер параметров, используется разделитель — знак &.
  • якорь - ссылка на определенное место открываемого документа. После разработки интерактивных пользовательских приложений (AJAX) в позиции якоря размещают параметры JavaScript, позволяющие представлять пользователям одну и ту же страницу в разном виде. Для улучшения процесса индексирования, Google предложила использовать знак ! в начале якоря.

На данный момент URL является родоначальником унифицированного формата адреса – URI, который имеет следующую структуру:

< протокол>:// <тип- сайта>. <имя домена>: <порт>/<путь>/

Составные части здесь аналогичны частям в URL, отличие составляет лишь секция <тип- сайта>, которая может получать значения, указывающее на тип обозревателя, например www (простой браузер) или wap(браузер для мобильных устройств). При наличии у ресурса версий, поддерживающих оба браузера, параметр не указывается.

Формат записи

Первоначально разработчики URL предполагали использовать для записи только цифры, буквы латиницы и определенные знаки препинания. По мере развития появилась возможность использовать символы, относящиеся к другим языкам, к примеру, китайские иероглифы, арабские и славянские буквы. Добиться этого позволили системы перекодирования:

  • Двухступенчатое перекодирование: сначала все символы кириллицы в UTF-8, а затем преобразование результата в шестнадцатеричный вид. К примеру, ЧПУ http://standart.ru/Пример

после перекодировки будет представлен в виде

http://standart.ru/%BA%D1%80%D0%BE%D0%BA%D1%80%D0%B5%D0%B4%.

  • Перекодирование PunnyCode. При данном методе кириллица конвертируется в латинские символы. Например, URL http://80aafi6cg.ru после перекодировки будет выглядеть так:  http://правда.ru.

Сервисы

Учитывая большую длину URL, особенно перекодированных, а так же возможность сохранения адреса после прекращения существования ресурса, разработаны определенные сервисы, облегчающие работу:

  • Краткий URL — обобщенное название всех сервисов, позволяющих сократить реальную длину URL. Это происходит за счет применения синонимов конечного URL на страницах сервиса с кратким именем домена.
  • PURL (от Persistent Uniform Resource Locator) — сервис, предоставляющий база данных для хранения URL. При изменении (прекращении существования) адреса, необходимая информация сохраняется в базе. В результате внешний адрес фактически не изменяется. Сервис облегчает работу с сайтами, имеющими постоянно изменяющийся контент или местоположение. В этом случае краулеры проиндексируют сайт с учетом ссылки в PURL, поэтому ресурс появится в списке выдачи даже при изменении исходного адреса.

См. дополнительно: