Seopult Cybermarketing Click.ru Seopult TV Trustlink Webartex.ru UpToLike.ru Blog.Seopult.ru Форум
25 марта 2013

Пять шагов к SEO-ориентированной структуре URL сайта

Плюсануть
Поделиться
Отправить
Класснуть
Линкануть
Алезия Краш — SEO-специалист и маркетолог в Link-Assistant.Com. Она принимает участие в разработке программного обеспечения для поискового продвижения и аудита сайтов.

Некоторые считают, что не существует такой вещи, как SEO-ориентированная структура URL. Они утверждают, что поисковики отлично могут разобраться в любом виде URL, практически любой структуры. Чаще всего это можно услышать от веб-разработчиков (просто я, знаете ли, люблю веб-разработчиков).

Я заметила, что порой веб-разработчики и сеошники живут в двух параллельных вселенных, каждая из которых имеет свой собственный центр притяжения. В то время как веб-разработчики, в основном, заботятся о дружественности сайта к поисковым системам, скорости загрузки и других технических моментах, сеошники больше фокусируются на своём священном Граале: рейтинге сайта и ROI.


Поэтому, то, что веб-разработчик сочтёт нормальной структурой URL, для сеошника может быть совершенно неприемлемым:

 

Что такое SEO-ориентированная структура URL сайта?
Начнем с того, что всегда лучше обратиться к SEO-менеджеру на ранних этапах разработки, чтобы потом не возникало необходимости в сложных изменениях.

С точки зрения SEO структура URL должна быть:

  • Простой: для URL с дублированным контентом необходимо указывать отдельные canonical URL; на сайте не должно быть запутанных редиректов и т.п.
  • Осмысленной: URL должны содержать ключевые слова, а не непонятные цифры и знаки пунктуации.
  • С акцентом на нужные URL: с точки зрения SEO, как правило, не все URL сайта одинаково важны. Некоторые даже бывает нужно скрыть от поисковиков. В то же время, важно убедиться, что те страницы, которые должны быть доступны для поисковиков, открыты для просмотра и индексации.

Итак, вот что мы можем сделать, чтобы структура наших URL была SEO-ориентированной:

1. Объедините www и не-www версии своего домена
Как правило, существует две основные версии вашего домена, которые индексируются в поисковиках: версия с www и версия без www. Их можно объединить разными способами, но я упомяну здесь лишь о наиболее распространенной практике.

Большинство сеошников (по моему опыту) используют редирект 301, ведущий с одной версии сайта на другую.

В качестве альтернативы (например, если вы не можете сделать редирект) можно указать приоритетную версию в Google Webmaster Tools: Configuration >> Settings >> Preferred Domain. Однако у этого способа есть определенные недостатки:

  • Он подходит только для Google.
  • Он ограничивается только корневыми доменами. Если у вас сайт вида example.wordpress.com, то этот способ не для вас.

Но зачем вообще беспокоиться об этой проблеме — www или не www? Дело в том, что некоторые из ваших ссылок могут вести на версию с www, а другие — на версию без www.

Так что, чтобы объединить SEO-вес обеих версий, лучше всего напрямую связать обе версии (либо через редирект 301, либо через Google Webmaster Tools, либо с помощью тега canonical — об этом поговорим чуть позже).

2. Избегайте динамических и относительных URL

В зависимости от используемой вами системы управления контентом, генерируемые ей URL могут выглядеть «красиво», например, вот так:

www.example.com/topic-name

или «некрасиво», например, вот так:

www.example.com/?p=578544

Как уже было сказано ранее, поисковикам подходит любой вариант, но в силу определенных причин лучше пользоваться статическими (красивыми) URL, а не динамическими (некрасивыми). Дело в том, что статические URL содержат ваши ключевые слова, к тому же, они более ориентированы на пользователей, так как по ним можно понять, о чём написано на странице.

Кроме того, Google рекомендует использовать в URL дефисы (-) вместо знаков подчеркивания (_), поскольку фраза, слова в которой соединены знаками подчеркивания, рассматривается Google как одно слово, например, one_single_word  Google видит как onesingleword.

Также некоторые веб-разработчики пользуются относительными URL. Проблема с относительными URL в том, что они зависят от контекста, в котором используются. Если контекст меняется, URL перестает работать. С точки зрения SEO лучше использовать абсолютные URL вместо относительных, поскольку поисковики предпочитают именно первые.

Далее, иногда к URL можно добавлять разные параметры в целях анализа или по другим причинам (например, sid, utm и т.п.). Чтобы убедиться, что эти параметры не создают слишком много URL с дублированным контентом, можно выполнить одно из следующих действий:

  • Попросить Google не обращать внимания на определенные параметры URL в Google Webmaster Tools: Configuration > URL Parameters.
  • Проверить, не позволяет ли ваша система управления контентом привязывать URL с дополнительными параметрами к их более коротким вариантам.

3. Создайте XML карту сайта
XML карту сайта иногда путают с HTML картой сайта. Но первая предназначена для поисковиков, в то время как последняя — в основном, для людей.

Что такое XML карта сайта? Просто говоря, это список URL вашего сайта, который вы представляете поисковикам. Это служит двум целям:

1. Позволяет поисковикам легче находить страницы вашего сайта;

2. Поисковики могут использовать карту сайта при выборе канонических URL на вашем сайте.

«Канонический» в данном случае означает «предпочитаемый». Выбирать канонические URL необходимо, когда поисковики видят на вашем сайте дублированные страницы.

Так что, поскольку дублированные результаты в выдаче не нужны, поисковики используют специальный алгоритм для идентификации дублированных страниц и выбора одного URL, который будет представлять эту группу в результатах поиска, а остальные страницы отсеиваются.

Итак, вернемся к картам сайта… Один из критериев, используемых поисковиками при выборе канонического URL для группы страниц, состоит в том, упомянут ли данный URL в карте сайта.

Так какие страницы следует включать в карту сайта, все или не все? На самом деле, для целей SEO рекомендуется включать только те страницы, которые вы хотите показывать в результатах поиска.

4. Закройте нерелевантные страницы с помощью robots.txt
На вашем сайте могут быть страницы, которые необходимо скрыть от поисковиков. Это может быть страница с пользовательским соглашением и правилами сайта, страница с конфиденциальной информацией и т.п. Лучше не допускать индексации таких страниц, поскольку они обычно не содержат целевых ключевиков и только разбавляют собой семантическую совокупность вашего сайта.

Файл robots.txt содержит инструкции для поисковиков, какие страницы вашего сайта они должны игнорировать. Такие страницы получают атрибут noindex и не отображаются в результатах поиска.

Однако иногда незадачливые вебмастера используют noindex на страницах, где его использовать не следует. Поэтому, когда вы приступаете к оптимизации сайта, важно убедиться, что на тех страницах, которые должны показываться в результатах поиска, нет атрибута noindex. В противном случае все может получиться, как у этого парня:

 

5. Укажите канонические URL с помощью специального тега
Еще один способ отметить канонические URL на сайте — воспользоваться так называемыми тегами canonical.

Внимание: тег canonical следует применять только в целях помощи поисковикам в выборе канонического URL. Для перенаправления со страниц сайта следует использовать редирект. А для разбитого на страницы контента чаще всего лучше использовать теги rel=»next» и rel=»prev».

Например, на сайте универмага Macy’s можно перейти на страницу «Пледы и покрывала» напрямую или попасть туда с главной страницы несколькими разными путями:

  • Главная страница >> Спальня и ванная >> Пледы и покрывала. При этом генерируется URL, отражающий пройденный вами путь:

http://www1.macys.com/shop/bed-bath/quilts-bedspreads?id=22748&edge=hybrid&cm_sp=us_catsplash_bed-%26-bath-_-row6-_-quilts-%26-bedspreads

  • Или можно перейти с главной страницы на страницу «Товары для дома», оттуда на страницу «Спальня и ванная», потом на страницу «Постельные принадлежности», а оттуда уже на «Пледы и покрывала». При этом генерируется следующий URL:

http://www1.macys.com/shop/bed-bath/quilts-bedspreads?id=22748&edge=hybrid

Все три URL ведут к одному и тому же контенту. И если вы посмотрите на код каждой страницы, вы увидите следующий тег в элементе head:

Как видите, для каждого из этих URL указан канонический URL, которым служит самая аккуратная версия из этой группы:

http://www1.macys.com/shop/bed-bath/quilts-bedspreads?id=22748

Для чего это нужно? Для того чтобы SEO-вес каждого из этих трех URL переходил к одному-единственному URL, который будет отображаться в результатах поиска (канонический URL). Обычно поисковики и сами неплохо разбираются, какой URL считать каноническим, но, как однажды написала Сьюзан Москва в Google Webmaster Central:

«Если мы не можем определить все дубликаты той или иной страницы, мы не сможем и объединить их свойства. Это может привести к снижению показателей рейтинга этого контента из-за их разделения между несколькими URL».

Заключение
SEO-ориентированная структура URL сайта — это такая структура, которая позволяет сайту ранжироваться выше в результатах поиска. Хотя с точки зрения веб-разработчиков архитектура того или иного сайта может казаться кристально-чистой и совершенно безупречной, для SEO-специалиста это может означать упущенные возможности в плане рейтинга.




Плюсануть
Поделиться
Отправить
Класснуть
Линкануть

Давайте это обсудим

  • Duke

    «поскольку фраза, слова в которой соединены знаками подчеркивания, рассматривается Google как одно слово, например, one_single_word Google видит как onesingleword.»
    Полный бред, каждый может в этом убедиться

Расписание вебинаров и
мастер-классов
24 октября 2017 Вторник 13:00
Евгений Костин
SEO: продвинутый курс
26 октября 2017 Четверг 12:00
Александр Серебряков
Новый инструмент для маркетолога - мессенджер-маркетинг
26 октября 2017 Четверг 13:00
Дмитрий Климчуков
Контекстная реклама: продвинутый курс