Как найти и удалить дубли страниц сайта: пошаговое руководство для SEO

13.12.2024
Узнайте, как эффективно находить и устранять дубли страниц на сайте, включая дубли с GET параметрами, в WordPress и Битрикс. Руководство по проверке дублей страниц, их удалению и улучшению SEO-показателей.

Дубли страниц — частая проблема для сайтов разного размера. Они мешают поисковикам правильно индексировать страницы и ухудшают пользовательский опыт. В этом руководстве расскажем, как найти и удалить дубли, чтобы улучшить SEO и сделать сайт удобнее для пользователей.

Что такое дубли страниц и почему они вредны для SEO

Дублированные страницы — это страницы с одинаковым или похожим контентом, но доступные по разным URL. Они могут появляться по разным причинам: из-за настроек CMS, неправильной структуры сайта или технических ошибок. Например, одна и та же страница может открываться по разным адресам — с http и https, с www и без него, или через динамические параметры, как ?ref=utm_source (часть ссылки, которая меняется). Каждый такой вариант поисковики воспринимают как отдельную страницу.

Поисковые системы хотят показывать пользователям только уникальный контент. Когда одна и та же информация появляется на разных URL, это воспринимается как мусор в индексе. Рейтинг таких страниц может упасть, потому что поисковики не знают, какая из них важнее. Также, когда одна страница дублируется, вес страницы (например, ссылочная популярность) делится между дублями, что усложняет продвижение.

Дубли ссылок

Интернет-магазин приводит юзера на одну страницу, хотя ссылки разные: https://www.zappos.com/shoes?size=10 и https://www.zappos.com/shoes?color=black

Дублированные страницы мешают пользователям найти нужную информацию, особенно если они сталкиваются с одинаковыми страницами. Это снижает удовлетворенность и повторные посещения. В конечном итоге это может привести к потере трафика и ухудшению показателей конверсии — например, меньшее количество покупок или регистраций.

Как возникают дубли страниц

Дубли часто появляются из-за динамических параметров в URL, например, метки utm_source. Каждый раз, когда добавляется новый параметр, создаётся уникальный URL, который поисковики воспринимают как отдельную страницу. Это особенно актуально для сайтов с множеством рекламных кампаний или аналитических параметров.

Еще одна причина — пагинация. Когда страницы сайта делятся на несколько частей (например, товары разбиты по страницам), иногда они показывают одинаковый контент. Страница категории товаров может отображаться как несколько URL, но все они ведут к одному и тому же набору товаров, что создаёт дубли.

HTTP и HTTPS, а также наличие или отсутствие www также создают дополнительные версии страниц. Чтобы избежать путаницы, важно выбрать основной протокол и домен и настроить редиректы.

Иногда страницы с небольшими изменениями (например, разные размеры или цвета товара) создаются как отдельные URL, но не добавляют уникального контента. Это приводит к появлению дублей, которые усложняют SEO.

Как найти дубли страниц на сайте

Чтобы найти дубли страниц, можно использовать несколько методов — от простых и бесплатных до более сложных инструментов. Важно выбрать подходящий метод в зависимости от размера и сложности вашего сайта.

Ручной поиск (для небольших сайтов)

Поиск через команду site

Для небольших сайтов этот способ подойдет. Введите команду site:вашдомен.ру в поисковую строку. Вы увидите все страницы, которые проиндексированы поисковиками. Среди результатов ищите одинаковые страницы с разными URL, например, с параметрами ?ref=utm_source.

Страницы сайта Cinar в индексе

Страницы сайта Cinar, которые индексируются Яндексом

Просмотр кэша через команду cache

Команда cache: позволяет увидеть версию страницы, сохраненную поисковыми системами. Например, cache:вашдомен.ру/страница покажет, как поисковик видел страницу. Это поможет вам сравнить содержимое дублей и понять, есть ли проблема.

Специализированные инструменты

Для крупных сайтов или более точного анализа лучше использовать инструменты, которые автоматизируют процесс поиска дублей.

Screaming Frog. Это один из самых мощных инструментов для поиска дублей. Он сканирует сайт и находит страницы с одинаковыми заголовками, мета-тегами и контентом.

Плюсы

Минусы

Проверяет все ключевые параметры: заголовки, мета-теги, контент.

Бесплатная версия ограничена 500 URL.

Подходит для крупных сайтов и поддерживает фильтрацию URL.

Бесплатные инструменты для анализа индексации

Если ваш сайт небольшой или нет бюджета на платные сервисы, используйте Яндекс.Вебмастер (раздел «Индексация») и Google Search Console (раздел «Покрытие»).

Как удалить дубли страниц

Чтобы избавиться от дублей страниц и улучшить SEO, используйте правильные инструменты. Вот как это сделать.

301 редирект — это способ перенаправить пользователей и поисковики с одной страницы на другую. Этот метод особенно эффективен для страниц с одинаковым контентом, которые не должны существовать параллельно. При редиректе «вес» страницы передаётся основной, и поисковики будут индексировать только её.

Канонический тег говорит поисковикам, какая версия страницы должна быть основной. Это удобно, если на сайте есть несколько URL с похожим контентом — например, страницы с фильтрами или сортировками товаров. Канонический тег помогает избежать дублей, указывая, какой URL следует индексировать.

Пример:

<link rel="canonical" href="https://example.com/product">

С помощью robots.txt можно контролировать, какие страницы будут проиндексированы, а какие — нет. Если на сайте есть страницы-дубликаты, например, с фильтрами, которые не добавляют ценности, можно запретить их индексировать.

Пример:

User-agent: *

Disallow: /product?color=red

Disallow: /product?color=blue

Но не перегружайте файл лишними запретами — это может повлиять на индексацию нужных страниц.

Если страница не должна индексироваться, используйте метатег noindex. Этот тег говорит поисковикам не индексировать страницу, но она остаётся доступной для пользователей.

Пример:

Этот тег полезен для страниц с дублирующим контентом, например, для страниц с фильтрами товаров./p>

Для предотвращения дублей из-за разных протоколов (HTTP/HTTPS) или доменов (с www и без) важно правильно настроить сервер. Это избавит от дублирования страниц, если один и тот же контент доступен по разным URL.

  • Редирект с HTTP на HTTPS. Убедитесь, что ваш сайт доступен только через HTTPS. Если у вас есть старые ссылки с HTTP, настроите редирект с HTTP на HTTPS.
  • Редирект с www на без www (или наоборот). Выберите одну версию домена (с www или без) и настройте редирект с другой. Например, example.com и example.com — это две страницы для поисковиков. Настройка редиректа поможет избежать дублирования.

Если на вашем сайте есть фильтры (например, сортировка товаров по цвету или размеру), обязательно используйте канонические теги или метатеги noindex для таких страниц. Это поможет поисковикам не воспринимать их как дубляж основного контента.

Как проверить эффективность удаления дублей

После удаления дублей важно убедиться, что изменения действительно дали результат. Вот как это сделать.

  1. Проверьте индексацию в Яндекс.Вебмастере и Google Search Console. Перейдите в Яндекс.Вебмастер в раздел «Индексация» > «Статус индексации». Здесь вы увидите, какие страницы проиндексированы, а какие — нет. Если дубли были удалены, их не должно быть в индексации. В Google Search Console откройте раздел «Покрытие». Здесь будут показаны страницы с ошибками и исключенные из индексации. После удаления дублей таких страниц должно стать меньше.

Скриншот с сайта MRPopular

Скриншот с MRPopular

  1. Следите за трафиком. Используйте Google Analytics или Яндекс.Метрику, чтобы отслеживать, как изменился трафик на сайт. После удаления дублей сайт должен начать привлекать больше целевых посетителей, так как поисковые системы будут правильно индексировать страницы. Если трафик увеличился, значит, вы на правильном пути.
  2. Проверьте позиции в поисковой выдаче. Используйте Ahrefs, SEMrush или другие SEO-сервисы для мониторинга позиций вашего сайта. Если дубли мешали продвижению, после их удаления сайт должен подняться по ключевым запросам, особенно по тем, что были связаны с дублями. Рост позиций — это явный показатель того, что индексация улучшилась.
  3. Сравните данные до и после. Если вы видите рост трафика и улучшение позиций в поисковой выдаче, значит, вы правильно устранили дубли. Также важно сравнить данные в Яндекс.Вебмастере и Google Search Console до и после, чтобы убедиться, что дубли исчезли из индексации и не создают проблем для сайта.

Если всё настроено правильно, вы заметите улучшение видимости сайта, рост целевого трафика и повышение позиций.

Как предотвратить появление новых дублей

Метод

Что делать

Пример

Регулярное сканирование

Используйте Screaming Frog или Ahrefs для регулярного поиска дублей.

Настройте ежемесячное сканирование сайта, чтобы вовремя находить дубли и исправлять их.

Плагины для CMS

Для WordPress или Bitrix установите плагины, такие как Yoast SEO, чтобы настроить канонические теги.

В WordPress настройте Yoast SEO, чтобы поисковики видели только одну версию страницы.

Обучение сотрудников

Обучите команду правильно работать с UTM-метками и URL, чтобы не создавать дубли.

Проведите тренинг для контент-менеджеров, чтобы они не создавали лишние страницы с одинаковым контентом.

Настройка фильтров и пагинации

Настройте фильтры и пагинацию так, чтобы они не создавали дублирующихся страниц с одинаковым контентом.

Для фильтров товаров используйте канонические теги, чтобы поисковики индексировали только основную страницу.

Техническая настройка

Настройте редиректы с http на https и с www на без www, чтобы избежать дублей из-за разных URL.

Перенаправьте http://example.com на https://example.com и www.example.com на example.com.

Чтобы избежать дублей, регулярно сканируйте сайт, используйте правильные инструменты и обучайте сотрудников. Настройка фильтров и редиректов поможет предотвратить дублирование контента.

Работа над дублями входит в обязанности SEO-специалиста. Если вам требуется техническая помощь или консультация по продвижению, то оставляйте заявку.

Telegram
Подписывайтесь на наш канал в Telegram
Мы расскажем о последних новостях и публикациях
Подписаться
Спасибо за заявку!
Мы свяжемся с вами, ответим на интересующие вопросы и подготовим коммерческое предложение
Давайте работать
Оставьте заявку, после чего мы сможем собрать ключевые запросы, проверить позиции по ним, составить план продвижения и сделать вам предложение по продвижению сайта с гарантиями.
Ваш номер телефона *
Адрес вашего сайта
Антиспам вопрос: cколько будет 01 + 01 ?
Прикрепить список запросов
Только файлы Word, Excel, Блокнот
Оставить заявку
Нажимая на кнопку, вы даете согласие на обработку ваших персональных данных, согласно политике конфиденциальности

go to top