Как убрать дубли страниц в WordPress. Как убрать дубли страниц в wordpress
Как убрать дубли страниц wordpress
Replytocom! Как найти, убрать и избавиться от дублей страниц replytocom в wordpress блоге!
Привет! В предыдущей статье я рассказывала о том, как найти дубликаты страниц и чем они опасны. Сегодня мы узнаем как избавиться от дублей страниц раз и навсегда.
В WordPress есть отдельная категория дублей страниц, которые образуются из-за технических особенностей системы и присутствуют только в Google. Такие повторения сложно заметить на сайте и еще сложнее самостоятельно удалить. Радуйтесь, что вы читаете эту статью, потому что сейчас я вас всему научу!
Простой способ убрать дубли страниц
Если вы давно занимаетесь техническим совершенствованием своего блога, то наверняка уже сделали самые простые шаги, предотвращающие появление дублей. Проверьте себя:
Если ваш блог сделан на WordPress, у вас наверняка присутствуют следующие типы дублей страниц:
Например, если добавить в конце урла любой статьи /feed, откроется xml версия статьи для RSS-рассылки - ее текст тот же самый, но адрес отличается. Replytocom используется в древовидных комментариях при нажатии кнопки «Ответить». Выходит, что каждый комментарий создает дополнительный url одной и той же страницы. А если у статьи тысяча комментариев, то и дублей у нее будет 1000.
Почему именно Гугл, я уже объясняла. Все дело в файле robots.txt. Когда в нем закрыт доступ к чему-то, Google все равно забирает это в выдачу. Просто не показывает содержимое:
Хорошо, если у вас сделаны эти три простейших пункта, но это еще не значит, что вы знаете, как удалить дубли страниц. Все самое интересное впереди.
Что такое дубли страниц WordPress replytocom и другие?
- feed
- replytocom
- tag
- page
- attachment
Каждый из этих типов связан с определенной технической возможностью WordPress. Определить, какие из них есть у вас можно с помощью оператора site, об этом очень подробно написано в прошлой статье - тут.
С такими дублями страниц срочно нужно бороться, потому что сайт с подобной проблемой мгновенно попадает под фильтр Гугла Панда.
Чтобы этого избежать, нужно наоборот открыть Гуглу доступ ко всему в файле robots.txt, при этом в head каждого файла добавить запрещающий индексацию мета-тег:
Фото по теме с интрнетаkakware.blogspot.com
Как убрать дубли страниц в WordPress
От автора: дубли страниц – одна из самых распространенных технических проблем, которая может ухудшить позиции сайта в поиске. Как с ней разобраться? Невозможно в одной статье рассказать о всех видах дублей на всех движках, давайте сосредоточимся на чем-то одном. Например, на cms WordPress, так как это самый популярный движок. Как убрать дубли страниц в wordpress? Давайте рассмотрим самые основные.
Самое большое зло WordPress
В этом движке есть один вид дублей, который особенно опасен и от него в свое время страдали очень многие сайты. Это так называемый replytocom. Появится он только в том случае, если включить в настройках обсуждения древовидные комментарии. Таким образом, появится возможность ответить на комментарий какого-то человека. Это очень удобно, если только не одно но.
Если присмотреться к url-адресу на кнопке “Ответить”, то можно найти там тот самый злосчастный отросток – replytocom. Ну и что? А то, что чем больше комментариев теперь у вас будет на странице, тем больше дублей. Причем 1 новый комментарий породит не 1 дубль, а много.
Все это происходит потому, что к странице теперь можно будет обратиться не только так: http://site.ru/название-записи
Практический курс по верстке адаптивного лендинга с нуля!
Научитесь с нуля верстать адаптивные лендинги на HTML5 и CSS3 за ближайшие 6 дней
Узнать подробнееНо и так: http://site.ru/название-записи?replytocom=…
Таким образом, если к статье оставили 100 комментариев, то появится как минимум 100 дублей, но на самом деле гораздо больше. Я часто анализирую различные сайты с помощью специальных сервисов вроде pr-cy. Так вот, там можно наблюдать историю количества проиндексированных страниц.
Так вот, в 2012-13 годах, когда решение проблемы знали немногие, у многих сайтов было 100 тысяч – 10 миллионов страниц в индексе! Сейчас их в тысячи раз меньше, хотя с тех пор на сайтах появилось намного больше контента.
Как раз все эти тысячи и даже миллионы дублей в основном были из-за дублей replytocom. Когда же владельцы сайтов узнали о проблеме и о ее решении, они избавились от дублей и со временем из поисковой выдаче исчезли сотни миллионов мусорных страниц!
Лечение или как избавиться от replytocom
Вариантов тут есть несколько. Во-первых, можно установить плагин Yoast SEO, который используют тысячи веб-мастеров для поисковой оптммизации своих записей. Если хорошенько покопаться в его настройках, то можно найти там пункт “Убрать replytocom”. Ставим галочку и спим спокойно.
Во-вторых, можно просто не включать древовидные комментарии, если вы в них не нуждаетесь. Конечно, будет не так удобно, но это самый простой способ никогда не сталкиваться с этими дублями.
В-третьих, поставить какой-то другой плагин. В частности, не так давно нашел плагин Ark hidecommentslinks, который делает сразу 2 полезных дела: заменяет ссылки в комментариях на кликабельный текст, а заодно и убирает replytocom. Но плагин приведен только в пример, потому что я уверен, что это не единственное расширение, которое справляется с этой проблемой.
Четвертый способ более сложен – замена кнопки ответить. Эта кнопка должна выводиться не стандартными средствами wordpress, а с помощью скрипта. Обычно эту работу делает программист, либо вы можете найти готовое решение в каком-нибудь шаблоне, где стоит самописная система комментариев.
Практический курс по верстке адаптивного лендинга с нуля!
Научитесь с нуля верстать адаптивные лендинги на HTML5 и CSS3 за ближайшие 6 дней
Узнать подробнееДумаю, этих способов вам хватит, тут еще нужно сказать о том, что чем раньше вы сделаете что-либо для устранения дублей, тем лучше. Самое главное, чтобы ваши статьи не были доступны по такому адресу: http://site.ru/название-записи?replytocom=какое-то число
Потому что если они недоступны (вылазит 404 ошибка) то со временем все дубли, если они уже попали в выдачу, пропадут. Если они еще не успели попасть в выдачу, то еще лучше.
Простой способ проверить дубли
В WordPress на главной странице вы можете видеть, сколько на вашем блоге на данный момент записей, а также сколько страниц. Вот вы и можете примерно прикинуть, сколько страниц должно быть в индексе. Вводим адрес своего сайта в сервис для проверки этих показателей.
Там вы увидите данные для Яндекса и Гугла. Если они примерно отвечают вашим подсчетам и отличаются незначительно, значит, на данный момент все в порядке. Если же вы видите существенную разницу между количеством страниц в Индексе поисковиков, либо в обоих поисковиках это количество сильно превышает кол-во реальных записей, нужно начинать бить тревогу и принимать меры по борьбе с дублями.
Дубли на страницах рубрик
На странице рубрики обычно содержится анонс статьи и кнопка на нее полное прочтения. Так вот, хотя это и не полный дубль, но все же какая-то часть текста может совпадать на обеих страницах (300-600 символов). Таким образом, вы сами у себя понижаете уникальность. Чтобы этого не допустить, желательно закрывать текст в анонсах в теги noindex.
Хорошо, но из-за этого страницы рубрик вообще могут не проиндексироваться? Если вы хотите все-таки их индексировать, рекомендую добавить для каждой рубрики ее уникальное описание в 150-250 символов и выводить его в шаблоне рубрик – category.php.
Дубли в архивах
По умолчанию в wordpress есть архивы по дате и архивы по автору. На этих страницах также выводится описание статей, а еще одинаковые title. Если вы в них не нуждаетесь, можно просто отключить. Это можно сделать с помощью seo-плагина. Например, Yoast SEO.
Дубль на уровне домена
По умолчанию при создании сайта он доступен по двум адресам: site.ru и www.site.ru. По сути, для поисковой системе это 2 разных сайта. Чтобы контент не дублировался, нужно явно указать главное зеркало. Это можно сделать с помощью файла robots.txt, прописав в нем следующее:
User-Agent: * Host: site.ruСо временем поисиковые роботы поймут, что вариант без www является основным зеркалом. Теперь, если кто-то наберет www.site.ru, его будет редиректить на вариант без www. Также настроить главное зеркало можно в новом Бета-вебмастере Яндекса.
Итак, мы с вами рассмотрели самые основные дубли в wordpress, а также как от них можно избавиться. Но это далеко не все дубли. Вообще, если вы хотите провести тотальную зачистку блога на wordpress и избавиться абсолютно от всех видов дублей, я рекомендую к просмотру наш курс о продвижении и монетизации блогов. Вы получите такие знания, которые пригодятся вам, когда вы решите зарабатывать серьезные деньги на сайтах.
Практический курс по верстке адаптивного лендинга с нуля!
Научитесь с нуля верстать адаптивные лендинги на HTML5 и CSS3 за ближайшие 6 дней
Узнать подробнееХотите быстро научиться создавать сайты и блоги на WordPress с уникальным дизайном?
Получите самую полную в Рунете бесплатную систему обучения создания сайтов на WordPress “Уникальный сайт с нуля”
webformyself.com
Осторожно! Wordpress создает дубли многостраничными постами
Всем привет! На днях обнаружил баг в WordPress, который создает бесчисленное множество дублей страниц. Проблема касается всех, у кого есть сайты на этой CMS. Да-да, многими любимый движок может создать большое количество идентичных документов.
Напугал? Не переживайте =) . Баг, действительно, серьезный, но исправить его можно достаточно просто. Ниже я расскажу, что это за зверь и как от него избавиться.
В связи с недавними баден-баденовскими событиями начал плотно изучать информацию в Яндекс.Вебмастере. Анализировал сводку по индексированию ("Страницы в поиске"). Искал связь между пометками "Некачественная страница" и наложением фильтра за переоптимизацию.
И вот, зайдя в статистику для блога, был неприятно шокирован — сотни дублей несуществующих документов.
Оказывается, если к любому посту в блоге добавить любые цифры, то WordPress создаст такую страницу — она будет идентична основной записи. Баг с постраничной навигацией отдельных постов — сотни или тысячи вероятных дублей.
На таких страницах нет мета-тега robots и есть canonical, который в качестве канонического документа указывает именно дубль.
Проверьте, у вас также?
Усугубляет ситуацию связь с плагином All in one SEO pack, который дополнительно дает ссылку на предыдущую запись: поисковый робот не только заходит, по сути, на несуществующую страницу, но и начинает ходить по другим таким же. Добавлялось и удалялось сотни подобных "постов".
Я начал копать глубже и создал топик на wordpress.org. Оказалось, что еще в 2014 был баг при создании многостраничных постов с помощью тега <!--nextpage-->. Тогда также создавались несуществующие документы, но canonical для 2-й, 3-й или последующих страниц, наоборот, указывали всегда на первую, то есть не индексировались.
Начиная с WordPress 4.4 баг с canonical убрали (у каждой "пагинированной" страницы поста появился свой каноникал), а вот ошибку с созданием несуществующих документов не убрали. Поэтому сейчас индексируется больше, чем нужно .
Что делать и как убрать дубли?
Сперва, хочу сказать, что в одной из ближайших версий вордпресса этот баг постараются исправить.
Пока же нам придется убирать его, так называемыми, "костылями" . Существует 2 варианта.
1) Плагин After Last Page Fix от Белотицкого Юрия. Скачать можно здесь. Установка в один клик, настроек нет. Скрипт вместо создания множества дублированных документов отдает 404-ошибку. На мой взгляд, самый удачный вариант. Недостатки:
- плагин добавляет дубль rel="canonical";
- и shortlink.
2) Дополнительная настройка All in One SEO Pack. Разработчики этого плагина, скорее всего, оказались в курсе данного бага и в новых версиях появились дополнительные чекбоксы.
Несуществующие записи будут создаваться, но в них будет указан мета-тег robots, запрещающий их индексирование.
В других SEO-плагинах для wordpress не смотрел. Вероятно, в Yoast SEO или подобных будут такие же настройки. UPD. Да, действительно, в плагине от Yoast прописывается каноникал на основную запись.
Вот и все ! Баг достаточно серьезный, но исправляется, можно сказать, в один клик. Вам остается проверить, создаются ли у вас подобные страницы. Если да, то выбрать один из вариантов решения проблемы.
Получается, что, обновляясь на новую версию wordpress, не только устраняешь старые ошибки CMS, но можешь и получить новые. Интересно, какая у вас версия движка и создаются ли такие несуществующие посты? Поделитесь статистикой в комментариях .
Загрузка...sosnovskij.ru
Как удалить дубли страниц WordPress?
Страницы с одинаковыми адресами — это распространенная техническая проблема, которая довольно таки серьезно может негативно повлиять на поисковую выдачу Вашего сайта в поисковых системах.
Что такое дубли страниц?
Причин появления дублей на сайте может быть несколько: если страница имеет несколько подстраниц, присутствие комментариев (особенно если для них активна функция постраничного отображения или древовидный вид), прикрепленные картинки, начилие календаря в сайдбаре, и др.
Как удалить дубли?
Наиболее простой и универсальный способ — использовать плагины, которые корректно и безболезненно решают данную проблему.
Удаляем дубли страниц в комментариях
Присутствие кнопки “Ответить” в блоке комментариев порождает самый злосчастный вид дублей — replytocom. К примеру, если в одной статье 50 раз нажмут на “Ответить” и оставят свой комментарий, то на сайте будет присутствовать 50 дублей этой статьи. Чтобы обезопасить Ваш сайт от подобной беды, необходимо в админ-панели перейти Настройки -> Обсуждение и убрать галочки напротив пунктов Разрешить древовидные (вложенные) комментарии глубиной и Разбивать комментарии верхнего уровня на страницы по.
Используем плагин Yoast SEO
После установки и активации плагина Yoast SEO в админ-панели необходимо перейти SEO -> Возможности, в разделе Дополнительные настройки страницы перетянуть ползунок в состояние Включено и нажать кнопку Сохранить изменения. У Вас в разделе SEO появятся новые подменю, из которых нужно выбрать Дополнительно -> Постоянные ссылки. На этой вкладке необходимо поставить ползунки в положения, согласно рисунку ниже:
Для вступления изменений в силу следует нажать кнопку Сохранить изменения.
Если Вы используете плагин Clearfy, то для удаления дублей страниц необходимо в админ-панели перейти Clearfy -> Основные -> Дубли страниц и отметить все пункты меню в этом окне.
Если Вам понравилась статья — поделитесь с друзьями
wpschool.ru
Как удалить дубли страниц WordPress?
Дубли страниц — это ничто иное, как наличие одного и того же адреса у нескольких страниц сайта. Дублирование адресов является распространенной технической проблемой, которая может негативно отразится на поисковой выдаче Вашего сайта.
Почему создаются дубли?
Наличие одинаковых адресов может быть следствием нескольких причин: постраничное отображение комментариев, начилие календаря на сайте и т.д.
Наиболее простой вариант избавится от дублей — воспользоваться плагином Clearfy Pro, о котором мы писали в одном из наших материалов.
Удаление дублей в комментариях
Избавится от повторения страниц в комментариях помогут стандартные средства WordPress. Для этого необходимо в админ-панели перейти Настройки -> Обсуждение и убрать галочки напротив пунктов Разрешить древовидные (вложенные) комментарии глубиной и Разбивать комментарии верхнего уровня на страницы по.
Удаление дублей в прикрепленных файлах
С удалением дублей в прикрепленных файлах хорошо справляется бесплатный плагин Yoast SEO. Итак, после его установки и активации, необходимо перейти SEO -> Возможности, где в разделе Дополнительные настройки страницы перетянуть ползунок в состояние Включено и нажать кнопку Сохранить изменения. После этого в разделе SEO появятся новые подменю, из которых нужно выбрать Дополнительно -> Постоянные ссылки. Находясь на этой вкладке, необходимо перетянуть ползунки в положения, согласно рисунку:
Плагин Clearfy Pro
Плагин Clearfy Pro решает эту задачу комплексно, удаляя дубли в архивах дат, пользователей и тегов, а также страницы вложений, пагинации постов. Для этого достаточно на странице настроек плагина (Clearfy Pro -> Основные), во вкладке Дубли, отметить все перечисленные пункты и нажать кнопку Сохранить изменения.
wpplus.ru
Найти и удалить дубли wordpress ! — ТОП
С помощью плагина — Trash Duplicate and 301 Redirect вы сможете найти и удалить дубли записей и страниц сайта wordpress. Данный плагин довольно простой он ищет и показывает дубли на вашем сайте, если они есть. Если дубли есть, то вы сможете очень просто удалить их, нажав на кнопку. Установить плагин вы сможете прямо из админ-панели wordpress. Перейдите на страницу: Плагины — Добавить новый, введите название плагина в форму поиска, нажмите Enter, установите и активируйте плагин.
После установки и активации плагина, перейдите на страницу: Trash Duplicates. Если на вашем сайте есть дубли, то они сразу же отобразятся на данной странице. Вверху страницы будет показано количество дублей и общее количество записей.
Чтобы удалить дубль записи, нажмите рядом с названием записи на кнопку — Apply. Если вы хотите удалить одновременно несколько записей, то поставьте слева вверху галочку возле значения All и нажмите рядом на кнопку Apply. Удалённые дубли переместятся в корзину, не забудьте потом очистить корзину на странице всех записей.
У плагина есть функция редиректа, то есть, на все имеющиеся у вас на сайте дубли будет создан автоматический 301 редирект. После удаления дублей редирект останется, вы можете оставить его на некоторое время, 1-2 месяца. На сайте у вас больше не будет дублей, но в поисковой системе останутся URL адреса дублей, для этого и нужен редирект, хотя и не обязательно. Чтобы удалить редирект для дубля, нажмите рядом с ссылкой на вкладку — Delete.
Если на вашем сайте нет дублей, но вы заметили, что дубли есть в поисковой системе, то есть в поиске, то возможно вы стали жертвой вируса replytocom.
info-effect.ru
Убираем дубли страниц на WordPress
При создании сайта на движке WordPress, да и вообще на любом другом движке, вы можете столкнуться с весьма неприятной ситуацией. Особенно, если это блог или сайт, предназначающийся для продажи ссылок. Ситуация заключается в возникновении дублирующихся страниц. Т.е. в поисковые системы попадают две или более ссылки, которые ведут на одну и ту же страницу. Естественно, что содержимое этих страниц полностью совпадает. Чаще всего дублируются: главная страница сайта, различные посты с комментариями на форумах и другие страницы. Как вы думаете, понравится ли страницы поисковым системам 2-4 одинаковых по структуре и содержимому? Естественно, нет. Оптимизаторы и так стараются написать достаточно простые сайты, для продажи ссылок. А тут ещё и дубли страниц. В итоге, ваш сайт может быть заблокирован в поисковой системе и вытеснен за её приделы и получить санкции. Естественно, не оптимизатору, не тем более любому другому бизнесмену – это не нужно. Давайте поговорим о том, как бороться с этим.
Для начала, рассмотрим основные причины такого явления, как дубли. Самой частой причиной является использование так называемых древовидных комментариев. Видели когда-нибудь форум? Вот и здесь аналогичная структура. Когда человек отвечает на чей-то вопрос в комментариях, то его ответ появляется рядом. Это облегчает посетителю поиск нужной информации и помогает понять тему разговора. Однако движок wordpress создаёт дубликат страницы с содержимым поста, которое и индексируется поисковой системой.В данном случае, именно параметр replytocom является причиной появления таких дублирующихся страниц. Как же быть? Отключить древовидность у сайта или блога, или пойти навстречу пользователям?
Выбор, разумеется, за вами. Можно, конечно, отключить древовидность комментариев, убрав соответствующий флажок в программе, но если вы хотите сделать ваш блог удобным для пользователя, и в тоже самое время избавиться от дублирующихся страниц, то придётся сделать несколько действий.Для начала заглянем в файл Robots.txt. Это служебный файл, находящийся обычно в корневой директории вашего сайта. В нём содержится информация о том, какие файлы и страницы будут индексироваться поисковиками, а какие не будут. Вот и пропишите в нём запрет на индексацию дублей. Шаблон для закрытия индексации дублей будет выглядеть так: Disallow: /*/?replytocom=*
Т.е. тем самым, мы исключаем наши дубли из индексации поисковиком.
Есть и другие способы исключить дубли, но для этого придётся покопаться в файлах самого сайта. Первое, что нужно сделать, это найти файл comment-template.php в папке wp-includes. В этом файле находим строку под номером 1062 и дописываем параметр nofollow. После этого строка будет выглядеть следующим образом:
$link = "$reply_text";
Конечно, в интернете существует куча плагинов и программ, которые убирают эти самые дубли страниц автоматически, однако вручную это сделать хоть и несколько сложнее, за то надёжнее. Не забывайте, что дубли страниц могут свести на нет все остальные ваши усилия по оптимизации сайта. Поэтому к данному вопросу, нужно подходить с особой серьёзностью! В противном случае, вы можете получить санкции от поисковых систем. И тогда, сайт придётся продвигать заново!
krutim-all.ru