Дубли страниц Joomla. Как избавиться от дублей страниц. Дубли страниц joomla


Убираем дубли страниц в Joomla

Убираем дубли страниц в Joomla CMS

Добрый день уважаемые посетители сайта joomla-shablons.com! В данной статье мы с вами поговорим о том, как убрать дубли страниц Joomla, и каких видов дубли страниц бывают.

 

Виды дублей главной страницы и методика борьбы с дублями страниц в Joomla CMS

Одной из самый распространённых ошибок что можно встретить на многих сайтах - это отсутствие настроенного 301-ого редиректа с www на домен без www. Многие люди в строке браузера вводят адреса сайтов с www, но есть вебмастера такие, которые ещё к тому же настраивают доступ к сайту таким образом, что без ввода www, на сайт просто невозможно  было попасть. Имеет смысл склеить с www и без www домен, определив главное зеркало, ведь если этого не сделать, поисковые системы будут видеть и воспринимать данные доменные адреса http://www.site.ru и http://site.ru как два отдельных домена, хотя на самом деле это домен одного сайта. Поэтому, чтобы не получилось такого недоразумения, необходимо настроить 301-редирект домена с www на домен без www, или при желании можно определить главным зеркалом домен с www. Тогда 301-redirect надо будет настроить без www на домен с www, то есть произвести так называемую "склейку".

Чтобы настроить 301 редирект, необходимо зайти через FTP-клиент на сайт, где находятся все файлы движка Joomla, и там найти файл под названием .htaccess. Обращаю ваше внимание! Файл .htaccess не имеет расширения и перед названием файла сначала идёт точка (.) Если у вас такого файла нету, то есть в таком случае файл htaccess.txt, который вам необходимо будет переименовать в файл с названием .htaccess.

В данном файле необходимо прописать следующий код редиректа с www на без:

Options +FollowSymLinks  RewriteEngine On  RewriteCond %{HTTP_HOST} ^www.domain\.com$ [NC]  RewriteRule ^(.*)$ http://domain.com/$1 [R=301,L]

После того как вы впишите выше приведённый код, ваш сайт будет при написании доменного имени в строке браузера с www, автоматически перенаправляться на домен без www. В результате у вас должен быть адрес сайта такой: http://ваш-сайт.ру. После установки подобного редиректа, поисковые боты также будут редиректиться на ваш домен без www. Как итог, вы таким образом избавитесь от дубля главной страницы в Joomla CMS.

Дубль страницы /index.php

На втором месте по распространённости дублей главной страницы - это адрес формата http://site.ru/index.php или http://site.ru/index.html. Подобные адреса тоже являются дублями главной страницы сайта. Исправить данную ситуацию можно тоже с помощью того же фала .htaccess.

Код для избавления от /index.php

RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /index\.php\ HTTP/RewriteRule ^index\.php$ http://ваш сайт.ua/ [R=301,L]

Код для избавления от /index.html

RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /index\.html\ HTTP/RewriteRule ^index\.html$ http://ваш сайт.ua/ [R=301,L]

Дубль страницы / в конце адресаАдреса сайта которые открываются со слэшем в конце и и без слэша, тоже являются дублями страницы в глазах поисковых систем. То есть, подобные адреса также нужно склеить 301-ым редиректом. Исправление данной ситуации также не помешает вашему сайту. Склейка также производится в файле .htaccess

Код для склейки / (данный код убирает в конце /)

RewriteBase /RewriteCond %{HTTP_HOST} (.*)RewriteCond %{REQUEST_URI} /$ [NC]RewriteRule ^(.*)(/)$ $1 [L,R=301]]

Код для склейки / (ниже код добавляет / в конце)

RewriteBase /RewriteCond %{REQUEST_FILENAME} !-fRewriteCond %{REQUEST_URI} !(.*)/$RewriteRule ^(.*[^/])$ $1/ [L,R=301]

Последнее по дублям хочется сказать про алиас главной страницы в Joomla. Приведу просто пример, вы зашли на главную страницу сайта http://site.ru. C главной страницы вы перешли на внутреннюю страницу сайта и потом решили вернуться обратно на главную страницу сайта, и в итоге видите в адресной строке не http://site.ru, а адрес такого формата как http://site.ru/content или http://site.ru/glavnaya или что-то нечто подобное. Как вы понимаете подобные адреса тоже являются дублями страниц в Joomla CMS.

Чтобы вылечить ваш сайт от данного симптома, необходимо будет немного покопаться в MySQL базе джумлы. Открываем удобный скрипт phpMyAdmin, который имеется в каждом хостинг аккаунте, там выбираем вашу базу сайта, и там ищем таблицу под названием jos_menu, нажимаем обзор, далее ищем меню, которое отвечает за главную страницу, и там очищаем поле под названием alias. Послы выполнения выше описанных телодвижений, переходим на сайт и смотрим на результат.

Хочется также отметить, что дубли страниц могут возникнуть после установки в движок сторонних компонентом, модулей и плагинов. Подобные дубли довольно легко можно убрать простым удалением компонента. А если вам установленный компонент очень нужен уже индивидуальный подход к решению сложившейся проблемы.

Многие Joomla CMS не любят только потому, что данный движок имеет проблемы с дублями не только главной, но ещё и с внутренними страницами. С дублями внутренних страниц можно решить вопрос с помощью правил описанных к файле robots.txt

Итог таков...Если умело подойти к решению вопросов по устранению дублей в джумла движке, ваш сайт будет хорошо индексироваться всеми популярными поисковыми системами и хорошо ранжироваться в результатах поиска.

На этом всё! Желаем вам успешного сайтостроения...

joomla-shablons.com

Убираем дубли страниц в Joomla

Убираем дубли страниц в Joomla CMS

Добрый день уважаемые посетители сайта joomla-shablons.com! В данной статье мы с вами поговорим о том, как убрать дубли страниц Joomla, и каких видов дубли страниц бывают.

 

Виды дублей главной страницы и методика борьбы с дублями страниц в Joomla CMS

Одной из самый распространённых ошибок что можно встретить на многих сайтах - это отсутствие настроенного 301-ого редиректа с www на домен без www. Многие люди в строке браузера вводят адреса сайтов с www, но есть вебмастера такие, которые ещё к тому же настраивают доступ к сайту таким образом, что без ввода www, на сайт просто невозможно  было попасть. Имеет смысл склеить с www и без www домен, определив главное зеркало, ведь если этого не сделать, поисковые системы будут видеть и воспринимать данные доменные адреса http://www.site.ru и http://site.ru как два отдельных домена, хотя на самом деле это домен одного сайта. Поэтому, чтобы не получилось такого недоразумения, необходимо настроить 301-редирект домена с www на домен без www, или при желании можно определить главным зеркалом домен с www. Тогда 301-redirect надо будет настроить без www на домен с www, то есть произвести так называемую "склейку".

Чтобы настроить 301 редирект, необходимо зайти через FTP-клиент на сайт, где находятся все файлы движка Joomla, и там найти файл под названием .htaccess. Обращаю ваше внимание! Файл .htaccess не имеет расширения и перед названием файла сначала идёт точка (.) Если у вас такого файла нету, то есть в таком случае файл htaccess.txt, который вам необходимо будет переименовать в файл с названием .htaccess.

В данном файле необходимо прописать следующий код редиректа с www на без:

Options +FollowSymLinks  RewriteEngine On  RewriteCond %{HTTP_HOST} ^www.domain\.com$ [NC]  RewriteRule ^(.*)$ http://domain.com/$1 [R=301,L]

После того как вы впишите выше приведённый код, ваш сайт будет при написании доменного имени в строке браузера с www, автоматически перенаправляться на домен без www. В результате у вас должен быть адрес сайта такой: http://ваш-сайт.ру. После установки подобного редиректа, поисковые боты также будут редиректиться на ваш домен без www. Как итог, вы таким образом избавитесь от дубля главной страницы в Joomla CMS.

Дубль страницы /index.php

На втором месте по распространённости дублей главной страницы - это адрес формата http://site.ru/index.php или http://site.ru/index.html. Подобные адреса тоже являются дублями главной страницы сайта. Исправить данную ситуацию можно тоже с помощью того же фала .htaccess.

Код для избавления от /index.php

RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /index\.php\ HTTP/RewriteRule ^index\.php$ http://ваш сайт.ua/ [R=301,L]

Код для избавления от /index.html

RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /index\.html\ HTTP/RewriteRule ^index\.html$ http://ваш сайт.ua/ [R=301,L]

Дубль страницы / в конце адресаАдреса сайта которые открываются со слэшем в конце и и без слэша, тоже являются дублями страницы в глазах поисковых систем. То есть, подобные адреса также нужно склеить 301-ым редиректом. Исправление данной ситуации также не помешает вашему сайту. Склейка также производится в файле .htaccess

Код для склейки / (данный код убирает в конце /)

RewriteBase /RewriteCond %{HTTP_HOST} (.*)RewriteCond %{REQUEST_URI} /$ [NC]RewriteRule ^(.*)(/)$ $1 [L,R=301]]

Код для склейки / (ниже код добавляет / в конце)

RewriteBase /RewriteCond %{REQUEST_FILENAME} !-fRewriteCond %{REQUEST_URI} !(.*)/$RewriteRule ^(.*[^/])$ $1/ [L,R=301]

Последнее по дублям хочется сказать про алиас главной страницы в Joomla. Приведу просто пример, вы зашли на главную страницу сайта http://site.ru. C главной страницы вы перешли на внутреннюю страницу сайта и потом решили вернуться обратно на главную страницу сайта, и в итоге видите в адресной строке не http://site.ru, а адрес такого формата как http://site.ru/content или http://site.ru/glavnaya или что-то нечто подобное. Как вы понимаете подобные адреса тоже являются дублями страниц в Joomla CMS.

Чтобы вылечить ваш сайт от данного симптома, необходимо будет немного покопаться в MySQL базе джумлы. Открываем удобный скрипт phpMyAdmin, который имеется в каждом хостинг аккаунте, там выбираем вашу базу сайта, и там ищем таблицу под названием jos_menu, нажимаем обзор, далее ищем меню, которое отвечает за главную страницу, и там очищаем поле под названием alias. Послы выполнения выше описанных телодвижений, переходим на сайт и смотрим на результат.

Хочется также отметить, что дубли страниц могут возникнуть после установки в движок сторонних компонентом, модулей и плагинов. Подобные дубли довольно легко можно убрать простым удалением компонента. А если вам установленный компонент очень нужен уже индивидуальный подход к решению сложившейся проблемы.

Многие Joomla CMS не любят только потому, что данный движок имеет проблемы с дублями не только главной, но ещё и с внутренними страницами. С дублями внутренних страниц можно решить вопрос с помощью правил описанных к файле robots.txt

Итог таков...Если умело подойти к решению вопросов по устранению дублей в джумла движке, ваш сайт будет хорошо индексироваться всеми популярными поисковыми системами и хорошо ранжироваться в результатах поиска.

На этом всё! Желаем вам успешного сайтостроения...

joomla-shablons.com

Как найти и удалить дубли страниц на сайте Joomla

Дубли страниц нередко становятся причиной АГС, но даже если и не приводят к фильтру, то создают серьёзный барьер на пути продвижения сайта, поэтому их надо своевременно найти и удалить.

Давайте коротко расскажем о вреде дублей и причинах их появления.

Если один и тот же web-документ доступен по разным интернет адресам, то это классические дубли страниц, которые могут, во-первых, восприниматься, как попытка искусственно увеличить объём документов для роста трафика или продажи ссылок, а, во-вторых, из-за них на сайте неправильно распределяется статический вес, что ведёт к ухудшению ранжирования некоторых запросов.

Дублироваться web-страницы могут на разных движках, но особенно этим грешит CMS Joomla, «родные» настройки которой далеко не идеальны.

Ищем дубли web-документов

Найти дублирующиеся страницы непросто на крупном сайте, так как просмотреть вручную индекс тысяч документов нереально, тем более что проиндексированные страницы надо отсортировать по названию (по title).

Здесь на помощь может придти специальный софт, который в десятки раз ускорит поиск дублей и поможет быстрее решить проблему.

Можно воспользоваться программой Henu, однако она не русифицирована и, по большому счёту, предназначена для других целей, поэтому находим в сети Net peak Spider и устанавливаем её на компьютер.

Этот софт пригодится и в дальнейшем, так как он кроме поиска дублирующихся документов поможет рассчитать предполагаемый PR страниц и покажет количество h2, title и Meta страниц.

Отдельно стоит отметить, что Net peak Spider бесплатна и для получения обновлений программу надо лишь зарегистрировать.

В верхнем окне после установки вводим url сайта и нажимаем «пуск» (настройки по умолчанию подойдут, потом при желании их можно расширить).

«Паук» выкачивает все документы сайта и теперь останется в правом окне выбрать тип сортировки «по title» и нажать «поиск дублей».

Теперь все одинаковые страницы, открывающиеся по разным адресам, видны нам как на ладони и остаётся только избавиться от этого наследия системы управления сайтом Joomla.

Удаляем дубли

В прямом смысле слова удалить дубли страниц Joomla или другой CMS нельзя, но избавиться от них можно. Что касается именно Joomla, то лучше всего установить плагин Shnodoubles, который устанавливает автоматически редирект 301 на основную навигационную страницу и все дубли клеятся на неё.

Если Вы установили этот плагин, то после начала его работы надо проверить сайт на битые ссылки, ибо неизвестно на какие страницы ставились внутренние ссылки. Однако одним плагином от всех дублей не избавишься и часто надо вносить правки в файлы htaccess и robots.txt. Так закрыть все страницы пагинации (динамические ссылки) можно с помощью директивы

Disallow: /*?* в файл robots,

А в случае необходимости ручной склейки в htaccess надо прописать в файл

Redirect 301 /старая страница.html http://сайт//новая страница.html,

При этом важно старый url указывать от корня, а новый приписать полностью.

Если дублируются web-документы с www и без, то это тоже плохо и надо клеить и тут через htaccess.

Вариантов избавления от дублей много и конкретный тип зависит от причины возникновения дублирующейся страницы, гораздо важнее найти все «лишние» документы, а избавиться от них проще, тем более, если держать в голове, что это может предотвратить фильтры (в том числе АГС) и сделает продвижение сайта более динамичным.

Еще статьи на тему

Сохраните, чтобы не потерять!

seofa.ru

Дубли страниц Joomla | Причины и решения

Дубли страниц Joomla | Причины и решения

Дублями принято считать идентичные по содержанию документы, которые доступны по различным адресам url. Слабым местом практически любой системы управления контентом являются именно дубли, таким недостатком обладает не только джумла. Дублированные страницы не приносят особого вреда до тех пор, пока сайт не начнет индексироваться поисковыми системами, вот именно тогда и начинаются проблемы. Но неприятностей можно избежать, если сразу отслеживать процесс индексации сайта, и удалять дубли страниц из поиска. Самым лучшим выходом из данной ситуации является правильно организовать структуру для будущего ресурса, все продумать еще на самом раннем этапе.

Причины возникновения дублей

Первой причиной появления дублей страниц является неверная структура сайта. Вот почему нужно с самого начала продумывать всю иерархию пунктов для меню и категорий. Если заранее создать несколько категорий, то в будущем это предотвратит появление дублей страниц Joomla. Самые распространенные ошибки, которые допускают веб мастера при создании сайтов на CMS Joomla: например, на сайте уже есть категория «blog», к которой относятся подкатегории «new» и «old». Все материалы на Вашем сайте привязаны к подкатегориям. Тогда если создать пункты меню только для подкатегорий, в нашем случае для «new», то url, которые формирует cms, могут иметь такой вид:

http://mysite.com/new/23-material http://mysite.com/1-blog/new/23-material http://mysite.com/1-blog/2-new/23-material http://mysite.com/index.php?option=com_content&task=view&id=23&Itemid=1

Выше изложенный пример хорошо показывает то чего на качественном сайте недолжно существовать. Более того, роботы любой поисковой системы могут проиндексировать технические страницы, такие как: страница для печати материала, страница в PDF формате, страница для подготовки отправки на почту.

Вот почему так необходимо предопределять и продумывать категории и подкатегории еще тогда кода сайт только начинает создаваться. А при росте сайта просто нужно будет добавить дополнительные разделы. Ведь если начать реструктуризацию ресурса, когда он уже полностью проиндексирован и длительное время действует, можно запросто свести все труды на нет. Так при таком подходе большая часть страниц, а то и все страницы попросту изменять свой адрес, и как следствие - падение позиций в ПС, потеря трафика с тех же ПС.

По статистике 80 процентов посетителей приходят на сайт благодаря поисковым системам. Львиная доля посетителей ищут в интернете определенные товары или услуги. Что бы привлечь целевых посетителей на ресурс нужно кроме оптимизации использовать профессиональное продвижение сайта, и тогда успех гарантирован!

Как поисковыми системами находятся дубли страниц

Самой первой причиной можно считать расширения, установленные на Joomla сайт. Так, с виду обычный новостной модуль, который выводится на главной странице, может формировать разные url. Очень часто такие адреса могут находится даже в карте сайта, особенно это актуально при использовании компонента Xmap (для создания и формирования карты сайта Joomla).

Для определения дублированных страниц на уже проиндексированном сайте необходимо пару уникальных текстов вставить в форму поисковой системы Google, текст необходимо «обернуть» кавычками. Для не проиндексированных ресурсов можно порекомендовать программу XENU (актуально для небольших сайтов).

Чем опасны дубли?

Поисковые системы не любят ресурсы с страницами которые имеют дубли, и к тому же не сильно спешат их индексировать. Оригинальные страницы могут очень часто заменяться своими дублями (это происходит при обновлении поисковой базы поисковой системы), и как следствие – Ваш сайт теряет позиции и соответственно трафик с пс.

Эффективные методы избавления от дублей рассмотрены в этом материале.

joomlarulit.com

Как убрать дубли страниц на сайте

Как убрать дубли страниц на сайте

Что такое дубли страниц - это страницы с абсолютно одинаковым содержанием и разными URL адресами.

Причин возникновения дублей страниц на сайте может быть несколько, однако почти все они так или иначе связаны с системой управления содержимым сайта. Лучше всего принять меры, предотвращающие появление страниц-дублей еще на стадии создания сайта. Если Ваш сайт уже функционирует — обязательно проверьте наличие на нем повторяющихся страниц, иначе серьёзных проблем с индексацией и SEO не избежать.

Существует несколько способов избавления от дублей страниц сайта. Одни могут помочь в борьбе с уже появившимися копиями страниц, другие помогут избежать их появления в будущем.

Как найти дубли страниц на сайте?

Но для начала необходимо проверить — есть ли вообще повторяющиеся страницы на Вашем ресурсе и, если да, то какого типа эти страницы. Как это сделать?

Можно воспользоваться командой «site:». Эта команда выдает результаты поиска по определенному сайту. Введя site:www.yoursite.com/page1, Вы увидите, есть ли в поиске дубли этой страницы.

Выделяем небольшой отрывок текста со страницы, для которой мы ищем дубли, и вставляем в поиск. Результаты поиска сразу покажут все проиндексированные дубли нужной страницы.

Как бороться с дублями страниц?

301 редирект

Одним из самых эффективных, но в то же время и самых непростых методов борьбы с дублями является 301-редирект, он склеивает указанные страницы и дубли со временем исчезают из индекса поисковых систем.

При попадании поискового робота на дубликат страницы, на которой прописан 301 редирект, веб-сервер автоматически перенаправит его на страницу-оригинал. Прописываются все перенаправления в файле .htaccess, который находится в корневом каталоге сайта. Не стоит использовать 301 перенаправление (постоянный редирект), если вы планируете в дальнейшем как-то использовать страницу-копию. Для этого можно использовать 302 перенаправление (временное). Тогда склеивания страниц не произойдет.

При использовании 301 редиректа для удаления дублей страниц из индекса прежде всего надо определиться с главным зеркалом сайта. Для примера в качестве главного зеркала укажем http://site.ru Вам останется только поменять на адрес своего сайта

Для этого надо в файле .htaccess (файл находится в корне сайта) добавить следующие строки сразу после RewriteEngine On:

RewriteCond %{HTTP_HOST} ^www.site.ru$ [NC]RewriteRule ^(.*)$ http://site.ru/$1 [R=301,L]

RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /index\.php\ HTTP/ RewriteRule ^index\.php$ http://site.ru/ [R=301,L]

Аналогичным образом можно избавиться от дублей типа:

http://site.ru/indexhttp://site.ru/index.htmlhttp://site.ru/index.htm

Если Вы, к примеру, хотите склеить страницы http://site.ru и http://site.ru/page123, то в файле .htaccess следует прописать следующее:

Redirect 301 /page123 http://site.ru

Теперь при попытке зайти на страницу http://site.ru/page123 будет срабатывать перенаправление на главную.

Канонические ссылки

Другой способ указать оригинал — прописывать на страницах-дублях т.н. канонические ссылки. Это ссылки с атрибутом rel=canonical, иными словами в блоке head такой страницы прописано:

<link rel="canonical" href="http://site.ru/load" />

Если поисковые системы сталкиваются с такой ссылкой, то понимают какая из многочисленных копий страниц является оригиналом и индексируют её.

Например, в примере выше на сайте были 2 страницы-дубля:

http://site.ru/loadhttp://site.ru/load/

Указав на странице http://site.ru/load атрибут rel=canonical мы покажем поисковым системам, что эта страница является главной и именно ее надо индексировать.

Некоторые CMS (например, Joomla!) могут автоматически создавать такие ссылки, на других эта операция выполняется различными плагинами. Однако, даже если все новосозданные дубли страниц Вашего сайта будут с каноническими ссылками, это не поможет решить проблему уже существующих дублей.

robots.txt

Частично проблему дублей страниц решает файл robots.txt в котором содержатся рекомендации поисковым системам с перечнем файлов и папок, которые не должны быть проиндексированы. Почему частично? Потому что этот файл содержит именно рекомендации, а не правила и некоторые поисковые системы игнорируют эти рекомендации.

Например, чтобы Яндекс удалил из индекса старые дубли страниц, достаточно прописать соответствующие запрещающие их индексацию правила в robots.txt. С Google ситуация немного сложнее. Те же правила придется вносить в особый инструментарий от Google, разработанный специально для веб-мастеров. В Google вебмастер понадобится задать необходимые нам параметры ссылок в разделе «Сканирование».

При создании же robots.txt нам понадобится воспользоваться запрещающей директивой Disallow.

User-agent: *Disallow: /administrator/Disallow: /cache/Disallow: /includes/Disallow: /language/Disallow: /libraries/Disallow: /media/Disallow: /modules/Disallow: /plugins/Disallow: /templates/Disallow: /tmp/Sitemap: http://site.ru/sitemap.xml User-agent: YandexDisallow: /administrator/Disallow: /cache/Disallow: /includes/Disallow: /language/Disallow: /libraries/Disallow: /media/Disallow: /modules/Disallow: /plugins/Disallow: /templates/Disallow: /tmp/Disallow: /xmlrpc/Host: site.ruSitemap: http://site.ru/sitemap.xml

User-agent: *Disallow: /wp-adminDisallow: /wp-includes Disallow: /wp-content/plugins Disallow: /wp-content/cache Disallow: /wp-content/themes Disallow: /trackback Disallow: */trackbackDisallow: */*/trackback Disallow: */*/feed/*/ Disallow: */feed Disallow: /*?* Disallow: /tagSitemap: http://site.ru/sitemap.xml User-agent: Yandex Disallow: /wp-admin Disallow: /wp-includes Disallow: /wp-content/plugins Disallow: /wp-content/cache Disallow: /wp-content/themes Disallow: /trackback Disallow: */trackback Disallow: */*/trackback Disallow: */*/feed/*/ Disallow: */feed Disallow: /*?* Disallow: /tag Host: site.ru Sitemap: http://site.ru/sitemap.xml

Что означают эти строки:

Борьба с дублями страниц в Wordpress

Каким должен быть файл robots.txt для Wordpress мы уже рассмотрели выше. А теперь поговорим о плагинах, которые позволяют бороться с дублями и вообще незаменимы для оптимизатора сайтов на этом движке.

Yoast SEO - Один из самых популярных плагинов для Wordpress, позволяющим бороться с проблемой дублей. С его помощью можно заставить Wordpress прописывать канонические ссылки, запретить индексацию страниц с постраничным разбиением (рубрики), скрыть архивы автора, удалить /category/ из URL и многое другое.

All in One Seo Pack - Аналогичный плагин, не менее популярный и выполняющий похожие функции. Какой из них использовать - решать вам.

Как убрать дубли страниц в Joomla

Несмотря на то, что Joomla! поддерживает автоматическое создание канонических ссылок, некоторые дубли все равно могут попадать в индекс поисковых машин. Для борьбы с дублями в Joomla! можно использовать robots.txt и 301редирект. Правильный файл rorbots.txt описан выше. 

Ну, а чтобы включить ЧПУ (человеко понятные урлы) в Joomla достаточно переименовать htaccess.txt в .htaccess и добавить туда сразу после RewriteEngine On:

RewriteCond %{HTTP_HOST} ^www.site.ru$ [NC]RewriteRule ^(.*)$ http://site.ru/$1 [R=301,L] RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /index\.php\ HTTP/RewriteRule ^index\.php$ http://site.ru/ [R=301,L]

А также в настройках сайта поставить галочки следующим образом:

Таким образом мы избавимся от дублей типа www.site.ru и site.ru/index.php, потому что в этой CMS возникает такая проблема с дублями. И поисковики часто индескируют страницы типа site.ru/index.php. Теперь после всех манипуляций при попытке зайти на страницу, например, www.site.ru посетителя перекинет на главную, т.е. site.ru.

Из плагинов для Джумлы могу посоветовать JL No Doubles - плагин убирает дубли страниц в компоненте com_content. Возможен 301 редирект на правильную страницу, либо вывод 404 ошибки.

Специальные сервисы для создания robots.txt и .htaccess

Если Вы только начинаете осваивать сайтостроение — попробуйте воспользоваться услугами специализированных сервисов, которые помогут Вам сгенерировать валидные файлы robots.txt и .htaccess:

seolib.ru - На нем можно не только создать, но и протестировать Ваш robots.txt

htaccess.ru -  один из наиболее популярных сервисов, на котором можно создать и выбрать различные параметры генерируемого файла .htaccess

aff1.ru

NoDoubles - плагин для сокращения количества дублей страниц в Joomla 3

У Joomla 3 хоть и появилась особенность добавлять тег rel="сanonical" абсолютно во все страницы сайта - это все равно не панацея от огромного количества дублей страниц. А если у страницы с одним содержанием два и более адреса и все они в индексе поисковой системы - это не есть хорошо. Думаю многие уже научились бороться с дублями страниц Joomla 3 путем создания опубликованных, но невидимых меню, но все равно для каждой страницы сайта невидимый пункт меню создать просто нереально. Поэтому периодически выскакивают разработки, которые эту проблему частично решают. Например, плагин JL NoDoubles. Его и обсудим в этом посте.

На joomla я стараюсь как можно больше использовать встроенные в нее компоненты. Просто так проще обновлять саму среду. Я говорю не просто об обновлении на десятую долю версии, но и о смене линейки 2.5 на 3. Поэтому я всегда использую родной sef генератор Joomla и никогда не добавляю суффикс материала к URL материала. Но у родного sef есть недостаток в виде дублей страниц. Например, на сайте под управлением joomla 3 и включенном родном sef открыв страницу любого материала, попробуйте удалить несколько символов с конца адреса и нажмите на enter. Joomla выведет вам ту же самую страницу хоть адрес уже чуть обрезан вами. Оставьте хоть только ид материала в ссылке - все равно страница отобразится. Кроме того, если вы используете суффикс html то просто добавьте в конец адресной строки какой нибудь символ, то вы и вовсе получите страницу неизвестной ошибки. Поэтому наилучший на данный момент для меня вариант - это использовать родной SEF, отключенный суффикс материала и небольшой плагин JL NoDoubles.

Плагин бесплатный. Предоставляется как есть. Скачать можно с сайта разработчика joomline.

 1. Установка плагина JL NoDoubles для Joomla 3

Устанавливаем как простое расширение через меню Расширения - Менеджер Расширений. Далее переходим в меню Менеджер плагинов и находим наш только что установленный JL NoDoubles, хотя почему-то в списке плагинов он назван как JL NoDubles.

NoDoubles - плагин для уменьшения дублей страниц в Joomla 3

2. Настройка плагина JL NoDoubles для Joomla 3

Открываем его и видим список предустановленных переменных. Они обрабатываются плагином во всех компонентах, но ясное дело что заточены больше под родной com_content. Под любой другой затачивать данный плагин придется самому, хотя он для этого можно сказать и не предназначен, так как написан в основном для стандартного компонента материалов joomla.

NoDoubles - плагин для уменьшения дублей страниц в Joomla 3

Самое полезное, что плагин позволяет выбрать из настроек это, что делать если пользователь ввел неправильный адрес или пришел по нему откуда-нибудь. Плагин позволяет как показать ему вашу страницу ошибки 404, так и попробовать определить на какую похожую по адресу страницу пользователя стоит принудительно перенаправить. Если вы только-только наполняете новый сайт - ставьте NO. А вот если боретесь с дублями страниц на уже запущенном сайте - ставьте редирект YES.

NoDoubles - плагин для уменьшения дублей страниц в Joomla 3

3. Мое заключение

По большинству отзывов данный плагин конечно далек от идеала, но редирект со срезанных урлов моих страниц, неизвестно как попавших в индекс, работает исправно. На большинстве своих сайтов под управлением Joomla 3 я использую его и вам советую. Если, конечно, вы не используете сторонних компонентов для текстового содержания сайта, так как в этом случае - вам пользы от данного плагина не прибавится.

Кот Бублик же советует делать невидимые меню, хоть и муторно- зато адрес страницы будет один. Вот только на случай когда страниц тысячи, он лапками то вбивать все не хочет. 

jedir.ru

Дубли страниц Joomla. Как избавиться от дублей страниц.

Дубли страниц Joomla. Как избавиться от дублей страниц

Статья о том, что такое дубли страниц в Joomla, как они появляются и как от них можно избавиться.

CMS Joomla является достаточно популярным движком для построения самых разнообразных сайтов. Это вызвано тем, что панель управления очень понятная и простая. Также под данную CMS создано большое количество шаблонов оформления, различных расширений и плагинов.

Но, несмотря на все это, в joomla имеет один достаточно неприятный момент, который может создать массу проблем администратору сайта. Среди них - индексирование сайта в поисковых системах, падение позиций сайта, а следовательно потеря целевой аудитории посетителей. И имя данной проблемы - дублирование страниц.

Если использовать стандартную систему ЧПУ Joomla, то одна и та же страница, при отсутствии прямой ссылки в меню на нее, может быть доступна из разных адресов, причем данных адресов можно найти большое количество. Получается так, что если по ряду причин, эти адреса проиндексируются ПС, то в индекс попадут несколько копий какой-то одной страницы - т.е. будут появляться дубли страниц. А многие поисковые системы плохо относятся к дублям.

Причин для этого несколько. Например, ПС может расценить такую ситуацию, как намеренное увеличение количества страниц для более выгодной продажи рекламных мест. Кроме того, зачем ему сохранять в своей базе абсолютно идентичные страницы? Таким образом, ваш сайт может пострадать. Неужели все так плохо?

Естественно нет. Плохо будет тогда, когда дубли проиндексируются поисковой системой. А это произойдет только при наличии ссылок на них, либо если кто-то специально добавил эти страницы (к примеру, конкурент), либо из-за чего-то еще. Если бы все действительно было так плохо, то интернет не был бы забит сотнями тысяч сайтов, сделанных на Joomla.

Дубли страниц Joomla. Как избавиться от дублей страниц.

Как же решить вопрос дублирования страниц в joomla? Можете использовать сторонние расширения с целью формирования красивых интуитивно-понятных ссылок (ЧПУ), к примеру, sef404 . Однако данные расширения существенно увеличивают нагрузку сайта, особенно если там еще много страниц. Данный вариант также не стоит использовать, если на сайте уже включена стандартная функция ЧПУ.

Потому лучше будет использовать встроенный ЧПУ. Сайт с ним быстрее работает, отсутствуют лишние расширения. Единственное, что вам придется сделать – это небольшие правки в 2-х файлах, и грамотно прописать robots.txt. Для этого открываем файл robots.txt, который находится в корневой директории сайта и добавляем в него строчку вида:

При использовании на сайте компонента K2 следует добавить:

Для избавления от дублей страниц с окончанием .html и без него в файле .htaccess нужно прописать следующие строки ;

Данный метод позволяет избавиться от дублей страниц с .html и без.

joomlarulit.com


Prostoy-Site | Все права защищены © 2018 | Карта сайта