Реклама на сайте Advertise with us

Выкладываем свои robots.txt

Расширенный поиск по форуму
 
Новая тема Новая тема   
Автор
Поиск в теме:

Z

С нами с 15.05.05
Сообщения: 55190
Рейтинг: 7770


Передовик Master-X (16.10.2007) Передовик Master-X (16.12.2010) Передовик Master-X (01.02.2015) Передовик Master-X (16.05.2015) Передовик Master-X (01.06.2015) Ветеран трепа Master-X (16.06.2015)
Ссылка на сообщениеДобавлено: 18/01/09 в 21:00       Ответить с цитатойцитата 

создал вот топик в стиле CyberDesire

думаю будет полезно для всех, разобрать данный вопрос.

Я не использую robots.txt, но размеры логов на сервере меня начинают напрягать, да и есть один момент, я не пойму как закрыть индексацию поиска по блогу

andreich дарит вам акцию до 1 000р
КАТАЛОГ ПАРТНЕРОК | Бурж Гембла – тут! | RU Датинг на подписках

0
 

« ... full on ... »

С нами с 17.03.07
Сообщения: 670
Рейтинг: 1686

Ссылка на сообщениеДобавлено: 18/01/09 в 21:41       Ответить с цитатойцитата 

Юзаю довольно обычную схему - исключены фиды, админка, логин/регистер, + отдельное разрешение для гугл-имэйджес и путь до сайтмепа. Где-то с вариациями, где-то не юзаю вообще и особой разницы пока не вижу. Порой кажется, что боты глубоко забивают на роботс, т.к. не только индексят, но ещё и в выдачу пихают (несколько раз даже логин/регистр страницы вылазили).

Вот тут неплохой конфиг собран, можно кусками растащить по необходимости: http://www.askapache.com/seo/wordpress-robotstxt-seo.html

Цитата:
как закрыть индексацию поиска по блогу

Синтаксически вот так должно работать: Disallow: /*?s=*

Power of the lime madness...

5
 

www.phpdevs.com

С нами с 24.10.02
Сообщения: 16633
Рейтинг: 16105


Передовик Master-X (01.09.2005) Передовик Master-X (16.09.2005) Передовик Master-X (01.10.2005) Передовик Master-X (16.08.2006) Передовик Master-X (16.10.2006) Ветеран трепа Master-X ()
Ссылка на сообщениеДобавлено: 18/01/09 в 21:45       Ответить с цитатойцитата 

Многим поисковикам пофигу этот robots.txt Тот же гугл его тупо игнорирует, единственное что не показывает запрещенные странице в результате поиска. Но тем не менее сканит их.

Пишу на php/mysql/django за вменяемые деньги.
Обращаться в личку.

5
 

Z

С нами с 15.05.05
Сообщения: 55190
Рейтинг: 7770


Передовик Master-X (16.10.2007) Передовик Master-X (16.12.2010) Передовик Master-X (01.02.2015) Передовик Master-X (16.05.2015) Передовик Master-X (01.06.2015) Ветеран трепа Master-X (16.06.2015)
Ссылка на сообщениеДобавлено: 18/01/09 в 21:55       Ответить с цитатойцитата 

Corex: Stek: Спасибо, вот поэтому и не юзал, что google вообще до фоноря помойму, но изи того что у меня нет robots.txt растут логи, да и в какойто мере это ошибка, тоесть бот запросил а ему хуй, он может и обидеться, вот к чему я клоню

P.S. кстати многим совет, смотрите почаще domen.com-error_log - иногда открывается много чего интересного
наприер недавно обнаружил около 1К траффа идущего в топку, немного подрехтавал, результат был получен через пару дней icon_smile.gif

andreich дарит вам акцию до 1 000р
КАТАЛОГ ПАРТНЕРОК | Бурж Гембла – тут! | RU Датинг на подписках

0
 

www.phpdevs.com

С нами с 24.10.02
Сообщения: 16633
Рейтинг: 16105


Передовик Master-X (01.09.2005) Передовик Master-X (16.09.2005) Передовик Master-X (01.10.2005) Передовик Master-X (16.08.2006) Передовик Master-X (16.10.2006) Ветеран трепа Master-X ()
Ссылка на сообщениеДобавлено: 18/01/09 в 22:03       Ответить с цитатойцитата 

andreich: сделай проще, найди любой похожий блог и посмотри его роботс.тхт.
Вот у мастера к примеру такой https://www.master-x.com/robots.txt ^)

Пишу на php/mysql/django за вменяемые деньги.
Обращаться в личку.

0
 
+ + +
www.sgmanaged.com

С нами с 01.12.07
Сообщения: 691
Рейтинг: 403

Ссылка на сообщениеДобавлено: 19/01/09 в 11:30       Ответить с цитатойцитата 

Цитата:

Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/plugins/
Disallow: /wp-content/cache/
Disallow: /wp-content/themes/

Disallow: */trackback/
Disallow: */feed/

Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$

0
 



С нами с 06.11.02
Сообщения: 24551
Рейтинг: 5315

Ссылка на сообщениеДобавлено: 19/01/09 в 13:00       Ответить с цитатойцитата 

Your Ad Here. PM.

0
 



С нами с 14.04.07
Сообщения: 1439
Рейтинг: 1045

Ссылка на сообщениеДобавлено: 19/01/09 в 16:12       Ответить с цитатойцитата 

Я не слишком верю в дубликат, но robots.txt использую. На нетпонде недавно поднимал этот вопрос:

http://www.netpond.com/blogging-forum/143155-wordpress-duplicate-co…s-txt.html

Конечно мой вариант далеко не идеален, поэтому интересно посмотреть, как делают другие.

0
 

стара потыкана ондатра

С нами с 25.12.07
Сообщения: 3850
Рейтинг: 2579

Ссылка на сообщениеДобавлено: 20/01/09 в 02:20       Ответить с цитатойцитата 

что то я установил этот robots.txt что в примере выше и хуяк счетчик гугл аналитикс траф перестал показывать... Че за байда? вроде больше я нигде не рылся....

0
 
+ + +
www.sgmanaged.com

С нами с 01.12.07
Сообщения: 691
Рейтинг: 403

Ссылка на сообщениеДобавлено: 20/01/09 в 07:28       Ответить с цитатойцитата 

Так что, может вообще удалить robots.txt ?

0
 
Новая тема Новая тема   

Текстовая реклама в форме ответа
Заголовок и до четырех строчек текста
Длина текста до 350 символов
Купить рекламу в этом месте!


Перейти:  



Спонсор раздела Стань спонсором этого раздела!

Реклама на сайте Advertise with us

Опросы

Рецепт новогоднего блюда 2022



Обсудите на форуме обсудить (11)
все опросы »