Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Поисковые роботы

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
ALEN
Отправлено: 22 Августа, 2008 - 08:21:32
Post Id



Участник


Покинул форум
Сообщений всего: 1459
Дата рег-ции: Авг. 2008  
Откуда: Крым


Помог: 11 раз(а)




При входе роботов на сайт они кроме своего уникального ip? что-то дают. Т.е. у меня есть вариант забить в БД всех роботов (описание роботов каждой системы легко можно найти в инете) и потом просто использовать их инфу. Либо они в заголовках, что-то несут.

Никто не сталкивался.

Цель:
- "Кто на сайте" - т.е. указание какие боты сейчас сканят.
- Если на сайте бот, то можно не формировать некоторые части страниц и к тому же нам уже не нужно работать в этом случае на внешний вид ресурса, а только на его качество и содержание.

Например зачем вставлять на страницах noindex если понимаешь, что не все поисковые системы это поймут и зачем лишний раз нагружать страницу, а так просто ти части не будут формироватся.


Вроде объяснил очень все понятно, кто сталкивался тот подскажет а для новичков будет хорший + к идеи.
 
 Top
Andrey5555
Отправлено: 22 Августа, 2008 - 09:49:01
Post Id


Частый гость


Покинул форум
Сообщений всего: 183
Дата рег-ции: Авг. 2007  


Помог: 0 раз(а)




Формировать страницу специально для роботов нет смысла. А роботы несут такую информацию (compatible; Googlebot/2.1; +http://www.google.com/bot.html). Данные можно получить из масива $_SERVER. Вот только роботы не так часто сканят сайт, как хотелось бы. Так что я не вижу смысла выводить какой робот сканит.
 
 Top
ALEN
Отправлено: 22 Августа, 2008 - 10:47:12
Post Id



Участник


Покинул форум
Сообщений всего: 1459
Дата рег-ции: Авг. 2008  
Откуда: Крым


Помог: 11 раз(а)




Andrey5555
Есть просто заказы ткие от клиентов + там же, чтоб была история когда происходит сканирование страниц.

Так же в заказах клиентов иногда есть не достаточно честные поступки, но я не видил, что этого делать нельзя. Например:
При большом колличестве внешних ссылок на страницах поисковые системы могут запретить индексацию страницы или всего сайта, хотя бы на месяц. Вот чтоб такого небыло, нужно исключить эти страницы. Вариант noindex - не всегда подходит для решения задач, поэтому принято решение не публиковать некоторые данные.
 
 Top
Andrey5555
Отправлено: 22 Августа, 2008 - 13:23:36
Post Id


Частый гость


Покинул форум
Сообщений всего: 183
Дата рег-ции: Авг. 2007  


Помог: 0 раз(а)




В таком случае вообще не делать много внешних ссылок. Либо ограничить доступ роботов через robots.txt. И еще, как вы собираетесь не публиковать некоторые данные, если зашел робот. Покажите код.
 
 Top
ALEN
Отправлено: 22 Августа, 2008 - 13:34:46
Post Id



Участник


Покинул форум
Сообщений всего: 1459
Дата рег-ции: Авг. 2008  
Откуда: Крым


Помог: 11 раз(а)




Andrey5555
При входе бота я при генерации страницы проставлю даже условные операторы и информация не будет генерироваться. А если простой человек то все ок.

Понимаете, как чсто Вы читали статьи когда богатенькие дяденьки и тетеньки хотят, чтоб было именно так, как они этого хотят, даже если это расходится с некими нормами, правилами и даже культурным тоном!

CODE (text):
скопировать код в буфер обмена
  1. <?php
  2. $bot=1;
  3. // Если ip определен, как БОТ, то переменная равна 1, иначе переменная НЕ равна 1
  4. if($bot==1){
  5. ?>
  6. <a href='http://vasya_pypkin.pupkin'>Сайт Васи Пупкина</a>
  7. <?php
  8. } ?>

(Отредактировано автором: 22 Августа, 2008 - 13:38:34)

 
 Top
Andrey5555
Отправлено: 22 Августа, 2008 - 15:47:58
Post Id


Частый гость


Покинул форум
Сообщений всего: 183
Дата рег-ции: Авг. 2007  


Помог: 0 раз(а)




Лучше определять бота не по IP, а по имени. Что будет выводиться на странице если зашел бот?
 
 Top
ALEN
Отправлено: 22 Августа, 2008 - 18:04:57
Post Id



Участник


Покинул форум
Сообщений всего: 1459
Дата рег-ции: Авг. 2008  
Откуда: Крым


Помог: 11 раз(а)




Andrey5555
Я больше подымаю вопрос, что не будет выводится, а выводится может большее колличество внутренних ссылок, чтоб уровень вложености сделать меньше!

Насчет определения бота - поэтому я и задал в теме, оставляет ли какой-то заголовок и т.д. бот. А точно на поисковиках: google, yandex, rambler,aport,yahoo,MSN и т.д. их боты передают свои данные?
 
 Top
Andrey5555
Отправлено: 22 Августа, 2008 - 18:10:21
Post Id


Частый гость


Покинул форум
Сообщений всего: 183
Дата рег-ции: Авг. 2007  


Помог: 0 раз(а)




Да, боты передают данные. Но каждый свои и их необходимо знать. Но также можно проверять бот или нет, по IP и/или Названию.
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Программирование на PHP »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB