Покинул форум
Сообщений всего: 1459
Дата рег-ции: Авг. 2008 Откуда: Крым
Помог: 11 раз(а)
При входе роботов на сайт они кроме своего уникального ip? что-то дают. Т.е. у меня есть вариант забить в БД всех роботов (описание роботов каждой системы легко можно найти в инете) и потом просто использовать их инфу. Либо они в заголовках, что-то несут.
Никто не сталкивался.
Цель:
- "Кто на сайте" - т.е. указание какие боты сейчас сканят.
- Если на сайте бот, то можно не формировать некоторые части страниц и к тому же нам уже не нужно работать в этом случае на внешний вид ресурса, а только на его качество и содержание.
Например зачем вставлять на страницах noindex если понимаешь, что не все поисковые системы это поймут и зачем лишний раз нагружать страницу, а так просто ти части не будут формироватся.
Вроде объяснил очень все понятно, кто сталкивался тот подскажет а для новичков будет хорший + к идеи.
Andrey5555
Отправлено: 22 Августа, 2008 - 09:49:01
Частый гость
Покинул форум
Сообщений всего: 183
Дата рег-ции: Авг. 2007
Помог: 0 раз(а)
Формировать страницу специально для роботов нет смысла. А роботы несут такую информацию (compatible; Googlebot/2.1; +http://www.google.com/bot.html). Данные можно получить из масива $_SERVER. Вот только роботы не так часто сканят сайт, как хотелось бы. Так что я не вижу смысла выводить какой робот сканит.
Покинул форум
Сообщений всего: 1459
Дата рег-ции: Авг. 2008 Откуда: Крым
Помог: 11 раз(а)
Andrey5555
Есть просто заказы ткие от клиентов + там же, чтоб была история когда происходит сканирование страниц.
Так же в заказах клиентов иногда есть не достаточно честные поступки, но я не видил, что этого делать нельзя. Например:
При большом колличестве внешних ссылок на страницах поисковые системы могут запретить индексацию страницы или всего сайта, хотя бы на месяц. Вот чтоб такого небыло, нужно исключить эти страницы. Вариант noindex - не всегда подходит для решения задач, поэтому принято решение не публиковать некоторые данные.
Andrey5555
Отправлено: 22 Августа, 2008 - 13:23:36
Частый гость
Покинул форум
Сообщений всего: 183
Дата рег-ции: Авг. 2007
Помог: 0 раз(а)
В таком случае вообще не делать много внешних ссылок. Либо ограничить доступ роботов через robots.txt. И еще, как вы собираетесь не публиковать некоторые данные, если зашел робот. Покажите код.
Покинул форум
Сообщений всего: 1459
Дата рег-ции: Авг. 2008 Откуда: Крым
Помог: 11 раз(а)
Andrey5555
При входе бота я при генерации страницы проставлю даже условные операторы и информация не будет генерироваться. А если простой человек то все ок.
Понимаете, как чсто Вы читали статьи когда богатенькие дяденьки и тетеньки хотят, чтоб было именно так, как они этого хотят, даже если это расходится с некими нормами, правилами и даже культурным тоном!
Покинул форум
Сообщений всего: 1459
Дата рег-ции: Авг. 2008 Откуда: Крым
Помог: 11 раз(а)
Andrey5555
Я больше подымаю вопрос, что не будет выводится, а выводится может большее колличество внутренних ссылок, чтоб уровень вложености сделать меньше!
Насчет определения бота - поэтому я и задал в теме, оставляет ли какой-то заголовок и т.д. бот. А точно на поисковиках: google, yandex, rambler,aport,yahoo,MSN и т.д. их боты передают свои данные?
Andrey5555
Отправлено: 22 Августа, 2008 - 18:10:21
Частый гость
Покинул форум
Сообщений всего: 183
Дата рег-ции: Авг. 2007
Помог: 0 раз(а)
Да, боты передают данные. Но каждый свои и их необходимо знать. Но также можно проверять бот или нет, по IP и/или Названию.
Все гости форума могут просматривать этот раздел. Только зарегистрированные пользователи могут создавать новые темы в этом разделе. Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.