Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Как забанить фейковый Googlebot в htaccess?

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
JustSkeptik
Отправлено: 08 Сентября, 2015 - 20:11:55
Post Id


Новичок


Покинул форум
Сообщений всего: 15
Дата рег-ции: Сент. 2015  


Помог: 0 раз(а)




В последнее время заметил в логах сервера фальшивый Googlebot. Похоже, сканирует сайт с ботнета - по 2-10 запросов в секунду, и каждый раз с нового IP. При этом диапазон IP совершенно непредсказуем - то Вьетнам, то Кыргызстан, то Мексика и т. д.
В гугле говорят, что диапазон своих белых IP не раскрывают, так что, как я понимаю, блокировка по IP методом исключения - не вариант. Реально ли вообще как-то с этим бороться?
 
 Top
DlTA
Отправлено: 08 Сентября, 2015 - 21:12:20
Post Id



Постоянный участник


Покинул форум
Сообщений всего: 2952
Дата рег-ции: Окт. 2010  


Помог: 53 раз(а)




если по логам видно что это гуглбот, а по ip это не он, вот и баньте
но для начала в robots.txt пропишите предпочитаемое время/задержку для бота, может учтут
 
 Top
JustSkeptik
Отправлено: 08 Сентября, 2015 - 21:19:43
Post Id


Новичок


Покинул форум
Сообщений всего: 15
Дата рег-ции: Сент. 2015  


Помог: 0 раз(а)




DlTA пишет:
если по логам видно что это гуглбот, а по ip это не он, вот и баньте
Как банить? В секунду до 10 запросов, и каждый с разных IP. То есть совсем с разных - даже диапазоны разные. Причем они практически не повторяются - в течение часа каждый запрос с другого IP.
 
 Top
DlTA
Отправлено: 08 Сентября, 2015 - 21:21:51
Post Id



Постоянный участник


Покинул форум
Сообщений всего: 2952
Дата рег-ции: Окт. 2010  


Помог: 53 раз(а)




JustSkeptik пишет:
Как банить? В секунду до 10 запросов, и каждый с разных IP. То есть совсем с разных - даже диапазоны разные. Причем они практически не повторяются - в течение часа каждый запрос с другого IP.

читайте заголовки если по ним видно что это гугл
проверяйте ip
если он не диапазоне гугла баньте/посылайте ему какую нить статику

в каком месте проблема то?
(Добавление)
DlTA пишет:
но для начала в robots.txt пропишите предпочитаемое время/задержку для бота, может учтут
 
 Top
JustSkeptik
Отправлено: 08 Сентября, 2015 - 21:41:00
Post Id


Новичок


Покинул форум
Сообщений всего: 15
Дата рег-ции: Сент. 2015  


Помог: 0 раз(а)




DlTA пишет:
в каком месте проблема то?
Проблема в проверке IP. Как его проверить?
(Добавление)
DlTA пишет:
но для начала в robots.txt пропишите предпочитаемое время/задержку для бота, может учтут
Попробую, но маловероятно. У меня на другом сайте схожая ситуация с фейковым яндексботом. В роботсе для яндекса стоит задержка в 10 сек., а подделка все равно отправляет по нескольку запросов в секунду.
 
 Top
DlTA
Отправлено: 08 Сентября, 2015 - 21:53:54
Post Id



Постоянный участник


Покинул форум
Сообщений всего: 2952
Дата рег-ции: Окт. 2010  


Помог: 53 раз(а)




getenv("REMOTE_ADDR")
возвращает пользовательский IP
 
 Top
JustSkeptik
Отправлено: 08 Сентября, 2015 - 22:03:39
Post Id


Новичок


Покинул форум
Сообщений всего: 15
Дата рег-ции: Сент. 2015  


Помог: 0 раз(а)




То есть этот шаг позволит получить IP зашедшего. А с чем его сравнить? D гугле говорят следующее:
Цитата:
Компания Google не публикует "белые списки" IP-адресов для веб-мастеров. Они могут изменяться, что вызовет проблемы на сайтах, где эти адреса указаны в коде.
И рекомендуют сделать следующее:
Цитата:
Как убедиться, что сайт сканируется роботом Googlebot:

С помощью команды host выполните обратный DNS-запрос IP-адреса, который можно узнать в журнале.
Убедитесь, что доменное имя – googlebot.com или google.com.
С помощью команды host выполните прямой запрос DNS на преобразование доменного имени, которое вы узнали на шаге 1. IP-адрес, полученный в результате, и исходный должны совпадать.

https://support[dot]google[dot]com/webma[dot][dot][dot]swer/80553?hl=ru
Вот, собственно, и вопрос: возможно ли это реализовать через htaccess?
 
 Top
DlTA
Отправлено: 08 Сентября, 2015 - 22:13:28
Post Id



Постоянный участник


Покинул форум
Сообщений всего: 2952
Дата рег-ции: Окт. 2010  


Помог: 53 раз(а)




JustSkeptik пишет:
Вот, собственно, и вопрос: возможно ли это реализовать через htaccess?

сомневаюсь, а зачем??
обрабатывайте это пыхой
 
 Top
JustSkeptik
Отправлено: 08 Сентября, 2015 - 22:15:29
Post Id


Новичок


Покинул форум
Сообщений всего: 15
Дата рег-ции: Сент. 2015  


Помог: 0 раз(а)




DlTA пишет:
обрабатывайте это пыхой
А как это реализовать на php?
 
 Top
DlTA
Отправлено: 08 Сентября, 2015 - 22:57:03
Post Id



Постоянный участник


Покинул форум
Сообщений всего: 2952
Дата рег-ции: Окт. 2010  


Помог: 53 раз(а)




JustSkeptik пишет:
А как это реализовать на php?

что именно?
 
 Top
JustSkeptik
Отправлено: 09 Сентября, 2015 - 08:38:59
Post Id


Новичок


Покинул форум
Сообщений всего: 15
Дата рег-ции: Сент. 2015  


Помог: 0 раз(а)




DlTA пишет:
что именно?

То, о чем пишет гугл:
Цитата:

С помощью команды host выполните обратный DNS-запрос IP-адреса, который можно узнать в журнале.
Убедитесь, что доменное имя – googlebot.com или google.com.
С помощью команды host выполните прямой запрос DNS на преобразование доменного имени, которое вы узнали на шаге 1. IP-адрес, полученный в результате, и исходный должны совпадать.
Только не из журнала, а в режиме реального времени. Это возможно?
 
 Top
DeepVarvar Супермодератор
Отправлено: 09 Сентября, 2015 - 09:33:30
Post Id



Активный участник


Покинул форум
Сообщений всего: 10377
Дата рег-ции: Дек. 2008  
Откуда: Альфа Центавра


Помог: 353 раз(а)




 
 Top
JustSkeptik
Отправлено: 09 Сентября, 2015 - 11:10:18
Post Id


Новичок


Покинул форум
Сообщений всего: 15
Дата рег-ции: Сент. 2015  


Помог: 0 раз(а)




DeepVarvar пишет:
http://php.net/manual/ru/functio...ethostbyaddr.php
Да, это именно то, что нужно! Круто
 
 Top
JustSkeptik
Отправлено: 10 Сентября, 2015 - 11:32:10
Post Id


Новичок


Покинул форум
Сообщений всего: 15
Дата рег-ции: Сент. 2015  


Помог: 0 раз(а)




DeepVarvar пишет:
http://php.net/manual/ru/functio...ethostbyaddr.php
Будет ли работать эта функция с IPv6?
 
 Top
Мелкий Супермодератор
Отправлено: 10 Сентября, 2015 - 11:46:52
Post Id



Активный участник


Покинул форум
Сообщений всего: 11926
Дата рег-ции: Июль 2009  
Откуда: Россия, Санкт-Петербург


Помог: 618 раз(а)




Да, если PHP собран с #if HAVE_IPV6 && HAVE_INET_PTON


-----
PostgreSQL DBA
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Apache и другие веб-серверы »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB