Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Отфильтровать ботов

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
Pacan4ik
Отправлено: 03 Апреля, 2012 - 10:46:22
Post Id


Новичок


Покинул форум
Сообщений всего: 16
Дата рег-ции: Сент. 2009  


Помог: 0 раз(а)




Привет всем!

Периодически сайт сканируют всякие боты, пытаясь подменить значение переменной, передаваемой методом GET.

Вариантов множество:
http://217.218.225.2:2082/index.html?
ftp://comprapr:ItYqK123qe5r@comprapremiadacielo.voudeargohost.net/kapuvull.txt??
http://www.webproof123.hdfree.com.br/Hospedagen.txt?id?

Одни и те же запросы с разных IP, привязанных к разным странам. Есть идея отсеивать таких ботов, путем добавления в стоп-лист и перенаправление их на станицу ошибки, но как это реализовать не давая выполнить скрипт до конца,
 
 Top
Viper
Отправлено: 03 Апреля, 2012 - 11:00:48
Post Id



Активный участник


Покинул форум
Сообщений всего: 4555
Дата рег-ции: Февр. 2007  
Откуда: Симферополь


Помог: 98 раз(а)




Может Fail2Ban поможет.


-----
Список фильмов с описанием, блекджеком и... для Joomla? -> https://киноархив[dot]com
Демо нового движка для сайта php.su -> php[dot]su, проект на гитхабе
 
 Top
login8
Отправлено: 03 Апреля, 2012 - 17:07:16
Post Id



Новичок


Покинул форум
Сообщений всего: 34
Дата рег-ции: Февр. 2012  
Откуда: Куба


Помог: 0 раз(а)




Pacan4ik
Пропиши вот это в htaccess
CODE (html):
скопировать код в буфер обмена
  1.  
  2. SetEnvIfNoCase User-Agent "MJ12bot" bad_bot
  3. SetEnvIfNoCase User-Agent "Java" bad_bot
  4. SetEnvIfNoCase User-Agent "NjuiceBot" bad_bot
  5. SetEnvIfNoCase User-Agent "Gigabot" bad_bot
  6. SetEnvIfNoCase User-Agent "Baiduspider" bad_bot
  7. SetEnvIfNoCase User-Agent "JS-Kit" bad_bot
  8. SetEnvIfNoCase User-Agent "Voyager" bad_bot
  9. SetEnvIfNoCase User-Agent "PostRank" bad_bot
  10. SetEnvIfNoCase User-Agent "PycURL" bad_bot
  11. SetEnvIfNoCase User-Agent "ia_archiver" bad_bot
  12. SetEnvIfNoCase User-Agent "DotBot" bad_bot
  13. SetEnvIfNoCase User-Agent "SurveyBot" bad_bot
  14. SetEnvIfNoCase User-Agent "larbin" bad_bot
  15. SetEnvIfNoCase User-Agent "Butterfly" bad_bot
  16. SetEnvIfNoCase User-Agent "libwww" bad_bot
  17. SetEnvIfNoCase User-Agent "Wget" bad_bot
  18. SetEnvIfNoCase User-Agent "SWeb" bad_bot
  19. SetEnvIfNoCase User-Agent "LinkExchanger" bad_bot
  20. SetEnvIfNoCase User-Agent "Soup" bad_bot
  21. SetEnvIfNoCase User-Agent "WordPress" bad_bot
  22. SetEnvIfNoCase User-Agent "PHP" bad_bot
  23. SetEnvIfNoCase User-Agent "spbot" bad_bot
  24. SetEnvIfNoCase User-Agent "MLBot" bad_bot
  25. SetEnvIfNoCase User-Agent "InternetSeer" bad_bot
  26. SetEnvIfNoCase User-Agent "FairShare" bad_bot
  27. SetEnvIfNoCase User-Agent "Yeti" bad_bot
  28. SetEnvIfNoCase User-Agent "Birubot" bad_bot
  29. SetEnvIfNoCase User-Agent "YottosBot" bad_bot
  30. SetEnvIfNoCase User-Agent "gold\ crawler" bad_bot
  31. SetEnvIfNoCase User-Agent "Linguee" bad_bot
  32. SetEnvIfNoCase User-Agent "Ezooms" bad_bot
  33. SetEnvIfNoCase User-Agent "lwp-trivial" bad_bot
  34. SetEnvIfNoCase User-Agent "Purebot" bad_bot
  35. SetEnvIfNoCase User-Agent "User-Agent" bad_bot
  36. SetEnvIfNoCase User-Agent "kmSearchBot" bad_bot
  37. SetEnvIfNoCase User-Agent "SiteBot" bad_bot
  38. SetEnvIfNoCase User-Agent "ptd-crawler" bad_bot
  39. SetEnvIfNoCase User-Agent "HTTrack" bad_bot
  40. SetEnvIfNoCase User-Agent "suggybot" bad_bot
  41. SetEnvIfNoCase User-Agent "ttCrawler" bad_bot
  42. SetEnvIfNoCase User-Agent "Nutch" bad_bot
  43. SetEnvIfNoCase User-Agent "Zeus" bad_bot
  44. SetEnvIfNoCase User-Agent "CamontSpider" bad_bot
  45. SetEnvIfNoCase User-Agent "Downloader" bad_bot
  46. <Limit GET POST HEAD>
  47.  Order Allow,Deny
  48.  Allow from all
  49.  Deny from env=bad_bot
  50. </Limit>


Можешь сделать так:

CODE (html):
скопировать код в буфер обмена
  1.  
  2. SetEnvIfNoCase User-Agent "Юзер-агент бота" bad_bot
  3. <Limit GET POST HEAD>
  4.  Order Allow,Deny
  5.  Allow from all
  6.  Deny from env=bad_bot
  7. </Limit>
  8.  


Закатив глазки
 
 Top
Viper
Отправлено: 04 Апреля, 2012 - 11:24:39
Post Id



Активный участник


Покинул форум
Сообщений всего: 4555
Дата рег-ции: Февр. 2007  
Откуда: Симферополь


Помог: 98 раз(а)




login8 меняем юзерагента на гуглеботный или что-нить валидное и дуплим сайт запросами на любые порты и в любом количестве.


-----
Список фильмов с описанием, блекджеком и... для Joomla? -> https://киноархив[dot]com
Демо нового движка для сайта php.su -> php[dot]su, проект на гитхабе
 
 Top
Zuldek
Отправлено: 04 Апреля, 2012 - 11:59:11
Post Id


Постоянный участник


Покинул форум
Сообщений всего: 2122
Дата рег-ции: Июнь 2010  


Помог: 50 раз(а)




1.Всех ботов - через авторизацию.
2.Белых и пушистых - отстреливать по юзер-агенту
3.Плохих и с разных ip - см. пункт 1.
 
 Top
login8
Отправлено: 07 Апреля, 2012 - 14:45:59
Post Id



Новичок


Покинул форум
Сообщений всего: 34
Дата рег-ции: Февр. 2012  
Откуда: Куба


Помог: 0 раз(а)




Viper
Оригенально.
Однако.......... ........ ......... можно задуплить сравнение если это гугле бот то у него должен быть гуглеботовский ip если нет то в бан его Язычок
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Вопросы новичков »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB