PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи

Страниц (1): [1]

> Найдено сообщений: 15
JustSkeptik Отправлено: 24 Сентября, 2015 - 10:07:58 • Тема: Как обнаружить точку между http_host и request_uri? • Форум: HTTP и PHP

Ответов: 7
Просмотров: 1707
Viper, у меня к денверу претензий нет. Наоборот, если он находит точку, ее можно обрезать. Как раз проблема в том, что на хостинге хотя $_SERVER['HTTP_HOST'] и определяется без точки, сайт все же открывается с ней, что не позволяет как-то повлиять на ситуацию.
Viper пишет:
можно, но не нужно ибо
Я так полагаю, вы говорите о решении, описанном здесь:
http://habrahabr[dot]ru/post/172999/
Однако, как я понимаю, это решение реализуется на уровне администратора сервера, а хотелось бы что-нибудь попроще, реализуемое на уровне сайта. И насколько я понял, такого решения нет. Огорчение
JustSkeptik Отправлено: 23 Сентября, 2015 - 20:03:31 • Тема: Как обнаружить точку между http_host и request_uri? • Форум: HTTP и PHP

Ответов: 7
Просмотров: 1707
Viper пишет:
уверены? вообще-то для браузера это 2 разных адреса.
Я имел в виду зеркало с точки зрения поисковой системы.
JustSkeptik Отправлено: 23 Сентября, 2015 - 12:29:59 • Тема: Как обнаружить точку между http_host и request_uri? • Форум: HTTP и PHP

Ответов: 7
Просмотров: 1707
Как я понимаю, урл, по которому открывается вебстраница, определяется как
http://$_SERVER['HTTP_HOST']$_SERVER['REQUEST_URI']
Однако, если в конце доменного имени поставить точку, то сайт открывается как зеркало.
Иными словами, сайт может быть доступен как по адресу
CODE (htmlphp):
скопировать код в буфер обмена
  1. http://www.site.com/index.html

так и по адресу
CODE (htmlphp):
скопировать код в буфер обмена
  1. http://www.site.com./index.html

И если при этом на денвере $_SERVER['HTTP_HOST'] определяется вместе с этой точкой, то на хостинге $_SERVER['HTTP_HOST'] определяется без нее.
Вопрос: возможно ли средствами php определить наличие точки между $_SERVER['HTTP_HOST'] и $_SERVER['REQUEST_URI']?
JustSkeptik Отправлено: 22 Сентября, 2015 - 14:49:25 • Тема: Проверка на наличие лишних символов в коце строки • Форум: Регулярные выражения

Ответов: 7
Просмотров: 903
andrewkard, вы правы, так действительно лучше.
JustSkeptik Отправлено: 22 Сентября, 2015 - 10:15:02 • Тема: Проверка на наличие лишних символов в коце строки • Форум: Регулярные выражения

Ответов: 7
Просмотров: 903
broshurkaplus пишет:
2 возвращает начиная с позиции первого входжения..., а тк ищем word2 и если вернет word2 (word2==word2) - то ясно что слово и есть последнее
Но ведь это сработает и в случае http://www.site.ru/*word2$, и в случае, например, http://www.site.ru/*word2?page=5$. Ведь в обоих случаях присутствует вхождение word2. Или я чего-то не понимаю?
(Добавление)
broshurkaplus пишет:
если слово не 100500символов и знаете что word2 именно в конце, а не 5 раз посередине.
В том-то и дело, что мне надо не просто найти это слово, а проверить, что после него в урл не поставили что-то еще.
JustSkeptik Отправлено: 21 Сентября, 2015 - 23:16:39 • Тема: Проверка на наличие лишних символов в коце строки • Форум: Регулярные выражения

Ответов: 7
Просмотров: 903
broshurkaplus пишет:
для получения вхождения (и/или их количества) курите функции работы со строками, это быстрее чем регулярка

strpos для получения вхождения word1 - вы ж сами пишете не false - ок
strstr - для word2 если вернет word2 то ок
В случае с word1 вы правы - пока поставил strstr, но попробую заменить на strpos. А в случае с word2 мне нужно обнаружить наличие любого количества любых символов после него, так что решил через preg_match с регуляркой '/word2.+/i'
JustSkeptik Отправлено: 20 Сентября, 2015 - 21:15:51 • Тема: Проверка на наличие лишних символов в коце строки • Форум: Регулярные выражения

Ответов: 7
Просмотров: 903
Мне нужно проверить request_uri на предмет одновременного соблюдения в нем двух условий:
1) наличия у него внутри слова word1
2) что request_uri заканчивается словом word2.
Как я понимаю, что для этого следует использовать
CODE (htmlphp):
скопировать код в буфер обмена
  1. strstr(strtolower($_SERVER['REQUEST_URI']), "регулярное выражение")

Но мне нужно составить соответствующее регулярное выражение. То есть чтобы находились все отличия от
CODE (htmlphp):
скопировать код в буфер обмена
  1. http://www.my-site/*word1*word2$
, где *-любое количество любых символов, а $-конец строки, после которого ничего не должно быть. Кто-нибудь может помочь?
JustSkeptik Отправлено: 10 Сентября, 2015 - 11:32:10 • Тема: Как забанить фейковый Googlebot в htaccess? • Форум: Apache и другие веб-серверы

Ответов: 14
Просмотров: 2070
DeepVarvar пишет:
http://php.net/manual/ru/functio...ethostbyaddr.php
Будет ли работать эта функция с IPv6?
JustSkeptik Отправлено: 09 Сентября, 2015 - 11:10:18 • Тема: Как забанить фейковый Googlebot в htaccess? • Форум: Apache и другие веб-серверы

Ответов: 14
Просмотров: 2070
DeepVarvar пишет:
http://php.net/manual/ru/functio...ethostbyaddr.php
Да, это именно то, что нужно! Круто
JustSkeptik Отправлено: 09 Сентября, 2015 - 08:38:59 • Тема: Как забанить фейковый Googlebot в htaccess? • Форум: Apache и другие веб-серверы

Ответов: 14
Просмотров: 2070
DlTA пишет:
что именно?

То, о чем пишет гугл:
Цитата:

С помощью команды host выполните обратный DNS-запрос IP-адреса, который можно узнать в журнале.
Убедитесь, что доменное имя – googlebot.com или google.com.
С помощью команды host выполните прямой запрос DNS на преобразование доменного имени, которое вы узнали на шаге 1. IP-адрес, полученный в результате, и исходный должны совпадать.
Только не из журнала, а в режиме реального времени. Это возможно?
JustSkeptik Отправлено: 08 Сентября, 2015 - 22:15:29 • Тема: Как забанить фейковый Googlebot в htaccess? • Форум: Apache и другие веб-серверы

Ответов: 14
Просмотров: 2070
DlTA пишет:
обрабатывайте это пыхой
А как это реализовать на php?
JustSkeptik Отправлено: 08 Сентября, 2015 - 22:03:39 • Тема: Как забанить фейковый Googlebot в htaccess? • Форум: Apache и другие веб-серверы

Ответов: 14
Просмотров: 2070
То есть этот шаг позволит получить IP зашедшего. А с чем его сравнить? D гугле говорят следующее:
Цитата:
Компания Google не публикует "белые списки" IP-адресов для веб-мастеров. Они могут изменяться, что вызовет проблемы на сайтах, где эти адреса указаны в коде.
И рекомендуют сделать следующее:
Цитата:
Как убедиться, что сайт сканируется роботом Googlebot:

С помощью команды host выполните обратный DNS-запрос IP-адреса, который можно узнать в журнале.
Убедитесь, что доменное имя – googlebot.com или google.com.
С помощью команды host выполните прямой запрос DNS на преобразование доменного имени, которое вы узнали на шаге 1. IP-адрес, полученный в результате, и исходный должны совпадать.

https://support[dot]google[dot]com/webma[dot][dot][dot]swer/80553?hl=ru
Вот, собственно, и вопрос: возможно ли это реализовать через htaccess?
JustSkeptik Отправлено: 08 Сентября, 2015 - 21:41:00 • Тема: Как забанить фейковый Googlebot в htaccess? • Форум: Apache и другие веб-серверы

Ответов: 14
Просмотров: 2070
DlTA пишет:
в каком месте проблема то?
Проблема в проверке IP. Как его проверить?
(Добавление)
DlTA пишет:
но для начала в robots.txt пропишите предпочитаемое время/задержку для бота, может учтут
Попробую, но маловероятно. У меня на другом сайте схожая ситуация с фейковым яндексботом. В роботсе для яндекса стоит задержка в 10 сек., а подделка все равно отправляет по нескольку запросов в секунду.
JustSkeptik Отправлено: 08 Сентября, 2015 - 21:19:43 • Тема: Как забанить фейковый Googlebot в htaccess? • Форум: Apache и другие веб-серверы

Ответов: 14
Просмотров: 2070
DlTA пишет:
если по логам видно что это гуглбот, а по ip это не он, вот и баньте
Как банить? В секунду до 10 запросов, и каждый с разных IP. То есть совсем с разных - даже диапазоны разные. Причем они практически не повторяются - в течение часа каждый запрос с другого IP.
JustSkeptik Отправлено: 08 Сентября, 2015 - 20:11:55 • Тема: Как забанить фейковый Googlebot в htaccess? • Форум: Apache и другие веб-серверы

Ответов: 14
Просмотров: 2070
В последнее время заметил в логах сервера фальшивый Googlebot. Похоже, сканирует сайт с ботнета - по 2-10 запросов в секунду, и каждый раз с нового IP. При этом диапазон IP совершенно непредсказуем - то Вьетнам, то Кыргызстан, то Мексика и т. д.
В гугле говорят, что диапазон своих белых IP не раскрывают, так что, как я понимаю, блокировка по IP методом исключения - не вариант. Реально ли вообще как-то с этим бороться?

Страниц (1): [1]
Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB