Форумы портала PHP.SU

PHP.SU

Программирование на PHP, MySQL и другие веб-технологии

PHP.SU Портал

Главная

Помощь

Поиск

Поиск Яндекс Вакансии

Пользователи

Здравствуйте, Гость

( Вход · Регистрация · Правила форума )

Забыли пароль?

Форумы портала PHP.SU » Список сообщений, автором которых является JustSkeptik

Страниц (1): [1]

Найдено сообщений: 15

JustSkeptik

Отправлено: 24 Сентября, 2015 - 10:07:58 • Тема: Как обнаружить точку между http_host и request_uri? • Форум: HTTP и PHP

Ответов: 7
Просмотров: 1707

Viper, у меня к денверу претензий нет. Наоборот, если он находит точку, ее можно обрезать. Как раз проблема в том, что на хостинге хотя $_SERVER['HTTP_HOST'] и определяется без точки, сайт все же открывается с ней, что не позволяет как-то повлиять на ситуацию.

Viper пишет:

можно, но не нужно ибо

Я так полагаю, вы говорите о решении, описанном здесь:
http://habrahabr[dot]ru/post/172999/
Однако, как я понимаю, это решение реализуется на уровне администратора сервера, а хотелось бы что-нибудь попроще, реализуемое на уровне сайта. И насколько я понял, такого решения нет. Огорчение

JustSkeptik	Отправлено: 23 Сентября, 2015 - 20:03:31 • Тема: Как обнаружить точку между http_host и request_uri? • Форум: HTTP и PHP
Ответов: 7 Просмотров: 1707	Viper пишет: уверены? вообще-то для браузера это 2 разных адреса. Я имел в виду зеркало с точки зрения поисковой системы.

JustSkeptik

Отправлено: 23 Сентября, 2015 - 12:29:59 • Тема: Как обнаружить точку между http_host и request_uri? • Форум: HTTP и PHP

Ответов: 7
Просмотров: 1707

Как я понимаю, урл, по которому открывается вебстраница, определяется как
http://$_SERVER['HTTP_HOST']$_SERVER['REQUEST_URI']
Однако, если в конце доменного имени поставить точку, то сайт открывается как зеркало.
Иными словами, сайт может быть доступен как по адресу

CODE (htmlphp):
скопировать код в буфер обмена

http://www.site.com/index.html

так и по адресу

CODE (htmlphp):
скопировать код в буфер обмена

http://www.site.com./index.html

И если при этом на денвере $_SERVER['HTTP_HOST'] определяется вместе с этой точкой, то на хостинге $_SERVER['HTTP_HOST'] определяется без нее.
Вопрос: возможно ли средствами php определить наличие точки между $_SERVER['HTTP_HOST'] и $_SERVER['REQUEST_URI']?

JustSkeptik	Отправлено: 22 Сентября, 2015 - 14:49:25 • Тема: Проверка на наличие лишних символов в коце строки • Форум: Регулярные выражения
Ответов: 7 Просмотров: 903	andrewkard, вы правы, так действительно лучше.

JustSkeptik

Отправлено: 22 Сентября, 2015 - 10:15:02 • Тема: Проверка на наличие лишних символов в коце строки • Форум: Регулярные выражения

Ответов: 7
Просмотров: 903

broshurkaplus пишет:

2 возвращает начиная с позиции первого входжения..., а тк ищем word2 и если вернет word2 (word2==word2) - то ясно что слово и есть последнее

Но ведь это сработает и в случае http://www.site.ru/*word2$, и в случае, например, http://www.site.ru/*word2?page=5$. Ведь в обоих случаях присутствует вхождение word2. Или я чего-то не понимаю?
(Добавление)

broshurkaplus пишет:

если слово не 100500символов и знаете что word2 именно в конце, а не 5 раз посередине.

В том-то и дело, что мне надо не просто найти это слово, а проверить, что после него в урл не поставили что-то еще.

JustSkeptik

Отправлено: 21 Сентября, 2015 - 23:16:39 • Тема: Проверка на наличие лишних символов в коце строки • Форум: Регулярные выражения

Ответов: 7
Просмотров: 903

broshurkaplus пишет:

для получения вхождения (и/или их количества) курите функции работы со строками, это быстрее чем регулярка

strpos для получения вхождения word1 - вы ж сами пишете не false - ок
strstr - для word2 если вернет word2 то ок

В случае с word1 вы правы - пока поставил strstr, но попробую заменить на strpos. А в случае с word2 мне нужно обнаружить наличие любого количества любых символов после него, так что решил через preg_match с регуляркой '/word2.+/i'

JustSkeptik

Отправлено: 20 Сентября, 2015 - 21:15:51 • Тема: Проверка на наличие лишних символов в коце строки • Форум: Регулярные выражения

Ответов: 7
Просмотров: 903

Мне нужно проверить request_uri на предмет одновременного соблюдения в нем двух условий:
1) наличия у него внутри слова word1
2) что request_uri заканчивается словом word2.
Как я понимаю, что для этого следует использовать

CODE (htmlphp):
скопировать код в буфер обмена

strstr(strtolower($_SERVER['REQUEST_URI']), "регулярное выражение")

Но мне нужно составить соответствующее регулярное выражение. То есть чтобы находились все отличия от

CODE (htmlphp):
скопировать код в буфер обмена

http://www.my-site/*word1*word2$

, где *-любое количество любых символов, а $-конец строки, после которого ничего не должно быть. Кто-нибудь может помочь?

JustSkeptik	Отправлено: 10 Сентября, 2015 - 11:32:10 • Тема: Как забанить фейковый Googlebot в htaccess? • Форум: Apache и другие веб-серверы
Ответов: 14 Просмотров: 2070	DeepVarvar пишет: http://php.net/manual/ru/functio...ethostbyaddr.php Будет ли работать эта функция с IPv6?

JustSkeptik	Отправлено: 09 Сентября, 2015 - 11:10:18 • Тема: Как забанить фейковый Googlebot в htaccess? • Форум: Apache и другие веб-серверы
Ответов: 14 Просмотров: 2070	DeepVarvar пишет: http://php.net/manual/ru/functio...ethostbyaddr.php Да, это именно то, что нужно!

JustSkeptik

Отправлено: 09 Сентября, 2015 - 08:38:59 • Тема: Как забанить фейковый Googlebot в htaccess? • Форум: Apache и другие веб-серверы

Ответов: 14
Просмотров: 2070

DlTA пишет:

что именно?

То, о чем пишет гугл:

Цитата:

С помощью команды host выполните обратный DNS-запрос IP-адреса, который можно узнать в журнале.
Убедитесь, что доменное имя – googlebot.com или google.com.
С помощью команды host выполните прямой запрос DNS на преобразование доменного имени, которое вы узнали на шаге 1. IP-адрес, полученный в результате, и исходный должны совпадать.

Только не из журнала, а в режиме реального времени. Это возможно?

JustSkeptik	Отправлено: 08 Сентября, 2015 - 22:15:29 • Тема: Как забанить фейковый Googlebot в htaccess? • Форум: Apache и другие веб-серверы
Ответов: 14 Просмотров: 2070	DlTA пишет: обрабатывайте это пыхой А как это реализовать на php?

JustSkeptik

Отправлено: 08 Сентября, 2015 - 22:03:39 • Тема: Как забанить фейковый Googlebot в htaccess? • Форум: Apache и другие веб-серверы

Ответов: 14
Просмотров: 2070

То есть этот шаг позволит получить IP зашедшего. А с чем его сравнить? D гугле говорят следующее:

Цитата:

Компания Google не публикует "белые списки" IP-адресов для веб-мастеров. Они могут изменяться, что вызовет проблемы на сайтах, где эти адреса указаны в коде.

И рекомендуют сделать следующее:

Цитата:

Как убедиться, что сайт сканируется роботом Googlebot:

С помощью команды host выполните обратный DNS-запрос IP-адреса, который можно узнать в журнале.
Убедитесь, что доменное имя – googlebot.com или google.com.
С помощью команды host выполните прямой запрос DNS на преобразование доменного имени, которое вы узнали на шаге 1. IP-адрес, полученный в результате, и исходный должны совпадать.

https://support[dot]google[dot]com/webma[dot][dot][dot]swer/80553?hl=ru
Вот, собственно, и вопрос: возможно ли это реализовать через htaccess?

JustSkeptik

Отправлено: 08 Сентября, 2015 - 21:41:00 • Тема: Как забанить фейковый Googlebot в htaccess? • Форум: Apache и другие веб-серверы

Ответов: 14
Просмотров: 2070

DlTA пишет:

в каком месте проблема то?

Проблема в проверке IP. Как его проверить?
(Добавление)

DlTA пишет:

но для начала в robots.txt пропишите предпочитаемое время/задержку для бота, может учтут

Попробую, но маловероятно. У меня на другом сайте схожая ситуация с фейковым яндексботом. В роботсе для яндекса стоит задержка в 10 сек., а подделка все равно отправляет по нескольку запросов в секунду.

JustSkeptik

Отправлено: 08 Сентября, 2015 - 21:19:43 • Тема: Как забанить фейковый Googlebot в htaccess? • Форум: Apache и другие веб-серверы

Ответов: 14
Просмотров: 2070

DlTA пишет:

если по логам видно что это гуглбот, а по ip это не он, вот и баньте

Как банить? В секунду до 10 запросов, и каждый с разных IP. То есть совсем с разных - даже диапазоны разные. Причем они практически не повторяются - в течение часа каждый запрос с другого IP.

JustSkeptik

Отправлено: 08 Сентября, 2015 - 20:11:55 • Тема: Как забанить фейковый Googlebot в htaccess? • Форум: Apache и другие веб-серверы

Ответов: 14
Просмотров: 2070

В последнее время заметил в логах сервера фальшивый Googlebot. Похоже, сканирует сайт с ботнета - по 2-10 запросов в секунду, и каждый раз с нового IP. При этом диапазон IP совершенно непредсказуем - то Вьетнам, то Кыргызстан, то Мексика и т. д.
В гугле говорят, что диапазон своих белых IP не раскрывают, так что, как я понимаю, блокировка по IP методом исключения - не вариант. Реально ли вообще как-то с этим бороться?

Страниц (1): [1]