Насколько я понимаю, тут первая часть куков удаляет старые записи и указывает новую запись о регионе, городе и типе валюты и ид сессии и срок на три дня. И потом пытается это спросить, а если нету ответа то выпадает капча.
В общем работу через прокси наладил, и даже какое-то время это работало. Но теперь, в алгоритме, видимо что-то изменилось, и сервер дает зайти только один раз в три дня, а потом, видимо, присылает куку. А вот куки для такого ламера как я совсем непреодолимая задача
Помогите отослать обратно ответ серверу с куками, кому не сложно.
Через прокси почему-то не получается. Возвращается ошибка 404 (страница не найдена)
Цитата:
//HTTP/1.1 404 Not Found Date: Sun, 29 Nov 2015 10:21:23 GMT Server: Apache/2.2.22 (Ubuntu) Vary: Accept-Encoding Content-Length: 329 Content-Type: text/html; charset=iso-8859-1
Not Found
The requested URL /mobile-mobilnye-telefony-i-smartfony/apple-iphone-5-16gb-white/' was not found on this server.
По-сути нужно просто получить одну страничку и добавить с нее данные в базу. Как я уже писал ранее, парсер работает в ручном режиме, то-есть запускается пару раз в неделю. То-есть создает нагрузку на сервер не более чем человек.
Всё зависит от причин её появления.
Если она появляется только на определёных адерсах - то юзать прокси
Если от от частых запросов - то делать слип между запросами
Всё зависит от обствоятельст
Это не автоматический парсер, юзается в ручном режиме несколько раз в неделю. Не думаю что создает какую-то заметную нагрузку на сервер. Скорее бан на диапазон адресов. В общем-то так написано в сообщении от сервера, которое приходит вместе с капчей.
Я имел ввиду, что капча приходит не всем. Видимо только на определенный диапазон айпиадресов или еще по какому-то признаку выдается. То-есть с локалки я могу нормально использовать этот парсер, а вот с хостинга немогу.
вы не поняли. С локалки у вас будет ваш внешний IP, а IP хостера у них может быть в черном списке. Думаю вывод очевиден.
Видимо очевиден, но не для всех
И все же, как ее обойти?
Мне кажется тут возможны 2 варианта:
1. Заставить капчу нормально отобразиться, и потом просто клацнуть по ней мышкой.
2. Парсить через прокси, чтобы скрыть реальный адрес.
Вот на локальной версии она не показывается вообще.
это не означает что сайт работает как надо.
Я имел ввиду, что капча приходит не всем. Видимо только на определенный диапазон айпиадресов или еще по какому-то признаку выдается. То-есть с локалки я могу нормально использовать этот парсер, а вот с хостинга немогу.
Дело в том, что вам могут показывать капчу, а куками вы текст с картинки не введете.
Выхода 2.
1. Пользоваться проксями
2. Правильно отправлять запросы на сайт.
Таки да. Показывается капча (точнее пытается показываться, но там какая-то ошибка вылазит и я не могу на нее клацнуть мышкой)
По сути там нужно один раз клацнуть мышкой чтобы подтвердить страну или регион. Потом капча не показывается.
Вот на локальной версии она не показывается вообще.
Помогите преобразовать строку:
xE0 x90 x91 xE0 x90 xB5 xE0 x90 xBB xE0 x91 x8C xE0 x90 xB3 xE0 x90 xB8 xE0 x90 xB5 xE0 x91 x86
Судя по виду это суррогатные пары трехбайтной кодировки.
Как сделать чтобы они отображались в браузере не в виде пустых квадратов а в виде символов?
Что ж , в таком случае, хочу выразить свою благодарность на словах.
Спасибо за то, что помогаете таким новичкам как я, разбираться в тонкостях программирования.
Надеюсь Вам доставило такое же удовольствие как и мне решение этой , неразрешимой для меня, и кажется элементарной для Вас, задачи.
Ура! Кажется дело близится к развязке. Число , как я и догадывался, оказалось числом с плавающей запятой.
Ваша ссылка на конвертер из бинарников в числа с плавающей запятой (да и не только в них) многое прояснила.
+ Вам, и огромное спасибо. ( а то я уже с ума начал сходить )
Теперь осталось всего 2 нерешенные позиции в этом пакете. Одна из них состоит из 5 байт , 4 последних из них постоянно изменяются. Думаю это может быть, как Вы заметили в прошлых постах, какой-то идентификатор пакета, либо же показатель пинга (этот показатель тоже есть).
Но эту задачу постараюсь решить самостоятельно.
P.S. Блин немогу плюсануть Вам. Сказано , что у меня недостаточно сообщений для этого. Подскажите что делать?