Тема, условно говоря, "парсинга", заезжена донельзя, но, за 2 месяца поисков, нужной информации я в сети не встретил.
Возникло желание формировать «корзину заказа» на drupal-потале (посредник по доставке интернет-товаров), при просмотре страниц, непосредственно, самих интернет-магазинов.
Цель – максимально облегчить свой сайт, не перегружая его 10ти тысячной базой чужих данных. Кроме того, в таком случае, будет учитываться динамическое изменение позиций по наличию товара. Парсер, в чистом виде, слишком тяжеловесная штука.
В HTML-коде страницы , в явной форме, нужная информация не содержится (как например, на sportsdirect.com).
iFrame… HtmlUnit… html2canvas… парсер-модули… удаленный прокси… может, скриншоты :)
Не прошу готового решения. Просто подскажите, please, общий метод подхода к поставленной задаче.
З.Ы. Понимаю, что проще всего заказать у проффесионала, но хочется разобраться в «матчасти» самому (хотя бы для формирования толкового ТЗ).
|