PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи

Страниц (1): [1]

> Найдено сообщений: 2
tutSV Отправлено: 16 Сентября, 2015 - 19:23:07 • Тема: Вопрос по парсингу с PHP Simple HTML DOM Parser • Форум: Вопросы новичков

Ответов: 2
Просмотров: 197


Посмотрел. Да, желтые страницы. Да, Екатеринбург. И?
tutSV Отправлено: 15 Сентября, 2015 - 21:36:22 • Тема: Вопрос по парсингу с PHP Simple HTML DOM Parser • Форум: Вопросы новичков

Ответов: 2
Просмотров: 197
Добрый вечер.

Имеется каталог желтые страницы: 100 000 фирм по всей стране, из которых интересны только 300 (один город).

1. На каждую фирму 1 страница, из которой выбираем 20 текстовых блоков с необходимой информацией. Урл каждой страницы примерно www[dot]yp[dot]ru/firm/85365

2. Список этих фирм выглядит так: селекторы, потом список из 20 фирм и таких 5000 страниц. Урл примерно такой: www.yp.ru/search.

Теперь собственно вопрос: существует ли какая-либо возможность вытащить из объема информации с такой структурой только необходимую с фильтром по городу? И как это сделать?

Или нужно вытаскивать все подряд, в т.ч. и ненужное, и уже здесь локально дополнительно выбирать только то, что нужно (один город)?

Второй вариант мне кажется более тупым, но реальным, но первый вариант более правильным.

Что скажете? Как лучше?

Страниц (1): [1]
Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB