Форумы портала PHP.SU :: Версия для печати :: Вытаскивать текст с сайта

1. supmener - 21 Июня, 2013 - 10:51:09 - перейти к сообщению

Есть страницы с определенным форматированием. Пример:
http://zhurnalko[dot]net/=nauka-i-te[dot][dot][dot]hi/2009-07--num4
На них 2 кнопки: "картинка" и "текст". Внизу ссылки на другие связанные страницы. Как можно вытаскивать текстовую часть из каждой страницы? За готовый работающий проверенный код (есть установленный Денвер) готов отблагодарить материально. Записывать весь документ нужно не постранично, а в один файл.

2. AlexAnder - 21 Июня, 2013 - 11:04:51 - перейти к сообщению

в процессе Улыбка

(Добавление)
HTML теги нужны?

3. supmener - 21 Июня, 2013 - 11:22:06 - перейти к сообщению

HTML теги не нужны

Есть еще работа, основанная на этом задании, более повышенного уровня сложности:
а). Выкачивать с адреса более верхнего уровня:
http://zhurnalko[dot]net/journal-2 (каждый месяц писать в отдельный файл, годы группировать в разные папки)

Под пунктом б) не знаю, осуществимо ли такое.
б). Резать постатейно, беря из файлов разделители.

Во вложении пример разделителей для резки на статьи. Разделитель = именам файлам, порезанным в этих местах. Расширение txt. По быстрому схожу в магазин, затем буду на связи во время обеда, потом пойду подстригаться.