Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770
Форумы портала PHP.SU :: Версия для печати :: Вытаскивать текст с сайта
Форумы портала PHP.SU » Объявления » FreeLance » Вытаскивать текст с сайта

Страниц (1): [1]
 

1. supmener - 21 Июня, 2013 - 10:51:09 - перейти к сообщению
Есть страницы с определенным форматированием. Пример:
http://zhurnalko[dot]net/=nauka-i-te[dot][dot][dot]hi/2009-07--num4
На них 2 кнопки: "картинка" и "текст". Внизу ссылки на другие связанные страницы. Как можно вытаскивать текстовую часть из каждой страницы? За готовый работающий проверенный код (есть установленный Денвер) готов отблагодарить материально. Записывать весь документ нужно не постранично, а в один файл.
2. AlexAnder - 21 Июня, 2013 - 11:04:51 - перейти к сообщению
в процессе Улыбка
(Добавление)
HTML теги нужны?
3. supmener - 21 Июня, 2013 - 11:22:06 - перейти к сообщению
HTML теги не нужны

Есть еще работа, основанная на этом задании, более повышенного уровня сложности:
а). Выкачивать с адреса более верхнего уровня:
http://zhurnalko[dot]net/journal-2 (каждый месяц писать в отдельный файл, годы группировать в разные папки)

Под пунктом б) не знаю, осуществимо ли такое.
б). Резать постатейно, беря из файлов разделители.

Во вложении пример разделителей для резки на статьи. Разделитель = именам файлам, порезанным в этих местах. Расширение txt. По быстрому схожу в магазин, затем буду на связи во время обеда, потом пойду подстригаться.

 

Powered by ExBB FM 1.0 RC1