Есть страницы с определенным форматированием. Пример:
http://zhurnalko[dot]net/=nauka-i-te[dot][dot][dot]hi/2009-07--num4
На них 2 кнопки: "картинка" и "текст". Внизу ссылки на другие связанные страницы. Как можно вытаскивать текстовую часть из каждой страницы? За готовый работающий проверенный код (есть установленный Денвер) готов отблагодарить материально. Записывать весь документ нужно не постранично, а в один файл.
1. supmener - 21 Июня, 2013 - 10:51:09 - перейти к сообщению
2. AlexAnder - 21 Июня, 2013 - 11:04:51 - перейти к сообщению
в процессе
(Добавление)
HTML теги нужны?
(Добавление)
HTML теги нужны?
3. supmener - 21 Июня, 2013 - 11:22:06 - перейти к сообщению
HTML теги не нужны
Есть еще работа, основанная на этом задании, более повышенного уровня сложности:
а). Выкачивать с адреса более верхнего уровня:
http://zhurnalko[dot]net/journal-2 (каждый месяц писать в отдельный файл, годы группировать в разные папки)
Под пунктом б) не знаю, осуществимо ли такое.
б). Резать постатейно, беря из файлов разделители.
Во вложении пример разделителей для резки на статьи. Разделитель = именам файлам, порезанным в этих местах. Расширение txt. По быстрому схожу в магазин, затем буду на связи во время обеда, потом пойду подстригаться.
Есть еще работа, основанная на этом задании, более повышенного уровня сложности:
а). Выкачивать с адреса более верхнего уровня:
http://zhurnalko[dot]net/journal-2 (каждый месяц писать в отдельный файл, годы группировать в разные папки)
Под пунктом б) не знаю, осуществимо ли такое.
б). Резать постатейно, беря из файлов разделители.
Во вложении пример разделителей для резки на статьи. Разделитель = именам файлам, порезанным в этих местах. Расширение txt. По быстрому схожу в магазин, затем буду на связи во время обеда, потом пойду подстригаться.