Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Распарисить форум

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (2): [1] 2 »   

> Без описания
difight
Отправлено: 09 Ноября, 2011 - 18:47:20
Post Id



Посетитель


Покинул форум
Сообщений всего: 355
Дата рег-ции: Нояб. 2011  


Помог: 3 раз(а)




Занимался кто нить когда нить парсингом форумов ?. Посоветуйте как лучше, что бы не забанили, может у кого наработки остались, буду благодарен.
 
My status
 Top
LIME
Отправлено: 09 Ноября, 2011 - 18:52:52
Post Id


Активный участник


Покинул форум
Сообщений всего: 10732
Дата рег-ции: Нояб. 2010  


Помог: 322 раз(а)




difight при парсинге не могут банить
 
 Top
Данил_123
Отправлено: 09 Ноября, 2011 - 19:05:58
Post Id


Участник


Покинул форум
Сообщений всего: 1026
Дата рег-ции: Июнь 2011  
Откуда: rostov


Помог: 9 раз(а)






-----
http://mysitecost.ru
 
 Top
difight
Отправлено: 09 Ноября, 2011 - 19:15:07
Post Id



Посетитель


Покинул форум
Сообщений всего: 355
Дата рег-ции: Нояб. 2011  


Помог: 3 раз(а)




LIME пишет:
difight при парсинге не могут банить
Разве? Меня чё то уверяют что могут, мол как то лучше парсить по частям постраничноУлыбка
(Добавление)
Данил_123 пишет:
клац
Бонально, парсить я парсил сайты, мне интересный сами нюансы при парсинге форумов, может какие специальные готовые инструменты, решения есть что бы велосипед не изобретать
 
My status
 Top
LIME
Отправлено: 09 Ноября, 2011 - 19:28:18
Post Id


Активный участник


Покинул форум
Сообщений всего: 10732
Дата рег-ции: Нояб. 2010  


Помог: 322 раз(а)




difight а какой еще вариант?))
скачать все страницы в массив?
вы начните если забанят помогу
 
 Top
difight
Отправлено: 09 Ноября, 2011 - 19:32:08
Post Id



Посетитель


Покинул форум
Сообщений всего: 355
Дата рег-ции: Нояб. 2011  


Помог: 3 раз(а)




LIME пишет:
difight а какой еще вариант?))
скачать все страницы в массив?
вы начните если забанят помогу

Да я не про парсинг данного форума я в принципе спрашиваюУлыбка))
 
My status
 Top
LIME
Отправлено: 09 Ноября, 2011 - 19:36:23
Post Id


Активный участник


Покинул форум
Сообщений всего: 10732
Дата рег-ции: Нояб. 2010  


Помог: 322 раз(а)




и я в принципе
если боитесь пользуйте прокси
curl и пркси меняйте в цикле
хватит нескольких
(Добавление)
будет медленнее
 
 Top
difight
Отправлено: 09 Ноября, 2011 - 19:54:24
Post Id



Посетитель


Покинул форум
Сообщений всего: 355
Дата рег-ции: Нояб. 2011  


Помог: 3 раз(а)




LIME пишет:
будет медленнее

ну смотри я раньше такой парсил конструкцией
CODE (htmlphp):
скопировать код в буфер обмена
  1. $code = file_get_contents($url);
  2. $patternlink = '/<span class="BigNnice">(.*?)<\/span>/';
  3. preg_match_all($patternlink, $code, $found);
такой не должны забанить?Улыбка
 
My status
 Top
LIME
Отправлено: 09 Ноября, 2011 - 19:57:07
Post Id


Активный участник


Покинул форум
Сообщений всего: 10732
Дата рег-ции: Нояб. 2010  


Помог: 322 раз(а)




difight такой на форуме не сработает
курите curl
 
 Top
difight
Отправлено: 09 Ноября, 2011 - 19:57:42
Post Id



Посетитель


Покинул форум
Сообщений всего: 355
Дата рег-ции: Нояб. 2011  


Помог: 3 раз(а)




LIME пишет:
difight такой на форуме не сработает
курите curl
Хорошо, спасибо, буду разбираться!
 
My status
 Top
LIME
Отправлено: 09 Ноября, 2011 - 19:59:30
Post Id


Активный участник


Покинул форум
Сообщений всего: 10732
Дата рег-ции: Нояб. 2010  


Помог: 322 раз(а)




 
 Top
difight
Отправлено: 09 Ноября, 2011 - 20:26:15
Post Id



Посетитель


Покинул форум
Сообщений всего: 355
Дата рег-ции: Нояб. 2011  


Помог: 3 раз(а)





хм а если на хостинге он не подключен как быть ?Улыбка Или я чё то не то делаю но примеры найдены мной вообще никаких действий не производят
 
My status
 Top
LIME
Отправлено: 09 Ноября, 2011 - 20:30:06
Post Id


Активный участник


Покинул форум
Сообщений всего: 10732
Дата рег-ции: Нояб. 2010  


Помог: 322 раз(а)




difight phpinfo()
пояснения надо?
 
 Top
difight
Отправлено: 09 Ноября, 2011 - 20:34:33
Post Id



Посетитель


Покинул форум
Сообщений всего: 355
Дата рег-ции: Нояб. 2011  


Помог: 3 раз(а)




LIME пишет:
difight phpinfo()
пояснения надо?

все разобрался, мой касяк был, спасибо еще раз!
 
My status
 Top
difight
Отправлено: 10 Ноября, 2011 - 15:18:34
Post Id



Посетитель


Покинул форум
Сообщений всего: 355
Дата рег-ции: Нояб. 2011  


Помог: 3 раз(а)




Столкнулся с проблемой вот Задача распарсить сообщения в форуме так вот парсится по такому шаблону
PHP:
скопировать код в буфер обмена
  1.  
  2. $patternlink = '/<div class="postbody">(.*?)<\/div>/';
  3. preg_match_all($patternlink, $text2, $zfound);
  4.  

но в результате он вытягивает мне помимо сообщения в элементы массива и подписи и структуру типа

как быть кто что посоветует?
 
My status
 Top
Страниц (2): [1] 2 »
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Напишите за меня, пожалуйста »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB