PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (2): « 1 [2]   

> Без описания
DeepVarvar Супермодератор
Отправлено: 09 Июля, 2015 - 16:49:10
Post Id



Активный участник


Покинул форум
Сообщений всего: 10421
Дата рег-ции: Дек. 2008  
Откуда: Альфа Центавра


Помог: 353 раз(а)




Щас еще придет Арманчо и скажет что симплехмл полный кал ))
 
 Top
esterio
Отправлено: 09 Июля, 2015 - 16:51:11
Post Id



Активный участник


Покинул форум
Сообщений всего: 5016
Дата рег-ции: Нояб. 2012  
Откуда: Украина, Львов


Помог: 127 раз(а)




если флудить то по полной
PHP:
скопировать код в буфер обмена
  1. $doc = new DOMDocument();
  2. $doc->loadHTML($content);
  3. $html = simplexml_import_dom($doc);
  4. $xpath = $html->xpath(".//*[@id='index']/ul");
  5. foreach($xpath[0]->li as $li)
  6. {
  7.         //
  8. }
 
 Top
DeepVarvar Супермодератор
Отправлено: 09 Июля, 2015 - 16:56:37
Post Id



Активный участник


Покинул форум
Сообщений всего: 10421
Дата рег-ции: Дек. 2008  
Откуда: Альфа Центавра


Помог: 353 раз(а)




Не надо флудить. Надо делать:

PHP:
скопировать код в буфер обмена
  1. $enc  = 'utf-8';
  2. $content = mb_convert_encoding($content, 'HTML-ENTITIES', $enc);
  3. $dom = new DOMDocument('1.0', $enc);
  4. @ $dom->loadHTML($content);
  5. $xpath = new DOMXPath($dom);

Так еще ошибки исправит если они будут и не высрет нотисы.
 
 Top
esterio
Отправлено: 09 Июля, 2015 - 17:07:21
Post Id



Активный участник


Покинул форум
Сообщений всего: 5016
Дата рег-ции: Нояб. 2012  
Откуда: Украина, Львов


Помог: 127 раз(а)




ну подавлять ошибкы loadHTML по любому надо. Хотя небольшой тест на главной странице докы показал валидный HTML
 
 Top
DeepVarvar Супермодератор
Отправлено: 09 Июля, 2015 - 17:14:17
Post Id



Активный участник


Покинул форум
Сообщений всего: 10421
Дата рег-ции: Дек. 2008  
Откуда: Альфа Центавра


Помог: 353 раз(а)




Ну, короче ты забрал себе задачу парсера?
 
 Top
esterio
Отправлено: 09 Июля, 2015 - 17:21:49
Post Id



Активный участник


Покинул форум
Сообщений всего: 5016
Дата рег-ции: Нояб. 2012  
Откуда: Украина, Львов


Помог: 127 раз(а)




DeepVarvar
Похоже на то
 
 Top
DeepVarvar Супермодератор
Отправлено: 09 Июля, 2015 - 17:28:45
Post Id



Активный участник


Покинул форум
Сообщений всего: 10421
Дата рег-ции: Дек. 2008  
Откуда: Альфа Центавра


Помог: 353 раз(а)




Ну тогда за тобой закрепилось.

Из того что я не описал:

В итоге нужно получить дерево, чтобы была возможность построить хлебные крошки.
Пили пока не внедренное, просто свою директорию и свой дампик.
Как только будет полурабочий вариант -- маякни, воткнем как контроллер для крона.
И продолжишь улучшать и дорабатывать уже внутри движка.
 
 Top
DeepVarvar Супермодератор
Отправлено: 10 Июля, 2015 - 00:46:40
Post Id



Активный участник


Покинул форум
Сообщений всего: 10421
Дата рег-ции: Дек. 2008  
Откуда: Альфа Центавра


Помог: 353 раз(а)




Добавил модуль и основные контроллеры для документации.

На сайте работает примерно вот так:
CODE (URI):
скопировать код в буфер обмена
  1. /documentation/manual/function/imagecreatefromjpeg


Для крона в кли режиме примерно вот так (покажет статус, не знаю нужно ли это вообще, но добавил для примера):
CODE (bash):
скопировать код в буфер обмена
  1. ~$ /usr/bin/php /path/do/public_html/index.php --request /documentation/parser


Или так (типа запуск самого процесса парсинга):
CODE (bash):
скопировать код в буфер обмена
  1. ~$ /usr/bin/php /path/do/public_html/index.php --request /documentation/parser/run
 
 Top
Страниц (2): « 1 [2]
Сейчас эту тему просматривают: 1 (гостей: 1, зарегистрированных: 0)
« Колонка администратора »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB