PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи

Страниц (8): « 1 2 3 [4] 5 6 7 8 »

> Найдено сообщений: 112
romanov Отправлено: 25 Мая, 2012 - 14:02:15 • Тема: запуск скрипта • Форум: Операционная система и системные вызовы

Ответов: 24
Просмотров: 10198
А если нет shh
romanov Отправлено: 25 Мая, 2012 - 13:47:02 • Тема: запуск скрипта • Форум: Операционная система и системные вызовы

Ответов: 24
Просмотров: 10198
DeepVarvar, что за cli- режим , где прописать команду которую вы написали.

Просто я запускаю парсер , он должен работать около 7 часов , на рабочем сервере он работает некоторое время потом запускается заново. Если этот же скрипт запустить на локальном сервере то он проработает до конца
romanov Отправлено: 25 Мая, 2012 - 13:27:00 • Тема: запуск скрипта • Форум: Операционная система и системные вызовы

Ответов: 24
Просмотров: 10198
Всем доброго времени суток, помогите пожалуйста разобраться

Как запустить php сценарий на рабочем сервере, чтобы не происходил тайм-аут браузера или сервера не знаю как правильно.
romanov Отправлено: 23 Мая, 2012 - 00:48:07 • Тема: создать экспорт таблицы • Форум: Работа с СУБД

Ответов: 2
Просмотров: 789
Большое спасибо, очень сильно помогли, экспорт сделался как надо. Нереально вам благодарен
romanov Отправлено: 23 Мая, 2012 - 00:25:34 • Тема: создать экспорт таблицы • Форум: Работа с СУБД

Ответов: 2
Просмотров: 789
Всем доброго времени суток , подскажите как создать экспорт таблицы весом 70 Мб, при этом phpMyadmin не помогает, пользовался скриптами dumper.php, использовал программу sypex dumper. Помогите пожалуйста решит проблему очень надо.
romanov Отправлено: 14 Мая, 2012 - 23:05:05 • Тема: Нужна небольшая помощь по регулярке • Форум: Регулярные выражения

Ответов: 2
Просмотров: 134
а как дописать чтобы учитывались атрибуты width , heigth border, просто под это выражение попадают другие изображения на странице
romanov Отправлено: 14 Мая, 2012 - 22:35:25 • Тема: Нужна небольшая помощь по регулярке • Форум: Регулярные выражения

Ответов: 2
Просмотров: 134
Ребят подскажите как написать рег.выражение для следующего тега
CODE (html):
скопировать код в буфер обмена
  1. <img src="http://img.merlion.ru/items/657531_v01_m.jpg" width="167" height="225" alt="Смартфон Apple Iphone 4S 16Gb черный моноблок 3G 3.5" iOS 5 WiFi BT GPS" border="0">


Чтобы вытащить содержимое атрибута src
romanov Отправлено: 07 Мая, 2012 - 22:42:17 • Тема: Запуск скрипта из консоли • Форум: Работа с файловой системой и файлами

Ответов: 3
Просмотров: 3595
если можно поподробнее... я не врубаюсь
romanov Отправлено: 07 Мая, 2012 - 14:32:53 • Тема: Запуск скрипта из консоли • Форум: Работа с файловой системой и файлами

Ответов: 3
Просмотров: 3595
Всем доброго времени суток.

Мне необходимо запустить скрипт парсера, он выполняется и после этого происходит тайм-айт браузера, чтобы этого избежать необходимо запустить скрипт из консоли , на дом. компе есть Денвер, как из него запустить скрипт. При запуске этого скрипта из консоли , появляются ошибки. т.к. идет подключение файлов Битрикса и в консоле появляются ошибки и консоли непонятны файлы которые подключаются require($_SERVER["DOCUMENT_ROOT"]."/bitrix/modules/main/include/prolog_before.php");
они должны быть с обратными слешами ( \...\ ) .
Может быть есть какой-нибудь другой способ подключения ?
romanov Отправлено: 04 Мая, 2012 - 14:29:45 • Тема: Помогите написать небольшое регулярное выражение • Форум: Регулярные выражения

Ответов: 6
Просмотров: 324
Благодарю, выражение работает
romanov Отправлено: 04 Мая, 2012 - 14:01:26 • Тема: Помогите написать небольшое регулярное выражение • Форум: Регулярные выражения

Ответов: 6
Просмотров: 324
Есть страница с html разметкой

$html ="

<html>
<head><title></title></head>
<body>

Код таблицы который написан выше

</body>
</html>
"


Надо получить эту таблицу
romanov Отправлено: 04 Мая, 2012 - 13:53:57 • Тема: Помогите написать небольшое регулярное выражение • Форум: Регулярные выражения

Ответов: 6
Просмотров: 324
Спасибо вам за ответ, вы правильно поняли надо получить содержимое между table .... и /table но то что вы написали работает некорректно.
romanov Отправлено: 04 Мая, 2012 - 13:39:47 • Тема: Помогите написать небольшое регулярное выражение • Форум: Регулярные выражения

Ответов: 6
Просмотров: 324
Всем доброго времени суток, помогите пожалуйста написать рег.выражение которое получает теги между table

CODE (html):
скопировать код в буфер обмена
  1.  
  2. <table cellpadding="4" cellspacing="0" border="0" class="text" width="100%">
  3. <tr class="cat-r1">
  4.         <td>
  5. Высота  </td>
  6.         <td style="padding-right:10px;border-left:1px solid #ffffff;">390</td>
  7. </tr>
  8. <tr class="cat-r2">
  9.         <td>
  10. Глубина </td>
  11.         <td style="padding-right:10px;border-left:1px solid #ffffff;">98</td>
  12. </tr>
  13. <tr class="cat-r1">
  14.         <td>
  15. Вес     </td>
  16.         <td style="padding-right:10px;border-left:1px solid #ffffff;">3.2</td>
  17. </tr>
  18. <tr class="cat-r2">
  19.         <td>
  20. Диагональ       </td>
  21.         <td style="padding-right:10px;border-left:1px solid #ffffff;">21.5</td>
  22. </tr>
  23. <tr class="cat-r1">
  24.         <td>
  25. Ширина  </td>
  26.         <td style="padding-right:10px;border-left:1px solid #ffffff;">528</td>
  27. </tr>
  28. <tr class="cat-r2">
  29.         <td>
  30. Вес без подставки       </td>
  31.         <td style="padding-right:10px;border-left:1px solid #ffffff;">0</td>
  32. </tr>
  33. <tr class="cat-r1">
  34.         <td>
  35. Глубина без подставки   </td>
  36.         <td style="padding-right:10px;border-left:1px solid #ffffff;">0</td>
  37. </tr>
  38. <tr class="cat-r2">
  39.         <td>
  40. Высота без подставки    </td>
  41.         <td style="padding-right:10px;border-left:1px solid #ffffff;">0</td>
  42. </tr>
  43. <tr class="cat-r1">
  44.         <td>
  45. Ширина без подставки    </td>
  46.         <td style="padding-right:10px;border-left:1px solid #ffffff;">0</td>
  47. </tr>
  48. <tr class="cat-r2">
  49.         <td>
  50. Тип     </td>
  51.         <td style="padding-right:10px;border-left:1px solid #ffffff;">LED-телевизор</td>
  52. </tr>
  53. <tr class="cat-r1">
  54.         <td>
  55. Серия   </td>
  56.         <td style="padding-right:10px;border-left:1px solid #ffffff;">НЕТ</td>
  57. </tr>
  58. <tr class="cat-r2">
  59.         <td>
  60. Дизайн (телевизоры)     </td>
  61.         <td style="padding-right:10px;border-left:1px solid #ffffff;">НЕТ</td>
  62. </tr>
  63. <tr class="cat-r1">
  64.         <td>
  65. PatrNumber/Артикул Производителя        </td>
  66.         <td style="padding-right:10px;border-left:1px solid #ffffff;">LEM2288FDT</td>
  67. </tr>
  68. <tr class="cat-r2">
  69.         <td>
  70. Брэнд   </td>
  71.         <td style="padding-right:10px;border-left:1px solid #ffffff;">BBK</td>
  72. </tr>
  73. <tr class="cat-r1">
  74.         <td>
  75. Модель  </td>
  76.         <td style="padding-right:10px;border-left:1px solid #ffffff;">LEM2288FDT</td>
  77. </tr>
  78. <tr class="cat-r2">
  79.         <td>
  80. Диагональ экрана        </td>
  81.         <td style="padding-right:10px;border-left:1px solid #ffffff;">22" (55.88 см)</td>
  82. </tr>
  83. <tr class="cat-r1">
  84.         <td>
  85. Цвет    </td>
  86.         <td style="padding-right:10px;border-left:1px solid #ffffff;">черный металлик</td>
  87. </tr>
  88. <tr class="cat-r2">
  89.         <td>
  90. Разрешение экрана (телевизоры)  </td>
  91.         <td style="padding-right:10px;border-left:1px solid #ffffff;">FULL HD</td>
  92. </tr>
  93. <tr class="cat-r1">
  94.         <td>
  95. Поддержка 3D    </td>
  96.         <td style="padding-right:10px;border-left:1px solid #ffffff;">Нет</td>
  97. </tr>
  98.  
  99. </table>
  100.  


Пробовал получить содержимое с помощью

PHP:
скопировать код в буфер обмена
  1.  
  2. preg_match('#<table cellpadding="4" cellspacing="0" border="0" class="text" width="100%">\s+(.*?)\s+</table>#im',$content,$description);
  3.  
  4.  


не получилось
romanov Отправлено: 03 Мая, 2012 - 09:47:23 • Тема: Парсинг сайта • Форум: Хранение данных, их вывод и обработка

Ответов: 10
Просмотров: 6759
Всегда готов

Я тут немного функцию изменил

PHP:
скопировать код в буфер обмена
  1.  
  2. require_once ("simple_html_dom.php");
  3.  
  4.  
  5. // Вызываем функцию для главной страницы каталога сайта
  6. $links = parsing_page('http://www.merlion.ru/goods/catalog/cat/');
  7.  
  8. #parsing_page("http://www.merlion.ru/goods/catalog/cat/j100/j10000/p1/");
  9. function parsing_page($url)
  10.  
  11. {
  12.  
  13.         // выделяем из url страницы относительный путь
  14.         $path_url = parse_url($url);
  15.        
  16.  
  17.         // переходим на case который достает ссылки с главной страницы каталога
  18.         preg_match('#(/goods/catalog/cat/)#i',$path_url['path'], $pathmain);
  19.                
  20.         // переходим на case который достает ссылки со страниц категорий
  21.         preg_match('#(/goods/catalog/cat/\w+/\w+/)#i', $path_url['path'], $pathcat);
  22.        
  23.         // переходим на case который достает ссылки с постраничной навигации
  24.         preg_match('#(/goods/catalog/cat/\w+/\w+/\w+/)#i', $path_url['path'], $pathpages);
  25.        
  26.         preg_match('#(/goods/catalog/product/\w+/)#i', $path_url['path'], $pathdetail);
  27.  
  28.         // получаем html страницы
  29.         $merl = file_get_html($url);
  30.  
  31.         switch( $path_url['path'] ):
  32.         case $pathmain[0] :
  33.  
  34.  
  35.  
  36.                 foreach ($merl->find('div[class="catalog_link"]') as $main_container):
  37.                
  38.                 $h3 = $main_container->find("h3");
  39.  
  40.                 foreach ($main_container->find('ul[class="catalog_list"] li ul') as $ul):
  41.  
  42.                        
  43.                         foreach($ul->find('a') as $li):
  44.                                                                
  45.                     parsing_page("http://www.merlion.ru".$li->href);
  46.                                         #$main_links[] = "http://www.merlion.ru".$li->href;
  47.  
  48.                         endforeach;    
  49.                        
  50.                 endforeach;
  51.        
  52.         endforeach;
  53.        
  54.         #return $main_links;
  55.        
  56.         break;
  57.        
  58.         case $pathcat[0]:
  59.        
  60.                
  61.        
  62.                  if (preg_match_all('#(/goods/catalog/cat/\w+/\w+/\w+/)#s', $merl,$pages)):
  63.                          
  64.                          
  65.                          foreach ($pages as $page=>$pre_page):
  66.                                
  67.                                 foreach ($pre_page as $new_page):
  68.                                
  69.                                         $mas_links[]=$new_page;
  70.                                
  71.                                 endforeach;
  72.                                
  73.                                
  74.                          endforeach;
  75.                          
  76.                          $unique_keys = array_unique($mas_links);
  77.                        
  78.                         foreach ($unique_keys as $keys):
  79.                                
  80.                                 parsing_page("http://www.merlion.ru".$keys);
  81.                                 #$mas2[] = "http://www.merlion.ru".$keys;
  82.                                
  83.                         endforeach;
  84.                          
  85.                  endif;
  86.                
  87.                 #return $mas2;
  88.         break;
  89.  
  90.         case $pathpages[0]:
  91.        
  92.                 echo "1";
  93.        
  94.         /*      if (preg_match_all('#(/goods/catalog/product/\w+/)#',$merl,$detail_links)):
  95.                
  96.                
  97.                
  98.                 $links_detail = array_unique($detail_links[0]);
  99.                
  100.  
  101.                  foreach ($links_detail as $goods=>$goods_value):
  102.                
  103.                         #$mas_detail[] = "http://www.merlion.ru".$goods_value;
  104.                         parsing_page("http://www.merlion.ru".$goods_value);
  105.                
  106.                 endforeach;
  107.                
  108.                 endif;*/
  109.                
  110.                 #return $mas_detail;
  111.        
  112.         break;
  113.        
  114.        
  115.         case $pathdetail[0]:
  116.        
  117.         echo "ds";
  118.        
  119.                 $h1 = $merl->find("h1");
  120.                 echo $h1[0];
  121.        
  122.         break;
  123.        
  124.        
  125. endswitch;
  126.  
  127. }
  128.  
  129.  
  130. #foreach ($links as $return_values):
  131.        
  132.        
  133.  # $links2[] = parsing_page($return_values);
  134.  
  135. #endforeach;
  136.  
  137. #$newarr = array ( array("http://www.merlion.ru/goods/catalog/cat/e110/e11007/p1/"));
  138.  
  139. #foreach ($links2 as $return_keys=>$return_values_n):
  140.        
  141. #       foreach ($return_values_n as $product_links):
  142.        
  143. #               $links3[] = parsing_page($product_links);
  144.        
  145. #       endforeach;
  146.        
  147. #endforeach;
  148.  
  149. #echo "<pre>"; print_r($links2); echo "</pre>";
  150.  
  151.  
romanov Отправлено: 26 Апреля, 2012 - 18:05:19 • Тема: Парсинг сайта • Форум: Хранение данных, их вывод и обработка

Ответов: 10
Просмотров: 6759
уже использовал циклы вместо рекурсии не помогает

ну типа:

PHP:
скопировать код в буфер обмена
  1.  
  2. foreach ($links as $return_values):
  3.  
  4.         parsing_page($return_values);
  5.  
  6. endforeach;
  7.  

Страниц (8): « 1 2 3 [4] 5 6 7 8 »
Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB