Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Самый быстрый парсер файлов

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Описание: как это сделать?
101-s
Отправлено: 29 Ноября, 2011 - 20:42:13
Post Id


Новичок


Покинул форум
Сообщений всего: 3
Дата рег-ции: Нояб. 2011  


Помог: 0 раз(а)




Всем привет, сделал на пхп простейший парсер, он работает на домашнем компе, но тратится много времени.

Задача такая: Из файла выбрать строки, содержащие только определенные слова с помощью регулярных выражений, отбросить кое что лишнее и записать эти строки в другой файл.

Как сделал:
CODE (htmlphp):
скопировать код в буфер обмена
  1.         $preg = preg_match_all("|(.*)здесь выборка с помощью регулярного выражения(.*)\r\n|",$stroki, $massiv);
  2.         $kol_vo= count($massiv[1]) ;
  3.         //запись в файл
  4.         for($i=0; $i<$kol_vo; $i++ )
  5.         {
  6.         $new_stroka = $здесь_формируется новая строка ;
  7.         здесь строка записывается в файл
  8.         }


подскажите плиз профи, более быстрый алгоритм
 
 Top
Stierus Супермодератор
Отправлено: 30 Ноября, 2011 - 10:13:51
Post Id



Рекордсмен по количеству сообщений за 7 дней


Покинул форум
Сообщений всего: 2132
Дата рег-ции: Дек. 2008  
Откуда: Москваль


Помог: 52 раз(а)




вы действительно думаете, что этот кусок кода говорит кому-то о том, что у вас происходит? Я догадываюсь, как он работает, но это лишь мои догадки
 
My status
 Top
101-s
Отправлено: 12 Декабря, 2011 - 23:14:14
Post Id


Новичок


Покинул форум
Сообщений всего: 3
Дата рег-ции: Нояб. 2011  


Помог: 0 раз(а)




вот код
PHP:
скопировать код в буфер обмена
  1. <?PHP
  2. $ppp = 100;
  3.         //Получаем массив
  4.         $file =file_get_contents("D:\file.txt");
  5.         $preg = preg_match_all("|(.*)\t(.*)слово1\t(.*)слово2(.*)\r\n|",$file, $array);
  6.         $kol_vo4 = count($array[1]);
  7.         //Запись в файл
  8.         for($i4=0; $i4<$kol_vo4; $i4++ )
  9.         {
  10.         $content = $content.$array[1][$i4]."\t".($array[2][$i4]+$ppp+60)."\t".$array[4][$i4]."\t1\r\n" ;
  11.         $textfile->add_string_to_file("D:\result.txt",$content,0) ;
  12.         }
  13. ?>


add_string_to_file - это функция Human Emulator
add_string_to_file($file,$str,$timeout);

Данная функция используется для записи строки в файл. Строка записывается в конец файла.

Функция на вход принимает параметры

$file – путь к файлу
$str – строка
$timeout – таймаут

(Отредактировано автором: 12 Декабря, 2011 - 23:18:11)

 
 Top
DlTA
Отправлено: 12 Декабря, 2011 - 23:19:49
Post Id



Постоянный участник


Покинул форум
Сообщений всего: 2952
Дата рег-ции: Окт. 2010  


Помог: 53 раз(а)




и че?
 
 Top
101-s
Отправлено: 13 Декабря, 2011 - 21:06:39
Post Id


Новичок


Покинул форум
Сообщений всего: 3
Дата рег-ции: Нояб. 2011  


Помог: 0 раз(а)




DlTA пишет:
и че?

Подскажите плиз, может есть другие варианты?
На обработку тратится много времени
 
 Top
Okula
Отправлено: 13 Декабря, 2011 - 21:25:16
Post Id



Участник


Покинул форум
Сообщений всего: 1389
Дата рег-ции: Окт. 2010  


Помог: 42 раз(а)




Попоробуй перебрать массив циклом foreach может он побыстрее работать будет.
PHP:
скопировать код в буфер обмена
  1. $ppp = 100;
  2.  
  3.         //Получаем массив
  4.  
  5.         $file =file_get_contents("D:\file.txt");
  6.  
  7.         $preg = preg_match_all("|(.*)\t(.*)слово1\t(.*)слово2(.*)\r\n|",$file, $array);
  8.  
  9.         //Запись в файл
  10.  
  11.         foreach($array[1] as $key=>$val)
  12.  
  13.         {
  14.  
  15.         $content = $content.$val."\t".($array[2][$key]+$ppp+60)."\t".$array[4][$key]."\t1\r\n" ;
  16.  
  17.         $textfile->add_string_to_file("D:\result.txt",$content,0) ;
  18.  
  19.         }
 
 Top
DlTA
Отправлено: 14 Декабря, 2011 - 00:10:23
Post Id



Постоянный участник


Покинул форум
Сообщений всего: 2952
Дата рег-ции: Окт. 2010  


Помог: 53 раз(а)




варианты:
1) fgetcsv указав разделитель табуляцию
2) fscanf почти тоже самое, нужно указать как записаны дынне в файл

любой вариант должен работать быстрее чем регулярка, хотя возможны подтормаживания связанные с тем что файл читается не сразу а по частям
ну за то сервер будете меньше грузить)
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Работа с файловой системой и файлами »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB