Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770
Форумы портала PHP.SU :: Версия для печати :: Самый быстрый парсер файлов
Форумы портала PHP.SU » » Работа с файловой системой и файлами » Самый быстрый парсер файлов

Страниц (1): [1]
 

1. 101-s - 29 Ноября, 2011 - 20:42:13 - перейти к сообщению
Всем привет, сделал на пхп простейший парсер, он работает на домашнем компе, но тратится много времени.

Задача такая: Из файла выбрать строки, содержащие только определенные слова с помощью регулярных выражений, отбросить кое что лишнее и записать эти строки в другой файл.

Как сделал:
CODE (htmlphp):
скопировать код в буфер обмена
  1.         $preg = preg_match_all("|(.*)здесь выборка с помощью регулярного выражения(.*)\r\n|",$stroki, $massiv);
  2.         $kol_vo= count($massiv[1]) ;
  3.         //запись в файл
  4.         for($i=0; $i<$kol_vo; $i++ )
  5.         {
  6.         $new_stroka = $здесь_формируется новая строка ;
  7.         здесь строка записывается в файл
  8.         }


подскажите плиз профи, более быстрый алгоритм
2. Stierus - 30 Ноября, 2011 - 10:13:51 - перейти к сообщению
вы действительно думаете, что этот кусок кода говорит кому-то о том, что у вас происходит? Я догадываюсь, как он работает, но это лишь мои догадки
3. 101-s - 12 Декабря, 2011 - 23:14:14 - перейти к сообщению
вот код
PHP:
скопировать код в буфер обмена
  1. <?PHP
  2. $ppp = 100;
  3.         //Получаем массив
  4.         $file =file_get_contents("D:\file.txt");
  5.         $preg = preg_match_all("|(.*)\t(.*)слово1\t(.*)слово2(.*)\r\n|",$file, $array);
  6.         $kol_vo4 = count($array[1]);
  7.         //Запись в файл
  8.         for($i4=0; $i4<$kol_vo4; $i4++ )
  9.         {
  10.         $content = $content.$array[1][$i4]."\t".($array[2][$i4]+$ppp+60)."\t".$array[4][$i4]."\t1\r\n" ;
  11.         $textfile->add_string_to_file("D:\result.txt",$content,0) ;
  12.         }
  13. ?>


add_string_to_file - это функция Human Emulator
add_string_to_file($file,$str,$timeout);

Данная функция используется для записи строки в файл. Строка записывается в конец файла.

Функция на вход принимает параметры

$file – путь к файлу
$str – строка
$timeout – таймаут
4. DlTA - 12 Декабря, 2011 - 23:19:49 - перейти к сообщению
и че?
5. 101-s - 13 Декабря, 2011 - 21:06:39 - перейти к сообщению
DlTA пишет:
и че?

Подскажите плиз, может есть другие варианты?
На обработку тратится много времени
6. Okula - 13 Декабря, 2011 - 21:25:16 - перейти к сообщению
Попоробуй перебрать массив циклом foreach может он побыстрее работать будет.
PHP:
скопировать код в буфер обмена
  1. $ppp = 100;
  2.  
  3.         //Получаем массив
  4.  
  5.         $file =file_get_contents("D:\file.txt");
  6.  
  7.         $preg = preg_match_all("|(.*)\t(.*)слово1\t(.*)слово2(.*)\r\n|",$file, $array);
  8.  
  9.         //Запись в файл
  10.  
  11.         foreach($array[1] as $key=>$val)
  12.  
  13.         {
  14.  
  15.         $content = $content.$val."\t".($array[2][$key]+$ppp+60)."\t".$array[4][$key]."\t1\r\n" ;
  16.  
  17.         $textfile->add_string_to_file("D:\result.txt",$content,0) ;
  18.  
  19.         }
7. DlTA - 14 Декабря, 2011 - 00:10:23 - перейти к сообщению
варианты:
1) fgetcsv указав разделитель табуляцию
2) fscanf почти тоже самое, нужно указать как записаны дынне в файл

любой вариант должен работать быстрее чем регулярка, хотя возможны подтормаживания связанные с тем что файл читается не сразу а по частям
ну за то сервер будете меньше грузить)

 

Powered by ExBB FM 1.0 RC1