Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: как читать файл по строке в кодировке utf-8

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
DlTA
Отправлено: 24 Августа, 2016 - 16:53:38
Post Id



Постоянный участник


Покинул форум
Сообщений всего: 2952
Дата рег-ции: Окт. 2010  


Помог: 53 раз(а)




у меня файл в кодировке utf-8, нужно прочитать часть файла
найти в файле данные.

как прочитать файл?? он очень большой (почти 2 гига) и как то это нужно сделать по частям?

данные в файле не разбиты на строчки.
(Добавление)
в общем, мое решение (надеюсь что получится)

читаем из файла по байту fgetc()
по правилам https://ru[dot]wikipedia[dot]org/wiki/UTF-8
получается первый байт это типа указатель на количество следующий байт
каждый следующий байт состоит из 10111111

в общем все будет тормозяво но вроде рабочее.
 
 Top
dcc0
Отправлено: 25 Августа, 2016 - 13:44:52
Post Id


Участник


Покинул форум
Сообщений всего: 1043
Дата рег-ции: Июль 2014  


Помог: 10 раз(а)




PHP:
скопировать код в буфер обмена
  1. читаем из файла по байту fgetc()

Субъективно, чота как-то не айс
Я бы примерно так сделал , правда с оговоркой, что доступ к проекту имеет ограничение
system(grep патттерн)

Можно еще сделать алгоритм, который будет бить файл на несколько "временных" частей
И искать в этих частях, причем, скорее всего, в два шага (если вдруг шаблон поиска окажется на стыке).

(Отредактировано автором: 25 Августа, 2016 - 14:01:16)



-----
Март 2021. Бросил программирование
 
 Top
DlTA
Отправлено: 25 Августа, 2016 - 17:30:54
Post Id



Постоянный участник


Покинул форум
Сообщений всего: 2952
Дата рег-ции: Окт. 2010  


Помог: 53 раз(а)




для начала таки забил, и в линухе перекодил файл в cp1251

там же в joe частично убрал лишний текст (как же это все тормозит !!!!!)

ну а час пытаюсь разбить на чет по меньше

но опять не понятно как бы это не здохло
 
 Top
dcc0
Отправлено: 25 Августа, 2016 - 18:34:57
Post Id


Участник


Покинул форум
Сообщений всего: 1043
Дата рег-ции: Июль 2014  


Помог: 10 раз(а)




"10 отличных примеров просмотра больших файлов в линуксе"

http://gnu[dot]su/news.php?extend[dot]1464

Нужно только передать php


-----
Март 2021. Бросил программирование
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Кодировки и все смежное »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB