Спасибо DeepVarvar. Всегда у тебя имеется, что ответить по делу. Прикрутил к винде iconv - конвертит. Скрипт мой барахло. Конва бысрее работает. Плюс, на 30 мб куске, в ходе проб, скрипт нашел нечетный, ненулевой байт (всего 15 - а сколько их на 45 г), а значит перекодировать правильно моей логикой не получится. Конва, без //ignore не стопарнулась, значит эти символы ей подвластны. Поставил на конвертацию. Ориентировочное время 6 часов.
P.S. Вообще сколько проблем из за этих кодировок. Все было бы проще, если бы болтали на одном языке. Представляю как все ужасно у китайцев. У них ведь буква, по сути, является словом. Представляю как выглядит их азбука - что то на вроде нашего толкового словаря...
|