Ответов: 0 Просмотров: 1437
|
Всех приветствую!
Стоит такая задача:
Есть html-файл (может быть в разных кодировках, напр. charset=us-ascii или charset=windows-1251) сконвертированный с mht-архива, распарсиваю его по разделам и записываю в базу в php-скрипте.
Кодировку php-скрипту header'ом не задаю, база в UTF-8.
Когда парситься файл с charset=us-ascii, в базу пишется все гуд, когда файл имеет charset=windows-1251 - в базу пишется абракадабра.
Пробовал конвертировать строку файл с charset=windows-1251 с помощью mb_convert_encoding($str, 'utf-8', 'windows-1251') - пишеться другая кадабра в базу.
Подскажите в какую сторону рыть? Толковый мануал? У кого есть опыт?
Спасибо |