Haron пишет:Я встречал разной степени костылистости решения, встречал способы на паттернах, на основе подсчёта частот символов и их биграмм, и т. д.
К сожалению, только так.
Можно еще иметь словари буквосочетаний. Тогда повысится степень правильности определиния кодировки текста с реальными словами, но, скорее всего, оно того не будет стоить. Универсального стопроцентного способа определить кодировку произвольной строки нету
|