PHP.SU

Программирование на PHP, MySQL и другие веб-технологии

PHP.SU Портал

Главная

Помощь

Поиск

Поиск Яндекс Вакансии

Пользователи

Здравствуйте, Гость

( Вход · Регистрация · Правила форума )

Забыли пароль?

Шифр Цезаря на php (?¿)

Форумы портала PHP.SU » PHP » Программирование на PHP » Вопросы новичков (Модераторы: OrmaJever, Саныч, Строитель)

Страниц (2): [1] 2 »

Описание: Криптоанализ шифра Цезаря

Поиск в теме | Версия для печати

Aleri	Отправлено: 06 Февраля, 2021 - 01:05:45
Новичок Покинул форум Сообщений всего: 16 Дата рег-ции: Янв. 2021 Помог: 0 раз(а)	Хех, здравствуйте, я снова здесь и проблемы реализации размером со знатный такой вагон и маленькую тележку, разумеется, тоже со мной. Мне необходимо осуществить программный взлом шифра Цезаря Ориентировочный алгоритм (постановка задачи): 1. Определить частоты символов алфавита. Занести их в массив FiA. 2. Определить частоты символов шифротекста. Занести их в массив FiC: а) вычислить сколько раз случается тот или иной символ в шифротексте (занести в массив freq) б) определить количество символов в шифротексте (l) в) нормировать частоты символов, вычисленные в пункте 2 (a), результат поместить в массив FiC, то есть FiC[i]=freq[i]/l. 3. Найти такое значение k, при котором сумма одноименных разниц d была бы минимальной: а) вычислить для всех значений k=0,1, ..., 26 суммы разниц d=∑_(j=0)^26\|FiA[j]-FiC[m]\|, где m= (j-k+27) mod27 б) найти минимальную сумму разниц d; в) запомнить значение k. 4. Расшифровать шифротекст, используя ключ k. Но алгоритм выше, можно применять к текстам только английского языка. Это объясняется тем, что процесс анализа шифротекста выполнялся по модулю 27 (26 букв латинского алфавита и пробел). В случае анализа шифров других языков необходимо изменить в зависимости от количества букв в алфавите рассматриваемого значения модуля, по которому ведется анализ (русский) Я перевернула весь Интернет в поисках хоть чего-то, отдалённо приближенного к истине, но ничегошеньки похожего мне найти не удалось, кругом одна лишь зашифровка, может кто-то уже сталкивался с похожим заданием, ибо у меня руки опускаются, а понимания совсем нет (ниже прикреплю сам файл таблицы с алфавитом и шифротекстом). Дайте обратную связь, если у вас есть хоть какое-то понимание происходящего Скачать файл: Таблицa + Шифротекст.docx Скачан раз: 32 (Отредактировано автором: 06 Февраля, 2021 - 12:17:19)

Vladimir Kheifets	Отправлено: 06 Февраля, 2021 - 16:03:18
Частый посетитель Покинул форум Сообщений всего: 879 Дата рег-ции: Март 2017 Откуда: Германия, Бавария Помог: 37 раз(а)	Aleri пишет: Мне необходимо осуществить программный взлом шифра Цезаря Дайте обратную связь, если у вас есть хоть какое-то понимание происходящего Добрый день! Вы приложили Ворд документ. В таблице2 потерян символ "ь" м.б ещё что-то неверно. Вероятно и в самом тексте для расшифровки тоже есть ошибки, потому, что результат получается странный Цитата: е одной интересной функцией программ влетс стеганографи теганографи то возможност прикреплени ифротекста в лбой файл с сохранением его работоспособности одобно тому как револционер писали писма молоком на полх книг так и здес заифрованнй текст можно записат например в файл картинки никто не догадаетс то фотографии которми в обмениваетес с ваим деловм партнером содержат секретну информаци Массивы сделал, но для поиска ключа не использовал. Результат получен перебором. Ключь шифрования -9 Спойлер (Отобразить) PHP: скопировать код в буфер обмена <? echo "<pre>"; $table2 = [ " "=>0.175, "А"=>0.062, "Б"=>0.014, "В"=>0.038, "Г"=>0.013, "Д"=>0.025, "Е"=>0.072, "Ж"=>0.007, "З"=>0.016, "И"=>0.062, "Й"=>0.010, "К"=>0.028, "Л"=>0.035, "М"=>0.026, "Н"=>0.053, "О"=>0.090, "П"=>0.023, "Р"=>0.040, "С"=>0.045, "Т"=>0.053, "У"=>0.021, "Ф"=>0.002, "Х"=>0.009, "Ц"=>0.004, "Ч"=>0.012, "Ш"=>0.006, "Щ"=>0.003, "Ъ"=>0.014, "Ы"=>0.016, "Ь"=>0.016, "Э"=>0.003, "Ю"=>0.006, "Я"=>0.018 ]; $alphabet = []; foreach ($table2 as $symbol => $frequency) { $symbol = mb_strtolower($symbol); $FiA[$symbol] = $frequency; $alphabet[] = $symbol; } echo "<hr>Array FiA<br>"; print_r($FiA); $alphabet_f=array_flip($alphabet); $text = "боичнцчтисцыощоъцчтиэьцуясотишщчмщйххгизлфзоыъзиъыомйцчмщйэсзиыомйцчмщйэсзииеычилчрхчпцчъыдишщсущошфоцсзиасэщчыоуъыйилифжкчтиэйтфиъиъчющйцоцсохиомчищйкчычъшчъчкцчъысичнчкцчиычхьиуйуищолчфжясчцощгишсъйфсишсъдхйихчфчучхицйишчфзюиуцсмиыйуисирноъдирйасэщчлйццгтиыоуъыихчпцчирйшсъйыдицйшщсхощилиэйтфиуйщысцусиицсуычицоинчмйнйоыъзи ычиэчычмщйэссиучычщгхсилгичкхоцслйоыоъдиъилйасхинофчлгхишйщыцощчхиъчнощпйыиъоущоыцьжисцэчщхйясжи"; $buf = preg_split('//u', $text, null, PREG_SPLIT_NO_EMPTY); // Определяем частоты символов шифротекста $uniq_buf = array_unique($buf); $buf_count = count($buf); $FiC = []; $symbol_frequency=[]; foreach ($uniq_buf as $i => $vu) { foreach($buf as $v) { if($v===$vu) $symbol_frequency[$i]++; } } foreach($symbol_frequency as $i=>$vu) { $symbol=$uniq_buf[$i]; $FiC[$symbol] = number_format($vu/$buf_count,3); } echo "<hr>Array FiC<br>"; print_r($FiC); echo "<hr>"; //Расшифровака с перебором ключей (без учёта частоты) for($key=1;$key<=count($FiA);$key++) { echo "key: $key<br>"; foreach($buf as $symbol) { $ind=$alphabet_f[$symbol]; echo $alphabet[$ind+$key]; } echo "<br>~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~<br>"; echo "key: -$key<br>"; foreach($buf as $symbol) { $ind=$alphabet_f[$symbol]; echo $alphabet[$ind-$key]; } echo "<hr>"; } /* key: -9 е одной интересной функцией программ влетс стеганографи теганографи то возможност прикреплени ифротекста в лбой файл с сохранением его работоспособности одобно тому как револционер писали писма молоком на полх книг так и здес заифрованнй текст можно записат например в файл картинки никто не догадаетс то фотографии которми в обмениваетес с ваим деловм партнером содержат секретну информаци / ?> Когда разберётесь с данными, приложите их,пожалуйста, в .тхт файле. Удачи! (Отредактировано автором: 06 Февраля, 2021 - 16:04:08)*

Aleri	Отправлено: 06 Февраля, 2021 - 18:11:43
Новичок Покинул форум Сообщений всего: 16 Дата рег-ции: Янв. 2021 Помог: 0 раз(а)	Vladimir Kheifets пишет: Aleri пишет: Мне необходимо осуществить программный взлом шифра Цезаря Дайте обратную связь, если у вас есть хоть какое-то понимание происходящего Добрый день! Вы приложили Ворд документ. В таблице2 потерян символ "ь" м.б ещё что-то неверно. Вероятно и в самом тексте для расшифровки тоже есть ошибки, потому, что результат получается странный Цитата: е одной интересной функцией программ влетс стеганографи теганографи то возможност прикреплени ифротекста в лбой файл с сохранением его работоспособности одобно тому как револционер писали писма молоком на полх книг так и здес заифрованнй текст можно записат например в файл картинки никто не догадаетс то фотографии которми в обмениваетес с ваим деловм партнером содержат секретну информаци Массивы сделал, но для поиска ключа не использовал. Результат получен перебором. Ключь шифрования -9 Спойлер (Отобразить) PHP: скопировать код в буфер обмена <? echo "<pre>"; $table2 = [ " "=>0.175, "А"=>0.062, "Б"=>0.014, "В"=>0.038, "Г"=>0.013, "Д"=>0.025, "Е"=>0.072, "Ж"=>0.007, "З"=>0.016, "И"=>0.062, "Й"=>0.010, "К"=>0.028, "Л"=>0.035, "М"=>0.026, "Н"=>0.053, "О"=>0.090, "П"=>0.023, "Р"=>0.040, "С"=>0.045, "Т"=>0.053, "У"=>0.021, "Ф"=>0.002, "Х"=>0.009, "Ц"=>0.004, "Ч"=>0.012, "Ш"=>0.006, "Щ"=>0.003, "Ъ"=>0.014, "Ы"=>0.016, "Ь"=>0.016, "Э"=>0.003, "Ю"=>0.006, "Я"=>0.018 ]; $alphabet = []; foreach ($table2 as $symbol => $frequency) { $symbol = mb_strtolower($symbol); $FiA[$symbol] = $frequency; $alphabet[] = $symbol; } echo "<hr>Array FiA<br>"; print_r($FiA); $alphabet_f=array_flip($alphabet); $text = "боичнцчтисцыощоъцчтиэьцуясотишщчмщйххгизлфзоыъзиъыомйцчмщйэсзиыомйцчмщйэсзииеычилчрхчпцчъыдишщсущошфоцсзиасэщчыоуъыйилифжкчтиэйтфиъиъчющйцоцсохиомчищйкчычъшчъчкцчъысичнчкцчиычхьиуйуищолчфжясчцощгишсъйфсишсъдхйихчфчучхицйишчфзюиуцсмиыйуисирноъдирйасэщчлйццгтиыоуъыихчпцчирйшсъйыдицйшщсхощилиэйтфиуйщысцусиицсуычицоинчмйнйоыъзи ычиэчычмщйэссиучычщгхсилгичкхоцслйоыоъдиъилйасхинофчлгхишйщыцощчхиъчнощпйыиъоущоыцьжисцэчщхйясжи"; $buf = preg_split('//u', $text, null, PREG_SPLIT_NO_EMPTY); // Определяем частоты символов шифротекста $uniq_buf = array_unique($buf); $buf_count = count($buf); $FiC = []; $symbol_frequency=[]; foreach ($uniq_buf as $i => $vu) { foreach($buf as $v) { if($v===$vu) $symbol_frequency[$i]++; } } foreach($symbol_frequency as $i=>$vu) { $symbol=$uniq_buf[$i]; $FiC[$symbol] = number_format($vu/$buf_count,3); } echo "<hr>Array FiC<br>"; print_r($FiC); echo "<hr>"; //Расшифровака с перебором ключей (без учёта частоты) for($key=1;$key<=count($FiA);$key++) { echo "key: $key<br>"; foreach($buf as $symbol) { $ind=$alphabet_f[$symbol]; echo $alphabet[$ind+$key]; } echo "<br>~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~<br>"; echo "key: -$key<br>"; foreach($buf as $symbol) { $ind=$alphabet_f[$symbol]; echo $alphabet[$ind-$key]; } echo "<hr>"; } /* key: -9 е одной интересной функцией программ влетс стеганографи теганографи то возможност прикреплени ифротекста в лбой файл с сохранением его работоспособности одобно тому как револционер писали писма молоком на полх книг так и здес заифрованнй текст можно записат например в файл картинки никто не догадаетс то фотографии которми в обмениваетес с ваим деловм партнером содержат секретну информаци / ?> Когда разберётесь с данными, приложите их,пожалуйста, в .тхт файле. Удачи! Я вам безумно благодарна, спасибо, что так заморочились и реализовали всё это А насчёт ошибок, то уже пробелы в самом исходнике который нам выдал преподаватель, мол главное, чтобы была хоть какая-то читабельность, ибо относительно русского алфавита данный метод работает слегка кривовато (Отредактировано автором: 06 Февраля, 2021 - 18:34:33)*

dcc0	Отправлено: 07 Февраля, 2021 - 00:38:41
Участник Покинул форум Сообщений всего: 1043 Дата рег-ции: Июль 2014 Помог: 10 раз(а)	Интересно. Если зашифровано одно слово, то его можно поискать в словаре и выделить жирным при выводе (как я понял, - необязательно прибегать к исследованию частот символов в строке, хотя, наверное, так красивее). Интересно стало. Правильно ли мыслю?! Алфавит в массиве дублировал для упрощения. Спойлер (Отобразить) PHP: скопировать код в буфер обмена <?PHP //Алфавит. Продублирован для упрощения поиска $alfabet = array( 'а', 'б', 'в', 'г', 'д', 'е', 'ё', 'ж', 'з', 'и', 'й', 'к', 'л', 'м', 'н', 'о', 'п', 'р', 'с', 'т', 'у', 'ф', 'х', 'ц', 'ч', 'ш', 'щ', 'ъ', 'ы', 'ь', 'э', 'ю', 'я', 'а', 'б', 'в', 'г', 'д', 'е', 'ё', 'ж', 'з', 'и', 'й', 'к', 'л', 'м', 'н', 'о', 'п', 'р', 'с', 'т', 'у', 'ф', 'х', 'ц', 'ч', 'ш', 'щ', 'ъ', 'ы', 'ь', 'э', 'ю', 'я' ); //Шифрованный текст $string=mb_strtolower('ткгуяыщмкшшёф эпхьэ'); //Переведём в массив строку с текстом $text=preg_split('//u', $string, null, PREG_SPLIT_NO_EMPTY); //Идем вперед по алфавиту вперёд $i=0; while ($i < 33) { foreach ($text as $k => $val) { $decoded=array_search($val, $alfabet)+$i; $word_we_searach.=$alfabet[$decoded]; } print 'ключ ' . $i .' '. $word_we_searach . ' <br/>'; unset($word_we_searach); $i++; } ?> (Отредактировано автором: 07 Февраля, 2021 - 02:15:39) ----- Март 2021. Бросил программирование

Vladimir Kheifets	Отправлено: 07 Февраля, 2021 - 08:34:12
Частый посетитель Покинул форум Сообщений всего: 879 Дата рег-ции: Март 2017 Откуда: Германия, Бавария Помог: 37 раз(а)	dcc0 пишет: Интересно стало. Правильно ли мыслю?! Спойлер (Отобразить) PHP: скопировать код в буфер обмена <?PHP //Алфавит. Продублирован для упрощения поиска $alfabet = array( 'а', 'б', 'в', 'г', 'д', 'е', 'ё', 'ж', 'з', 'и', 'й', 'к', 'л', 'м', 'н', 'о', 'п', 'р', 'с', 'т', 'у', 'ф', 'х', 'ц', 'ч', 'ш', 'щ', 'ъ', 'ы', 'ь', 'э', 'ю', 'я', 'а', 'б', 'в', 'г', 'д', 'е', 'ё', 'ж', 'з', 'и', 'й', 'к', 'л', 'м', 'н', 'о', 'п', 'р', 'с', 'т', 'у', 'ф', 'х', 'ц', 'ч', 'ш', 'щ', 'ъ', 'ы', 'ь', 'э', 'ю', 'я' ); //Шифрованный текст $string=mb_strtolower('ткгуяыщмкшшёф эпхьэ'); //Переведём в массив строку с текстом $text=preg_split('//u', $string, null, PREG_SPLIT_NO_EMPTY); //Идем вперед по алфавиту вперёд $i=0; while ($i < 33) { foreach ($text as $k => $val) { $decoded=array_search($val, $alfabet)+$i; $word_we_searach.=$alfabet[$decoded]; } print 'ключ ' . $i .' '. $word_we_searach . ' <br/>'; unset($word_we_searach); $i++; } ?> Добрый день! "Шифр Цезаря — это вид шифра подстановки, в котором каждый символ в открытом тексте заменяется символом, находящимся на некотором постоянном числе позиций левее или правее от него в алфавите." См. здесь: https://en[dot]wikipedia[dot]org/wiki/Caesar_cipher В Ваше коде Вы сделали только положительный сдвиг, а должен быть и отрицательный. (Отредактировано автором: 07 Февраля, 2021 - 08:41:31)

dcc0	Отправлено: 07 Февраля, 2021 - 11:10:00
Участник Покинул форум Сообщений всего: 1043 Дата рег-ции: Июль 2014 Помог: 10 раз(а)	Как я понял, - это вопрос нумерации ключа. По идее: если повторить код, перевернув массив, то получится нужная нумерация для отрицательного сдвига. Я сориентировался вот на этот калькулятор: https://planetcalc[dot]ru/1434/ (Добавление) Vladimir Kheifets,Aleri, спасибо. Интересная задачка. (Отредактировано автором: 07 Февраля, 2021 - 11:32:21) ----- Март 2021. Бросил программирование

dcc0	Отправлено: 07 Февраля, 2021 - 15:45:26
Участник Покинул форум Сообщений всего: 1043 Дата рег-ции: Июль 2014 Помог: 10 раз(а)	У меня получилось добавить немного эвристики для поиска по словарю существительных. Точность указания ключа я не стал трогать - назовём это смещением. Будем считать, что средняя длина корня русского слова = 4 буквам. Тогда строку можно разделять в цикле по 4 символа, удаляя с каждым проходом первый и искать только слова с корнем минимум из 4 букв. Такой подход позволяет отсеять "мусор" - ошибочные симолы или "шум", если использовать специальные термины. Следовательно, получается, можно взять любой фрагмент строки и попытаться найти смещение перебором с поиском по словарю. Однако, при таком подходе возможны совпадения, т.е. неверные результаты (но, думаю, редко). Можно протестировать. Фрагмент строки взял этот: чычмщйэссиучычщгхси Результат удовлетворительный. Найдены возможные смещения: 9, 22, 24. 24 и есть верный результат. Протестировать можно тут: http://comb[dot]org[dot]ru/z_heuristic.php Спойлер (Отобразить) PHP: скопировать код в буфер обмена <?PHP //Алфавит. $alfabet = array( 'а', 'б', 'в', 'г', 'д', 'е', 'ё', 'ж', 'з', 'и', 'й', 'к', 'л', 'м', 'н', 'о', 'п', 'р', 'с', 'т', 'у', 'ф', 'х', 'ц', 'ч', 'ш', 'щ', 'ъ', 'ы', 'ь', 'э', 'ю', 'я', 'а', 'б', 'в', 'г', 'д', 'е', 'ё', 'ж', 'з', 'и', 'й', 'к', 'л', 'м', 'н', 'о', 'п', 'р', 'с', 'т', 'у', 'ф', 'х', 'ц', 'ч', 'ш', 'щ', 'ъ', 'ы', 'ь', 'э', 'ю', 'я' ); //Шифрованный текст $string=mb_strtolower("чычмщйэссиучычщгхси"); //Переведём в массив строку с текстом $text=preg_split('//u', $string, null, PREG_SPLIT_NO_EMPTY); //Идем вперед по алфавиту вперёд $reverse=array_reverse($alfabet); $n=33; $i=0; while ($i < $n) { foreach ($text as $k => $val) { $decoded=array_search($val, $alfabet)+$i; $word_we_searach.=$alfabet[$decoded]; } //print 'сдвиг ' . $i .' '. $word_we_searach . ' <br/>'; $string=$word_we_searach; for ($j=0; $j < strlen($string); $j=$j+2) { $str = substr($string, $j); $arr = str_split($str, 10); //Для вывода обратного значения смещения $key=$n-$i; foreach($arr as $v) { if(strlen($v) ==10) if (exec("grep -o $v wordsruss.txt")) { print 'Поиск в словаре (эвристика). сдвиг <strong>' . $i . ' или ' .$key. ' ' .$v . '</strong><br/>'; } } } unset($word_we_searach); $i++; } ?> (Отредактировано автором: 07 Февраля, 2021 - 16:46:39) ----- Март 2021. Бросил программирование

Vladimir Kheifets	Отправлено: 07 Февраля, 2021 - 18:15:10
Частый посетитель Покинул форум Сообщений всего: 879 Дата рег-ции: Март 2017 Откуда: Германия, Бавария Помог: 37 раз(а)	Добрый день, Aleri! Я убрал Вашу таблицу частотности символов алфавита. Кажется, она не совсем достоверна. Вместо неё добавил массив часто встечающихся в русских текстах символов и написал взлом шифра с частоным алгоритмом. Спойлер (Отобразить) PHP: скопировать код в буфер обмена <? $alphabet_str =" абвгдежзийклмнопрстуфхцчшщъыьэюя"; $alphabet = preg_split('//u', $alphabet_str, null, PREG_SPLIT_NO_EMPTY); //эти символы наиболле часто встречаются в текстах на русском языке. $most_frequently_used = ["о","п","р","с"]; $text = "боичнцчтисцыощоъцчтиэьцуясотишщчмщйххгизлфзоыъзиъыомйцчмщйэсзиыомйцчмщйэсзииеычилчрхчпцчъыдишщсущошфоцсзиасэщчыоуъыйилифжкчтиэйтфиъиъчющйцоцсохиомчищйкчычъшчъчкцчъысичнчкцчиычхьиуйуищолчфжясчцощгишсъйфсишсъдхйихчфчучхицйишчфзюиуцсмиыйуисирноъдирйасэщчлйццгтиыоуъыихчпцчирйшсъйыдицйшщсхощилиэйтфиуйщысцусиицсуычицоинчмйнйоыъзи ычиэчычмщйэссиучычщгхсилгичкхоцслйоыоъдиъилйасхинофчлгхишйщыцощчхиъчнощпйыиъоущоыцьжисцэчщхйясжи"; $buf = preg_split('//u', $text, null, PREG_SPLIT_NO_EMPTY); // Определяем частоты символов шифротекста $uniq_buf = array_unique($buf); $buf_count = count($buf); $FiC = []; $symbol_frequency=[]; foreach ($uniq_buf as $i => $vu) { foreach($buf as $v) { if($v===$vu) $symbol_frequency[$i]++; } } foreach($symbol_frequency as $i=>$vu) { $symbol=$uniq_buf[$i]; $FiCs[] = $symbol; $FiCr[] = number_format($vu/$buf_count,5); } // Определяем символ, который наиболeе часто встречается в шифротексте $maxFic = max($FiCr); $iFiC = array_search($maxFic, $FiCr); $symbol = $FiCs[$iFiC]; $iAmfuT = array_search($symbol, $alphabet); //------------------------------------------------ echo "В шифротексте наиболeе часто встречается<br>символ: '$symbol' порядковый номер в алфавите: $iAmfuT<hr>"; //Расшифровака с учётom частоты foreach($most_frequently_used as $symbol) { $iAmfu_sumbol = array_search($symbol, $alphabet); $key=$iAmfuT - $iAmfu_sumbol; echo "Ключевой символ алфавита: '$symbol' порядковый номер в алфавите:$iAmfu_sumbol ключ: $iAmfuT - $iAmfu_sumbol = $key<br>Расшифрованный текст:<br>"; foreach($buf as $symbolT) { $ind=array_search($symbolT, $alphabet); echo $alphabet[$ind+$key]; } echo "<hr>"; } /* В шифротексте наиболeе часто встречается символ: 'и' порядковый номер в алфавите: 9 Ключевой символ алфавита: 'с' порядковый номер в алфавите:18 ключ: 9 - 18 = -9 Расшифрованный текст: е одной интересной функцией программ влетс стеганографи теганографи то возможност прикреплени ифротекста в лбой файл с сохранением его работоспособности одобно тому как револционер писали писма молоком на полх книг так и здес заифрованнй текст можно записат например в файл картинки никто не догадаетс то фотографии которми в обмениваетес с ваим деловм партнером содержат секретну информаци */ ?> Удачи!

dcc0	Отправлено: 07 Февраля, 2021 - 19:32:35
Участник Покинул форум Сообщений всего: 1043 Дата рег-ции: Июль 2014 Помог: 10 раз(а)	Vladimir Kheifets, Я где-то недавно читал, что в русских текстах чаще встречается буква "а", потом только "о". Цитата: тфсфрфзфн Код, получается, в расчёте только на большие строки слово "тфсфрфзфн" не получилось расшифровать. ----- Март 2021. Бросил программирование

Aleri	Отправлено: 07 Февраля, 2021 - 22:08:03
Новичок Покинул форум Сообщений всего: 16 Дата рег-ции: Янв. 2021 Помог: 0 раз(а)	dcc0 пишет: У меня получилось добавить немного эвристики для поиска по словарю существительных. Точность указания ключа я не стал трогать - назовём это смещением. Будем считать, что средняя длина корня русского слова = 4 буквам. Тогда строку можно разделять в цикле по 4 символа, удаляя с каждым проходом первый и искать только слова с корнем минимум из 4 букв. Такой подход позволяет отсеять "мусор" - ошибочные симолы или "шум", если использовать специальные термины. Следовательно, получается, можно взять любой фрагмент строки и попытаться найти смещение перебором с поиском по словарю. Однако, при таком подходе возможны совпадения, т.е. неверные результаты (но, думаю, редко). Можно протестировать. Фрагмент строки взял этот: чычмщйэссиучычщгхси Результат удовлетворительный. Найдены возможные смещения: 9, 22, 24. 24 и есть верный результат. Протестировать можно тут: http://comb[dot]org[dot]ru/z_heuristic.php Спойлер (Отобразить) PHP: скопировать код в буфер обмена <?PHP //Алфавит. $alfabet = array( 'а', 'б', 'в', 'г', 'д', 'е', 'ё', 'ж', 'з', 'и', 'й', 'к', 'л', 'м', 'н', 'о', 'п', 'р', 'с', 'т', 'у', 'ф', 'х', 'ц', 'ч', 'ш', 'щ', 'ъ', 'ы', 'ь', 'э', 'ю', 'я', 'а', 'б', 'в', 'г', 'д', 'е', 'ё', 'ж', 'з', 'и', 'й', 'к', 'л', 'м', 'н', 'о', 'п', 'р', 'с', 'т', 'у', 'ф', 'х', 'ц', 'ч', 'ш', 'щ', 'ъ', 'ы', 'ь', 'э', 'ю', 'я' ); //Шифрованный текст $string=mb_strtolower("чычмщйэссиучычщгхси"); //Переведём в массив строку с текстом $text=preg_split('//u', $string, null, PREG_SPLIT_NO_EMPTY); //Идем вперед по алфавиту вперёд $reverse=array_reverse($alfabet); $n=33; $i=0; while ($i < $n) { foreach ($text as $k => $val) { $decoded=array_search($val, $alfabet)+$i; $word_we_searach.=$alfabet[$decoded]; } //print 'сдвиг ' . $i .' '. $word_we_searach . ' <br/>'; $string=$word_we_searach; for ($j=0; $j < strlen($string); $j=$j+2) { $str = substr($string, $j); $arr = str_split($str, 10); //Для вывода обратного значения смещения $key=$n-$i; foreach($arr as $v) { if(strlen($v) ==10) if (exec("grep -o $v wordsruss.txt")) { print 'Поиск в словаре (эвристика). сдвиг <strong>' . $i . ' или ' .$key. ' ' .$v . '</strong><br/>'; } } } unset($word_we_searach); $i++; } ?> Это чертовски интересно, благодарю вас А ссылка на тестирование это ваше творение? (Отредактировано автором: 07 Февраля, 2021 - 23:01:21)

Vladimir Kheifets	Отправлено: 07 Февраля, 2021 - 22:15:09
Частый посетитель Покинул форум Сообщений всего: 879 Дата рег-ции: Март 2017 Откуда: Германия, Бавария Помог: 37 раз(а)	dcc0 пишет: Vladimir Kheifets, Я где-то недавно читал, что в русских текстах чаще встречается буква "а", потом только "о". Цитата: тфсфрфзфн Код, получается, в расчёте только на большие строки слово "тфсфрфзфн" не получилось расшифровать. google по запросу "частота букв в русском языке" выдаёт: о п р с https://www[dot]google[dot]com/search?cl[dot][dot][dot]1%8B%D0%BA%D0%B5 слово "тфсфрфзфн" не пробовал расшифрововать

Aleri	Отправлено: 07 Февраля, 2021 - 22:34:05
Новичок Покинул форум Сообщений всего: 16 Дата рег-ции: Янв. 2021 Помог: 0 раз(а)	Vladimir Kheifets пишет: Добрый день, Aleri! Я убрал Вашу таблицу частотности символов алфавита. Кажется, она не совсем достоверна. Вместо неё добавил массив часто встечающихся в русских текстах символов и написал взлом шифра с частоным алгоритмом. Спойлер (Отобразить) PHP: скопировать код в буфер обмена <? $alphabet_str =" абвгдежзийклмнопрстуфхцчшщъыьэюя"; $alphabet = preg_split('//u', $alphabet_str, null, PREG_SPLIT_NO_EMPTY); //эти символы наиболле часто встречаются в текстах на русском языке. $most_frequently_used = ["о","п","р","с"]; $text = "боичнцчтисцыощоъцчтиэьцуясотишщчмщйххгизлфзоыъзиъыомйцчмщйэсзиыомйцчмщйэсзииеычилчрхчпцчъыдишщсущошфоцсзиасэщчыоуъыйилифжкчтиэйтфиъиъчющйцоцсохиомчищйкчычъшчъчкцчъысичнчкцчиычхьиуйуищолчфжясчцощгишсъйфсишсъдхйихчфчучхицйишчфзюиуцсмиыйуисирноъдирйасэщчлйццгтиыоуъыихчпцчирйшсъйыдицйшщсхощилиэйтфиуйщысцусиицсуычицоинчмйнйоыъзи ычиэчычмщйэссиучычщгхсилгичкхоцслйоыоъдиъилйасхинофчлгхишйщыцощчхиъчнощпйыиъоущоыцьжисцэчщхйясжи"; $buf = preg_split('//u', $text, null, PREG_SPLIT_NO_EMPTY); // Определяем частоты символов шифротекста $uniq_buf = array_unique($buf); $buf_count = count($buf); $FiC = []; $symbol_frequency=[]; foreach ($uniq_buf as $i => $vu) { foreach($buf as $v) { if($v===$vu) $symbol_frequency[$i]++; } } foreach($symbol_frequency as $i=>$vu) { $symbol=$uniq_buf[$i]; $FiCs[] = $symbol; $FiCr[] = number_format($vu/$buf_count,5); } // Определяем символ, который наиболeе часто встречается в шифротексте $maxFic = max($FiCr); $iFiC = array_search($maxFic, $FiCr); $symbol = $FiCs[$iFiC]; $iAmfuT = array_search($symbol, $alphabet); //------------------------------------------------ echo "В шифротексте наиболeе часто встречается<br>символ: '$symbol' порядковый номер в алфавите: $iAmfuT<hr>"; //Расшифровака с учётom частоты foreach($most_frequently_used as $symbol) { $iAmfu_sumbol = array_search($symbol, $alphabet); $key=$iAmfuT - $iAmfu_sumbol; echo "Ключевой символ алфавита: '$symbol' порядковый номер в алфавите:$iAmfu_sumbol ключ: $iAmfuT - $iAmfu_sumbol = $key<br>Расшифрованный текст:<br>"; foreach($buf as $symbolT) { $ind=array_search($symbolT, $alphabet); echo $alphabet[$ind+$key]; } echo "<hr>"; } /* В шифротексте наиболeе часто встречается символ: 'и' порядковый номер в алфавите: 9 Ключевой символ алфавита: 'с' порядковый номер в алфавите:18 ключ: 9 - 18 = -9 Расшифрованный текст: е одной интересной функцией программ влетс стеганографи теганографи то возможност прикреплени ифротекста в лбой файл с сохранением его работоспособности одобно тому как револционер писали писма молоком на полх книг так и здес заифрованнй текст можно записат например в файл картинки никто не догадаетс то фотографии которми в обмениваетес с ваим деловм партнером содержат секретну информаци / ?> Удачи! Здравствуйте! Я вам очень признательна и согласна, что достоверность таблицы оставляет желать лучшего, но это главный фетиш задания Спасибо вам ещё раз (Отредактировано автором: 07 Февраля, 2021 - 22:37:04)*

dcc0	Отправлено: 07 Февраля, 2021 - 22:39:31
Участник Покинул форум Сообщений всего: 1043 Дата рег-ции: Июль 2014 Помог: 10 раз(а)	Vladimir Kheifets, Доброго вечера! Да. Я не прав. Неправильно запомнил. Но вроде бы так по частотности: о, е, а https://ru[dot]m[dot]wikipedia[dot]org/wiki/Частотность Данные отсюда. P.s. даже без знаний о частотности, думаю, на первых местах гласные. Цитата: А ссылка на тестирование это ваше творение? Aleri Да (Отредактировано автором: 07 Февраля, 2021 - 22:59:00) ----- Март 2021. Бросил программирование

Vladimir Kheifets	Отправлено: 08 Февраля, 2021 - 11:12:05
Частый посетитель Покинул форум Сообщений всего: 879 Дата рег-ции: Март 2017 Откуда: Германия, Бавария Помог: 37 раз(а)	dcc0 пишет: Vladimir Kheifets, Доброго вечера!Да. Я не прав. Неправильно запомнил. Но вроде бы так по частотности: о, е, а Добрый день! Ради интереса взял на с wiki таблицу "Статистика частотности букв русского языка (на материале НКРЯ)" Расчитал частота букв в русском языке (частотность>5%) Спойлер (Отобразить) PHP: скопировать код в буфер обмена <? //https://ru.m.wikipedia.org/wiki/%D0%A7%D0%B0%D1%81%D1%82%D0%BE%D1%82%D0%BD%D0%BE%D1%81%D1%82%D1%8C $table_f=[ ["а","3","40487008","8.01"], ["б","21","8051767","1.59"], ["в","9","22930719","4.54"], ["г","19","8564640","1.70"], ["д","13","15052118","2.98"], ["е","2","42691213","8.45"], ["ё","33","184928","0.04"], ["ж","25","4746916","0.94"], ["з","20","8329904","1.65"], ["и","4","37153142","7.35"], ["й","23","6106262","1.21"], ["к","11","17653469","3.49"], ["л","10","22230174","4.40"], ["м","12","16203060","3.21"], ["н","5","33838881","6.70"], ["о","1","55414481","10.97"], ["п","14","14201572","2.81"], ["р","8","23916825","4.73"], ["с","7","27627040","5.47"], ["т","6","31620970","6.26"], ["у","15","13245712","2.62"], ["ф","31","1335747","0.26"], ["х","24","4904176","0.97"], ["ц","28","2438807","0.48"], ["ч","22","7300193","1.44"], ["ш","26","3678738","0.73"], ["щ","29","1822476","0.36"], ["ъ","32","185452","0.04"], ["ы","17","9595941","1.90"], ["ь","18","8784613","1.74"], ["э","30","1610107","0.32"], ["ю","27","3220715","0.64"], ["я","16","10139085","2.01"] ]; echo "<pre>"; $fr = array_column($table_f, 3); array_multisort($fr, SORT_DESC, $table_f); $most_frequently_used = []; foreach ($table_f as $s) { if($s[3]>5) $most_frequently_used[] = $s[0]; } print_r($most_frequently_used); ?> Результат Цитата: Array ( [0] => о [1] => е [2] => а [3] => и [4] => н [5] => т [6] => с ) Если предположить, что этот источник болле достоверный, то Вы были правы, а google ошибается. Кому пожаловаться? (Добавление) Aleri, замените, пожалуйста, в последнем варианте скрипта PHP: скопировать код в буфер обмена //эти символы наиболле часто встречаются в текстах на русском языке. $most_frequently_used = ["о", "е", "а", "и", "н", "т", "с"]; В шифротексте был потерян первый символ "о" и "ш" в середине д.б. так Спойлер (Отобразить) PHP: скопировать код в буфер обмена $text = "обоичнцчтисцыощоъцчтиэьцуясотишщчмщйххгизлфзоыъзиъыомйцчмщйэсзиыомйцчмщйэсзииеычилчрхчпцчъыдишщсущошфоцсзиасэщчыоуъыйилифжкчтиэйтфиъиъчющйцоцсохиомчищйкчычъшчъчкцчъысишчнчкцчиычхьиуйуищолчфжясчцощгишсъйфсишсъдхйихчфчучхицйишчфзюиуцсмиыйуисирноъдирйасэщчлйццгтиыоуъыихчпцчирйшсъйыдицйшщсхощилиэйтфиуйщысцусиицсуычицоинчмйнйоыъзи ычиэчычмщйэссиучычщгхсилгичкхоцслйоыоъдиъилйасхинофчлгхишйщыцощчхиъчнощпйыиъоущоыцьжисцэчщхйясжи"; необходимо добавить проверку на отрицательный индекс массива $alphabet Спойлер (Отобразить) PHP: скопировать код в буфер обмена foreach($buf as $symbol) { $ind=$alphabet_f[$symbol]; $ind_a = $ind + $key; if($ind_a < 0) $ind_a +=33; echo $alphabet[$ind_a]; } После всех этих мучений получите чистую расшифровку Цитата: еще одной интересной функцией программы является стеганография теганография это возможность прикрепления шифротекста в любой файл с сохранением его работоспособности подобно тому как революционеры писали письма молоком на полях книг так и здесь зашифрованный текст можно записать например в файл картинки никто не догадается что фотографии которыми вы обмениваетесь с вашим деловым партнером содержат секретную информацию Удачи! (Отредактировано автором: 08 Февраля, 2021 - 13:21:13)

dcc0	Отправлено: 08 Февраля, 2021 - 12:34:37
Участник Покинул форум Сообщений всего: 1043 Дата рег-ции: Июль 2014 Помог: 10 раз(а)	Vladimir Kheifets, доброго дня! Думаю, что ситуация с этим такая: google анализирует тексты из интернета. Помимо классических текстов - это могут быть: запросы, комментарии, строчки из метаданных и т.д. В связи с этим предполагаю, что и результат отличный. Данные НКРЯ - это, скорее всего, данные на основе анализа литературных, научных текстов. В случае с НКРЯ перевес на стороне классических русских текстов, я бы сказал, - нормальных текстов. Образно выражаясь, google жуёт вершки, а статистика НКРЯ - это корешки. Но есть интересный факт (можно сказать, противоречие, почти), который отчасти объясняет ответ, полученный Вами от Google. "На какую букву больше всего слов в русском языке?". Ответ: "п". Весы качнулись в Вашу пользу. P.S. Интересно с Цезарем: есть шанс найти достаточно большой текст без ошибок с первого раза на листке бумаге, если попадётся слово с двумя нн. (Отредактировано автором: 08 Февраля, 2021 - 16:49:53) ----- Март 2021. Бросил программирование

Поиск в теме | Версия для печати

Страниц (2): [1] 2 »

Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)

« Вопросы новичков »

Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.