apximhd: (Default)
[personal profile] apximhd
Это не совсем головоломка, скорее, тест на проверку утверждения о том, что все докомпьютерные методы шифрования нестойки перед мощью современных компьютеров. Предположим, что вам в руки попал некий зашифрованный документ. Вы не знаете ни адресата сообщения, ни даже языка, на котором было написано исходное сообщение. Все, что вам известно, это то, что документ был зашифрован вручную, без использования компьютера, хотя я и потратил на его шифрование изрядное количество времени. Ваша задача, используя современные знания в области криптографии и ее истории, и мощь ваших компьютеров, попытаться расшифровать приведенное ниже сообщение.

Upd:

К сожалению, в первый фрагмент при ручном кодировании вкралась ошибка, я его вычеркиваю...


INNSSWYJWQETPSZKFPDVCSENWMXBPZHLAAFLUQDAPCBPZHVVALUZHDEMSEUSSWFV
FAUVVAAEXGAVFYBUAMAFQVIGRSSENAKTLPUNWDTWAMMSAMGKWDKWGEEVAAOXLTCQ
FBEQGETLIDNZLUSAZHSWBYWEYPMSLEYDVOZAYLOQSAMMXDSWWBOEAHSWBMDXLPAO
JSEVWSQCKRNGIGOEXGWVNHILWDXLXCFEEWQQKWFGOQEIGOELWPCEMTSQCKEEYORF
GTGAHINANAAWYSDXMSAZHUOWFHMAHNLAKMHIIQEWCSSLZAESDEILJOALINZAIHSV
MSARLPFTTZPCBPARMGDQKGAVFASAYSEAMPPHKMARCETLUZGTEHDIQMAZZBCRSOGA
RQFODVKWBETHAELMWVMASPMUWSSJQPLQKOKRAOZWDPWOMSWJDITDGVFWMKMPQWVV
FQVNDSZSVAARQVFAAFHHQIGENSLJZHNXGYWLEYYEILTTLMLAMELWDXWDRSV


Но время на его декодирование тем не менее, надеюсь, потрачено не зря, поскольку алгоритм шифрования в новом фрагменте полностью сохранен. Приношу извинения и привожу более объемный фрагмент текста (другого, но на том же языке). Чтобы смягчить свою вину, я сообщу, что это фрагмент литературного произведения на английском языке. Алгоритм шифрования, естественно, остался тем же самым:

MSZEQRHDURAYCSCBRJILWKVUGYSSKXAMPSKTKLAHTNDYCMDYQXCMGIBWOYIXQEH
CBPASZOUCFGLDHKBJUQNSKAPXAPTCSXDCZVLBJRPXYGKTOCZIEFAYTZGDFOZOJX
NZCMBKYNGFIOUQQMKCMGGGRHQWWGGVGKDRPAWWDPJHUGFONZTMCZVCXVMGVTSUQ
JIKTAHGVGHOOGOKCEUZTONZOUDWWFTGOUQJYVVGOYLKYFAGOHKDHHNQAFAHOCLY
QTUDPJNGHKKZGOCLTWXPKASKNBFWYMEXIXPGRSSGFWYVCLDPJESPAKURWGYIFKY
FTSKAZRQEUJXNUYKDEXZLWCEIOXINDCZPGLWTONCISPOYIFKVUGIEXAJARPJEUD
CYCVGDYVJBINZKNHCWFSKTCEOQDEASFCZTXFWVFWYLBKDFWJHKYCUQJNHXAHCUD
ZWYVGGVGKLONDPQOBGZLVUSRUZEOKNBWSSKOGLVVGLUJAGYSDOGDGZEACOQPUNV
LOGISMGLTSCCOKYNZGOHGHBVGZWXOQGYLBKYIXCUJYLKYPBKQACZVCISYQXNCMZ
GRWXFHBCINYQJTJDHGLYCRMYDEAYFWFEFWCUAXAHSKQAVMZISXFOOYSIRHVJHKW
GLOZTVMVGDCZVJVUSSGLGLTVGAVGTVVGKKTLGVGASAYFDBBUZOZGLTVUGIKLDZY
ZTPOYFIKDBWJHGLQEWGLEURTAJTNDZGORMZTCMGGLYNGAFKEXLASXCPYLKYTYWW
FVISPRJASRDPCVGDXSZQPGGZVDFITAHOYBMEIXLDZGOHOKVCISOZGDXJGURQQRP
JAJTVCISCIXJVTSTONEKKTKTKYQYKYYLOQTGOGVTSCZLWKNKGRGOGZVDPKKASCC
IFXKCIEASOKLVQWMZCZLBJOQEXIEXGRVGASUIEACMBWMWKWMBWYWYVLWTGOGVGD
GLBRTLQMASPTZROUMTNVGIICUNHYVVCLVFEARJHGGDHSXPUZGOHKHOCIGKOUDRU
JYLBYDXIFVJNCISGLORDXSAWWNCZTCEUYUDEADFISSKAPRZIRMSZGHOQJQDBEFK
YLQEWGLVMNQDWKOJKTKYSKAZOUDPAHTNCIEAKBKLHDPQKYCBRDCLDBBOGASRUVY
QJAWFSKQKDKGYKYSCUGZIVVMDXWKYDUYQGOQGKDRUSXMKTASZQWNCISKQNVJSTA
ZIFKVQECPMRQMOXMWKUGZLAGHKHNCDLOEOUDHILZCLBSCISZGOXCRPEQQRJVUXG
YNHRPNVDCIEXAMQPBIUYDEZTVQDUVMKAHBEFKYNUGGRXCLBYNZCLKBBKTKYFIWX
FHNBFVJQASMEZPMWKTGLJOXISKAOKNHGGZVDCRPOKXZWPMGIBIRYQNDCWILOGLY
UQMOJXLTYDYYVLBKQWNGYSUUCUQTDCSSXKCLWTZGDPQMOZYYBJXKQPEVGFDXSGL
QSXCRUCEKVYVKLXISMGZOKYSSGKQDPGKLDZSXJIUXWPKJEFSKVLOGVQDBVUGWAY
VZLSVCOYFIOVGKGHUOKVCISWTNZNRGLESWIKYPONCRYQGLHNKAFKESZQUQJESZZ
YFAGKAOKNUGSKUJXTVQRKYDWTONEACOQPUNCISWUSSTAKKAEDCRPTDUNHKUVMTA
VCEEKUJBILOGDKYKKXNKQAFAMKUZTUYCEHUGGVGHCUYQGKKEOGVUFIISXPONJHO
HFTOCDPNGLQOYPNUGGVGDCZBPMTSKDEXWKCMWIKWXJRFWDWPNQEHBWGCKLDHKVJ
VNWPHCVCZQGKGYLBKCIXWXKOKYSWXPMDOGGLYGLEKNHKHOZTCZIKYIXQMOKBJUQ
NSOJQVQWDHNDZKYCBSVASUGLOGVGAJGGVVGZOCBBKOVPCEESPOCUJIIFKVMGQAG
GVGFONZGISMECIEXCLHYLGOYLWKAPBYKYOTGOGVGOQWFAOKGDHSGYICEDELAGDU
RYCVCLWWCBBRGKGAYGZKUDXWXINRUSXJINUFIKDFEFOZGOHIXPHOXOXPUNUCUJL
BOQQRYZGGKAKYLWGLYCBIUYQNDCSSGZQKDEAHBXNEAYCBOGYMZCLTGCRPAVUXYC
BRZJTJHKYFNUYZGNUDGGRPXNZRCZITNZGRWXPKEDPCWWXPGVTJAWFSXRHRRUSXC
UNHTNKTAHGYSSGLXAOXIQOKDFARQNUFWMWWCVUGIFXNZTWGRTCZICRUFIGLONES
ZOUDFWGHUGGVGWKLQDXZLOZGASXOKAOXPKYQOPXNKLESMESPHUGDOHOZTXPOEFA
KLQCMVMCUYZTZGIOGLGOQKTGCZISKEOGLBYLKYFIXGFGAHOHYVLBXNWXKLMKBKY
PBKRHFEFCIEBSKASPGBUVCPOOQGLTYSPOGYILQEEWGLYPYURFDLQWIYZOUDCASM
KNHONZOQMOKHNCEIRFLQDCBSCIXMRDPKAYLCLTNCZQUJKQRVGAGHTASQJUOZTSK
VGOEFZTNKESSSGZOGYPOXPHYDRQRMZYSKVTSSKAMEKBYCBWJHKYIVVMDXWKKQNV
JSCIEBWFSXQEZGHBRGLTGOTOCRHVGZVDRUMSPGZZTFIGLCZICCMTRUNUGINRZLB
BZOUDKNHGLDXKLMCHUGASKSGYSDXWKHNCLQEOTAPBOPBOKJOJNCEESZQXNCUQTG
OQGLKUOCEDIBRXSMZCZMEQVQRJVTTCZYCUIFAKYKNHKYNGOGRODCWFSXKDHDPQO
PONCLDPRGOKBIGLGZLSTOYCBCXVMGGVGVGZINRGGQEXAVMGLXICMGIICBBVGZVY
DEDELQEASARQWMESSGASCEIVUGRVGAMKLWFOQKLDPCYKHCLQHZOUDWYDWCVTCFE
KEXAVDPSKKTAPWXIEFKTWUYZTOZIEGZPTDBGVMWFAKDHRHSSXCWXCSSGLMSMTNJ
VDPQORHQRTAGKDUYKDRRGZPSXJOQQRKWSKTAHVVTCBIUKBKDBWXCUJVUSOJNCVG
IFZYOGGRCOKGZISPTZTZGAKHYQTSAYFARCHOZPORJIUAXAKKAYSXSACLTDOGDLG
QRQJVYZGHKKTAHOGVGKDFIUYZRMRHGKHOURRXSVJSKARWCBBAVXZURQSXQWYPAV
NVJVLHONGDPQOKDRUYZGOGVTSGLKLYZRWFIOHUIURWGDCSVVGIWWFSNGUQMEUVU
VYCRPBYKYDUXAHCPBWIKCIEZCISOKUQRVGINNYQMKTOGHZVGQHNCLDRUVPOEAOQ
VQDWTKYUQJEFFDHYDDCYBBESZGRWPQMOKXSMTGQ

(no subject)

Date: 2007-06-15 01:54 pm (UTC)
From: [identity profile] phantomscadman.livejournal.com
Только один вопрос - это документ или он его незавершенный обрывок?
или это тоже не детерминировано?

(no subject)

Date: 2007-06-15 01:58 pm (UTC)
From: [identity profile] al-pas.livejournal.com
Априори это неизвестно.

(no subject)

Date: 2007-06-15 02:01 pm (UTC)
From: [identity profile] phantomscadman.livejournal.com
В принципе я в криптографии не силен, но сама головоломка меня интересует.
Очень надеюсь, что я хотя бы знаю этот язык:)
Кстати, на всякий случай, можете скрывать комменты, а то вдруг кто-то разгадает:)

(no subject)

Date: 2007-06-15 02:16 pm (UTC)
From: [identity profile] http://users.livejournal.com/_guard_/
такой объем шифрованного текста неинформативен. к примеру, вы могли зашифровать в такую штуку слово HELLO, исопльзовав 14, 27, 30, 35 и 111 символы (условно), или слово PRIVET (какие-то другие номера), и добив все лабудой.
нестойкость в математическом смысле означает, что при многократном (бесконечном) использовании шифра (метод/ключ) и известном алгоритме он ломается. и в этом смысле единственный стойкий шифр - одноразовый блокнот Вернама, где для шифровки каждого символа генерируется свой случайный ключ .

(no subject)

Date: 2007-06-15 02:25 pm (UTC)
From: [identity profile] al-pas.livejournal.com
Весь текст информативен и осмысленен, написан грамотно на одном из европейских языков, и никакого мусора в него не добавлено.

(no subject)

Date: 2007-06-15 02:29 pm (UTC)
From: [identity profile] http://users.livejournal.com/_guard_/
Уже конкретнее, но можно было к примеру использовать одну из n! (эн факториал, где эн - число букв в сообщении) подстановочных функций.
В последнем случае единственный доказанный метод анализа - частотный, но для него текст слишком краток. Тем более без пробелов.
В общем я все к тому, что утверждение о нестойкости хоть и верно (не совсем правда, тот же вернамовский блокнот можно было бы использовать и без компьютера), но не означает, что по единичной реализации алгоритма, не зная его можно запустить мега-программу и шифр взломать.
Ну и опять-таки к вернамовскому блокноту. Если вы выбрали последовательность из n условно-случайных цифр и каждую букву исходного текста сдвинули на очередную цифру, то это не ломается.

(no subject)

Date: 2007-06-15 02:42 pm (UTC)
From: [identity profile] http://users.livejournal.com/_guard_/
P.S. А вообще попробую поколупать )

(no subject)

Date: 2007-06-15 02:47 pm (UTC)
From: [identity profile] snusmumreak.livejournal.com
Поясните пожалуйста, этот текст зашифрован с помощью метода реально используемого для шифрования в докомпьютерную эпоху, скажем до второй мировой войны, или просто «в ручную». Я потому спрашиваю, что после второй мировой войны связи с развитием криптографии и активным внедрением в неё компьютеров получили распространения очень стойкие методы шифрования, которые, тем не менее, позволяют без использования каких либо устройств шифровать достаточно объёмные тексты. Пример: советский дипломатический код, с использованием одноразовых шифровальных книг. Считать такие методы шифрования «докомпьтерными» нельзя, хотя для их использования компьютер не нужен.

(no subject)

Date: 2007-06-15 02:52 pm (UTC)
From: [identity profile] al-pas.livejournal.com
Не знаю, использовался ли этот метод реально, но он достаточно прост для того, чтобы прийти в голову достаточно образованному жителю средневековой Европы. Никаких дополнительных книг и иных текстов не использовалось.

(no subject)

Date: 2007-06-15 03:15 pm (UTC)
From: [identity profile] spamsink.livejournal.com
Если шифрование производилось с использованием квадрата Виженера в его первоначальном виде (со сдвинутыми, но неперемешанными алфавитами), или в виде, описанном, например, в книге Уэзерелла "Этюды для программистов", то расшифровка в большой степени основывается на предположении сходства распределения частот букв в искомом тексте и распределения частот букв в каком-нибудь естественном языке. Произвольный английский текст таким образом расшифровать можно. Если же зашифрован отрывок из липограмматического произведения (http://en.wikipedia.org/wiki/A_Void_%28novel%29), то в нем мало того, что статистика букв непохожа на стандартную английскую, но и вообще их всего 25, а не 26, так что традиционные методы будут обречены на неудачу.

(no subject)

Date: 2007-06-15 03:35 pm (UTC)
From: [identity profile] snusmumreak.livejournal.com
http://ru.wikipedia.org/wiki/Шифр_Вернама#.D0.9E.D0.BF.D0.B8.D1.81.D0.B0.D0.BD.D0.B8.D0.B5
Конечно, этот метод очень прост, но вряд ли он мог использоваться в средневековой Европе.

(no subject)

Date: 2007-06-15 03:42 pm (UTC)
From: [identity profile] http://users.livejournal.com/_guard_/
похожи на английские частоты, и даже триграмма MSA-the выглядит относиельно вероятной. Но как-то не очень получается.

(no subject)

Date: 2007-06-15 03:43 pm (UTC)
From: [identity profile] http://users.livejournal.com/_guard_/
думаю, имелся в виду использованный здесь шифр, а не вернамовский

(no subject)

Date: 2007-06-15 04:54 pm (UTC)
From: [identity profile] spamsink.livejournal.com
Автор пишет, что "потратил на его шифрование изрядное количество времени", так что это скорее одноалфавитный шифр, и таких триграмм должно быть несколько. Но даже и с обычным подстановочным шифром, если текст написан не по-английски, а всего лишь "на одном из европейских языков", то это может быть хоть польский, хоть венгерский, хоть русский в одной из многочисленных транслитераций, где Щ может обозначаться и SC, и SCH, и SHH, и W, и XH.

Кстати, в тексте подозрительно много удвоенных букв. Уж не финский ли это? :)

(no subject)

Date: 2007-06-15 06:09 pm (UTC)
From: [identity profile] http://users.livejournal.com/_guard_/
Да, удвоенных действительно много, это смущает, поэтому я склоняюсь не в пользу простой замены.
Но если она, то триграмма MSA почти однозначна (под e-th-the всего 2 подходят: MSA и VFA, но у F слишком плохая частота для h)
По поводу других языков - я глянул итальянский - точно не он, там 3-4 буквы с почти равными max частотами. И вроде не испанский, хотя хз - надо пробивать знание иностранных языков автором шифровки :)
А вот русский с транслитом - это точно засада.

(no subject)

Date: 2007-06-15 06:19 pm (UTC)
From: [identity profile] spamsink.livejournal.com
Почему мои руки написали "одноалфавитным", когда я думал "полиалфавитным", не знаю. А то, что криптоаналитик без мета-знания (типа знания языков автором шифровки) - как без рук, это точно. Вон, рукопись Войнича так и лежит, потому что неясно, откуда копать.

Рассчитанные на английский язык скрипты для расшифровки шифра Виженера для данного текста показали фигу.

(no subject)

Date: 2007-06-15 06:22 pm (UTC)
From: [identity profile] http://users.livejournal.com/_guard_/
Да, я прогнал через некий crypttool или что-то в этом духе по всяким цезарям-вижинерам-хиллам - ничего осмысленного.
Еще любопытно - очень высокая энтропия текста (4,54 при как пишет та же прога max 4.70).
Мораль - надо анализировать дневник уважаемого al_pas :)

(no subject)

Date: 2007-06-15 07:57 pm (UTC)
From: [identity profile] http://users.livejournal.com/alkan-/
утверждение о том, что все "докомпьютерные методы шифрования нестойки перед мощью современных компьютеров" неверно: существует один метод принципиально неразгадываемого перебором шифра и известен он давно - это шифрование при помощи шифровального блокнота. У этого метода только один недостаток: длина ключа равна длине текста, что не очень удобно.

Криптографы больше бьются над созданием шифровальных алгоритмов с длиной ключа значительно меньшей чем длина текста, но при этом не позволяющих решить задачу дешифровки способом быстрее чем полный перебор вариантов, и тут ситуация сильно поменялась с появлением компьютера.

Поэтому, не могли бы вы уточнить насчёт этой задачи:
способен ли другой человек используя только ручку, бумагу, описание "метода шифрования" переданное устно и некоторый короткий "ключ" восстановить исходное сообщение?

а то ведь возможны варианты что Вы использовали для шифрования книгу, которая есть только у Вас, и придётся весь интернет выкачивать. или я сразу Вам скажу, что это гимн Советского Союза, шифровальный блокнот у Вас такой :)

(no subject)

Date: 2007-06-15 08:04 pm (UTC)
From: [identity profile] al-pas.livejournal.com
Да, способен. Но расшифровка займет приблизительно в три-четыре раза больше времени, чем шифрование. На шифрование у меня ушло около двух часов.

(no subject)

Date: 2007-06-15 08:05 pm (UTC)
From: [identity profile] al-pas.livejournal.com
Я уже написал выше, что никаких дополнительных книг и иных текстов не использовалось.

(no subject)

Date: 2007-06-16 06:58 am (UTC)
From: [identity profile] snusmumreak.livejournal.com
Уважаемый al_pas, я все-таки полагаю, что Вы немного лукавите, используя понятие «докомпьютерный метод шифрования». В «докомпьютерную» эпоху не было смысла в использование столь трудоёмких методов, так как системы шифрования, обеспечивающие абсолютную, по тем временам, стойкость, были гораздо удобнее. Сам по себе факт, что Ваш метод теоретически мог быть придуман уже в средневековье, ещё не позволяет считать его «докомпютерным». Например, уже неоднократно упомянутый шифр Вернама мог быть изобретён (и наверняка много раз был изобретён) в любой исторический период, начиная с момента появления письменности и счёта.

Анализ

Date: 2007-06-19 09:53 am (UTC)
From: [identity profile] pupugai.livejournal.com
Частота букв:
A 47 9.27%
S 37 7.30%
E 34 6.71%
W 33 6.51%
M 27 5.33%
L 27 5.33%
V 23 4.54%
Q 21 4.14%
D 21 4.14%
G 19 3.75%
H 18 3.55%
P 18 3.55%
F 18 3.55%
Z 17 3.35%
I 16 3.16%
O 16 3.16%
N 15 2.96%
T 15 2.96%
K 14 2.76%
Y 12 2.37%
X 11 2.17%
C 11 2.17%
R 11 2.17%
U 10 1.97%
B 10 1.97%
J 6 1.18%

Невооруженным глазом видно, что разброс частот больше, чем он был бы для случайного набора букв, но меньше, чем в естественном языке. Таким образом здесь не простая замена.

Частота пар букв:
Следующие пары повторяются 6 раз: AA, AM, MS, SA, SW, VF, WD, ZH
5 раз : AR, MA, SE, SS
4 раза: DX, ET, EY, GA, IG, KW, LU, TL, VA, WB
3 раза: 37 пар
2 раза: 60 пар

Хотя кажется, что много удвоенных букв их не намного больше, чем было бы, если бы они были независимы с распределением, как в данном шифре.
(Удвоенных букв должно быть в среднем 24.1, а на самом деле их 29).

Частота троек:
Три тройки повторяются три раза: MSA, VAA, VFA.
Еще 31 тройка повторяется 2 раза.

Частота четверок:
Восемь четрверок повторяются по 2 раза: BPZH, GAVF, HSWB, IGOE, LWDX, PCBP, SAZH, SQCK

Ни одна пятерка не повторяется дважды.

Если смотреть частоты через 1,2,... буквы никакой закономерности не видно. Кроме того расстояния между совпадающими четверками не имеют общего делителя. Таким образом это не Виженер.

(no subject)

Date: 2007-06-19 10:06 am (UTC)
From: [identity profile] pupugai.livejournal.com
Удвоенных букв не очень много. И это не Виженер (см. мой коммент ниже).

Упс! Я беру таймаут!

Date: 2007-06-19 02:50 pm (UTC)
From: [identity profile] al-pas.livejournal.com
Я беру таймаут, поскольку, похоже, я где-то ошибся при ручном кодировании. Я написал программку, чтобы закодировать большой кусок текста и не могу получить ту последовательность, которая получилась при ручном кодировании. Приношу извинения и прошу подождать, пока я не найду ошибку. Алгоритм, естественно, останется тем же самым, просто я опубликую правильный результат шифровки.

Упс. Я беру таймаут!

Date: 2007-06-19 02:50 pm (UTC)
From: [identity profile] al-pas.livejournal.com
Я беру таймаут, поскольку, похоже, я где-то ошибся при ручном кодировании. Я написал программку, чтобы закодировать большой кусок текста и не могу получить ту последовательность, которая получилась при ручном кодировании. Приношу извинения и прошу подождать, пока я не найду ошибку. Алгоритм, естественно, останется тем же самым, просто я опубликую правильный результат шифровки.

(no subject)

Date: 2007-06-19 04:18 pm (UTC)
From: [identity profile] al-pas.livejournal.com
Основная запись обновлена из-за обнаружившейся ошибки.

(no subject)

Date: 2007-06-19 04:18 pm (UTC)
From: [identity profile] al-pas.livejournal.com
Основная запись обновлена из-за обнаружившейся ошибки.

(no subject)

Date: 2007-06-19 04:18 pm (UTC)
From: [identity profile] al-pas.livejournal.com
Основная запись обновлена из-за обнаружившейся ошибки.

(no subject)

Date: 2007-06-19 04:19 pm (UTC)
From: [identity profile] al-pas.livejournal.com
Основная запись обновлена из-за обнаружившейся ошибки.

Re: Анализ

Date: 2007-06-19 04:20 pm (UTC)
From: [identity profile] al-pas.livejournal.com
Основная запись обновлена из-за обнаружившейся ошибки.

Внимание!

Date: 2007-06-19 04:21 pm (UTC)
From: [identity profile] al-pas.livejournal.com
Основная запись обновлена из-за обнаружившейся ошибки.

расшифровка

Date: 2007-06-22 10:37 am (UTC)
From: (Anonymous)
MANY years ago, I contracted an intimacy with a Mr. William
Legrand. He was of an ancient Huguenot family, and had once been
wealthy; but a series of misfortunes had reduced him to want. To
avoid the mortification consequent upon his disasters, he left New
Orleans, the city of his forefathers, and took up his residence at
Sullivan's Island, near Charleston, South Carolina. This Island is a
very singular one. It consists of little else than the sea sand, and
is about three miles long. Its breadth at no point exceeds a quarter
of a mile. It is separated from the main land by a scarcely
perceptible creek, oozing its way through a wilderness of reeds and
slime, a favorite resort of the marsh hen. The vegetation, as might
be supposed, is scant, or at least dwarfish. No trees of any
magnitude are to be seen. Near the western extremity, where Fort
Moultrie stands, and where are some miserable frame buildings,
tenanted, during summer, by the fugitives from Charleston dust and
fever, may be found, indeed, the bristly palmetto; but the whole
island, with the exception of this western point, and a line of hard,
white beach on the seacoast, is covered with a dense undergrowth of
the sweet myrtle, so much prized by the horticulturists of England.
The shrub here often attains the height of fifteen or twenty feet,
and forms an almost impenetrable coppice, burthening the air with its
fragrance.

Re: расшифровка

Date: 2007-06-22 02:07 pm (UTC)
From: [identity profile] al-pas.livejournal.com
Браво! Страна должна знать своих героев! Если не сложно, представьтесь, пожалуйста, и расскажите, как вы это сделали.

Забыл представиться

Date: 2007-06-22 05:04 pm (UTC)
From: [identity profile] pupugai.livejournal.com
Это было не сложно.
Во-первых, я посчитал частоту букв. Оказалось, что самая редкая встречается 2.28%, а самая частая 7.72%. Этот разброс слишком маленький для нормального текста. Значит шифровка была не простой заменой. С другой стороны, разброс слишком большой для случайного распределения. Это обнадеживает.

Во-вторых, я заметил, довольно длинные повторяющееся последовательности.
Например, EACOQPUN повторялось два раза. Значит, в шифре не было перестановок.

Далее я посчитал частоту пар букв. Получилась таблица. В каждой строчке этой таблицы частоты встречания букв после данной буквы (в процентах). Например после Z, с частотой 17% встречается G, с частотой 13% T, и т.д.

Сразу видно, что частоты распределены примерно так как в естественном языке. Значит можно предположить, что код буквы зависит не только от самой буквы, но и от предыдущего кода.

После того, как я посмотрел на эту таблицу я заметил, что первые буквы в строчках идут почти по алфавиту. Точнее к букве прибавляется обычно 3. Посмотрев внимательно, оказалось, что в каждой строчке можно выделить букву в самом начале или очень близко к началу, так чтобы выделенная буква в каждой строчке была бы на 3 больше, чем предыдущая, кроме каждой седьмой строчке, где скачок происходит на 4, а не на 3.

Естественно предположить, что вся эта цепочка соответствует какой-нибудь очень частой букве исходного текста. Потом я заметил еще семь таких же цепочек. Таким образом я знал восемь цепочек, каждая из которых соответствовала какой-то частой букве.

Далее все легко заменив эти буквы на цифры 0-7, я получил одноалфавитный код, который взламывается легко частотным анализом. Я получил буквы eathonsr. После этого я заметил в тексте слова "THAN THE SEA" "THE EASTERN" "SEEN NEAR THE", ввел их в google, и ву-аля.

Таблица пар частот

Date: 2007-06-22 07:36 pm (UTC)
From: [identity profile] pupugai.livejournal.com
A: [17 S, 11 H, 8 Y, 7 K, 6 V, 6 G, 5 R, 5 P, 5 O, 4 M, 4 C, 3 W, 3 J, 3 F, 2 Z, 1 X, 0 E, 0 D, 0 U, 0 T, 0 Q, 0 N, 0 L, 0 I, 0 B, 0 A]
B: [13 K, 11 W, 10 B, 8 R, 8 I, 6 Y, 5 O, 5 J, 4 S, 3 V, 3 E, 2 X, 2 U, 2 P, 2 G, 2 F, 2 C, 1 Z, 1 M, 1 A, 0 T, 0 Q, 0 N, 0 L, 0 H, 0 D]
C: [13 I, 11 Z, 10 L, 8 U, 8 B, 7 E, 6 M, 5 R, 4 V, 3 S, 2 W, 2 O, 2 P, 1 Y, 1 C, 1 X, 1 H, 1 F, 1 D, 0 K, 0 A, 0 T, 0 Q, 0 N, 0 J, 0 G]
D: [14 P, 13 C, 8 X, 8 H, 7 E, 6 R, 6 F, 5 W, 5 U, 5 B, 4 Z, 3 Y, 3 O, 2 L, 2 K, 2 G, 0 I, 0 D, 0 V, 0 T, 0 S, 0 Q, 0 N, 0 M, 0 J, 0 A]
E: [13 A, 12 S, 11 X, 11 F, 6 U, 6 O, 6 K, 5 D, 4 Z, 4 I, 4 E, 3 W, 3 Q, 3 H, 2 L, 2 C, 2 B, 1 V, 1 G, 0 Y, 0 T, 0 R, 0 P, 0 N, 0 M, 0 J]
F: [15 I, 13 A, 11 W, 10 K, 8 S, 7 O, 5 E, 4 D, 3 V, 3 T, 2 Z, 2 X, 2 H, 2 G, 2 C, 1 N, 1 L, 1 F, 0 Y, 0 U, 0 R, 0 Q, 0 P, 0 M, 0 J, 0 B]
G: [15 L, 9 O, 8 V, 8 Z, 7 G, 6 K, 6 D, 5 Y, 5 I, 5 A, 5 R, 4 H, 2 F, 1 Q, 1 C, 0 W, 0 U, 0 T, 0 S, 0 N, 0 B, 0 X, 0 P, 0 M, 0 J, 0 E]
H: [16 O, 14 K, 9 G, 8 N, 7 U, 7 C, 6 Y, 6 B, 4 T, 4 S, 3 V, 3 R, 3 D, 2 Z, 2 Q, 2 I, 2 F, 1 X, 1 H, 0 W, 0 P, 0 M, 0 L, 0 J, 0 E, 0 A]
I: [17 S, 11 E, 8 X, 7 F, 6 N, 6 K, 6 U, 5 C, 4 O, 4 L, 3 R, 3 I, 3 G, 2 V, 2 B, 1 W, 1 T, 0 Y, 0 Q, 0 Z, 0 P, 0 M, 0 J, 0 H, 0 D, 0 A]
J: [12 V, 10 H, 8 I, 8 A, 6 X, 6 N, 6 E, 5 T, 5 O, 4 Y, 4 U, 4 S, 4 Q, 2 R, 2 K, 2 G, 2 B, 1 L, 1 D, 0 Z, 0 W, 0 P, 0 M, 0 J, 0 F, 0 C]
K: [16 Y, 8 A, 8 T, 8 D, 7 L, 5 V, 5 K, 4 Q, 4 N, 4 U, 3 H, 3 B, 3 G, 3 E, 3 C, 2 O, 1 X, 1 W, 0 J, 0 Z, 0 S, 0 R, 0 P, 0 M, 0 I, 0 F]
L: [11 B, 10 Q, 9 O, 9 D, 8 W, 8 T, 6 Y, 5 K, 4 G, 4 V, 3 H, 3 E, 3 A, 2 X, 2 M, 1 S, 1 C, 0 Z, 0 U, 0 J, 0 R, 0 P, 0 N, 0 L, 0 I, 0 F]
M: [14 G, 11 E, 10 K, 9 Z, 7 W, 7 T, 7 O, 5 S, 5 D, 3 R, 3 C, 3 B, 2 V, 1 Y, 1 Q, 1 P, 1 N, 1 A, 0 X, 0 U, 0 M, 0 L, 0 J, 0 I, 0 H, 0 F]
N: [17 C, 12 Z, 11 H, 10 U, 8 G, 7 D, 6 V, 6 K, 4 R, 4 E, 3 Q, 3 B, 2 Y, 2 W, 2 S, 2 J, 1 N, 0 X, 0 T, 0 P, 0 O, 0 M, 0 L, 0 I, 0 F, 0 A]
O: [15 G, 13 K, 10 Q, 7 U, 7 N, 7 Z, 5 Y, 5 X, 5 H, 5 C, 3 J, 2 R, 2 E, 1 T, 1 P, 1 O, 1 V, 0 D, 0 B, 0 W, 0 S, 0 M, 0 L, 0 I, 0 F, 0 A]

From: [identity profile] pupugai.livejournal.com
P: [13 O, 8 B, 7 Q, 7 G, 6 K, 6 A, 5 T, 5 M, 5 J, 4 X, 4 U, 4 N, 4 H, 4 C, 3 S, 3 R, 2 Y, 2 E, 1 W, 0 Z, 0 V, 0 P, 0 L, 0 I, 0 F, 0 D]
Q: [9 R, 9 E, 8 M, 8 J, 7 W, 7 D, 6 G, 5 O, 5 N, 4 A, 4 T, 4 Q, 4 P, 4 K, 2 X, 2 V, 1 U, 1 S, 1 H, 0 Y, 0 C, 0 Z, 0 L, 0 I, 0 F, 0 B]
R: [11 U, 10 P, 8 H, 7 Q, 6 W, 6 G, 5 J, 4 M, 3 Y, 3 V, 3 T, 3 D, 2 Z, 2 X, 2 R, 2 F, 2 C, 1 O, 1 K, 0 S, 0 A, 0 N, 0 L, 0 I, 0 E, 0 B]
S: [16 K, 12 X, 10 S, 8 G, 7 Z, 6 P, 6 C, 6 M, 3 O, 3 A, 2 W, 2 V, 2 U, 2 T, 2 R, 1 D, 0 Y, 0 Q, 0 N, 0 I, 0 F, 0 L, 0 J, 0 H, 0 E, 0 B]
T: [13 A, 9 S, 9 O, 9 N, 9 G, 8 C, 6 V, 5 Z, 5 K, 3 D, 2 Y, 2 W, 2 J, 1 X, 1 U, 1 L, 0 T, 0 R, 0 P, 0 M, 0 F, 0 Q, 0 I, 0 H, 0 E, 0 B]
U: [14 G, 11 D, 10 Y, 10 Q, 7 J, 7 R, 5 V, 5 S, 5 N, 3 Z, 3 X, 3 F, 3 C, 2 O, 2 I, 1 M, 1 A, 0 U, 0 K, 0 W, 0 T, 0 P, 0 L, 0 H, 0 E, 0 B]
V: [26 G, 9 U, 9 M, 8 C, 7 J, 6 V, 6 T, 5 Q, 4 L, 4 D, 3 Y, 1 P, 1 N, 1 F, 0 Z, 0 X, 0 K, 0 I, 0 A, 0 W, 0 S, 0 R, 0 O, 0 H, 0 E, 0 B]
W: [12 X, 11 F, 10 K, 10 G, 8 W, 7 Y, 5 T, 5 C, 4 P, 4 M, 4 I, 2 N, 2 J, 2 D, 1 U, 1 S, 0 V, 0 O, 0 A, 0 Z, 0 R, 0 Q, 0 L, 0 H, 0 E, 0 B]
X: [10 P, 9 C, 9 A, 8 N, 8 I, 6 W, 6 S, 6 K, 5 J, 3 Z, 3 Q, 3 F, 2 O, 2 M, 2 L, 2 G, 1 Y, 1 V, 0 T, 0 R, 0 D, 0 X, 0 U, 0 H, 0 E, 0 B]
Y: [10 C, 9 Q, 9 L, 8 S, 7 F, 7 D, 6 Z, 6 V, 5 K, 5 I, 4 P, 4 N, 2 U, 1 Y, 1 G, 1 B, 1 W, 1 T, 1 O, 1 M, 0 X, 0 R, 0 J, 0 H, 0 E, 0 A]
Z: [17 G, 13 T, 9 O, 9 I, 7 V, 6 L, 5 Q, 5 C, 4 Y, 3 R, 3 P, 2 W, 2 K, 2 E, 1 Z, 0 U, 0 S, 0 N, 0 M, 0 J, 0 B, 0 X, 0 H, 0 F, 0 D, 0 A]

В каждой строчке этой таблицы частоты встречания букв после данной буквы (в процентах). Например после Z, с частотой 17% встречается G, с частотой 13% T, и т.д.
Жирным, курсивом и подчеркиванием выделены три цепочки, соответствующие самым частым буквам. Жирная цепочка соответствует "e". То есть в e переходит S после A, W после B, и т.д.

Hi everyone!

Date: 2011-02-15 10:32 pm (UTC)
From: (Anonymous)
I've to admit that i sometimes get bored to learn the entire thing but i believe you can add some value. Bravo !
I’m still studying from you, but I’m bettering myself. I actually love reading the whole lot that is written on your blog.Keep the tales coming. I beloved it!
I’ve not too long ago started a weblog, the information you present on this web site has helped me tremendously. Thanks for all your time & work.
I know this isn’t exactly on subject, however i have a site using the identical program as well and i get troubles with my comments displaying. is there a setting i am lacking? it’s potential you may help me out? thanx.
Highly rated post. I learn one thing totally new on totally different blogs everyday. Deciding on one . stimulating to read the paper content material from other writers and be taught somewhat one thing from their website. I’d like to use sure of this content on my blog you’re mind. Natually I’ll give a link right here we are at your internet-site. Respect your sharing.

Profile

apximhd: (Default)Alexey V. Pasechnik

December 2025

S M T W T F S
 123456
78910111213
14151617181920
212223 24252627
28 2930 31   

Page Summary

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 1st, 2026 09:31 pm
Powered by Dreamwidth Studios