Колмогоровская сложность также известна как описательная сложность,сложность Колмогорова — Хайтина, стохастическая сложность, алгоритмическая энтропия или алгоритмическая сложность.
Выражает возможность фрактального описания.
К примеру, рассмотрим две строки длиной 64 символа, содержащие только символы в нижнем регистре и цифры:
Первая строка имеет простое описание на естественном языке, а именно ab 32 раза, состоящее из 10 символов. Вторая строка не имеет очевидного простого описания с использованием того же набора символов, кроме собственно самой этой строки, длина которой составляет 64 символа.
Более формально, сложность строки — это длина описания этой строки на некотором универсальномязыке описания. Способность сложности к изменению относительно выбора языка описания обсуждается ниже. Колмогоровская сложность любой строки не может быть более, чем на несколько байт больше, чем длина самой этой строки, так как программа может выглядеть как одна команда "напечатать строку", где строка указана в явном виде. Строки, чья колмогоровская сложность слабо зависит от размера самой строки, не считаются сложными.
Чтобы определить колмогоровскую сложность, мы должны сначала задать язык описания строк. Такой язык описания может быть основан на любом языке программирования, таком как Lisp, Pascal или Java. Если — программа, выходом которой является строка , то — описание . Длиной описания является длина как строки. В ходе определения длины должны быть вычислены дли́ны подпрограмм, использующихся в . Длина любой целой константы , которая появляется в — это количество битов, требующихся для представления , равное (грубо) .
Мы можем альтернативно выбрать кодировку для машины Тьюринга, где кодировка — функция, устанавливающая в соответствие каждой машине Тьюринга битовую строку . Если — машина Тьюринга, которая на вход даёт на выходе строку , то объединённая строка есть описание для . Это теоретический подход, который является более подходящим для построения детальных формальных доказательств и предпочтителен в исследовательской литературе. Двоичное лямбда-исчисление может дать наиболее простое определение сложности. В этой статье мы используем неформальный подход.
Любая строка имеет как минимум одно описание, то есть программу
function GenerateFixedString()
returns
Если описание , минимальной длины, то есть использует наименьшее количество символов, то оно называется минимальным описанием, а длина , то есть количество символов в этом описании, — колмогоровской сложностью, . Символьно:
Рассмотрим, как выбор языка описания влияет на значение , и покажем, что эффект от смены языка описания является ограниченным.
Теорема. Если и — функции сложности, относящиеся к языкам описания и , то существует константа (зависящая только от языков и ), такая, что
Доказательство. Обратно, достаточно доказать, что существует некоторая константа , такая, что для всех битовых строк
Положим, что существует программа на языке , которая работает как интерпретатор для :
function InterpretLanguage(stringp)
где — программа на языке . Интерпретатор характеризуется следующим свойством:
Возвращаемым значением в результате работы InterpretLanguage на входных данных будет результат работы .
Таким образом, если является программой на языке , которая является минимальным описанием , то InterpretLanguage() возвращает строку . Длина этого описания есть сумма:
Длины программы InterpretLanguage, которая может быть принята за константу .
Идея теории колмогоровской сложности основана на ключевой теореме, впервые открытой Рэем Соломоноффом (англ.Ray Solomonoff), опубликовавшим её в 1960 году, описав в работе «A Preliminary Report on a General Theory of Inductive Inference»[1] как часть своего изобретения алгоритмической вероятности. Он дал более полное описание в своих публикациях «A Formal Theory of Inductive Inference», часть 1 и 2 в журнале «Information and Control»[2][3], сделанных в 1964 году.
Позже А. Н. Колмогоровнезависимо опубликовал эту теорему в журнале «Проблемы передачи информации»[4], Грегори Хайтин также представил эту теорему в журнале «J. ACM». Работа Хайтина была отправлена в октябре 1966 года, исправлена в декабре 1968 года и цитирует обе работы Соломоноффа и Колмогорова.[5]
Теорема утверждает, что среди алгоритмов, восстанавливающих (декодирующих) строки из их описаний (кодов) существует оптимальный. Этот алгоритм для всех строк даёт такие же короткие коды, как предоставляемые другими алгоритмами, с отличием на константу, зависящую от алгоритма, но не от самой строки. Соломонофф использовал этот алгоритм и предоставляемые им длины кодов для определения «универсальной вероятности» строк, на которой может быть основан индуктивный вывод последующих символов в строке. Колмогоров использовал эту теорему для определения нескольких функций строк: сложности, случайности и информации.
Когда Колмогоров узнал о работе Соломоноффа, он признал его приоритет[6]. Несколько лет работа Соломоноффа была более известна в СССР, чем на Западе. Однако, общепринято в научном сообществе ассоциировать этот тип сложности с Колмогоровым, который говорил о случайности последовательностей, в то время как алгоритмическая вероятность стала связываться с Соломоноффым, который фокусировался на прогнозировании, используя своё открытие распределения универсальной априорной вероятности.
Существуют некоторые другие варианты колмогоровской сложности или алгоритмической информации. Один из наиболее широко используемых основан на самоограниченных программах и в основном связывается с Л. А. Левиным (1974). Аксиоматический подход к колмогоровской сложности, основанный на аксиомах Блума (1967), был введен М. Бургиным (1982).
Некоторые полагают, что название «колмогоровская сложность» — это пример эффекта Матфея[7].
Основные следствия
В последующих рассуждениях под будем подразумевать сложность строки .
Несложно заметить, что минимальное описание строки не может быть больше, чем сама строка: приведённая выше программа GenerateFixedString, чей выход , больше на фиксированную величину.
Теорема. Существует константа , такая, что
Невычислимость колмогоровской сложности
Первое следствие[чего?] заключается в том, что нет эффективного способа вычисления .
Другими словами, задача вычисления алгоритмической сложности произвольной строки является алгоритмически неразрешимой — не существует программы, которая бы принимала на вход и выдавала бы на выходе целое число . Покажем это с помощью противоречия путём создания программы, которая создает строку, создать которую возможно только более длинной программой. Предположим, что существует программа
function KolmogorovComplexity(strings)
которая принимает на входе и возвращает . Теперь рассмотрим программу
function GenerateComplexString(intn)
for i = 1 to infinity:
for each string s of length exactly i
if KolmogorovComplexity(s) >= nreturnsquit
Эта программа вызывает подпрограмму KolmogorovComplexity. Программа пробует каждую строку, начиная с кратчайшей, пока не найдет строку со сложностью как минимум , которую возвращает. Следовательно, получив любое положительно целое число , она производит строку с колмогоровской сложностью не меньше . Эта программа имеет собственную фиксированную длину . Входом программы GenerateComplexString является целое и размер измеряется количеством битов, необходимым для его представления, которое есть . Далее рассмотрим следующую программу:
function GenerateParadoxicalString()
return GenerateComplexString(n0)
Эта программа вызывает GenerateComplexString как подпрограмму и также имеет свободный параметр . Эта программа выводит строку , чья сложность составляет как минимум . При благоприятном выборе параметра мы придём к противоречию. Чтобы выбрать это значение, заметим, что описывается программой GenerateParadoxicalString, чья длина не больше, чем
где константа добавлена из-за программы GenerateParadoxicalString. Так как растёт быстрее, чем , существует значение , такое, что
Но это противоречит определению о том, что имеется сложность как минимум . То есть, по определению (), допускается, что строка , возвращаемая программой GenerateParadoxicalString, может быть создана программой длиной или больше, но GenerateParadoxicalString короче, чем . Так программа KolmogorovComplexity на самом деле не может вычислить сложность случайной строки.
Это доказательство от противного, где противоречие похоже на парадокс Берри: «Пусть — наименьшее положительно целое, которое не может быть названо меньше чем двадцатью английскими словами».[8] Также возможно показать невычислимость путём сведения невычислимости к задаче остановки, так как и тьюринг-эквивалентны.[9]
В сообществе программистов существует следствие, известное как теорема о полном использовании, утверждающая, что нет компилятора с совершенной оптимизацией по размеру.
Цепное правило для колмогоровской сложности утверждает, что
Оно утверждает, что кратчайшая программа, воспроизводящая и не больше чем на превосходит по размеру программу, воспроизводящую , и программу, воспроизводящую при данном . С использованием этого выражения можно определить аналог взаимной информации для колмогоровской сложности.
Сжатие
Вычислять верхнюю границу для несложно: нужно просто сжать строку каким-либо методом, реализовать соответствующий декомпрессор на выбранном языке, соединить декомпрессор со сжатой строкой и измерить длину полученной строки.
Строка сжимается на , если имеет описание, длина которого не превосходит . Это равнозначно утверждению . Если это не выполняется, то не сжимается на . Строка, не сжимаемая на 1, называется просто несжимаемой; по принципу Дирихле, несжимаемые строки должны существовать, так как есть битовых строк длиной , но только строк длиной меньше [10].
По той же причине большинство строк сложны в том смысле, что они не могут быть значительно сжаты: не намного меньше , длины в битах. Чтобы уточнить, зафиксируем значение . Существует битовых строк длиной . Равномерное распределение вероятностей на пространстве этих битовых строк определяется точно равным весовому коэффициенту для каждой строки длиной .
Теорема. Вероятность того, что строка не сжимается на равна как минимум с равномерным распределением вероятностей на пространстве битовых строк длиной .
Для доказательства этой теоремы заметим, что количество описаний длин не превосходит , полученное из геометрической прогрессии:
Остаётся как минимум
битовых строк, несжимаемых на . Для определения вероятности разделим на .
Теорема Хайтина о неполноте
Нам известно, что во множестве всех возможных строк большинство строк являются сложными в том смысле, что не могут быть описаны в любом достаточно сжатом виде. Однако, оказывается, что тот факт, что конкретная строка сложна, не может быть формально доказан, если сложность строки выше определённого порога. Точная формализация представлена далее. Для начала зафиксируем частную аксиоматическую систему для натуральных чисел. Аксиоматическая система должна быть достаточно мощной, чтобы точному суждению о сложности строки можно было поставить в соответствие формулу в аксиоматической системе . Это соответствие должно обладать следующим свойством: если выводится из аксиом , то соответствующее суждение истинно.
Теорема. Существует такая константа (которая зависит только от частной аксиоматической системы и выбранного языка описания), что ни для одной строки утверждение
не может быть доказано в рамках .
Тем не менее, как легко понять, утверждение будет истинным для бесконечного множества строк, а точнее, для всех строк, за исключением конечного их числа.
Доказательство теоремы основано на самореферентной конструкции, использованной в парадоксе Берри. Доказательство от противного. Если теорема не верна, то
Предположение (X): Для любого целого числа существует строка , для которой в существует вывод формулы «» (для которой мы предположили, что она может быть формализована в ).
Рассмотрим программу, реализующую эффективное перечисление всех формальных доказательств в
function NthProof(intn)
принимающую на вход n и выдающую некоторое доказательство. Некоторые из них доказывают формулу вида «», где s и n — константы в языке . Существует программа, проверяющая, доказывает ли n-е доказательство формулу «»:
function NthProofProvesComplexityFormula(intn)
Обратно, строка s и число L могут быть вычислены программами
function StringNthProof(intn)
function ComplexityLowerBoundNthProof(intn)
Рассмотрим теперь следующую программу:
function GenerateProvablyComplexString(intn)
for i = 1 to infinity:
if NthProofProvesComplexityFormula(i) and ComplexityLowerBoundNthProof(i) ≥ nreturn StringNthProof(i)
Принимая на вход n, эта программа проверяет каждое доказательство, пока не находит некоторую строку s и доказательство формулы K(s) ≥ L для некоторого L ≥ n. Эта программа останавливается по Предположению (X). Пусть эта программа имеет длину U. Существует число n0, такое что U + log2n0 + C < n0, где C — дополнительная длина программы
function GenerateProvablyParadoxicalString()
return GenerateProvablyComplexString(n0)
Заметим, что число n0 также закодировано в этой программе, на что требуется log2(n0) информации. Программа GenerateProvablyParadoxicalString выдает строку s, для которой существует L, такое что K(s) ≥ L может быть выведено в , причём L ≥ n0. В частности для неё верно K(s) ≥ n0. Однако s может быть описана программой длины U + log2n0 + C, значит её сложность меньше n0. Полученное противоречие доказывает ложность Предположения (X).
Подобные же идеи используются для доказательства свойств константы Хайтина.
Минимальная длина сообщения
Принцип минимальной длины сообщения в статистическом и индуктивном выводе и машинном обучении был разработан Уоллесом (англ.C. S. Wallace) и Болтоном (англ.D. M. Boulton) в 1968 году. Принцип МДС является байесовским (включает априорные вероятности) и информационно-теоретическим. Он обладает желаемыми свойствами статистической инвариантности (вывод трансформируется с репараметризацией), статистической связности (даже для очень трудной задачи принцип сойдётся к нижележащей модели) и эффективности (модель, основанная на принципе МДС, сойдётся к любой достоверной нижележащей модели так быстро, как это возможно). Уоллес и Доу (англ.D. L. Dowe) показали формальную связь между принципом МДС и алгоритмической теорией информации (или колмогоровской сложностью).
Колмогоровская случайность
Согласно определению колмогоровской случайности (также алгоритмической случайности) строка называется случайной тогда и только тогда, когда она короче любой компьютерной программы, способной её воспроизвести. Чтобы сделать это определение точным, нужно зафиксировать универсальный компьютер (или универсальную машину Тьюринга), так что «компьютерная программа» будет обозначать программу для этой универсальной машины. Случайная в этом смысле строка будет «несжимаемой». С помощью принципа Дирихле легко показать, что для любой универсальной машины существуют алгоритмически случайные строки любой длины, однако свойство строки быть алгоритмически случайной зависит от выбора универсальной машины.
Это определение можно расширить на бесконечные последовательности символов конечного алфавита. Определение можно изложить тремя эквивалентными способами. Первый способ использует эффективный аналог теории меры; другой использует эффективный мартингал. Третий способ определения таков: бесконечная последовательность случайна, если колмогоровская сложность её начального сегмента растет достаточно быстро — существует константа c, такая что сложность любого начального сегмента длины n не меньше n − c. Оказывается, что это определение, в отличие от определения случайности конечной строки, не зависит от выбора универсальной машины.
Связь с энтропией
Согласно теореме Брудно, энтропия динамической системы и алгоритмическая сложность траекторий в ней связаны соотношением для почти всех.[11]
Можно показать[12], что колмогоровская сложность результата работы марковского источника информации связана с его энтропией. Более точно, колмогоровская сложность результата работы марковского источника информации, нормализованная на длины результата, сходится почти всегда к энтропии источника.
Jill IrelandIreland pada 1967LahirJill Dorothy Ireland(1936-04-24)24 April 1936London, InggrisMeninggal18 Mei 1990(1990-05-18) (umur 54)Malibu, California, Amerika SerikatPekerjaanPemeranTahun aktif1955–1990Suami/istriDavid McCallum (m. 1957; bercerai 1967) Charles Bronson (m. 1968)Anak5, yang meliputi Val McCallum dan Katrina Holden Bronson Jill Dorothy Ireland (24 April 1936 –&...
SroyoDesaKantor Desa SroyoNegara IndonesiaProvinsiJawa TengahKabupatenKaranganyarKecamatanJatenKode pos57731Kode Kemendagri33.13.11.2007 Luas... km²Jumlah penduduk... jiwaKepadatan... jiwa/km² Sroyo adalah desa di kecamatan Jaten, Karanganyar, Jawa Tengah, Indonesia. Pembagian wilayah Desa Sroyo terdiri dari beberapa dukuh/dusun: Beluk Kidul Dalon Gedangan Grumbulsawit Karangasem Kasak Menjing Ngabean Ngelom Ngledok Pulosari Sepreh Sroyo Tundungan Pendidikan Lembaga pendidikan yang ada...
Basilika Maria Diangkat ke SurgaBasilika Minor Maria Diangkat ke Surgabahasa Latvia: Aglonas Vissvētākās Jaunavas Marijas debesīs uzņemšanas Romas katoļu bazilikaBasilika Maria Diangkat ke Surga56°07′37″N 27°00′56″E / 56.12694°N 27.01556°E / 56.12694; 27.01556Koordinat: 56°07′37″N 27°00′56″E / 56.12694°N 27.01556°E / 56.12694; 27.01556LokasiAglonaNegara LatviaDenominasiGereja Katolik RomaSitus webWebiste B...
Date A Live IVMusim 4Key visualNegara asalJepangRilisJaringan asliAT-XTanggal disiarkan8 April (2022-04-08) –24 Juni 2022 (2022-6-24)Kronologi Musim← SebelumnyaDate A Live III Berikutnya →Date A Live V Musim keempat dari serial anime Date A Live, berjudul Date A Live IV (デート・ア・ライブIVcode: ja is deprecated , Dēto A Raibu IV),[1][2] diproduksi oleh Geek Toys dan disutradarai oleh Jun Nakagawa. Seperti seri lainnya, ini mengik...
Genus of extinct fishes DunkleosteusTemporal range: Late Devonian (Frasnian to Famennian), 382–358 Ma PreꞒ Ꞓ O S D C P T J K Pg N Partially reconstructed D. terrelli skull and trunk armor (specimen CMNH 5768), Cleveland Museum of Natural History Scientific classification Domain: Eukaryota Kingdom: Animalia Phylum: Chordata Class: †Placodermi Order: †Arthrodira Suborder: †Brachythoraci Family: †Dunkleosteidae Genus: †DunkleosteusLehman, 1956 Type species †Dinichthys terr...
Perang Salib KelimaBagian dari Perang SalibPara tentara Salib dari Frisia berhadapan dengan Menara Damietta di Mesir.Tanggal1213–1221LokasiLevant dan MesirHasil Kemenangan mutlak Dinasti Ayyubiyyah Perjanjian perdamaian selama 8 tahun antara Dinasti Ayyubiyyah dan Tentara SalibPihak terlibat Kekaisaran Latin Konstantinopel Yerusalem Kerajaan Siprus Kesultanan Rûm Seljuk Kekaisaran Romawi Suci Kadipaten Austria County Tirol Kadipaten Bayerns Kadipaten Meranien County Holandia Elektorat Köl...
هذه المقالة بحاجة لصندوق معلومات. فضلًا ساعد في تحسين هذه المقالة بإضافة صندوق معلومات مخصص إليها. تسمى التعتيق[1] أو التسوية يعتبر التعتيق أحد طرق تليين اللحوم يقصد به حفظ اللحوم فترة وهذا يساعد على ليونة الألياف بفعل بعض الأنزيمات المحللة للبروتين, وتزيد نسبة الحموضة...
This article is about LGBT rights in Northern Cyprus. For LGBT rights in the Republic of Cyprus, see LGBT rights in Cyprus. LGBT rights in Northern CyprusNorthern CyprusStatusLegal since 2014Gender identityNoMilitaryYes[1]Discrimination protectionsYes[2][3]Family rightsRecognition of relationshipsNoAdoptionNo Lesbian, gay, bisexual, and transgender (LGBT) persons in TRNC (Turkish Republic of Northern Cyprus) face legal challenges not experienced by non-LGBT residents. ...
هذه المقالة عن المجموعة العرقية الأتراك وليس عن من يحملون جنسية الجمهورية التركية أتراكTürkler (بالتركية) التعداد الكليالتعداد 70~83 مليون نسمةمناطق الوجود المميزةالبلد القائمة ... تركياألمانياسورياالعراقبلغارياالولايات المتحدةفرنساالمملكة المتحدةهولنداالنمساأسترالي�...
Pour les articles homonymes, voir Williams. Ne pas confondre avec Venus Williams, sa sœur aînée, également joueuse de tennis. Serena Williams (épouse Ohanian) Serena Williams à Roland Garros en 2018. Carrière professionnelle 1995 – 2022 Nom de naissance Serena Jameka Williams Pays États-Unis Naissance 26 septembre 1981 (42 ans)Saginaw, Michigan Taille 1,75 m (5′ 9″) Prise de raquette Droitière, revers à deux mains Entraîneurs Richard Williams (père) (1994-202...
See also: Demographics of Gibraltar Languages of GibraltarOne of the many bilingual signs found in the Gibraltar Nature Reserve, printed in both English and Spanish.OfficialEnglishRecognisedSpanishMainEnglishVernacularLlanitoMinorityMaghrebi Arabic, Sindhi, Hindi, Maltese, HebrewSignedBritish Sign LanguageKeyboard layoutBritish (QWERTY) Part of a series on theCulture of Gibraltar History People Genoese Jews Maltese Languages English Llanito Andalusian Spanish Cuisine Religion Roman Cath...
Faroese lawyer and politician Aksel V. JohannesenAksel V. Johannesen, 2015Prime Minister of the Faroe IslandsIncumbentAssumed office 22 December 2022MonarchsMargrethe II Frederik XDeputyHøgni HoydalPreceded byBárður á Steig NielsenIn office15 September 2015 – 16 September 2019MonarchMargrethe IIDeputyHøgni HoydalPreceded byKaj Leo JohannesenSucceeded byBárður á Steig NielsenLeader of the Social Democratic PartyIncumbentAssumed office 5 March 2011Preceded byJóannes ...
Reservoir in Arkansas, US This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Greers Ferry Lake – news · newspapers · books · scholar · JSTOR (November 2011) (Learn how and when to remove this message) Greers Ferry LakeLake with Sugarloaf Mountain visible on the horizonGreers Ferry LakeLocationCleburne / Van Bur...
Questa voce o sezione sull'argomento aerei non cita le fonti necessarie o quelle presenti sono insufficienti. Commento: alcune valutazioni sono opinabili e inesatte, in più, le definizioni spaziano tra le varie generazioni senza un ordine logico e cronologico Puoi migliorare questa voce aggiungendo citazioni da fonti attendibili secondo le linee guida sull'uso delle fonti. Segui i suggerimenti del progetto di riferimento. Due caccia di epoche diverse: l'F-15 Eagle e il P-51 Mustang L...
عائلة بيرنبرغمعلومات عامةالنوع أسرة تعديل - تعديل مصدري - تعديل ويكي بيانات عائلة بيرنبرغ (ـعني باللغة الهولندية «الدب الجبلي») هي عائلة فلمندية من الهانزيتين طبقة التجار والمصرفيين وأعضاء مجلس الشيوخ في هامبورغ، ولها فروع في لندن وليفورنو ومدن أوروبية أخرى. تنحدر العائل�...
Organisational body created for a certain purpose For other uses, see Institute (disambiguation). Not to be confused with Institution. The Aleksanteri Institute in Helsinki, Finland in June 2021 An institute is an organisational body created for a certain purpose. They are often research organisations (research institutes) created to do research on specific topics, or can also be a professional body. In some countries, institutes can be part of a university or other institutions of higher edu...
Article principal : Boxe aux Jeux olympiques d'été de 2020. Boxe aux Jeux olympiques d'été de 2020 Généralités Sport Boxe Organisateur(s) CIO Lieu(x) Tokyo Participants 21 (21 nations) Site(s) Ryōgoku Kokugikan Palmarès Vainqueur Sena Irie Deuxième Nesthy Petecio Troisième Irma Testa Karriss Artingstall Navigation Paris 2024 modifier L'épreuve féminine de boxe des poids plumes (-57 kg) des Jeux olympiques de 2020 de Tokyo se déroule au Ryōgoku Kokugikan du 24 juillet ...
ПосёлокСарматский 47°31′37″ с. ш. 38°36′40″ в. д.HGЯO Страна Россия Субъект Федерации Ростовская область Муниципальный район Матвеево-Курганский Сельское поселение Новониколаевское История и география Прежние названия хутор №3[1], до 1987 — поселок первого п�...
River in western Germany MöhneThe source of the MöhneLocationCountryGermanyStateNorth Rhine-WestphaliaPhysical characteristicsSource • locationSauerland • elevation550 m (1,800 ft) Mouth • locationRuhr • coordinates51°27′25″N 7°57′17″E / 51.45694°N 7.95472°E / 51.45694; 7.95472Length65.1 km (40.5 mi) [1]Basin size469 km2 (181 sq mi) ...