Симметрия в ранговой теории (часть 1)
Ilya Zelenskiy
1. Симметрия в ранговой теории
Ранговая теория описывает статистические системы не в пространстве самих состояний, а в пространстве рангов, определяемых их статистической значимостью. В этом формализме фундаментальную роль играют два взаимосвязанных явления: асимметрия, задающая иерархию рангов, и симметрия, возникающая при статистической неразличимости элементов.

Асимметрия соответствует ситуации, когда элементы занимают различные ранги с различными вероятностями и формируют устойчивую упорядоченную структуру. Напротив, симметрия возникает тогда, когда несколько элементов имеют одинаковую ранговую стоимость и, следовательно, одинаковое оптимальное распределение вероятностей. Такие элементы образуют вырожденные ранги или вырожденные группы.
Симметрия в ранговой теории не является исключением или артефактом данных. Напротив, как будет показано ниже, она является естественным и неизбежным следствием оптимальности распределения и ограниченности числа структурно различимых рангов.
1.1 Ранговые распределения и цепи Маркова
Ранговое распределение формируется на основе статистики наблюдаемых последовательностей. Переходы между элементами в этих последовательностях задают цепь Маркова, определяющую частоты появления элементов в различных позициях.

Важно подчеркнуть, что в ранговой теории цепь Маркова играет вспомогательную роль. Она не является объектом оптимизации, а служит источником статистики, из которой выводится ранговое распределение как решение вариационной задачи минимизации функционала ранговой стоимости и энтропии (см. теоремы R.1–R.7).
Таким образом, ранги отражают структурные уровни системы, а не конкретные символы или состояния. Различные элементы могут быть статистически неразличимы и, следовательно, занимать один и тот же ранг.

1.2 Вырожденные группы и симметрия
Вырожденная группа представляет собой множество элементов, для которых оптимальное распределение присваивает одинаковую вероятность. Формально, такие элементы имеют одинаковую ранговую стоимость и неразличимы на уровне функционала затрат.

Согласно теоремам, вырожденные группы обладают рядом фундаментальных свойств:
- они неизбежно возникают при росте объёма данных;
- они соответствуют статистически эквивалентным комбинациям элементов;
- их существование определяется структурой рангового пространства, а не конкретной реализацией датасета.

Симметрия внутри вырожденной группы означает отсутствие предпочтительного направления выбора между элементами. Это приводит к увеличению энтропии внутри группы и делает такие элементы более чувствительными к флуктуациям, шуму и внешним воздействиям.
1.3 Энтропия и устойчивость симметрии
Одним из ключевых следствий ранговой теории является то, что симметрия не является редким состоянием. Напротив, при росте данных наблюдается следующая картина:
- уникальные ранги соответствуют устойчивым структурным уровням;
- большинство новых элементов не формируют новые ранги, а попадают в уже существующие;
- размеры вырожденных групп со временем растут.

Это означает, что асимметрии определяют глобальную форму распределения, тогда как симметрии количественно доминируют и формируют внутреннюю неопределённость системы.
Такая неопределённость не является ошибкой модели. Она представляет собой прямое следствие оптимальности распределения и отражает реальные статистические свойства наблюдаемых данных.
1.4 Роль симметрии в дальнейшей динамике
Симметрия в ранговой теории играет двойственную роль. С одной стороны, она обеспечивает глобальную устойчивость оптимального распределения. С другой стороны, симметрия приводит к появлению подпространств вырождения, в которых функционал затрат обладает пониженной кривизной.

Как показано в теоремах S.3–S.4, именно в этих подпространствах возникают:
- минимальные собственные значения гессиана;
- медленная релаксация к оптимальному распределению;
- усиленная чувствительность к шуму;
- рост дисперсии и времени обучения.
Таким образом, симметрия приводит к появлению направлений, в которых динамика системы существенно замедляется, а флуктуации усиливаются. Эти эффекты лежат в основе таких наблюдаемых явлений, как конкуренция альтернативных продолжений, усиление контекстной зависимости и необходимость дополнительного регулирования динамики.
Симметрия в ранговой теории не является частным случаем и не представляет собой дефект модели. Это фундаментальное свойство рангового пространства, возникающее из оптимальности распределения и ограниченности числа структурно различимых рангов.
Понимание природы симметрии является необходимым шагом для анализа контекста, динамики и устойчивости ранговых систем. В последующих разделах мы покажем, как эти свойства симметрии проявляются в динамике, обучении и бифуркациях ранговых моделей.

2. Примеры ранговых распределений и их интерпретация
В этом разделе мы рассматриваем типичные формы ранговых распределений, наблюдаемые в эмпирических данных, и интерпретируем их с точки зрения теорем раздела S. Основное внимание уделяется проявлениям симметрии, вырождения и их роли в устойчивости и динамике ранговых структур.
Мы показываем, что характерные формы распределений — концентрация элементов в ограниченном числе рангов, плато частот и доминирование симметричных групп — не являются эмпирическими артефактами, а непосредственно следуют из вариационной структуры ранговой оптимизации и малошумовой динамики.

2.1 Ранги и количество элементов
На первом графике показано распределение числа элементов по рангам. Каждый ранг соответствует фиксированному значению ранговой стоимости, а высота столбца отражает количество элементов, статистически неразличимых в рамках данного ранга.
Согласно теоремам S.1–S.3, ранговое пространство обладает принципиальным ограничением: число структурно различимых уровней конечно и определяется формой функции ранговой стоимости, тогда как число элементов может расти неограниченно.
В результате, при увеличении объёма данных новые элементы с высокой вероятностью не формируют новые ранги, а заполняют уже существующие уровни, усиливая их вырождение.
Это приводит к систематическому росту вырожденных рангов и концентрации элементов в ограниченном числе уровней. Важно подчеркнуть, что данный эффект:
- не зависит от конкретного распределения данных,
- сохраняется при изменении масштаба выборки,
- является прямым следствием вариационного принципа с энтропийным регуляризатором.
С точки зрения Теоремы S.4, такие вырожденные ранги соответствуют направлениям с минимальной кривизной функционала, что делает их особенно чувствительными к флуктуациям и медленно релаксирующими.
2.2 Распределение частотности по рангам
Второй график показывает распределение частот появления элементов в зависимости от ранга. В отличие от предыдущего случая, здесь анализируется не индивидуальная статистика элементов, а агрегированное поведение рангов в цепях Маркова, порождающих наблюдаемую последовательность.
Согласно Теореме S.3.2, в малошумовом пределе стационарное распределение концентрируется вблизи минимумов ранговой стоимости. Это приводит к усилению различий между рангами. Однако внутри вырожденных рангов эта концентрация не разрушает симметрию.
В результате наблюдается следующая структура:
- различия между рангами являются устойчивыми и усиливаются при уменьшении шума;
- внутри одного ранга элементы остаются статистически эквивалентными;
- флуктуации перераспределяют вероятность внутри вырожденных групп, не нарушая глобального рангового порядка.
Именно этот механизм объясняет характерную плато-структуру частот: внутри ранга частоты сглажены, тогда как переходы между рангами сопровождаются резкими скачками.
Теорема S.4 уточняет этот эффект, показывая, что релаксация внутри вырожденных подпространств происходит медленно, а дисперсия флуктуаций растёт пропорционально вероятности ранга и обратно пропорционально параметру β (чувствительность системы/температура). Это приводит к устойчивой, но энтропийно насыщенной структуре внутри симметричных групп.
2.3 Структура симметрии: доля асимметрий и вырожденных групп
Круговая диаграмма иллюстрирует соотношение между элементами, формирующими уникальные асимметрии, и элементами, принадлежащими вырожденным симметричным группам.
Наблюдаемая структура имеет прямое теоретическое объяснение:
- элементы, образующие уникальные ранги, соответствуют изолированным минимумам ранговой стоимости;
- такие состояния структурно устойчивы, но редки;
- при росте статистики вероятность появления новых уникальных рангов стремится к нулю.
В терминах теорем раздела S это означает, что:
- асимметрии соответствуют глубоким энергетическим минимумам;
- симметричные группы образуют широкие энтропийные плато;
- переходы между различными асимметриями экспоненциально подавлены при малом шуме (Теорема S.3.2),
- тогда как движение внутри симметричных областей остаётся динамически разрешённым и медленным (Теорема S.4).
Эмпирическое наблюдение, что доля асимметричных элементов составляет порядка нескольких процентов и уменьшается при росте данных, полностью согласуется с теорией концентрации меры и экспоненциального роста времён перехода между различимыми структурами.
Рассмотренные примеры демонстрируют фундаментальное свойство ранговых систем:
- асимметрии редки, но структурно доминируют;
- симметрии многочисленны и определяют энтропийные свойства системы;
- глобальная устойчивость обеспечивается энергетическими барьерами,
- локальная неопределённость сохраняется внутри вырожденных рангов.
Таким образом, наблюдаемое доминирование симметрии является не эмпирическим эффектом конкретных данных, а прямым следствием малошумовой динамики и геометрии рангового пространства, формализованной в теоремах S.1–S.4.

3. Роль контекста H в ранговой динамике
В ранговой теории контекст H формализуется как вклад в энергетический функционал, определяющий стационарное распределение и динамику цепи Маркова в пространстве упорядочиваний. Его роль заключается не в случайном разрушении симметрии, а в структурной модуляции энергетического ландшафта, управляющей разрешением вырождений и асимптотическим выбором состояний.
3.1 Контекст как часть энергетического функционала
Согласно Теореме S.3.1, стационарное распределение цепи Маркова в ранговом пространстве имеет гиббсовскую форму:

где энергетический функционал H(π) включает как вклад ранговой стоимости, так и контекстные поправки.
Контекст H действует глобально: он не изменяет отдельные элементы или переходы локально, а переопределяет относительные энергии допустимых упорядочиваний целиком. Тем самым контекст задаёт геометрию энергетического ландшафта, в котором разворачивается динамика цепи Маркова.
Внутри вырожденных групп — классов упорядочиваний с одинаковой ранговой стоимостью — именно контекстный вклад становится единственным источником различий между состояниями, устраняя их статистическую неразличимость.
3.2 Регулирование симметрии в вырожденных группах
В отсутствие контекста вырожденные ранги формируют плоские энергетические плато: для всех состояний внутри группы значение H совпадает, а стационарное распределение является равномерным. Согласно Теореме S.3.2, в этом случае динамика цепи Маркова свободно блуждает внутри плато, и выбор конкретного состояния определяется флуктуациями.

Введение контекста H:
- сохраняет глобальную ранговую структуру;
- нарушает точное равенство энергий внутри плато;
- индуцирует различимые энергетические барьеры между элементами одной вырожденной группы.
Таким образом, симметрия не уничтожается, а переходит в управляемую форму: различия между элементами обусловлены структурой контекста, а не случайным шумом. Это принципиально отличает контекстное разрешение симметрии от стохастического.

3.3 Контекст и асимптотика выбора
Из Теоремы S.3.2 следует, что в малошумовом пределе β→0 стационарное распределение концентрируется на состояниях с минимальным значением энергетического функционала H. В частности, для двух состояний π1 и π2:

Следовательно, даже малое контекстное смещение приводит к экспоненциальному усилению предпочтений. Это объясняет, почему в присутствии контекста система демонстрирует устойчивый выбор внутри ранее симметричных групп, а не случайное чередование альтернатив.
Важно, что этот эффект не требует сильного контекста: при достаточно малой температуре слабые различия в H приводят к детерминированному поведению на наблюдаемых временных масштабах. В теореме S.4 показано, что именно такие направления обладают повышенной чувствительностью и замедленной релаксацией.

3.4 Интерпретация иллюстраций
Изображение А иллюстрирует ранговое пространство с вырожденной группой и графом переходов цепи Маркова. Контекст H деформирует энергетический профиль вершин, направляя динамику внутри группы без изменения глобальной иерархии рангов.
Изображение Б демонстрирует частный случай двух альтернатив, равновероятных в отсутствие контекста. После учёта контекстного вклада их вероятности расходятся, что является прямым следствием изменения стационарного распределения в соответствии с Теоремой S.3.1, а не результатом случайного выбора.
Контекст H в ранговой теории:
- не разрушает симметрию случайным образом;
- регулирует её через изменение энергетического ландшафта;
- определяет асимптотически устойчивый выбор в вырожденных группах;
- снижает неопределённость без введения внешнего шума.
Тем самым контекст выступает как структурный механизм разрешения симметрии, согласованный с теорией больших отклонений и асимптотикой цепей Маркова в малошумовом пределе. В следующем разделе будет показано, что именно такие симметричные подпространства определяют чувствительность, медленную релаксацию и динамику обучения системы.

4. Контекст, а не ошибка
В ранговой теории величина H, возникающая в правиле Метрополиса, не является ошибкой предсказания. Она представляет собой контекст, сформированный предшествующей историей системы и используемый для стохастического выбора между альтернативными устойчивыми упорядочиваниями.
Формально величина контекста определяется как

где x_MC — предсказание, согласованное со стационарным распределением цепи Маркова, а не с локальной линейной аппроксимацией входа (Теорема S.3.1).
Таким образом, H не является сигналом коррекции, минимизирующим локальную ошибку. Он является сигналом разрешения неопределённости, управляющим вероятностным выбором между несколькими допустимыми структурами, существующими в условиях вырождения.

4.1. Сопоставление с Predictive Coding и правилом Метрополиса
В классическом Predictive Coding используется детерминированная ошибка:
Err=x−W(x), где W(x) — детерминированное предсказание.
Этот сигнал:
- интерпретируется как ошибка,
- вычитается из входа,
- подавляет альтернативные интерпретации.
Математически это соответствует жёсткой стабилизации одной траектории, что эффективно разрушает пространство альтернативных цепей Маркова.
В ранговой теории используется принципиально иная операция:

которая не вычитается из входа, а входит в вероятность принятия перехода по правилу Метрополиса:

Здесь H:
- не минимизируется,
- не интерпретируется как ошибка,
- формирует энергетический контекст стохастического выбора.
Это различие является структурным, а не терминологическим.
4.2. Слой 6 → слои 2/3 и 4: нисходящий контекст
В коре головного мозга слой 6 формирует нисходящие сигналы, которые:
- не кодируют сенсорную ошибку,
- агрегируют информацию по иерархии,
- задают контекст интерпретации.

Эта роль полностью соответствует функции H в ранговой теории:
- слой 6 агрегирует информацию по иерархическим уровням,
- формирует функционал H,
- влияет на вероятности переходов между упорядочиваниями.
Такой сигнал не может быть ошибкой, поскольку он основан на уже интегрированной информации и управляет выбором, а не коррекцией.
Именно поэтому нисходящие сигналы слоя 6 не укладываются в классическую схему Predictive Coding, но естественно интерпретируются в рамках правила Метрополиса.
4.3. Таламус как интегратор контекстов, а не ошибок
Сигналы слоя 6 из различных корковых областей сходятся в ассоциативных ядрах таламуса.

При этом таламус:
- объединяет контексты,
- накладывает их на сенсорный поток,
- не вычисляет разность «ожидание − вход».
С точки зрения ранговой теории, таламус это стационарная проекция рангового пространства и участвует в формировании стационарного распределения на множестве альтернативных упорядочиваний, а не в минимизации локальной ошибки.
Таким образом, таламус реализует вероятностную интеграцию контекстов, что согласуется с марковской природой переходов, но несовместимо с интерпретацией его функции как узла вычисления ошибки.
4.4. Контекст объединяет модальности
Контекст H в ранговой теории напрямую соответствует процессам в мультисенсорной коре.

Например: слуховой контекст стабилизирует зрительную интерпретацию, зрительный контекст уточняет слуховую. При этом никакая модальность не «исправляет» другую.
Между модальностями отсутствует локальная ошибка, но присутствует общий контекст, который:
- разрушает симметрии,
- разрешает вырождение,
- повышает устойчивость выбранной интерпретации.
В терминах ранговой теории, H — это нисходящая интеграция предшествующей информации, которая модифицирует ранги элементов, не уничтожая альтернативы.

4.5. Контекст сохраняет альтернативные цепи
Ключевое различие между подходами можно сформулировать строго:
Predictive Coding: ошибка вычитается → альтернативы подавляются → одна траектория фиксируется.
Ранговая теория: контекст H модифицирует Gibbs-распределение → альтернативные цепи Маркова сохраняют ненулевую вероятность.
Это свойство критично для разрешения вырождения, переключения между устойчивыми режимами и объяснения мультистабильности и контекст-зависимого восприятия.
Согласно Теоремам S.3.1–S.3.2 и S.4, именно контекст H определяет: энергетический ландшафт, времена переходов и чувствительность системы в подпространстве вырождения.
Следовательно, H принципиально не является ошибкой, а представляет собой строго выведенный механизм стохастического выбора, основанный на правиле Метрополиса.
Predictive Coding корректно описывает локальную стабилизацию, но не описывает выбор между альтернативными устойчивыми структурами.
Ранговая теория делает это строго через контекст H, а не через ошибку.

5. Застревание в локальном максимуме
Застревание в локальном максимуме является прямым следствием вырождения в ранговом пространстве, а не ошибкой оптимизации или обучения.

Рассмотрим уровень иерархии k, на котором несколько элементов имеют одинаковую ранговую стоимость:

Это индуцирует классы эквивалентности Cm(k), внутри которых оптимальное распределение

В результате пространство допустимых решений содержит множество эквивалентных упорядочиваний Π(k), связанных симметрией.

5.1 Локальный максимум как динамический эффект симметрии
При отсутствии контекста или при контексте, не различающем элементы внутри Cm(k):
- элементы внутри класса эквивалентности становятся симметричными;
- переходные вероятности цепи Маркова внутри класса теряют направленность;
- динамика замыкается в одной орбите перестановок.
Согласно Теореме S.4, в подпространстве вырождения минимальное собственное значение гессиана

мало, а время релаксации

велико.
Это означает, что система динамически застревает в окрестности одного упорядочивания или малого множества эквивалентных состояний, несмотря на наличие альтернатив.
Время релаксации в рамках ранговой теории — это относительная величина, которая характеризует, как быстро распределение вероятностей в ранговом пространстве приходит к равновесию после возмущения.
- Оно не является прямым физическим временем (секунды, минуты), а связано со структурой и статистикой последовательности данных.
- Если система получает сигналы с определённой частотой, время релаксации можно сопоставить с интервалами реального времени, но это только косвенно.
- В многоуровневой иерархии оно отражает эффект сжатия данных: на более высоких уровнях (агрегированных) наблюдаем меньшее число значимых сигналов, и, следовательно, «релятивное» время релаксации будет больше.
- Формально, время релаксации показывает, сколько «шагов» последовательности нужно для статистического выравнивания распределения.
Простая аналогия:
Если на нижнем уровне каждый сигнал — это секунда, то на верхнем уровне, где сигналы агрегированы, один сигнал может представлять несколько секунд. Время релаксации учитывает эту разницу и показывает, как быстро система достигает стабильного распределения вероятностей на каждом уровне.

5.2 Почему это не ошибка оптимизации
Важно подчеркнуть, что наблюдаемый локальный максимум:
- не является максимумом функции правдоподобия;
- не связан с неправильным обучением;
- не нарушает стационарное распределение цепи Маркова.
Напротив, система корректно реализует стационарное распределение, но энергетический ландшафт внутри вырожденной группы оказывается плоским.
Именно это приводит к устойчивым циклам, например:
«что вот что вот что вот …»
в языковых моделях.

5.3 Dropout как случайное разрушение симметрии
Распространённое инженерное решение — Dropout — работает за счёт случайного исключения элементов и, тем самым, искусственного разрушения симметрии.
С точки зрения ранговой теории Dropout эквивалентен случайному удалению состояний из Π(k) без изменения функционала H(k).
Последовательность такова:
Dropout → разрушение симметрии → фиксация маршрута.
Однако, как следует из Теоремы S.4, это не устраняет вырождение, а лишь выбирает один из возможных локальных максимумов.
5.4 Контекст как механизм регулирования симметрии
Ранговая теория предлагает принципиально иной подход: симметрию не ломать, а регулировать.
Это достигается введением контекста H(k) в правило Метрополиса и определяющий стационарное распределение:

Контекст H:
- одинаково применяется ко всем элементам вырожденной группы;
- изменяет их вероятности строго пропорционально структуре предшествующих зависимостей;
- не устраняет альтернативы, а перераспределяет их веса.

В результате:
- симметрия разрушается не случайно, а структурно;
- альтернативные цепи Маркова сохраняются;
- выбор осуществляется согласованно с иерархией контекста.
Последовательность имеет вид:
Контекст → регулирование симметрии → согласованный выбор → избежание локального максимума.
Согласно Теоремам S.3.1 и S.4, такой подход сохраняет корректное стационарное распределение и предотвращает динамическое застревание.
Сравнение подходов

Застревание в локальном максимуме является не багом, а прямым следствием нерегулируемой симметрии в ранговом пространстве.
- Dropout разрушает симметрию случайно и временно.
- Контекст H, выведенный из структуры рангового пространства, регулирует симметрию корректно.
- Теорема S.4 формально объясняет устойчивость и длительность застревания.