Современная электронная библиотека ModernLib.Net

Методы статистического анализа исторических текстов (часть 1)

ModernLib.Net / История / Фоменко Анатолий Тимофеевич / Методы статистического анализа исторических текстов (часть 1) - Чтение (стр. 23)
Автор: Фоменко Анатолий Тимофеевич
Жанр: История

 

 


      x_1 + ... + x_n = y_1 + ... + y_n = B-A.
      Рассмотрим теперь множество всех целочисленных векторов c=(c_1,...,c_n), у которых все координаты неотрицательны и их сумма c_1+...+c_n равна одному и тому же числу, а именно B-A, то есть длине временно'го интервала (A,B). Обозначим множество всех таких векторов через S. Геометрически, эти векторы можно изобразить так. Будем считать, что все они выходят из начала координат, то есть из точки O в R_n. Рассмотрим концы все такие векторов c=(c_1,...,c_n). Все они лежат на "многомерном симплексе" L, определяемом в пространстве R_n одним уравнением
      c_1 + ... + c_n = B-A, где все координаты c_1,...,c_n являются вещественными неотрицательными числами. Множество S геометрически изображается как множество "целых точек" на симплексе L, то есть множество всех точек из L, имеющих целочисленные координаты.
      Ясно, что концы векторов локальных максимумов a(X) и a(Y) для летописей X и Y принадлежат множеству S. См. рис.3.7.
      Фиксируем теперь вектор a(X)=(x_1,...,x_n) и рассмотрим все векторы c=(c_1,...,c_n) (с вещественными координатами), принадлежащие симплексу L и такие, что они удовлетворяют еще одному дополнительному соотношению:
      (с_1 - x_1)^2 + ... + (c_n - x_n)^2 <
      
      (y_1 - x_1)^2 + ... + (y_n - x_n)^2.
      Множество всех таких векторов c=(c_1,...,c_n) мы обозначим через K. Математически эти векторы описываются как удаленные от фиксированного вектора a(X) на расстояние, не превышающее расстояния r(X,Y) от вектора a(X) до вектора a(Y). Говоря здесь о расстоянии между векторами, мы имеем в виду расстояние между их концами. Напомним, что величина
      (y_1 - x_1)^2 + ... + (y_n - x_n)^2 равна квадрату расстояния r(X,Y) между векторами a(X) и a(Y). Поэтому множество K - это часть симплекса L, попавшая в "n-мерный" шар радиуса r(X,Y) с центром в точке a(X).
      Подсчитаем теперь, сколько "целочисленных векторов" содержится в множестве K и сколько - в множестве L. Полученные числа обозначим через m(K) и m(L) соответственно. В качестве "предварительного коэффициента" p'(X,Y) мы возьмем отношение этих двух чисел, то есть
      p'(X,Y)=m(K)/m(L), то есть
      количество "целых точек" в множестве K
      p'(X,Y)= ----------------------------------------- .
      количество "целых точек" в множестве L
      Так как множество K составляет лишь часть множества L, то
      0 < p'(X,Y) < 1.
      -
      Если векторы a(X) и a(Y) совпадают, то p'(X,Y)=0. Если векторы, напротив, далеки друг от друга, то число p'(X,Y) близко к единице и даже может оказаться равным единице.
      Отметим здесь полезную, хотя и необязательную для дальнейшего, интерпретацию числа p'(X,Y). Предположим, что вектор c=(c_1,...,c_n) случайным образом пробегает все векторы из множества S, причем он с единаковой вероятностью может оказаться в любой точке этого множества. В таком случае говорят, что случайный вектор c=(c_1,...,c_n) распределен РАВНОМЕРНО на множестве S, то есть на множестве "целых точках" (n-1)-мерного симплекса. Тогда определенное нами число p'(X,Y) допускает вероятностную интерпретацию. Оно равно вероятности случайного события, заключающегося в том, что случайный вектор c=(c_1,...,c_n) оказался на расстоянии от фиксированного вектора a(X), не превышающем расстояния между векторами a(X) и a(Y). Чем меньше эта вероятность, тем менее случайна наблюдаемая нами близость векторов a(X) и a(Y). Другими словами, в этом случае их близость указывает на наличие какой-то ЗАВИСИМОСТИ между ними. И эта зависимость тем больше, чем меньше число p'(X,Y).
      Равномерность распределения случайного вектора c=(c_1,...,c_n) на симплексе L (точнее, на множестве S его "целых точек") может быть обоснована тем, что этот вектор изображает расстояния между соседними локальными максимумами функции объема "глав" исторических летописей или каких-то аналогичных текстов, описывающих заданный период времени (A,B). При рассмотрении всевозможных летописей, говорящих об истории всевоможных государств во всевозможные исторические эпохи, естественно предполагать, что локальный максимум может "с равной вероятностью" появиться в произвольной точке временно'го интервала (A,B).
      Описанное построение было выполнено в предположении, что мы фиксировали некоторый вариант введения кратных максимумов у графиков объема летописей. Таких вариантов, конечно, много. Рассмотрим все такие варианты и для каждого из них подсчитаем число p'(X,Y), после чего возьмем наименьшее из всех получившихся чисел. Обозначим его через p''(X,Y). То есть, мы минимизируем коэффициент p'(X,Y) по всем возможным способам введения локальных максимумов у графиков vol X(t) и vol Y(t).
      Наконец, вспомним, что при подсчете коэффициента p''(X,Y) летописи X и Y оказались в неравноправном положении. Дело в том, что выше мы рассматривали "n-мерный шар" радиуса r(X,Y) с центром в точке a(X). Чтобы устранить возникшее неравноправие между летописями X и Y, просто поменяем их местами и повторим описанную выше конструкцию, взяв теперь за центр "n-мерного шара" точку a(Y). В результате получится некоторое число, которое мы обозначим через p''(Y,X). В качестве "симметричного коэффициента" p(X,Y) мы возьмем среднее арифметическое чисел p'(X,Y) и p''(X,Y), то есть
      p''(X,Y) + p''(Y,X)
      p(X,Y)= --------------------.
      2
      Для наглядности поясним смысл "предварительного коэффициента" p'(X,Y) на примере графиков объема с всего лишь двумя локальными максимумами. В этом случае оба вектора
      a(X)=(x_1,x_2,x_3) и a(Y)=(y_1,y_2,y_3) являются векторами в трехмерном евклидовом пространстве. Концы этих векторов лежат на двумерном равностороннем треугольнике L, отсекающем от координатных осей в пространстве R_3 одно и то же число B-A. См.рис.3.8. Если расстояние от точки a(X) до точки a(Y) обозначить через |a(X)-a(Y)|, то множество K - это пересечение треугольника L с трехмерным шаром, центр которого находится в точке a(X), а радиус равен |a(X)-a(Y)|. После этого нужно подсчитать количество "целых точек" (то есть точек с целочисленными координатами) в множестве K и в треугольнике L. Взяв отношение получившихся чисел, мы и получим коэффициент p'(X,Y).
      При конкретных вычислениях удобно пользоваться приближенным способом вычисления коэффициента p(X,Y). Дело в том, что подсчет числа "целых точек" в множестве K довольно затруднителен. Но оказывается эту трудность можно обойти, перейдя от "дискретной модели" к "непрерывной модели". Хорошо известно, что если (n-1)-мерное множество K в (n-1)-мерном симплексе L достаточно велико, то число "целых точек" в K примерно равно (n-1)-мерному объему множества K. Поэтому с самого начала в качестве "предварительного коэффициента" p'(X,Y) можно брать просто отношение (n-1)-мерного объема K к (n-1)-мерному объему L, то есть
      (n-1)-мерный объем K
      p'(X,Y)= ----------------------.
      (n-1)-мерный объем L
      Например, в случае двух локальных максимумов в качестве коэффициента p'(X,Y) следует взять отношение:
      площадь множества K
      -------------------- .
      площадь треугольника L
      Конечно, при малых значениях B-A, "дискретный коэффициент" и "непрерывный коэффициент" различны. Но в наших исследованиях мы будем иметь дело с временны'ми интервалами B-A в несколько десятков и даже сотен лет, так что для интересующих нас целей можно, не делая большой ошибки, уверенно пользоваться "непрерывной моделью" p'(X,Y). Точные математические формулы для подсчета "непрерывного коэффициента" p'(X,Y) приведены в работе [375], с.107.
      Укажем еще одно уточнение описанной статистической модели. При работе с конкретными графиками объема исторических текстов следует "сглаживать" эти графики, чтобы устранить мелкие случайные всплески. Мы проводили такое сглаживание графика, "усредняя по соседям", то есть заменяя значение функции объема в каждой точке t на среднее арифметическое трех значений функции, а именно, в точках t-1, t, t+1. В качестве "окончательного коэффициента" p(X,Y) следует взять его значение, подсчитанное для таких "сглаженных графиков".
      Сформулированный выше принцип корреляции максимумов подвердится, если для большинства пар заведомо зависимых текстов X и Y коэффициент p(X,Y) окажется "малым", а для большинства пар заведомо независимых текстов, напротив, "большим".
      1.4. ЭКСПЕРИМЕНТАЛЬНАЯ ПРОВЕРКА ПРИНЦИПА КОРРЕЛЯЦИИ МАКСИМУМОВ.
      ПРИМЕРЫ ЗАВИСИМЫХ И НЕЗАВИСИМЫХ ИСТОРИЧЕСКИХ ТЕКСТОВ.
      В 1978-1985 годах нами был проведен первый обширный вычислительный эксперимент по подсчету чисел р(Х,Y) для нескольких сотен пар конкретных исторических текстов - хроник, летописей и т.п. Детали см. в [416], [438], [419], [375].
      Оказалось, что коэффициент р(Х,Y) достаточно хорошо различает ЗАВЕДОМО ЗАВИСИМЫЕ и ЗАВЕДОМО НЕЗАВИСИМЫЕ пары исторических текстов. Было обнаружено, что для всех исследованных нами пар реальных летописей Х,Y, описывающих ЗАВЕДОМО РАЗНЫЕ события (разные исторические эпохи или разные государства), - то есть для НЕЗАВИСИМЫХ текстов, число р(Х,Y) колеблется от 1 до 1/100 при количестве локальных максимумов от 10 до 15. Напротив, если исторические летописи Х и Y ЗАВЕДОМО ЗАВИСИМЫ, то есть описывают одни и те же события, то число р(Х,Y) не превосходит 10^{-8} для того же количества максимумов.
      Таким образом, между значениями коэффициента для зависимых и независимых текстов обнаруживается разрыв примерно на 5-6 порядков. Подчеркнем, что здесь важны не абсолютные величины получающихся коэффициентов, а тот факт, что "зона коэффициентов для заведомо зависимых текстов" отделена НЕСКОЛЬКИМИ ПОРЯДКАМИ от "зоны коэффициентов для заведомо независимых текстов". Приведем типичные примеры. Точные значения функций объемов для особо интересных летописей мы приводим в Приложении, в конце книги, чтобы не загромождать здесь изложение.
      ПРИМЕР 1.
      На рис.3.9, рис.3.10 и рис.3.11 показаны графики объемов двух заведомо зависимых исторических текстов.
      А именно, в качестве текста Х мы взяли историческую монографию современного автора В.С.Сергеева "Очерки по истории древнего Рима", тома 1-2, М., 1938, ОГИЗ.
      В качестве текста Y мы взяли "античный" источник, а именно, "Римскую историю" Тита Ливия, тома 1-6, М., 1897-1899.
      Согласно скалигеровской хронологии, эти тексты описывают события на интервале якобы 757-287 годы до н.э. Итак, здесь A = 757 год до н.э., B = 287 год до н.э. Оба текста описывают одну и ту же историческую эпоху, примерно одни и те же события. Наглядно видно, что графики объемов делают свои ОСНОВНЫЕ всплески практически одновременно. Для количественного сравнения функций следует предварительно сгладить "мелкую зыбь", то есть вторичные вплески, накладывающиеся на основные, первичные колебания графиков. При вычислении коэффициента p(X,Y) мы сгладили, усреднили эти графики, чтобы выделить лишь их ОСНОВНЫЕ локальные максимумы, в количестве не превышающем пятнадцати. Оказалось, что здесь р(Х,Y) = 2x10^{-12}. Малая величина коэффициента указывает на ЗАВИСИМОСТЬ сравниваемых текстов. В данном случае это неудивительно. Как мы уже отмечали, оба текста описывают один и тот же период в истории "античного" Рима. Малое значение коэффициента p(X,Y) показывает, что если рассматривать наблюдаемую близость точек всплесков обоих графиков как случайное событие, то его вероятность чрезвычайно мала. Как мы видим, современный автор В.С.Сергеев достаточно аккуратно воспроизвел в своей книге "античный" оригинал. Конечно, он дополнил его своими соображениями и комментариями, но, как выясняется, они не влияют на характер зависимости этих текстов.
      Теперь в качестве "летописи" Х' возьмем снова книгу В.С.Сергеева, а в качестве "летописи" Y' - ее же, но заменив порядок лет в тексте на противоположный. То есть, грубо говоря, прочитав книгу Сергеева "задом наперед". Оказывается, в этом случае р(Х',Y') будет равняться 1/3. Таким образом, получается значение, существенно более близкое к единице, чем предыдущее, и указывающее на независимость сравниваемых текстов. Что и неудивительно, так как проведенная нами операция "перевертывания летописи" очевидно дает два заведомо независимых текста.
      ПРИМЕР 2.
      Возьмем следующие заведомо зависимые исторические тексты, две русские летописи:
      Х - Никифоровская летопись,
      Y - Супрасльская летопись [166].
      Следующий интервал времени описан в обоих летописях: якобы, 850-1256 годы н.э.
      См. графики их объемов на рис.3.12. Оба графика объемов "глав" на интервале якобы 850-1255 годы н.э. имеют 31 всплеск и делают эти всплески практически одновременно, в одни и те же годы. Подсчет дает, что здесь р(Х,Y) = 10^{-24}. Это значение весьма мало, что подтверждает зависимость этих текстов. В Приложение 4.1 мы приводим точные численные значения функций объемов этих летописей.
      ПРИМЕР 3. Рассмотрим следующие две русские летописи:
      X - Холмогорская летопись [166],
      Y - "Повесть временных лет".
      Следующий интервал времени описан в обоих летописях: якобы, 850-1000 годы н.э. Графики объемов летописей также достигают локальных максимумов ПРАКТИЧЕСКИ ОДНОВРЕМЕННО. И снова это не случайно, а закономерно, иначе реализовался бы единственный шанс из 10^{15} шансов. Здесь p(X,Y)=10^{-15}. На указанном временно'м интервале эти две летописи зависимы. На рис.3.13 представлены сразу три графика объемов для Супрасльской летописи, Никифоровской летописи и Повести временных лет. Последняя летопись "богаче", поэтому ее график имеет больше локальных максимумов и зависимость не столь очевидна. Тем не менее, после сглаживания выясняется, что между этими тремя графиками также имеется ярко выраженная зависимость. Подробнее о сравнении "богатых" и "бедных" летописей мы расскажем в следующих разделах. Распределение объемов указанных летописей приведено в Приложении 4.1.
      ПРИМЕР 4.
      Приведем пример из средневековой римской истории.
      X - фундаментальная монография немецкого историка Фердинанда Грегоровиуса "История города Рима в средние века", тома 1-5. См. [47]. Эта книга написана в XIX веке на основе огромного числа средневековых светских и церковных документов.
      Y - Liber Pontificalis (T.Mommsen, Gestorum Pontificum Romanorum, 1898). Это "Книга Понтифексов" (то есть список и жизнеописания римских пап средних веков), восстановленная немецким историком Теодором Моммзеном на основе средневековых римских текстов. Здесь, оказывается, p(X,Y)=10^{-10}, что указывает на яркую зависимость этих двух текстов. В предположении случайности такой близости, реализовался бы один шанс из 10 миллиардов.
      И так далее. Во всех нескольких десятках обработанных нами примерах исторических текстов, - как ЗАВЕДОМО ЗАВИСИМЫХ, так и ЗАВЕДОМО НЕЗАВИСИМЫХ, - наша теоретическая модель подтвердилась. Таким образом, удалось обнаружить закономерности, позволяющие статистически характеризовать ЗАВИСИМЫЕ исторические тексты, то есть описывающие один и тот же период времени, одни и те же "потоки событий" в истории одного и того же региона, государства. В то же время, как показали эксперименты, если два исторических текста X и Y, напротив, НЕЗАВИСИМЫ, то есть описывают заведомо разные исторические эпохи, или разные регионы, или существенно разные "потоки событий", то графики объемов vol X(t) и vol Y(t) делают всплески в существенно разные годы. То есть, никакой корреляции не наблюдается. В этом последнем случае типичное значение для коэффициента p(X,Y), при количестве локальных максимумов от 10 до 15, колеблется от 1 до 1/100. Приведем типичный пример.
      ПРИМЕР 5.
      Вновь обратимся к "античной" истории Рима. В качестве сравниваемых текстов X и Y мы взяли следующие два фрагмента из книги В.С.Сергеева "Очерки по истории Древнего Рима" [188]. Первый фрагмент описывает период якобы 520-380 годы до н.э., а второй фрагмент - якобы 380-240 годы до н.э. Считается, что эти периоды независимы. Подсчет коэффициента p(X,Y) дает, что здесь он равен 1/5. Это значение разительно, на несколько порядков, отличается от типичных значений 10^{-12} - 10^{-6} для заведомо зависимых текстов, с аналогичным количеством локальных максимумов. Таким образом, эти два текста, "две половины" книги В.С.Сергеева оказываются действительно НЕЗАВИСИМЫМИ.
      Выше мы использовали такую числовую характеристику "главы", как ее объем. Однако, как показали наши исследования, аналогичные статистические закономерности (для достаточно больших исторических текстов) обнаруживаются и при использовании других числовых характеристик. Например, можно рассматривать количество имен в каждой "главе", количество ссылок на другие летописи и т.п.
      В нашем вычислительном эксперименте сравнивались:
      а) древние тексты с древними,
      б) древние с современными,
      в) современные с современными.
      Как мы уже сказали, наряду с графиками объема "глав" исследовались и другие количественные характеристики текстов. Например, графики числа упомянутых имен, графики числа упоминаний данного года в тексте, графики частот ссылок на какой-либо другой фиксированный текст, и т.п. [416], [438], [419], [375].
      Оказалось, что для всех этих характеристик выполняется тот же ПРИНЦИП КОРРЕЛЯЦИИ МАКСИМУМОВ. А именно, графики зависимых текстов делают всплески практически одновременно, а для независимых текстов точки всплесков графиков никак не коррелируют.
      Сформулируем еще одно следствие из нашей основной модели, статистической гипотезы.
      А именно, если два исторических текста ЗАВЕДОМО ЗАВИСИМЫ, то есть описывают один и тот же "поток событий" на одном и том же интервале времени в истории одного и того же государства, то для любой пары указанных выше числовых характеристик соответствующие им графики делают всплески приблизительно в одни и те же годы. Другими словами, если какой-то год в обоих летописях описан подробнее, чем соседние годы, то увеличится (локально) число упоминаний этого года в обоих летописях, увеличится количество имен персонажей, упомянутых в этом году в обоих летописях и т.п. Напротив, если тексты ЗАВЕДОМО НЕЗАВИСИМЫ, то никакой корреляции между указанными числовыми характеристиками быть не должно.
      Проверка этого "вторичного принципа корреляции максимумов" подтвердила его справедливость на конкретных заведомо зависимых исторических текстах. См. [375], с.110-111.
      1.5. МЕТОДИКА ДАТИРОВАНИЯ ИСТОРИЧЕСКИХ СОБЫТИЙ.
      Поскольку наша теоретическая модель подтвердилась на экспериментальном материале, мы можем теперь предложить новую методику датирования древних событий. Хотя она, конечно, не универсальна. Опишем идею метода.
      Пусть Y - исторический текст, описывающий неизвестный нам "поток событий" с утраченными абсолютными датировками. Пусть годы t отсчитываются в тексте от какого-то события местного значения, например, от основания какого-то города или от момента воцарения какого-то царя, абсолютные датировки которых нам неизвестны. Подсчитаем для текста Y его график объема "глав" и сравним его с графиками объема других текстов, для которых абсолютная датировка событий, описанных в них, нам известна. Если среди этих текстов обнаружится текст Х, для которого число р(Х,Y) мало, то есть имеет такой же порядок, как и для пар зависимых текстов (не превосходит, например, числа 10^{-8} для соответствующего количества локальных максимумов), то можно с достаточно большой вероятностью сделать вывод о совпадении описываемых в этих текстах "потоков событий". Причем, эта вероятность тем больше, чем меньше число р(Х,Y).
      При этом оба сравниваемых текста могут быть внешне несхожи. Например, они могут быть двумя вариантами одной и той же летописи, но написанными в разных странах, разными летописцами, на разных языках.
      Эта методика датирования была экспериментально проверена на средневековых текстах с заранее известной датировкой. Полученные даты совпали с этими датировками. Приведем типичные примеры.
      ПРИМЕР 6.
      В качестве текста Y мы взяли русскую летопись, так называемую краткую редакцию Двинского летописца, описывающая события на 320-летнем интервале [166]. Попробуем датировать описанные в летописи события, используя указанную методику. Перебирая все летописи, опубликованные в "Полном собрании русских летописей", мы вскоре обнаруживаем текст Х, график объема vol X(t) которого делает всплески практически в те же годы, что и график vol Y(t) летописи Y. См.рис.3.14.
      При сравнении графиков мы, конечно, предварительно совмещаем временны'е интервалы (А,В) и (C,D), накладываем их друг на друга. Подсчет дает, что здесь р(Х,Y) = 2x10^{-25}. Следовательно, весьма вероятно, что эти две летописи описывают приблизительно одни и те же "потоки событий". Таким образом, нам удалось чисто формально, на основе сравнения лишь статистических характеристик текстов, датировать события, описанные в тексте Y. Оказывается, что летопись Х - это пространная редакция Двинского летописца [166]. Считается, что эта летопись описывает "поток событий" 1390-1707 годов н.э. В результате, полученная нами датировка текста Y совпала с его стандартной датировкой, что подтверждает эффективность нашего метода.
      ПРИМЕР 7.
      Возьмем в качестве "текста Y с неизвестной датировкой" русскую Академическую летопись [166]. Следуя приему, описанному выше, вскоре обнаруживаем текст X, а именно, часть Супрасльской летописи [166], описывающей, как считается, 1336-1374 годы н.э. Оказывается, график объема vol X(t) делает всплески практически в те же годы, что и график объема vol Y(t). См.рис.3.15.
      Подсчет дает, что здесь p(X,Y)=10^{-14}. Такое малое значение коэффициента ясно указывает на зависимость этих двух текстов. Поскольку летопись X датирована, то мы датируем и летопись Y. Полученная нами датировка текста Y совпала с его датировкой, известной ранее.
      Мы обработали несколько десятков аналогичных текстов эпохи XV-XIX веков, и во всех случаях полученная нами датировка "неизвестного текста Y" совпала с его обычной датировкой.
      Конечно, во всех этих последних примерах мы ничего нового не узнали, поскольку датировка, например, краткой редакции Двинского летописца была и без того заранее известна, и особых оснований сомневаться в ее правильности у нас нет. Ведь это уже XIV-XVIII века, то есть эпоха более или менее надежной хронологии. Однако вскоре мы увидим, что наш метод даст интересные результаты для летописей, традиционно относимых к более ранним эпохам, то есть ранее XIV века н.э.
      Принцип корреляции максимумов мы изложили выше огрубленно, не вникая в статистические детали, потому что преследовали одну цель - быть быстро понятыми читателями. В то же время строгое математическое изложение метода и его уточнений требует существенно бо'льших подробностей. Мы отсылаем читателя, желающего глубже вникнуть в описанный метод, к научным публикациям [375], [386].
      Коэффициент p(X,Y) можно условно назвать ВССЛ - вероятностью случайного совпадения лет, подробно описанных в летописях X и Y.
      Дальнейшее развитие и уточнение идеи было дано в работах В.В.Федорова, А.Т.Фоменко [388] и В.В.Калашникова, С.Т.Рачева, А.Т.Фоменко [400]. Выяснилось далее, что наиболее ярко принцип корреляции максимумов проявляется при сравнении исторических текстов примерно одинакового объема, имеющих примерно олинаковую "плотность описания". Кроме того, обнаружилось, что в некоторых случаях для заведомо зависимых текстов коррелируют не только точки локальных максимумов, но даже и сами функции объема, то есть их амплитуды! Это достаточно удивительный и важный факт. Особо ярко корреляция амплитуд функций объема наблюдается при сравнении "достаточно бедных" текстов, то есть летописей, содержащих большие лакуны - значительные интервалы времени, не отраженные в хронике. Оказалось, что процесс написания хронистами "достаточно бедных" летописей подчиняется интересному принципу "уважения к информации", или принципу "сохранения раритетов". Эта закономерность была обнаружена С.Т.Рачевым и А.Т.Фоменко [410], [424]. Предварительные исследования в этом направлении и саму формулировку принципа уважения к информации см. как в работах [410], [424], так и ниже, в параграфе, написанном С.Т.Рачевым и А.Т.Фоменко.
      Принцип корреляции максимумов был также успешно применен к анализу некоторых русских летописей периода "смуты" конца XVI - начала XVII веков н.э. См. на эту тему работы Л.Е.Морозовой и А.Т.Фоменко [399], [402]. В этом исследовании большое участие принимал также Н.С.Келлин. См. ниже раздел, написанный Н.С.Келлиным, Л.Е.Морозовой и А.Т.Фоменко.
      1.6. ФУНКЦИИ ОБЪЕМОВ ИСТОРИЧЕСКИХ ТЕКСТОВ И ПРИНЦИП
      АМПЛИТУДНОЙ КОРРЕЛЯЦИИ.
      (С.Т.Рачев, А.Т.Фоменко)
      1.6.1. ЗАВИСИМЫЕ И НЕЗАВИСИМЫЕ ЛЕТОПИСИ. КОРРЕЛЯЦИЯ
      МАКСИМУМОВ ФУНКЦИЙ ОБЪЕМА.
      Здесь мы опишем результаты, опубликованные авторами в [410], [424]. Как и выше, назовем две исторические летописи X и Y ЗАВИСИМЫМИ, если они восходят к общему первоисточнику, описывают приблизительно одни и те же события на одном и том же отрезке времени (A,B) в истории одного и того же региона.
      Напротив, две летописи будем считать НЕЗАВИСИМЫМИ, если они описывают события на существенно разных отрезках времени (A,B) и (C,D), или же описывают события в заведомо разных географических регионах. Два отрезка времени мы будем считать СУЩЕСТВЕННО РАЗЛИЧНЫМИ, если на оси времени они пересекаются (то есть имеют общую часть) не более чем на половину их длины. В дальнейшем, для простоты, будем считать, что сравниваются летописи, описывающие отрезки времени одинаковой длины, то есть B-A = D-C.
      Пусть летопись X описывает события на отрезке времени (A,B) и параметр t пробегает годы от года A до года B. Как и выше, через X(t) мы обозначим часть летописи, описывающую события, происшедшие в год t. Для краткости, назовем фрагменты X(t) - ГЛАВАМИ. Подсчитаем объем каждого такого фрагмента в каких-либо единицах, например, в строках, или в страницах. В перечисляемых ниже примерах объем глав подсчитывался в строках. Впрочем, выбор единицы измерения здесь несущественен. При статистической обработке мы нормировали объемы глав, деля их на полный объем всей летописи. Таким образом, возможная разница в выборе единиц измерения объема нивелируется. Итак, мы получаем функцию vol X(t), которую называем ФУНКЦИЕЙ ОБЪЕМОВ летописи.
      Принцип корреляции точек локальных максимумов графиков объема был сформулирован и экспериментально проверен в [375]. Главная идея, положенная в основу принципа, и вытекающих из него методик, такова: зависимость или независимость хроник в некоторых случаях можно устанавливать, сравнивая их функции объемов. Огрубляя, можно сказать, что ТОЧКИ ЛОКАЛЬНЫХ МАКСИМУМОВ ГРАФИКОВ ОБЪЕМОВ ЗАВИСИМЫХ ЛЕТОПИСЕЙ ДОЛЖНЫ "КОРРЕЛИРОВАТЬ" (в подходящем точном смысле, см. выше), А ДЛЯ НЕЗАВИСИМЫХ ЛЕТОПИСЕЙ "КОРРЕЛЯЦИИ" БЫТЬ НЕ ДОЛЖНО. См.рис.3.1.
      В работе [400] общая идея корреляции функции объемов зависимых летописей, и отсутствие корреляции для независимых летописей, была для некоторых случаев распространена В.В.Калашниковым, С.Т.Рачевым и А.Т.Фоменко НА САМИ ФУНКЦИИ ОБЪЕМА, то есть с учетом их АМПЛИТУД. Поскольку здесь в исследование вовлекались амплитуды графиков, то необходимо было проверить эту усиленную форму принципа корреляции на конкретных летописях, что и было сделано в [400] с участием Н.Я.Ривеса. Предложенные в [400] методы обнаружения зависимых и независимых летописей оказались достаточно эффективными при сравнении хроник примерно ОДИНАКОВОГО ОБЪЕМА. Однако картина начинала "смазываться" при сравнении летописей существенно РАЗНЫХ ОБЪЕМОВ. В настоящей работе выделяется новый класс летописей, для которых верна усиленная форма принципа корреляции.
      Принцип корреляции максимумов опирался на то обстоятельство, что разные летописцы, рассказывавшие об одной и той же исторической эпохе, использовали, в основном, ОДИН И ТОТ ЖЕ объем, фонд уцелевшей информации, то есть сохранившейся до их времени. Поэтому они, как показали наши статистические эксперименты, подробнее описывали те годы, от которых сохранилось много текстов, и менее подробно - остальные.
      Напомним понятие первичного объема информации о событиях эпохи (А,В). Пусть С(t) - объем всех документов, написанных современниками года t о событиях этого года. См.рис.3.2. Пусть теперь X и Y летописцы, уже не являющиеся современниками эпохи (А,В), но желающие написать ее историю. Пусть M (соответственно N) - год, в который летописец X (соответственно Y) создает хронику эпохи (А,В).
      Напомним, что С_M (t) - это объем тех документов, которые уцелели от эпохи (А,В) до момента M, то есть до эпохи летописца X. Другими словами, это остаток первичных текстов, дошедших до времени M. График C_M (t) - это график объема уцелевшей информации о событиях эпохи (А,В). Аналогично определяется C_N (t).
      Принцип корреляции максимумов вытекает из следующего принципа. Каждый летописец Х, описывая эпоху (А,В), "в среднем" более подробно говорит о годах, где график С_M (t) делает всплески, то есть чем больше документов дошло до летописца Х от эпохи (А,В), тем подробнее он говорит об этом времени. См. рис.3.3.
      1.6.2. БЕДНЫЕ И БОГАТЫЕ ЛЕТОПИСИ. БЕДНЫЕ И БОГАТЫЕ ЗОНЫ ЛЕТОПИСЕЙ.
      Определение бедной или богатой летописи инстуитивно ясно из рис.3.16. БЕДНОЙ мы назовем летопись, у которой "большинство" объемов vol X(t) - нулевые, то есть большинство лет вообще не описано летописцем. БОГАТОЙ назовем хронику, у которой, напротив, "большинство" объемов vol X(t) отлично от нуля и достаточно велико, то есть летописец сообщает много сведений об эпохе (А,В).
      Конечно, в реальных примерах иногда трудно отнести ту или иную летопись к разряду бедных или богатых. Поэтому полезно ввести новые понятия БЕДНОЙ ЗОНЫ и БОГАТОЙ ЗОНЫ данной летописи. На рис.3.17 условно изображен график объема летописи, где начальная ее часть - БЕДНАЯ, а последняя - БОГАТАЯ. Наш опыт изучения конкретных летописей показывает, что следующая ситуация типична: НАЧАЛЬНАЯ ЧАСТЬ длинной летописи - это БЕДНАЯ ЗОНА, а ее заключительная часть - БОГАТАЯ ЗОНА. Встречаются, конечно, летописи, у которых бедная зона расположена "в середине". См.рис.3.18.
      1.6.3. ЗНАЧАЩИЕ И НЕЗНАЧАЩИЕ НУЛИ ФУНКЦИИ ОБЪЕМА.
      При изучении конкретной летописи мы будем в качестве самой левой точки А на оси времени брать год, для которого vol X(A) отличен от нуля, то есть этот год ОПИСАН летописцем. Нуль графика объема назовем ЗНАЧАЩИМ, если он расположен ПРАВЕЕ первого ненулевого значения графика. См.рис.3.19. Если же нуль расположен ЛЕВЕЕ первого ненулевого значения графика, то назовем такой нуль НЕЗНАЧАЩИМ. Незначащий нуль показывает, что летописец ничего не знает не только о данном годе, но и обо всех годах, ему предшествующих. А значащий нуль показывает, что хотя хронист ничего не знает о данном годе, он все-таки кое-что знает о некоторых ПРЕДЫДУЩИХ годах.

  • Страницы:
    1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46