Современная электронная библиотека ModernLib.Net

Методы статистического анализа исторических текстов (часть 1)

ModernLib.Net / История / Фоменко Анатолий Тимофеевич / Методы статистического анализа исторических текстов (часть 1) - Чтение (стр. 25)
Автор: Фоменко Анатолий Тимофеевич
Жанр: История

 

 


      ТАБЛИЦА 3 --------------------------------------------------------------------
      84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 00 01 02 03 04 05 06 --------------------------------------------------------------------- 1: Х--------------------Х--------------------Х----------------------- 2: ---Х-----Х-----------Х--------------------Х-----------Х-----Х----- 3: Х--------Х-----------Х--------------------Х--------Х--------------Х 4: Х--------------------Х--------------------Х--------Х--------------Х 5: Х--------Х-----------Х--------------------Х-----------------------Х 6: Х--------Х-----------Х--------------------Х-----------------------Х 7: Х--------Х-----------Х--------------------Х--------Х--------------Х 8: Х--------------------Х--------------------Х-----------Х-----------Х 9: Х--------------------Х--------------------Х-----------------------Х 10:Х--------------Х-----Х-----------------Х-----------------Х--------Х 11:Х--------Х-----------Х--------------------Х-----------------Х-----Х 12:Х--------Х-----------Х--------------------Х--------Х-----Х-----Х-- 13:Х--------Х-----------Х--------------------Х----------------------- 14:Х--------Х-----------Х--------------------Х-----------------------Х 15:Х--------Х-----------Х--------------------Х--------Х-----------Х-- 16:Х--------Х-----------Х--------------------Х--------------Х--------Х 17:Х--------Х-----------Х--------------------Х-----------------------Х 18:Х--------------------Х--------Х-----------Х-----Х--------Х-----Х-- 19:Х--------Х-----------Х-----------Х--------Х-----Х--------Х--------Х 20:Х--------Х-----------Х--------------------Х-----------Х-----------Х 21:Х--------Х-----------Х--------Х--------------Х--Х-----------Х-----Х 22:------------------------------------------Х-----Х--------Х-----Х-----------------------------------------------------------------------
      Отчетливо видно, что все функции объема делают всплески практически одновременно, что объясняется зависимостью этих текстов. Следовательно, принцип корреляции точек всплесков функций объемов зависимых текстов здесь подтверждается.
      Эту зависимость текстов можно выразить численно. Введем следующее "расстояние" между функциями объема vol X(t) и vol Y(t) для двух текстов X и Y, каждый из которых разбит в объединение отдельных погодных фрагментов X(t) и Y(t) соответственно. Напомним, что фрагменты X(t) и Y(t) описывают события лишь одного года t.
      Пусть параметр t изменяется на отрезке времени от года A до года B. Обозначим через t(X,1), t(X,2), ... , t(X,N) - те годы, где функция график объемов vol X(t) делает всплески (то есть достигает локальных максимумов). Соответственно, через t(Y,1), t(Y,2), ... , t(Y,M) обозначим точки всплесков графика объемов vol Y(t).
      Для каждой точки t(X,i) найдем БЛИЖАЙШУЮ К НЕЙ ТОЧКУ из последовательности t(Y,1), t(Y,2), ... , t(Y,M). Пусть это будет некоторая точка t(Y,k). Обозначим через p(i) - расстояние между ними, измеренное в годах, то есть - абсолютную величину разности t(X,i)-t(Y,k). Другими словами, выясняем - какой локальный максимум Y ближе всего расположен к выбранному локальному максимуму X.
      Совершенно аналогично, меняя ролями X и Y, для каждой точки t(Y,j) найдем БЛИЖАЙШУЮ К НЕЙ ТОЧКУ из последовательности t(X,1), t(X,2), ... , t(X,N). Пусть это будет некоторая точка t(X,s). Обозначим через q(j) - расстояние между ними, измеренное в годах, то есть - абсолютную величину разности t(Y,j)-t(X,s).
      Наконец, в качестве "расстояния между X и Y" мы возьмем следующую сумму:
      R(X,Y) = p(1)+p(2)+...+p(N)+q(1)+q(2)+...+q(M).
      Смысл расстояния R(X,Y) совершенно прозрачен. Для каждого локального максимума функции volX(t) мы находим ближайший к нему локальный максимум функции vol Y(t), определяем расстояние между ними (в годах), после чего суммируем получившиеся числа. Затем повторяем ту же операцию, поменяв местами хроники X и Y. Складывая полученные числа, получаем R(X,Y). Ясно, что R(X,Y) = R(Y,X).
      Если расстояние R(X,Y) равно нулю для некоторой пары текстов X и Y, следовательно, графики их функций объемов делают всплески ОДНОВРЕМЕННО. Чем больше это расстояние, тем хуже коррелируют их точки локальных максимумов. Можно рассматривать также и несимметричное расстояние от X до Y, положив
      p(X,Y) = p(1)+p(2)+...+p(N).
      Аналогично определяется и несимметричное расстояние от Y до X, а именно,
      q(Y,X) = q(1)+q(2)+...+q(M).
      Оценим численно степень зависимости между собой исторических текстов 1-22, перечисленных выше. Для этого подсчитаем квадратную матрицу размера 22х22 попарных расстояний R(X,Y), где X и Y независимо друг от друга пробегают все тексты 1-22. Далее подсчитаем гистограмму частот. Для этого рассмотрим горизонтальную ось, на которой отметим целые точки: 0,1,2,3,... и построим следующий график. Подсчитаем - сколько в получившейся ранее матрице {R(X,Y)} имеется нулей. Полученное число отложим по вертикали в точке с координатой 0. Затем подсчитаем - сколько в матрице {R(X,Y)} имеется единиц. Получившееся число отложим по вертикали в точке с координатой 1. И так далее. Получается график, который и называется гистограммой частот. Что можно сказать, изучая получившуюся гистограмму?
      Если выбранные для анализа хроники ЗАВИСИМЫ, то большинство попарных расстояний между хрониками должно выражаться МАЛЫМИ ЧИСЛАМИ, то есть хроники должны "быть близки". Другими словами, большинство элементов матрицы {R(X,Y)} должно быть близко к нулю ("быть мало"). Но в таком случае абсолютный максимум гистограммы частот должен смещаться ВЛЕВО, то есть должно быть много малых частот. И напротив, если среди исследуемых текстов много НЕЗАВИСИМЫХ, то максимум гистограммы частот смещается направо. См.рис.3.26. Здесь увеличивается доля "больших" и "средних" попарных расстояний между хрониками.
      Это наблюдение позволяет оценивать степень зависимости или независимости группы хроник путем построения соответствующей гистограммы частот по матрице {R(X,Y)}. А именно, смещение максимума влево указывает на возможную зависимость хроник, а смещение максимума направо, указывает на возможную независимость.
      Эта идея была применена для оценки степени зависимости перечисленных выше текстов 1-22. На рис.3.27 показана экспериментальная гистограмма матрицы {R(X,Y)} для текстов 1-22. В этой матрице оказалось много малых чисел, поэтому максимум гистограммы заметно смещен влево. Это указывает на зависимость текстов 1-22.
      Для сравнения построим гистограмму для независимых текстов. В качестве примера мы решили сравнить указанные ниже три хроники А,В,С, с предыдущими текстами 1-22. Три дополнительные хроники таковы:
      А: Повесть временных лет, якобы 850-1110 годы н.э.,
      В: Академическая летопись, якобы 1336-1446 годы н.э.,
      С: Никифоровская летопись, якобы 850-1430 годы н.э.
      Для каждой из них была вычислена функция объемов и найдены все ее локальные максимумы. Вычислим все попарные расстояния R(X,Y), где Х пробегает три хроники А, В, С, а Y пробегает тексты 1-22. В результате получается прямоугольная матрица {R(X,Y)} размера 3х22. Далее была подсчитана гистограмма частот. Результат показана на рис.3.28. Отчетливо виден совершенно другой характер гистограммы - ее максимум переместился направо. Что указывает на независимость двух групп текстов: {А, В, С} и {тексты 1-22}. Конечно, внутри каждой из этих групп могут быть зависимые тексты.
      2. МЕТОДИКА РАСПОЗНАВАНИЯ И ДАТИРОВАНИЯ
      ДИНАСТИЙ ПРАВИТЕЛЕЙ. ПРИНЦИП МАЛЫХ ИСКАЖЕНИЙ.
      2.1. ФОРМУЛИРОВКА ПРИНЦИПА МАЛЫХ ИСКАЖЕНИЙ.
      Принцип малых искажений и основанный на нем метод был предложен и разработан в [375], [376], [379], [381], [390], [398].
      Пусть обнаружен исторический текст, описывающий неизвестную нам династию правителей с указанием длительностей их правлений. Возникает вопрос: является ли эта династия новой, ранее нам неизвестной и, следовательно, нуждающейся в датировке, или это одна из известных нам династий. Однако описанная в непривычных для нас терминах. Например, видоизменены имена правителей и т.п.? Ответ дается излагаемой ниже методикой [416], [438], [419], [376], [377].
      Рассмотрим k любых последовательных реальных правителей (царей) в истории какого государства, области. Условно назовем эту последовательность РЕАЛЬНОЙ ДИНАСТИЕЙ. При этом ее члены отнюдь не обязаны быть родственниками. Часто одна и та же реальная династия описывается в разных документах и разными летописцами. При этом описывается с разных точек зрения. Например, по-разному оценивается деятельность правителей, их значение, их личные качества и т.д. Тем не менее, существуют "инвариантные" факты, описания которых в меньшей степени зависят от симпатий или антипатий летописцев. К таким более или менее "инвариантным фактам" относится, например, длительность правления царя. Обычно нет особых причин, по которым хронист значительно и намеренно исказил бы это число. Однако перед летописцами часто возникали трудности в подсчете длительности правления царя.
      Эти естественные трудности - неполнота информации, искажения в документах и т.д., приводили иногда к тому, что разные летописцы приводят в своих хрониках или таблицах разные числа, являющиеся, по их мнению, длительностью правления одного и того же царя. Такие расхождения характерны, например, для фараонов в таблицах Г.Бругша [22] и в "Хронологических таблицах" Ж.Блера [20]. Например, в таблицах Ж.Блера, доведенных до начала XIX века, собраны все основные исторические династии, с датами правлений, сведения о которых дошли до нас. Таблицы Ж.Блера ценны для нас тем, что они были составлены в эпоху, достаточно близкую ко времени создания скалигеровской хронологии. Поэтому они несут в себе более явственные отпечатки "скалигеровской деятельности", позднее затушеванные историками XIX-XX веков.
      Итак, каждый летописец, описывая реальную династию M, по-своему, в меру своих способностей и возможностей, вычисляет длительности правления царей. В результате он получает некоторую последовательность чисел a=(a_1, a_2,...,a_k), где число a_i изображает, - быть может с ошибкой, - реальную длительность правления царя с номером i. Напомним, что число k - это общее число царей в данной династии. Эту последовательность чисел, извлекаемую из летописи, мы условно называем ЛЕТОПИСНОЙ ДИНАСТИЕЙ. Ее удобно изображать вектором a в евклидовом пространстве R^k.
      Другой летописец, описывая ту же самую реальную династию M, возможно припишет этим же царям несколько другие длительности правлений. В результате получится другая летописная династия b=(b_1, b_2,...,b_k). Таким образом, одна и та же реальная династия M, но описанная в разных летописях, может изображаться в них разными летописными династиями a и b. Спрашивается, насколько велики возникающие искажения? При этом существенную роль играют ошибки и объективные трудности, препятствующие точному определению реальных длительностей правлений. Основные типы ошибок мы опишем ниже.
      Сформулируем статистическую модель, гипотезу, которую мы условно назовем "ПРИНЦИПОМ МАЛЫХ ИСКАЖЕНИЙ".
      ПРИНЦИП МАЛЫХ ИСКАЖЕНИЙ ДЛИТЕЛЬНОСТЕЙ ПРАВЛЕНИЙ.
      Если две летописные династии a и b "мало" отличаются друг от друга, то они изображают одну и ту же реальную династию M, то есть являются двумя вариантами ее описания (в разных летописях). В этом случае летописные династии назовем ЗАВИСИМЫМИ.
      Напротив, если же две летописные династии a и b изображают две различные реальные династии M и N, то они "значительно" отличаются друг от друга. В этом случае назовем их НЕЗАВИСИМЫМИ.
      Остальные пары династий мы назовем НЕЙТРАЛЬНЫМИ.
      Другими словами, согласно этой гипотезе-модели, РАЗНЫЕ ЛЕТОПИСЦЫ "МАЛО" ИСКАЖАЛИ ОДНУ И ТУ ЖЕ РЕАЛЬНУЮ ДИНАСТИЮ ПРИ НАПИСАНИИ СВОИХ ЛЕТОПИСЕЙ. Во всяком случае, возникавшие разночтения оказывались "в среднем" меньше, чем имеющиеся различия между заведомо разными, то есть независимыми реальными династиями.
      Сформулированная выше гипотеза, модель нуждается в экспериментальной проверке. В случае ее справедливости мы обнаруживаем важное, и отнюдь не очевидное свойство, характеризующее деятельность древних летописцев. А именно, ЛЕТОПИСНЫЕ ДИНАСТИИ, ВОЗНИКАВШИЕ ПРИ ОПИСАНИИ ОДНОЙ И ТОЙ ЖЕ РЕАЛЬНОЙ ДИНАСТИИ, ОТЛИЧАЮТСЯ ДРУГ ОТ ДРУГА И ОТ СВОЕГО ПРОТОТИПА, МЕНЬШЕ, ЧЕМ ОТЛИЧАЮТСЯ ДРУГ ОТ ДРУГА ДВЕ ДЕЙСТВИТЕЛЬНО РАЗНЫЕ РЕАЛЬНЫЕ ДИНАСТИИ.
      Существует ли естественный числовой коэффициент (мера) c(a,b), вычисляемый для каждой пары летописных династий a и b и обладающий тем свойством, что он "мал" для зависимых династий и, напротив, "велик" для независимых? Другими словами, этот коэффициент должен различать зависимые и независимые династии. Такой коэффициент был нами найден.
      Оказывается, для оценки "близости" двух династий a и b можно ввести числовой коэффициент c(a,b), аналогичный описанному выше коэффициенту ВССЛ = p(Х,Y). Этот коэффициент с(a,b) также имеет смысл вероятности. Сначала опишем грубую идею определения коэффициента с(a,b). Летописную династию удобно изображать в виде графика, отложив по горизонтали номера царей, а по вертикали - длительности их правлений. Мы скажем, что династия q "похожа" на две династии a и b, если график династии q отличается от графика династии a не больше, чем график династии b отличается от графика династии a. Подробности см. ниже и в [416], [419], [376], [377], [375].
      В качестве с(a,b) берется доля, которую династии, "похожие" на династии a и b, составляют во множестве всех династий. Другими словами, подсчитывается отношение:
      количество династий, "похожих" на a и b
      ------------------------------------------------- .
      общее количество династий, описанных в летописях
      Длительности правлений царей могут определяться летописцами с ошибкой. Фактически мы извлекаем из летописей лишь некоторые приближенные их значения. Можно математически описать вероятностные механизмы, приводящие к появлению этих ошибок. Кроме того, мы учитывали еще две возможные ошибки летописцев: перестановка двух соседних царей и замена двух соседних царей одним "царем" с суммарной длительностью правления.
      Коэффициент c(a,b) можно условно назвать ВССД, то есть вероятностью случайного совпадения династий a и b.
      2.2. СТАТИСТИЧЕСКАЯ МОДЕЛЬ.
      Дадим теперь формальное определение коэффициента c(a,b). Обозначим через D множество всех реальных династий длины k, то есть состоящих из k последовательных царей. Фактически за множество D нам придется взять те исторические династии, сведения о которых дошли до нас в сохранившихся исторических хрониках. Практически полный список всех таких династий мы составили на основе большого числа разнообразных хронологических таблиц, перечисленных ниже. На основе этих таблиц мы составили список всех групп из 15 последовательных царей, правивших, согласно скалигеровской хронологии, в интервале от 4000 года до н.э. до 1900 года н.э. в Европе, Средиземноморье, на Ближнем Востоке, в Египте, Азии.
      Каждую летописную династию можно условно изобразить вектором в евклидовом пространстве R^k размерности k. В нашем конкретном эксперименте мы брали k=15 (см. выше). Мы будем считать две династии существенно различными, если число царей (или реальных правителей), входящих одновременно в обе эти династии, не превышает k/2, то есть половины числа членов всей династии. Две взятые наугад реальные династии могут пересекаться, поскольку каждый раз мы можем произвольно объявить того или иного царя "началом династии". Наряду с зависимыии и независимыми династиями имеются еще и "промежуточные", "нейтральные" пары династий, в которых число общих царей (или реальных правителей) превышает k/2. Ясно, что если общее число рассматриваемых династий велико, то количество промежуточных, нейтральных пар династий относительно мало. Поэтому основное внимание можно уделять зависимым и независимым парам династий.
      Сформулированный выше принцип малых искажений означает, что на практике, "в среднем", летописцы ошибались все-таки незначительно, то есть не очень сильно искажали реальные числовые данные.
      Обсудим теперь ошибки, которые чаще всего делали летописцы при вычислении длительностей правлений древних царей. Эти три типа ошибок были выделены нами при обработке большого числа конкретных исторических текстов. Выяснилось, что именно эти ошибки чаще всего приводили к искажению реальных длительностей правлений царей.
      Ошибка (1). Перестановка, путаница двух соседних царей.
      Ошибка (2). Замена двух царей одним, длительность правления
      которого равна сумме длительностей их правлений.
      Ошибка (3). Неточность в вычислении самой длительности правления.
      Чем больше эта длительность правления, тем большую
      ошибку обычно допускал летописец при ее определении.
      Эти три типа ошибок можно описать и смоделировать математически. Начнем с ошибок (1) и (2). Рассмотрим какую-либо династию p=(p_1,p_2,...,p_k) из множества D. Вектор q=(q_1,q_2,...,q_k) мы назовем ВИРТУАЛЬНОЙ ВАРИАЦИЕЙ вектора (династии) p, и будем обозначать его через q=vir(p), если каждая координата q_i вектора c получается из координат вектора p одной из следующих двух процедур (1) и (2).
      (1) Либо q_i = p_i (то есть координата не меняется), либо q_i совпадает с одним из чисел p_{i-1}, p_{i+1}, то есть с одной из "соседних координат" вектора p.
      (2) Либо q_i = p_i, либо q_i совпадает с числом p_i + p_{i+1}.
      Ясно, что каждый такой вектор (династия) q можно рассматривать как летописную династию, получившуюся из реальной династии p в результате "ее размножения" под воздействием ошибок (1) и (2). Другими словами, мы берем каждую реальную династию p=(p_1,p_2,...,p_k) из списка D и применяем к ней "возмущения" (1) и (2). То есть, либо мы меняем местами два соседних числа p_i и p_{i+1}, либо заменяем какое-то число p_i суммой p_i + p_{i+1}, или суммой p_{i-1} + p_i. Для каждого номера i мы применяем указанные операции только по одному разу, то есть не рассматриваем "длинные итерации" операций на одном и том же месте i. В результате из одной династии p получается некоторое число виртуальных династий {q=vir(P)}. Количество таких виртуальных династий легко подсчитать.
      Таким образом, каждая "точка" из множества D "размножается" и порождает некоторое множество "виртуальных точек", ее окружающих, так сказать порождает "окрестное облако", "шаровое скопление". См. рис.3.29. Некоторые из получившихся виртуальных династий могут встретиться нам в какой-то конкретной летописи (в этом случае они будут летописными династиями), некоторые остаются всего лишь "теоретически возможными", то есть "виртуальными".
      Объединяя все виртуальные династии, получающиеся из всех реальных династий p, составляющих наш список D, мы получаем некоторое множество vir(D), то есть "окутывающее облако" исходного множества династий D.
      Таким образом, для каждой реальной династии M, множество изображающих ее летописных династий можно представлять себе как "шаровое скопление" vir(M). Пусть теперь даны две реальные династии M и N. Если сформулированный нами принцип малых искажений верен, то шаровые скопления vir(M) и vir(N), отвечающие двум заведомо независимым, разным реальным династиям M и N, не пересекаются в пространстве R^k. То есть, они должны быть расположены достаточно далеко друг от друга. См. рис.3.30.
      Пусть теперь a и b - две какие-то династии из множества vir(D), например две летописные династии. См. рис.3.31. Мы хотим ввести некоторую количественную меру близости между двумя династиями, то есть "измерить расстояние между ними", оценить - насколько они далеки друг от друга. Простейший способ был бы таким. Рассматривая обе династии как векторы в пространстве R^k, можно было бы просто взять евклидово расстояние между ними, то есть подсчитать число r(a,b), квадрат которого имеет вид:
      (a_1 - b_1)^2 + ... + (a_k - b^k)^2.
      Однако численные эксперименты с конкретными летописными династиями показывают, что это расстояние не позволяет уверенно отделить друг от друга зависимые и независимые пары династий. Другими словами, такие расстояния между заведомо зависимыми летописными династиями и расстояния между заведомо независимыми летописными династиями оказываются сравнимыми друг с другом. Оказывается, они имеют "один и тот же порядок".
      Тем более нельзя определять "похожесть" или "непохожесть" двух династий (точнее, графиков их правлений) "на глазок". Визуальная похожесть двух графиков может ни о чем не говорить. Можно привести примеры заведомо независимых династий, графики правлений которых окажутся "весьма похожими". И тем не менее никакой зависимости тут на самом деле нет. Как выяснилось, в данной проблеме визуальная близость может ввести в заблуждение. Требуется надежная количественная оценка, устраняющая зыбкие субъективные соображения вроде "похожи", "не похожи".
      Итак, задача состоит в том, чтобы выяснить - существует ли вообще такая естественная мера близости (на множестве всех виртуальных династий), которая позволила бы уверенно отделить зависимые династии от независимых. То есть, чтобы "расстояние" между заведомо зависимыми династиями было "мало", а "расстояние" между заведомо независимыми династиями было "велико". Причем, требуется, чтобы эти "малые" и "большие" значения существенно отличались бы друг от друга, например, чтобы они были отделены одним или несколькими порядками.
      Оказывается, такая мера близости, то есть "расстояние между династиями", действительно существует. К описанию такого коэффициента c(a,b) мы сейчас и перейдем.
      Итак, мы построили в пространстве R^15 некоторое множество династий D. Были смоделированы две наиболее типичные ошибки, делавшиеся летописцами. Каждая династия из множества D была подвергнута возмущениям типов (1) и (2). При этом каждая точка из D размножилась в несколько точек, что привело к увеличению множества. Получившееся множество мы обозначали через vir(D). Оказалось, что множество vir(D) состоит примерно из 15x10^11 точек.
      Будем считать "династический вектор a" случайным вектором в R^k, пробегающим множество vir(D). Тогда по множеству vir(D) мы можем построить функцию z плотности вероятностей. Для этого все пространство R^15 было разбито на стандартные кубы достаточно малого размера так, чтобы ни одна точка из множества vir(D) не попала на границу какого-либо куба. Если x - внутренняя точка куба, то положим
      число точек из множества vir(D), попавших в куб
      z(x) = ------------------------------------------------- .
      общее количество точек в множестве vir(D)
      Ясно, что для точки x, лежащей на границе какого-либо куба, можно считать. что z(x)=0. Функция z(x) достигает максимума в области, где сосредоточено особенно много династий из множества vir(D), и падает до нуля там, где точек из множества vir(D) нет. См.рис.3.32. Тем самым, график функции z(x) наглядно показывает, как именно распределено множество династий vir(D) по пространству R^k. Другими словами, где это множество "густое", "плотное", а где оно разрежено.
      Пусть теперь нам заданы две династии
      a=(a_1,...a_k) и b=(b_1,...,b_k), и мы хотим оценить - насколько они близки или далеки. Построим k-мерный параллелепипед P'(a,b) с центром в точке a, имеющий в качестве диагонали вектор a-b. См. рис.3.33. Если спроектировать параллелепипед P'(a,b) на i-ю координатную ось, то получится отрезок с концами
      [a_i - |a_i - b_i|, a_i + |a_i - b_i|].
      В качестве "предварительного коэффициента" c'(a,b) мы возьмем число
      число точек из множества vir(D), попавших в P'(a,b) c'(a,b) = ---------------------------------------------------- .
      общее число точек в множестве vir(D)
      Ясно, что число c'(a,b) является интегралом функции плотности z(x) по параллелепепиду P'(a,b).
      Смысл этого "предварительного коэффициента" c'(a,b) ясен. Династии, то есть векторы из vir(D), попавшие в параллелепипед P'(a,b), естественно назвать "похожими" на династии a и b. В самом деле, каждая из таких династий удалена от династии a не более чем от династии a удалена династия b. Следовательно, в качестве меры близости двух династия a и b, мы берем долю династий, "похожих" на a и b, в множестве всех династий vir(D).
      Однако такой коэффициент c'(a,b) пока недостаточно хорош, поскольку он никак не учитывает то обстоятельство, что летописцы определяли длительность правлений царей с какой-то ошибкой, причем обычно тем большей, чем дольше длительность правления. Другими словами, нам нужно учесть ошибку летописцев (3), обсужденную выше.
      Перейдем к моделированию ошибки (3). Пусть T - это длительность правления. Ясно, что длительность правления можно рассматривать как случайную величину, определенную на "множестве всех царей". Обозначим через g(T) число царей, правивших T лет. В работе [375] я экспериментально вычислил эту гистограмму частот g(T) (плотность распределения указанной случайной величины) на основе данных, приведенных в "Хронологических Таблицах" Ж.Блера [20]. Положим h(T)=1/g(T) и назовем h(T) функцией ошибок (летописцев). Ошибка h(T) в определении длительности T тем больше, чем с меньшей вероятностью случайная величина, - то есть длительность правления, - принимает значение T. Другими словами, небольшие, "короткие" длительности правлений царей лучше поддаются вычислению. Здесь летописец ошибается незначительно. Напротив, большие длительности правлений царей, встречающиеся довольно редко, летописец обычно вычисляет с существенной ошибкой. Чем больше длительность правления, тем большую ошибку он может совершить.
      Функция ошибок h(T) для указанной плотности вероятностей случайной величины (длительности правления) была определена экспериментально [375], с.115. Разобьем отрезок [0,100] целочисленной оси T на десять отрезков одинаковой длины, а именно:
      [0,9], [10,19], [20,29], [30,39], ... [90,99].
      Тогда оказывается, что:
      h(T)=2, если T изменяется от 0 до 19,
      h(T)=3, если T изменяется от 20 до 29,
      h(T)=5([T/10]-1), если T изменяется от 30 до 100.
      Здесь через [s] обозначена целая часть числа s. См.рис.3.34.
      Учтем теперь ошибки летописцев при построении "окрестности" точки a. Для этого расширим параллелепипед P'(a,b) до бо'льшего параллелепипеда P(a,b), центром которого по-прежнему является точка a, и ортогональными проекциями на координатные оси являются отрезки с концами
      [a_i - |a_i - b_i| + h(a_i), a_i + |a_i - b_i| + h(a_i)].
      Ясно, что параллелепипед P'(a,b) целиком лежит внутри большого параллелепипеда P(a,b). См. рис.3.33. Диагональю этого большого параллелепипеда является вектор a-b+h(a), где вектор h(a) выглядит так:
      h(a)=(h(a_1),...,h(a_k)).
      Его можно назвать вектором ошибок летописцев.
      Итак, мы смоделировали все три основные ошибки, делавшиеся летописцами при подсчете ими длительностей правлений царей. В качестве окончательного коэффициента c(a,b), измеряющего близость или удаленность друг от друга двух династий a и b, мы возьмем следующее число:
      число точек из множества vir(D), попавших в P(a,b) c(a,b) = ---------------------------------------------------- .
      общее число точек в множестве vir(D)
      Ясно, что число c(a,b) является интегралом функции плотности z(x) по параллелепепиду P(a,b). На рис.3.35 число c(a,b) условно изображается объемом призмы, имеющей в качестве основания параллелеипед P(a,b), и ограниченной сверху графиком функции z. Число c(a,b) можно, при желании, интерпретировать как вероятность того, что случайный "династический вектор", распределенный в пространстве R^k с функцией плотности z, оказался на расстоянии от точки a, не превышающем расстояния между точками a и b, с учетом ошибки h(a). Другими словами, случайный "династический" вектор, распределенный с функцией плотности z, попал в окрестность P(a,b) точки a, имеющую "радиус" a-b+h(a).
      Из предыдущего видно, что роль династий a и b при подсчете коэффициента c(a,b) неодинакова. Династия a была помещена в центр параллелеипеда P(a,b), а династия b определяла его диагональ. Конечно, можно было "уравнять в правах" династии a и b, поступив по аналогии с предыдущим коэффициентом p(X,Y). То есть, можно поменять местами династии a и b, вычислить коэффициент c(b,a), а затем взять среднее арифметическое чисел c(a,b) и c(b,a). Мы этого не делали по двум причинам. Во-первых, как показали конкретные эксперименты, замена коэффициента c(a,b) на его "симметризацию" фактически не меняет получающихся результатов. Во-вторых, в некоторых случаях династии a и b действительно могут быть неравноправными в том смысле, что одна из них может быть оригиналом, а вторая - всего лишь ее дубликатом, фантомным отражением. В этом случае естественно помещать в центр параллелепипеда династию a, претендующую на роль оригинала, а "фантомное отражение" b рассматривать как "возмущение" династии a. Возникающие различия между коэффициентами c(a,b) и c(b,a) хотя и невелики, но могут послужить полезным материалом для дальнейших, более тонких исследований, которых мы пока не проводили.
      2.3. УТОЧНЕНИЯ МОДЕЛИ И ПРОВЕДЕННОГО ВЫЧИСЛИТЕЛЬНОГО ЭКСПЕРИМЕНТА.
      Сформулированный выше принцип малых искажений проверялся на основе коэффициента c(a,b).
      1) Для проверки были использованы хронологические таблицы Ж.Блера [20], содержащие практически все основные хронологические данные (в скалигеровской версии) из истории Европы, Средиземноморья, Ближнего Востока, Египта, Азии от якобы 4000 года до н.э. до 1800 года н.э. Эти данные были затем дополнены списками правителей и их правлений, взятых нами из других таблиц и монографий, как средневековых, так и современных. Упомянем здесь, например, следующие книги: Ш.Бемон, Г.Моно [16], Э.Бикерман [19], Г.Бругш [22], А.А.Васильев [26], Ф.Грегоровиус [46], [47], Д.Эссад [56], Ш.Диль [60], Кольрауш [104], С.Г.Лозинский [125], Б.Низе [145], В.С.Сергеев [187], [188], Chronologie egiptienne [246], F.K.Ginzel [266], L.Ideler [284], L`art de verifier les dates faites historiques [293], T.Mommsen [306], Isaac Newton [314], D.Petavius [327], I.Scaliger [344].
      2) Как мы уже отмечали, под династией мы понимаем последовательность фактических правителей страны, безотносительно к из титулатуре и родственным связям. В дальнейшем мы иногда будем, для краткости, условно называть их царями.
      3) Из-за наличия соправителей иногда возникают трудности при расположении этих династов в ряд. Мы приняли простейший принцип их упорядочения - по серединам периодов правлений.

  • Страницы:
    1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46