Истину можно вычислить. - страница 6

Шрифт
Интервал

стр.

ПРИНЦИП КОРРЕЛЯЦИИ МАКСИМУМОВ:

а) Если две летописи (текста) X и Y ЗАВЕДОМО ЗАВИСИМЫ, то есть описывают один и тот же «поток событий» исторического периода (А, В) одного и того же государства Г, то графики объемов летописей X и Y ДОЛЖНЫ ОДНОВРЕМЕННО ДОСТИГАТЬ ЛОКАЛЬНЫХ МАКСИМУМОВ (ДЕЛАТЬ ВСПЛЕСКИ) на отрезке (А, В). Другими словами, годы, «подробно описанные в летописи X», и годы, «подробно описанные в летописи Y», должны быть близки или совпадать, см. рис. 4.

б) Напротив, если летописи X и Y ЗАВЕДОМО НЕЗАВИСИМЫ, то есть описывают либо разные исторические периоды (А, В) и (С, D), либо разные «потоки событий» в разных государствах, то графики объемов для летописей X и Y достигают локальных максимумов В РАЗНЫХ ТОЧКАХ. Другими словами, точки всплесков графиков vol X(t) и vol Y(t) не должны коррелировать, рис. 5. При этом считается, конечно, что для сравнения двух графиков мы должны предварительно совместить отрезки (А, В) и (С, D) одинаковой длины.


Рис. 5. Графики объемов независимых летописей X и Y, то есть говорящих о существенно разных эпохах, делают всплески в разных точках, после совмещения отрезков времени (А, В) и (С,D).


Все другие пары текстов, то есть не являющиеся ни заведомо зависимыми, ни заведомо независимыми, мы условно назовем НЕЙТРАЛЬНЫМИ. Относительно них никакого утверждения не делается.

Этот принцип подтвердится, если для большинства пар реальных, достаточно больших ЗАВИСИМЫХ летописей X и Y, то есть описывающих один и тот же «поток событий», графики объема для X и Y действительно делают всплески приблизительно одновременно, в одни и те же годы. При этом ВЕЛИЧИНА ЭТИХ ВСПЛЕСКОВ МОЖЕТ БЫТЬ СУЩЕСТВЕННО РАЗЛИЧНОЙ.

Напротив, для реальных НЕЗАВИСИМЫХ хроник какая-либо корреляция точек всплесков должна отсутствовать. Конечно, для конкретных зависимых хроник одновременность всплесков графиков объема может иметь место лишь приблизительно.


1.3. Статистическая модель

Грубая идея состоит в следующем. Для количественной оценки близости точек всплесков поступим так. Вычислим число f(X, Y) — сумму квадратов чисел f[k], где f[k] — расстояние в годах от точки всплеска с номером «k» графика объема X до точки всплеска с номером «k» графика объема Y. Если оба графика делают всплески одновременно, то моменты всплесков с одинаковыми номерами совпадают и все числа f[k] равны нулю. Рассмотрев достаточно большой фиксированный запас различных реальных текстов H, и вычисляя для каждого из них число f(X, H), отберем затем только такие тексты H, для которых это число не превосходит числа f(X, Y). Подсчитав долю таких текстов во всем запасе текстов H, получаем коэффициент, который — при гипотезе о распределении случайного вектора H — можно интерпретировать как вероятность p(X, Y) [904], [908], [1137], [884]. Если коэффициент p(X, Y) мал, то летописи X и Y зависимы, то есть описывают приблизительно один и тот же «поток событий». Если же коэффициент велик, то летописи X и Y независимы, то есть сообщают о разных «потоках событий».

Перейдем теперь к более детальному описанию статистической модели. Конечно, для реальных графиков объема одновременность их всплесков может иметь место лишь приблизительно. Для оценки того, насколько одновременно оба графика делают всплески, математический аппарат статистики позволяет определить некоторое число p(X, Y), измеряющее несовпадение лет, подробно описанных в летописи X, и лет, подробно описанных в летописи Y. Оказывается, если рассматривать наблюдаемую близость всплесков обоих графиков как случайное событие, то число p(X, Y) можно рассматривать как вероятность этого события (что, впрочем, вовсе не обязательно для эффективности метода). Чем меньше это число, тем лучше совпадают годы, подробно описанные в X, с годами, подробно описанными в Y. Дадим математическое определение коэффициента p(X, Y).

Рассмотрим интервал времени (А, В) и график объема vol X(t), который достигает локальных максимумов в некоторых точках m>1, …, m>n-1. Мы считаем для простоты, что каждый локальный максимум (всплеск) достигается ровно в одной точке. Эти точки, то есть годы, m разбивают интервал (А, В) на некоторые отрезки, вообще говоря, разной длины, см. рис. 6. Измеряя длины получившихся отрезков в годах, то есть, измеряя расстояния между точками соседних локальных максимумов m


стр.

Похожие книги