Итак, возникает следующая проблема. Верно ли, что под именем Ломоносова в «Древней Российской Истории» было напечатано совсем не то, что Ломоносов на самом деле написал? Если да, то кто автор подделки?
К решению этой задачи можно подойти на основе разработанного в [893] и [МЕТ2]: 2, с 743–778, метода идентификации авторства. Метод основан на открытом В.П. Фоменко и Т.Г. Фоменко авторском инварианте, см. книгу «Методы», Дополнение 3. Оказывается, инвариантом является частота употребления всех служебных слов. Подсчет этой частоты позволяет обнаруживать плагиат и выявлять писателей с близким авторским стилем.
Поясним вкратце — о чем идет речь. При возникновении и исследовании различных проблем авторства полезным инструментом могут оказаться «авторские инварианты» литературных произведений. Под авторским инвариантом понимается такой числовой параметр текстов, который однозначно характеризует своей величиной тексты одного автора или небольшой группы авторов. В то же время принимает существенно разные значения для текстов разных групп авторов. Желательно, чтобы количество этих «разных групп» было велико и чтобы в каждой группе объединялось мало «близких» авторов по сравнению с общим количеством исследуемых авторов.
После проведения В.П. Фоменко и Т.Г. Фоменко обширного численного эксперимента оказалось, что числовым параметром текстов, удовлетворяющим перечисленным условиям, является ОТНОСИТЕЛЬНАЯ ЧАСТОТА УПОТРЕБЛЕНИЯ АВТОРОМ СОВОКУПНОСТИ ВСЕХ СЛУЖЕБНЫХ СЛОВ — ПРЕДЛОГОВ, СОЮЗОВ И ЧАСТИЦ, см подробности в [893], [909]. При движении вдоль текста с выборками величиной по 16 000 слов, процент служебных слов для каждого автора оказался приблизительно постоянным для всех его произведений. То есть, кривая, изображающая эволюцию указанной частоты, оказывается практически горизонтальной прямой. Выяснилось далее, что разность между максимальным и минимальным значениями этого параметра значительно больше амплитуды его колебаний внутри произведений отдельных авторов. Минимум и максимум были взяты по всем исследованным авторам. Следовательно, обнаруженный параметр хорошо различает между собой многих авторов. На этом основании он был назван авторским инвариантом. Его можно использовать как для атрибуции неизвестных произведений, так и для обнаружения плагиата Хотя и с определенной осторожностью, поскольку у некоторых авторов могут быть очень близкие инварианты. Например, Фонвизин и Толстой. Кроме того, для достаточно уверенных статистических выводов требуются произведения большого объема.
Последнее условие в случае Ломоносова и Миллера выполнено. У обоих есть произведения, из которых можно делать много последовательных выборок по 16 000 слов каждая. Таким образом, условия применимости методики выполнены. Наше применение методики авторского инварианта в рассматриваемом случае состояло в следующем:
Шаг 1. Мы рассмотрели все доступные произведения М.В. Ломоносова, существующие сегодня в подлинных рукописях, написанных его рукой. Из них были выбраны те, которые содержат русский прозаический текст достаточного объема.
Шаг 2. Мы вычислили авторский инвариант М.В. Ломоносова, то есть эволюцию процента служебных слов, на основе методики, предложенной в [893], [909], [МЕТ2]: 2, с. 743–778, см. «Методы», Дополнение 3.
Шаг 3. Затем был подсчитан авторский инвариант для «Древней Российской Истории», приписываемой сегодня Ломоносову. Объем этого русского прозаического текста вполне достаточен для расчета авторского инварианта.
Шаг 4. Мы изучили все доступные произведения Г.Ф. Миллера. Были отобраны лишь те, которые содержат русский прозаический текст достаточного объема.
Шаг 5. На основе указанной методики был подсчитан авторский инвариант Г.Ф. Миллера — эволюция процента служебных слов.
Шаг 6. Наконец, мы сравнили полученные значения инварианта.
Нам были доступны и были использованы тексты Г.Ф. Миллера по изданию [529].
Результат вычислений таков. Авторский инвариант Миллера равен 28 процентам.
Важное замечание. ЭТО — ИСКЛЮЧИТЕЛЬНО БОЛЬШОЕ ЗНАЧЕНИЕ ИНВАРИАНТА. ОНО ЯВЛЯЕТСЯ НАИБОЛЬШИМ ПО СРАВНЕНИЮ СО ЗНАЧЕНИЕМ ИНВАРИАНТА ДЛЯ ВСЕХ АВТОРОВ, ТЕКСТЫ КОТОРЫХ АНАЛИЗИРОВАЛИСЬ В [893], [909], см. «Методы», Дополнение 3.