и к предполагаемым им классам слов:
T = {the}
N = {man, dog, chimpanzee, . . .}
V = {bites, eats, opens, . . .}.
Процесс лексической субституции (подстановка конкретных слов на позиции, установленные соответствующим грамматическим правилом; см. § 4.2.9) можно описать следующим образом: каждый случай появления символа грамматического класса в структурном описании предложения заменяется на любой член означенного класса, причем этот член берется из списка данного класса, приведенного в словаре. (Когда все символы грамматических классов заменены, или «переписаны», посредством многократного применения принципа лексической субституции, на «выходе» генеративной системы получается предложение, снабженное соответствующим структурным описанием.) Операция лексической субституции может быть формализована посредством следующего правила:
Х → х|х ∈ Х.
«Замени X, где X — переменная, принимающая значение всех грамматических классов, упоминаемых в генеративной системе (например, Т, N или V), на х, где х — любой член класса X». Последовательное применение этого правила лексической субституции превратит T + N + V + T + N в некоторое предложение типа The dog bites the man, как это представлено деревом на рис. 5. (Заметим, что различие между той частью «выхода», которая выводится из грамматического правила, и частью, полученной из словаря, представлено на дереве различием между сплошной и прерывистой линией. В настоящей работе мы будем везде придерживаться этого удобного соглашения.)
Рис. 5.
Поскольку правила лексической субституции действуют одинаковым образом, независимо от «значения», принимаемого Х-ом, мы можем рассматривать списки слов как множество правил, прилагаемых к грамматике, и таким образом обойтись без обобщенного правила лексической субституции. Принимая эту точку зрения (которую мы вскоре пересмотрим), мы следуем практике Хомского и других авторов первых работ по генеративной грамматике. Мы можем, следовательно, организовать словарь так, чтобы он принял следующую форму:
T → {the}
N → {man, dog, chimpanzee, . . .}
V → {bites, eats, opens, . . .}.
Стрелки можно интерпретировать как инструкцию заменить (или «переписать») элемент, находящийся слева от стрелки, на один из элементов, перечисленных справа от стрелки, например: 'y → z' означало бы «замени у на z (при условиях, определяющих систему правил)». Любая система правил, каждое из которых представлено в такой форме (способ их действия будет более подробно рассмотрен в гл. 6), называется системой подстановки (или системой правил подстановки).
Теперь используем стрелку подстановки также и для грамматического правила и объединим грамматическое правило и правила лексической субституции в одну систему:
(1) Σ>1 → T + N + V + T + N
(2) T → {the}
(3) N → {man, dog, chimpanzee, . . .}
(4) V → {bites, eats, opens, . . .}.
Это весьма простая генеративная грамматика, которую мы расширим, с тем чтобы она учитывала некоторые результаты деления классов слов на определенные подклассы.
В предыдущем разделе мы отмечали, что в рамках допущений, принятых нами при рассмотрении формальной грамматики, любая переклассификация слов в словаре производит не подклассы исходных более широких классов, а совершенно не связанные друг с другом новые классы. С грамматической точки зрения этот недостаток может быть исправлен посредством введения добавочных правил, а именно:
N → {N>a, N>b, N>c}
V → {V>d, V>e, V>f}.
Теперь мы должны внести поправки в правила лексической субституции (увеличив их число). Таким образом, новая система, включающая грамматику и словарь, примет следующий вид:
(1) Σ>1 → T + N + V + T + N
(2) N → {N>a, N>b, N>c}
(3) V → {V>d, V>e, V>f}
(4) N>a → {man, dog, chimpanzee, . . .}
(5) N>b → {banana, door, milk, . . .}
(6) N>c → {fact, meaning, structure, . . .}
(7) V>d → {eats, bites, frightens, . . .}
(8) V>d → {recognizes, . . .}
(9) V>f → {determines, . . .}.
Эта система правил формализует в пределах грамматики тот факт, что N>a, N>b и N>c представляют собой подклассы N (члены этих подклассов — «существительные»), а V>d, V>e,и V>f - подклассы V (члены — «глаголы»). Следовательно, в целях формализации этого факта наша система вводит дополнительный «слой» грамматической структуры (ср. рис. 6, представляющий дополнительный «слой» посредством ветвей «дерева», связывающих N и N