Введение в теоретическую лингвистику - страница 96
Если же мы занимаемся синтезом, мы должны решить, какие прилагательные принадлежат классу А>x; например, включает ли этот класс слова true 'верный' и strong 'сильный' с тем, чтобы trueness и strongness (в дополнение к truth 'правда' и strength 'сила' или вместо них) порождались как грамматичные или исключались как неграмматичные. Но грамматика «распознавания» не нуждается в решении этого вопроса. Эта грамматика могла бы вполне довольствоваться более общим правилом A + ness = N>y («Любое слово, встречающееся в предложении в позиции, в которой допустимо N>y, и которое можно разложить на А и ness, должно быть принято программой распознавания»). Если бы trueness и strongness встретились в анализируемом тексте, они были бы проанализированы и признаны грамматичными; если нет, то данный вопрос не релевантен. (Слова truth и strength были бы перечислены в словаре или анализировались бы на основе иных правил. Использованный здесь пример взят из действительной программы вычислительной машины, которая успешно анализировала очень многие английские деривационные образования.)
С различием точек зрения не связано никакое принципиальное различие. Формула A + ness = N>y порождает одно и то же множество слов, используется ли она для анализа или синтеза (предполагается, что она относится к одному и тому же списку прилагательных). Но, занимаясь исключительно анализом, можно позволить себе некоторые вольности. Можно намеренно порождать (в абстрактном, математическом значении — и именно в этом значении следует всегда понимать этот термин) множество предложений, которое включало бы ряд подлежащих исключению предложений, исходя из предположения, что они так или иначе не встретятся. Исключение предложений, которые предположительно не встретятся, значительно увеличило бы «затраты» (см. § 4.2.11). Этот принцип «эффективности затрат» часто применяется при автоматическом анализе языка с помощью компьютера, поскольку принцип «снижения рентабельности» имеет весьма прямую экономическую интерпретацию (в виде дополнительного времени, необходимого для программирования, излишних затрат времени компьютера и т. д.).
Следует, впрочем, учесть возможность неправильного понимания соотношения анализа и синтеза. Тот факт, что грамматика нейтральна по отношению к анализу и синтезу, не означает, что анализ — это просто нечто обратное синтезу (или vice versa). Не следует, например, полагать, что программа вычислительной машины могла бы проходить «сверху вниз» по набору правил (и от грамматики к словарю) при «образовании» предложений и «снизу вверх по тому же набору правил (и от словаря к грамматике) при «рас познавании» конкретного корпуса материала. Как «образование», так и «распознавание», производится ли оно говорящими и слушающими или компьютером, предназначенным для моделирования их речевого «поведения», по-видимому, предусматривают «обратную связь» между этими двумя процессами (см. § 3.2.9). В исследовании этой проблемы с психологической точки зрения достигнуты пока лишь незначительные успехи; некоторые «психолингвистические» исследования были неудачными из-за непонимания того факта, что «генеративный» («порождающий») не означает «производящий». Отсюда этот предостерегающий абзац.
4.3.2. ПРАВИЛА ЛЕКСИЧЕСКОЙ СУБСТИТУЦИИ
Теперь мы можем вернуться к обсуждению структуры словаря. Для простоты будем по-прежнему опираться на наше весьма простое представление о грамматических правилах. Хотя оно будет пересмотрено в последующих главах, этот пересмотр не окажет влияния на сделанные здесь общие утверждения. Итак, вернемся к первому правилу, использованному в предыдущем разделе:
Σ>1 : T + N + V + T + N,
и к предполагаемым им классам слов: