Грамматика оператора - Operator grammar

Операторная грамматика - это математическая теория человеческого языка, объясняющая, как язык передает информацию . Эта теория - кульминация работы Зеллига Харриса , основные публикации которой были опубликованы ближе к концу прошлого века. Операторная грамматика предполагает, что каждый человеческий язык представляет собой самоорганизующуюся систему, в которой как синтаксические, так и семантические свойства слова устанавливаются исключительно по отношению к другим словам. Таким образом, для определения правил языка не требуется никакой внешней системы ( метаязыка ). Вместо этого эти правила усваиваются через использование и участие, как в большинстве случаев социального поведения . Теория согласуется с идеей о том, что язык эволюционировал постепенно, и каждое последующее поколение вносило новые сложности и вариации.

Грамматика оператора устанавливает три универсальных ограничения: зависимость (некоторые слова зависят от наличия других слов, чтобы сформировать высказывание), вероятность (некоторые комбинации слов и их иждивенцы более вероятны, чем другие) и сокращение (слова в комбинациях с высокой вероятностью могут быть сокращены. в более короткие формы, а иногда полностью опускаются). Вместе они обеспечивают теорию языковой информации : зависимость строит структуру предикат-аргумент ; вероятность создает различные значения; сокращение позволяет использовать компактные формы для общения.

Зависимость

Основным механизмом грамматики операторов является ограничение зависимости: определенные слова ( операторы ) требуют, чтобы в высказывании присутствовало одно или несколько слов (аргументов). В предложении « Джон носит ботинки» оператор носит требуются два аргумента, например, Джон и ботинки . (Это определение зависимости отличается от других грамматик зависимостей, в которых говорят, что аргументы зависят от операторов.)

В каждом языке отношение зависимости между словами порождает синтаксические категории, в которых допустимые аргументы оператора определяются в терминах требований их зависимости. Класс N содержит слова (например, Джон , ботинки ), которые не требуют наличия других слов. Класс O N содержит слова (например, спотыкаться ), для которых требуется ровно одно слово типа N. Класс O NN содержит слова (например, износ ), требующие двух слов типа N. Класс O OO содержит слова (например, потому что ), для которых требуется два слова типа O, например, Джон спотыкается, потому что Джон носит ботинки . Другие классы включают O O (например , возможно ), O NNN (например, положить ), O ON (например, с ), O NO (например, знать ), O NNO (например, спросить ) и O NOO (например, атрибут ).

Категории в грамматике операторов универсальны и определяются исключительно с точки зрения того, как слова соотносятся с другими словами, и не полагаются на внешний набор категорий, таких как существительное, глагол, прилагательное, наречие, предлог, союз и т. Д. Свойства зависимости каждого слова можно наблюдать в процессе использования и, следовательно, изучить.

Вероятность

Ограничение зависимости создает структуру (синтаксис), в которой любое слово соответствующего класса может быть аргументом для данного оператора. Ограничение правдоподобия накладывает дополнительные ограничения на эту структуру, делая некоторые комбинации оператора / аргумента более вероятными, чем другие. Таким образом, Джон носит шляпы чаще, чем Джон носит снег, что, в свою очередь, более вероятно, чем Джон носит отпуск . Ограничение правдоподобия создает значение (семантику), определяя каждое слово в терминах слов, которые оно может принимать в качестве аргументов или аргументом которых оно может быть.

Каждое слово имеет уникальный набор слов, с которым оно встречается, называемое его выбором . Последовательный выбор слова - это набор слов, для которых отношение зависимости имеет вероятность выше среднего. Слова, похожие по значению, имеют похожий последовательный отбор. Этот подход к значению является самоорганизующимся, поскольку для определения значений слов не требуется никакой внешней системы. Вместо этого значение слова определяется его использованием в группе говорящих. Образцы частого использования наблюдаемы и, следовательно, им можно научиться. Новые слова могут быть введены в любое время и определены посредством использования.

В этом смысле грамматику ссылок можно рассматривать как своего рода операторную грамматику, поскольку связь слов полностью определяется их контекстом, и каждому выбору присваивается логарифмическая вероятность.

Снижение

Ограничение редукции действует на комбинации операторов и аргументов с высокой вероятностью и создает более компактные формы. Определенные сокращения позволяют полностью исключить слова из высказывания. Например, « Я ожидаю, что придет Джон» можно свести к « Я ожидаю Джона» , потому что вероятность прихода ниже ожидаемого . Приговор Джон носит сапоги и Джон носит шляпа может быть сведена к Джон носит сапоги и шляпы , потому что повторение первого аргумента Джона под оператором и весьма вероятно. Джон читает, что-то может быть сокращено до Иоанна чтения , потому что аргумент вещи имеет высокую вероятность встретиться с любым оператором.

Определенные сокращения сводят слова к более коротким формам, создавая местоимения, суффиксы и префиксы ( морфология ). Джон носит ботинки, а Джон носит шляпы, что может быть сокращено до Джон носит ботинки и он носит шляпы , где местоимение он является сокращенной формой Джона . Суффиксы и префиксы могут быть получены путем добавления других свободно встречающихся слов или их вариантов. Джон может нравиться, может быть редуцирован до Джона симпатичен . Джон вдумчивый уменьшаются от Иоанна полна мысли , и Джон антивоенный от Джона против войны .

Модификаторы являются результатом нескольких таких сокращений, которые приводят к появлению прилагательных, наречий, предложных фраз , придаточных предложений и т. Д.

  1. Джон носит ботинки; сапоги кожаные (два предложения соединены точкой с запятой ) →
  2. Джон носит кожаные сапоги (сокращение повторяющегося существительного до относительного местоимения ) →
  3. Джон носит сапоги из кожи (бездействие высокой вероятности фразы , которые являются ) →
  4. Джон носит кожаные сапоги (бездействие высокой вероятности оператора из , транспозиций короткого модификатора слева от существительного)

Каждый язык имеет уникальный набор сокращений. Например, некоторые языки имеют морфологию, а некоторые нет; некоторые транспонируют короткие модификаторы, а некоторые нет. Каждое слово в языке участвует только в определенных видах сокращений. Однако в каждом случае сокращенный материал может быть восстановлен на основе знания того, что вероятно в данной комбинации оператор / аргумент. Редукции, в которых участвует каждое слово, наблюдаемы и, следовательно, поддаются изучению, точно так же, как изучаются свойства зависимости и вероятности слова.

Информация

Важность сокращений в грамматике операторов заключается в том, что они отделяют предложения, содержащие сокращенные формы, от предложений, не содержащих (базовые предложения). Все сокращения являются перефразированием , поскольку они не удаляют никакой информации, а только делают предложения более компактными. Таким образом, базовые предложения содержат всю информацию о языке, а сокращенные предложения являются их вариантами. Базовые предложения состоят из простых слов без модификаторов и в основном без аффиксов, например, снег падает , овцы едят траву , Джон знает, что овцы едят траву , что овцы едят снег, удивляет Джона .

Каждый оператор в предложении вносит свой вклад в информацию в соответствии с вероятностью появления его аргументов. У очень ожидаемых комбинаций мало информации; редкие комбинации несут высокую информацию. Точный вклад оператора определяется его выбором, набором слов, с которыми он встречается с большой частотой. Аргументы сапоги , шляпы , овцы , трава и снег различаются по значению в зависимости от операторов, для которых они могут появляться с высокой вероятностью в позиции первого или второго аргумента. Например, снег ожидается как первый аргумент падения, но не еды , в то время как обратное верно для овец . Точно так же операторы есть , пожирать , жевать и глотать различаются по значению настолько, насколько различаются аргументы, которые они выбирают, и операторы, которые их выбирают.

Грамматика операторов предсказывает, что информация, переносимая предложением, представляет собой совокупность вкладов каждого аргумента и оператора. Прирост информации, которую данное слово добавляет к новому предложению, определяется тем, как оно использовалось раньше. В свою очередь, новые способы использования расширяют или даже изменяют информационное содержание, связанное со словом. Поскольку этот процесс основан на частом использовании, значения слов относительно стабильны во времени, но могут меняться в соответствии с потребностями лингвистического сообщества.

Библиография

  • Харрис , Зеллиг (1982), Грамматика английского языка по математическим принципам , Нью-Йорк: Джон Вили и сыновья, ISBN   0-471-02958-0
  • Харрис , Зеллиг (1988), язык и информация , Нью-Йорк: издательство Колумбийского университета, ISBN   0-231-06662-7
  • Харрис , Зеллиг (1989), Форма информации в науке: анализ подъязыка иммунологии , Springer, ISBN   90-277-2516-0
  • Харрис , Зеллиг (1991), Теория языка и информации: математический подход , Oxford University Press, США, ISBN   0-19-824224-7