Правила построения фраз - Phrase structure rules

Правила структуры фраз - это тип правила перезаписи, используемый для описания синтаксиса данного языка и тесно связанный с ранними этапами трансформационной грамматики , предложенной Ноамом Хомским в 1957 году. Они используются для разбиения предложения естественного языка на составные части. также известные как синтаксические категории , включая как лексические категории ( части речи ), так и фразовые категории. Грамматика, использующая правила структуры фраз, является разновидностью грамматики структуры фраз . Правила структуры фраз в том виде, в котором они обычно используются, действуют в соответствии с отношением избирательного округа , и грамматика, в которой используются правила структуры фраз, поэтому является грамматикой избирательного округа ; как таковой, он контрастирует с грамматиками зависимостей , которые основаны на отношении зависимостей .

Определение и примеры

Правила структуры фраз обычно имеют следующую форму:

означает, что компонент разделен на два компонента и . Вот некоторые примеры для английского языка:

Первое правило гласит: AS ( предложение ) состоит из NP ( именной фразы ), за которой следует VP ( глагольная фраза ). Второе правило гласит: именная фраза состоит из необязательного Det ( определитель ), за которым следует N (существительное). Третье правило означает, что перед N (существительное) может стоять необязательная AP ( фраза прилагательного ), а за ней - необязательная PP ( предложная фраза ). Круглые скобки указывают на необязательные составляющие.

Начиная с символа предложения S и последовательно применяя правила структуры фраз, наконец, применяя правила замены для замены абстрактных символов фактическими словами, можно сгенерировать множество правильных предложений на английском языке (или на любом другом языке, для которого определены правила). Если правила верны, то любое предложение, составленное таким образом, должно быть грамматически (синтаксически) правильным . Также следует ожидать, что правила будут генерировать синтаксически правильные, но семантически бессмысленные предложения, такие как следующий хорошо известный пример:

Бесцветные зеленые идеи яростно спят

Это предложение было построено Ноамом Хомским как иллюстрация того, что правила структуры фраз способны генерировать синтаксически правильные, но семантически неправильные предложения. Правила структуры фраз разбивают предложения на составные части. Эти составляющие часто представлены в виде древовидных структур ( дендрограмм ). Дерево для предложения Хомского можно представить следующим образом:

Бесцветные зеленые идеи яростно спят.

Составной элемент - это любое слово или комбинация слов, в которых преобладает один узел. Таким образом, каждое отдельное слово является составной частью. Кроме того, субъект Н. П. Бесцветные зеленые идеи , второстепенные зеленые идеи НП и яростный сон вице-президента являются составными частями . Правила структуры фраз и связанные с ними древовидные структуры представляют собой форму непосредственного составного анализа .

В трансформационной грамматике системы правил структуры фраз дополняются правилами трансформации, которые воздействуют на существующую синтаксическую структуру для создания новой (выполняя такие операции, как отрицание , пассивизация и т. Д.). Эти преобразования не являются строго обязательными для генерации, так как предложения, которые они производят, могут быть сгенерированы только с помощью подходящей расширенной системы правил структуры фраз, но преобразования обеспечивают большую экономию и позволяют отразить в грамматике важные отношения между предложениями.

Сверху вниз

Важным аспектом правил структуры фраз является то, что они рассматривают структуру предложения сверху вниз. Категория слева от стрелки - это большая составляющая, а непосредственные составляющие справа от стрелки - меньшие составляющие. Составляющие последовательно разбиваются на части по мере продвижения вниз по списку правил структуры фраз для данного предложения. Такой взгляд на структуру предложения сверху вниз контрастирует с большой работой, проделанной в современном теоретическом синтаксисе. В Минимализме , например, структура предложения формируется снизу вверх. Операция « Слияние» объединяет более мелкие составляющие для создания более крупных составляющих, пока не будет достигнута наибольшая составляющая (то есть предложение). В этом отношении теоретический синтаксис давно отказался от правил структуры фраз, хотя их важность для компьютерной лингвистики, кажется, остается неизменной.

Альтернативные подходы

Постоянная группа против зависимости

Правила структуры фраз, поскольку они обычно используются, приводят к представлению о структуре предложения, основанной на избирательных округах . Таким образом, грамматики, которые используют правила структуры фраз, являются грамматиками постоянных участников (= грамматиками структуры фраз ), в отличие от грамматик зависимостей , которые рассматривают структуру предложения как основанную на зависимостях . Это означает, что для того, чтобы правила структуры фраз вообще были применимы, нужно стремиться к пониманию структуры предложения на основе избирательных округов. Отношение избирательного округа - это соответствие "один-к-одному" или "нескольким". Для каждого слова в предложении существует по крайней мере один узел в синтаксической структуре, который соответствует этому слову. Отношение зависимости, напротив, является отношением «один-к-одному»; для каждого слова в предложении есть ровно один узел в синтаксической структуре, который соответствует этому слову. Различие иллюстрируется следующими деревьями:

Правила структуры фраз: постоянство против зависимости

Дерево избирателей слева может быть создано с помощью правил структуры фраз. Предложение S разбивается на все меньшие и меньшие составные части. В отличие от этого, дерево зависимостей справа не могло быть сгенерировано правилами структуры фраз (по крайней мере, не так, как они обычно интерпретируются).

Репрезентативные грамматики

Ряд теорий репрезентативной структуры фраз в грамматике никогда не признавали правила структуры фраз, а вместо этого преследовали понимание структуры предложения в терминах понятия схемы . Здесь структуры фраз не являются производными от правил, которые объединяют слова, а из спецификации или экземпляра синтаксических схем или конфигураций, часто выражающих какой-то семантический контент независимо от конкретных слов, которые в них появляются. Такой подход, по существу , эквивалентен системе правил структуры фразы в сочетании с не композиционной семантической теорией, так как грамматический формализм на основе правил перезаписи , как правило , эквивалентен по мощности, основанным на подмене в схемы.

Таким образом, в этом типе подхода, вместо того, чтобы быть производным от применения ряда правил структуры фраз, предложение Бесцветные зеленые идеи яростно спят , будет генерироваться путем заполнения слов в слоты схемы, имеющей следующую структуру:

[NP [ADJ N] VP [V] AP [ADV]]

И который выражал бы следующее концептуальное содержание:

X ДЕЛАЕТ Y В ОБРАЗЕ Z

Хотя они и не композиционные, такие модели монотонны. Этот подход широко развит в строительной грамматике и оказал некоторое влияние на грамматику структуры фраз, управляемую головой, и лексическую функциональную грамматику , последние две явно квалифицируются как грамматики структуры фраз.

Смотрите также

Примечания

использованная литература