Обработка предложений - Sentence processing

Обработка предложений происходит всякий раз, когда читатель или слушатель обрабатывает языковое высказывание либо изолированно, либо в контексте разговора или текста. Многие исследования процесса понимания человеческого языка были сосредоточены на чтении отдельных высказываний (предложений) без контекста. Обширные исследования показали, что на понимание языка влияет контекст, предшествующий данному высказыванию, а также многие другие факторы.

Двусмысленность

Понимание предложений должно иметь дело с двусмысленностью устных и письменных высказываний, например, с лексической , структурной и семантической неоднозначностями . Двусмысленность встречается повсеместно, но люди обычно разрешают ее так легко, что даже не замечают ее. Например, предложение Время летит , как стрела имеет (по крайней мере) интерпретацию время смещается так же быстро , как стрела , особым вид мухи, называется время летать, любит стрелку и измерить скорость мух , как вы бы измерить скорость стрелка . Обычно читатели будут знать только о первом толковании. Однако образованные читатели спонтанно думают о стреле времени, но препятствуют этой интерпретации, потому что она отклоняется от исходной фразы, а височная доля действует как переключатель.

Случаи неоднозначности можно классифицировать как локальные или глобальные . Предложение является глобально неоднозначным, если оно имеет две различные интерпретации. Примеры: Кто-то застрелил слугу актрисы, которая находилась на балконе (это служанка или актриса была на балконе?), Или Полицейский гнался за преступником на быстрой машине (у полицейского или преступника была быстрая машина?). Понимающие могут иметь предпочтительную интерпретацию для любого из этих случаев, но синтаксически и семантически нельзя исключать ни одну из возможных интерпретаций.

Локальные двусмысленности сохраняются только в течение короткого промежутка времени, когда высказывание слышно или записывается, и разрешаются в ходе высказывания, поэтому полное высказывание имеет только одну интерпретацию. Примеры включают такие предложения, как «Критик написал, что книга была поучительной» , что неоднозначно, когда «Критик написал книгу » встречался, но поучительный еще предстоит обработать. Затем предложение может заканчиваться заявлением о том, что критик является автором книги, или может продолжаться, поясняя, что критик что-то написал о книге. Неоднозначность заканчивается просветлением , которое определяет, что вторая альтернатива верна.

Когда читатели обрабатывают локальную неоднозначность, они сразу же выбирают одну из возможных интерпретаций, не дожидаясь, чтобы услышать или прочитать больше слов, которые могут помочь решить, какая интерпретация верна (поведение называется инкрементальной обработкой ). Если читатели удивляются тому, какой оборот действительно принимает предложение, обработка замедляется и заметна, например, во времени чтения. Поэтому локально неоднозначные предложения использовались в качестве тестовых примеров для исследования влияния ряда различных факторов на обработку человеческих предложений. Если фактор помогает читателям избежать затруднений, очевидно, что этот фактор играет важную роль в обработке предложения.

Теории

Экспериментальные исследования породили большое количество гипотез об архитектуре и механизмах понимания предложений. Такие вопросы, как модульность по сравнению с интерактивной обработкой и последовательное или параллельное вычисление анализов, были теоретическими разделениями в этой области.

Архитектурные вопросы

Модульное против интерактивного

Модульное представление обработки предложений предполагает, что каждый фактор, участвующий в обработке предложения, вычисляется в своем собственном модуле, который имеет ограниченные средства связи с другими модулями. Например, создание синтаксического анализа происходит без ввода семантического анализа или контекстно-зависимой информации, которая обрабатывается отдельно. Распространенное допущение модульных учетных записей - это архитектура с прямой связью, в которой выходные данные одного шага обработки передаются на следующий шаг без механизмов обратной связи, которые позволили бы скорректировать выходные данные первого модуля. Синтаксическая обработка обычно считается самым основным этапом анализа, который используется для семантической обработки и включения другой информации. Отдельный мысленный модуль анализирует предложения, и сначала происходит лексический доступ. Затем рассматривается одна синтаксическая гипотеза. Нет никакого первоначального влияния смысла или семантики. Обработка предложений поддерживается временно-фронтальной сетью. Внутри сети временные области обслуживают аспекты идентификации, а фронтальные области - построение синтаксических и семантических отношений. Временной анализ активации мозга в этой сети поддерживает модели, ориентированные на синтаксис, потому что они показывают, что построение синтаксической структуры предшествует семантическим процессам и что они взаимодействуют только на более поздней стадии.

Интерактивные учетные записи предполагают, что вся доступная информация обрабатывается одновременно и может немедленно повлиять на расчет окончательного анализа. В интерактивной модели обработки предложений нет отдельного модуля для синтаксического анализа. Лексический доступ, присвоение синтаксической структуры и присвоение значения происходят одновременно, параллельно. Одновременно можно рассматривать несколько синтаксических гипотез. Интерактивная модель демонстрирует интерактивное взаимодействие между структурным, лексическим и фонетическим уровнями обработки предложений. Каждое слово, как оно слышно в контексте нормального дискурса, немедленно вводится в систему обработки на всех уровнях описания и одновременно анализируется на всех этих уровнях в свете любой информации, доступной на каждом уровне в этот момент. обработка приговора. Интерактивные модели языковой обработки предполагают, что информация течет как снизу вверх, так и сверху вниз, так что на представления, сформированные на каждом уровне, могут влиять как более высокие, так и более низкие уровни. Структура, называемая интерактивной средой активации, которая включает это ключевое предположение, среди прочего, включая предположение, что влияния из разных источников комбинируются нелинейно. Нелинейность означает, что информация, которая может иметь решающее значение при одних обстоятельствах, может иметь незначительный эффект или не иметь никакого эффекта при других условиях. В интерактивной среде активации знания, которые направляют обработку, хранятся в связях между модулями на одном и том же и смежных уровнях. Блоки обработки, которые они подключают, могут получать входные данные из ряда различных источников, что позволяет знаниям, направляющим обработку, быть полностью локальными, в то же время позволяя результатам обработки на одном уровне влиять на обработку на других уровнях, как над и под. Основное предположение структуры состоит в том, что взаимодействия при обработке всегда взаимны; именно эта двунаправленная характеристика делает систему интерактивной. Двунаправленные возбуждающие взаимодействия между уровнями допускают взаимное одновременное ограничение между соседними уровнями, а двунаправленные тормозящие взаимодействия внутри уровня допускают конкуренцию между взаимно несовместимыми интерпретациями части входных данных. Межуровневые возбуждающие взаимодействия фиксируются в моделях как двусторонние возбуждающие связи между взаимно совместимыми процессорами. Синтаксическая двусмысленность фактически основана на лексическом уровне. Кроме того, более поздние исследования с более чувствительными машинами для отслеживания взгляда показали ранние контекстные эффекты. Частотная и контекстная информация будет модулировать активацию альтернатив, даже если они разрешены в пользу простой интерпретации. Структурная простота сочетается с частотой, что противоречит теории садовых дорожек.

Последовательный против параллельного

Серийные отчеты предполагают, что люди сначала строят только одну из возможных интерпретаций и пробуют другую, только если первая оказывается неверной. Параллельные счета предполагают одновременное построение нескольких интерпретаций. Чтобы объяснить, почему понимающие обычно осведомлены только об одном возможном анализе того, что они слышат, модели могут предположить, что все анализы ранжированы, а самый высокий ранжирован.

Модели

Существует ряд влиятельных моделей обработки человеческих предложений, основанных на различных комбинациях архитектурных решений.

Модель садовой дорожки

Модель садовой дорожки ( Frazier 1987 ) представляет собой серийную модульную модель разбора. Он предлагает, чтобы один синтаксический анализ был построен синтаксическим модулем. Контекстные и семантические факторы влияют на обработку на более позднем этапе и могут вызвать повторный анализ синтаксического анализа. Повторный анализ дорогостоящий и приводит к заметному замедлению чтения. Когда парсер обнаруживает двусмысленность, он руководствуется двумя принципами: позднее закрытие и минимальное присоединение. Модель была подкреплена исследованиями ранней левой передней негативности , потенциала, связанного с событием, часто выявляемого как реакция на нарушения структуры фразы .

Позднее закрытие приводит к добавлению новых слов или фраз к текущему предложению. Например, «Джон сказал, что уйдет вчера» будет проанализирован, как сказал Джон (он уйдет вчера) , а не так, как Джон сказал (он уйдет) вчера (т. Е. Он говорил вчера).

Минимальное прикрепление - это стратегия экономии: синтаксический анализатор строит простейшую синтаксическую структуру (то есть с наименьшим количеством фразовых узлов).

Модель на основе ограничений

Теории понимания языка, основанные на ограничениях, подчеркивают, как люди используют огромное количество вероятностной информации, доступной в лингвистическом сигнале. Посредством статистического обучения можно определить частоту и распределение событий в языковой среде, которые влияют на понимание языка. Таким образом, говорят, что пользователи языка приходят к определенной интерпретации по сравнению с другой во время понимания неоднозначного предложения, быстро интегрируя эти вероятностные ограничения.

Достаточно хорошая теория

Достаточно хороший подход к пониманию языка, разработанный Фернандой Феррейра и другими, предполагает, что слушатели не всегда вовлекаются в полную детальную обработку языкового ввода. Скорее, система имеет тенденцию к развитию поверхностных и поверхностных представлений, когда сталкивается с некоторыми трудностями. Теория использует подход, который в некоторой степени сочетает в себе модель садовой дорожки и модель на основе ограничений. Теория фокусируется на двух основных вопросах. Во-первых, изображения, сформированные из сложного или трудного материала, часто бывают поверхностными и неполными. Во-вторых, в случаях, когда система понимания сталкивается с трудностями, часто обращаются к ограниченным источникам информации. Теорию можно проверить с помощью различных экспериментов в психолингвистике, которые связаны с неправильным толкованием садовых дорожек и т. Д.

Методы

Поведенческие задачи

В поведенческих исследованиях испытуемым часто предъявляют лингвистические стимулы и просят выполнить действие. Например, их могут попросить вынести суждение о слове ( лексическое решение ), воспроизвести стимул или назвать визуально представленное слово вслух. Скорость (часто время реакции: время, необходимое для ответа на стимул) и точность (доля правильных ответов) обычно используются для измерения производительности в поведенческих задачах. Исследователи делают вывод, что природа базовых процессов, требуемых задачей, порождает различия; более медленные темпы и меньшая точность в этих задачах рассматриваются как меры повышенной сложности. Важным компонентом любой поведенческой задачи является то, что она остается относительно верной «нормальному» пониманию языка - способность обобщать результаты любой задачи ограничена, когда задача имеет мало общего с тем, как люди на самом деле сталкиваются с языком.

Распространенная поведенческая парадигма включает в себя эффекты прайминга , при которых участникам сначала предъявляется штрих, а затем целевое слово. На время отклика для целевого слова влияет соотношение между простым и целевым. Например, Фишлер (1977) исследовал кодирование слов, используя задачу лексического решения. Она попросила участников принять решение о том, являются ли две строки букв английскими словами. Иногда строки могут быть настоящими английскими словами, требующими ответа «да», а в других случаях - не словами, требующими ответа «нет». Подмножество допустимых слов было связано семантически (например, «кошка-собака»), в то время как другие не были связаны (например, «стебель хлеба»). Фишлер обнаружил, что связанные пары слов реагировали быстрее по сравнению с парами несвязанных слов, что предполагает, что семантическое родство может облегчить кодирование слов.

Движение глаз

Слежение за глазами использовалось для изучения языковой обработки онлайн. Этот метод сыграл важную роль в распространении знаний о чтении. Кроме того, Tanenhaus et al. (1995) установили парадигму визуального мира, в которой движения глаз используются для изучения обработки разговорной речи в режиме онлайн. Эта область исследований основана на гипотезе о том, что движения глаз тесно связаны с текущим фокусом внимания.

Нейровизуализация и вызванные потенциалы

Распространение неинвазивных методов предоставляет множество возможностей для изучения основ понимания языка мозгом. Общие примеры включают позитронно-эмиссионную томографию (ПЭТ), функциональную магнитно-резонансную томографию (фМРТ), связанные с событиями потенциалы (ERP) в электроэнцефалографии (ЭЭГ) и магнитоэнцефалографии (МЭГ), а также транскраниальную магнитную стимуляцию (ТМС). Эти методы различаются по своему пространственному и временному разрешению (фМРТ имеет разрешение несколько тысяч нейронов на пиксель, а ERP имеет точность до миллисекунд), и каждый тип методологии представляет собой набор преимуществ и недостатков для изучения конкретной проблемы понимания языка.

Вычислительное моделирование

Вычислительное моделирование - еще один способ изучить понимание языка. Модели, например созданные в нейронных сетях , особенно полезны, потому что они требуют от теоретиков явного выражения своих гипотез и потому, что их можно использовать для создания точных прогнозов для теоретических моделей, которые настолько сложны, что делают дискурсивный анализ ненадежным. Классическим примером компьютерного моделирования в языковых исследованиях является модель восприятия речи TRACE Макклелланда и Элмана . Модель обработки предложений можно найти в «рациональном» синтаксическом анализаторе Generalized Left Corner Хейла (2011). Эта модель выводит эффекты садовой дорожки, а также явления локальной когерентности. Вычислительное моделирование также может помочь связать обработку предложений с другими функциями языка. Например, одна модель эффектов ERP при обработке предложений (например, N400 и P600) утверждает, что эти явления возникают в результате процессов обучения, которые поддерживают овладение языком и лингвистическую адаптацию.

Смотрите также

Примечания

использованная литература

Феррейра Ф., Бейли К.Г. и Ферраро В. (2002). Достаточно хорошие представления в понимании языка [1] в Текущих направлениях психологической науки , 11 (1), 11-15.
Фернанда Феррейра, Пол Энгельхардт, Манон В. Джонс (Департамент психологии, Эдинбургский университет) (2009) Достаточно хорошая языковая обработка: удовлетворительный подход , в материалах 31-й ежегодной конференции общества когнитивных наук . Остин: Общество когнитивных наук.

дальнейшее чтение

Кэрролл, Дэвид, Психология языка (Wadsworth Publishing, 2003))

Феррейра Ф. и Патсон Н.Д. (2007). «Достаточно хороший» подход к пониманию языка в Language and Linguistics Compass , 1 (1-2), 71-83.
Фрейзер, Лин (1987), «Обработка предложений: обзор учебного пособия», в Coltheart, M. (ed.), Attention and Performance XII: The Psychology of Reading , Lawrence Erlbaum Associates.
Таунсенд, Дэвид Дж; Томас Дж. Бевер (2001). Понимание предложений: интеграция привычек и правил . MIT Press . п. 382 . ISBN 978-0-262-70080-1. ранний левый передний негатив.
Льюис, Ричард (1999), «Определение архитектур для языковой обработки: процесс, управление и память при синтаксическом анализе и интерпретации», в Crocker, M. (ed.), Architectures and Mechanisms for Language Processing (PDF) , Cambridge University Press, doi : 10.1017 / CBO9780511527210.004 , S2CID 16789862 , архивировано из оригинала (PDF) на 2019-08-24
Обработка человеческих предложений : вводный веб-сайт, посвященный вычислительным психолингвистическим аспектам обработки человеческих предложений, разработанный для студентов, изучающих лингвистику, психологию или информатику.

Languages

In other projects