FrameNet - FrameNet

FrameNet
Заявление о миссии Создание лексической базы данных на основе теории значения, называемой семантикой фреймов .
Коммерческий? Нет (доступно для скачивания в свободном доступе)
Тип проекта Лексическая база данных (содержащая: фреймы, элементы фрейма (FE), лексические единицы (LU), примеры предложений и отношения фреймов)
Место расположения Международный институт компьютерных наук в Беркли, Калифорния
Владелец Коллин Бейкер (нынешний руководитель проекта)
Основатель Чарльз Дж. Филмор
Учредил 1997 ; 24 года назад ( 1997 )
Веб-сайт framenet .icsi .berkeley .edu

В компьютерной лингвистике , FrameNet проект размещен в Международном институте компьютерных наук в Беркли, штат Калифорния , который производит электронный ресурс , основанный на теории означая называемые фреймы семантики . FrameNet показывает, например, что предложение «Джон продал машину Мэри» по существу описывает ту же базовую ситуацию (семантический фрейм), что и «Мэри купила машину у Джона», только с другой точки зрения. Семантический фрейм можно рассматривать как концептуальную структуру, описывающую событие, отношение или объект и его участников. Лексическая база данных FrameNet содержит более 1200 семантических фреймов , 13 000 лексических единиц (соединение слова со значением ; многозначные слова представлены несколькими лексическими единицами ) и 202 000 предложений-примеров. FrameNet - в значительной степени создание Чарльза Дж. Филлмора , который разработал теорию семантики фреймов, на которой основан проект, и первоначально был руководителем проекта, когда проект начался в 1997 году. Коллин Бейкер стал менеджером проекта в 2000 году. Проект FrameNet оказал влияние как на лингвистику, так и на обработку естественного языка, где привел к задаче автоматической семантической разметки ролей .

Концепции

Кадры

Фрейм - это схематическое изображение ситуации с участием различных участников, опор и других концептуальных ролей. Примеры имен фреймов: Being_bornи Locative_relation. Фрейм в FrameNet содержит текстовое описание того, что он представляет (определение фрейма), связанные элементы фрейма, лексические единицы, примеры предложений и межкадровые отношения.

Элементы каркаса

Элементы фрейма (FE) предоставляют дополнительную информацию к семантической структуре предложения. Каждый фрейм имеет ряд основных и дополнительных FE, которые можно рассматривать как семантические роли. Ключевые FE важны для значения кадра, тогда как неосновные FE обычно описательны (например, время, место, способ и т. Д.).

Вот некоторые примеры:

  • Вызывается единственный основной FE Being_bornкадра Child; неосновные FES быть Time, Place, Relativesи т.д.
  • Ядро FES из Commerce_goods-transferвключают в себя Seller, Buyer, Goods, среди прочего, в то время как неосновные FES включают в себя Place, Purposeи т.д.

FrameNet включает мелкие данные о синтаксических ролях, которые элементы фрейма играют в примерах предложений. Например, для такого предложения, как «Она родилась около 460 г. н.э.», FrameNet пометит «Она» как именную фразу, относящуюся к ChildFE, и «около 460 г. нашей эры» как именную фразу, соответствующую Timeэлементу фрейма. Детали того, как элементы фрейма могут быть реализованы в предложении, важны, потому что это раскрывает важную информацию о фреймах подкатегории, а также возможных чередованиях диатез (например, «Джон разбил окно» против «Разбил окно») глагола.

Лексические единицы

Лексические единицы (ЛЕ) - это леммы с их частью речи, которые вызывают определенный фрейм. Другими словами, когда LU идентифицируется в предложении, этот конкретный LU может быть связан с его конкретным кадром (ами). Для каждого кадра может быть много LU, связанных с этим кадром, а также может быть много кадров, которые совместно используют конкретный LU, это обычно случается с LU, которые имеют несколько значений слов. Наряду с фреймом каждая лексическая единица связана с конкретными элементами фрейма посредством аннотированных примеров предложений.

Пример:

Лексические единицы, которые вызывают Complainingфрейм (или, если быть точнее, его перспективные версии), включают глаголы «жаловаться», «рябчик», «сетовать» и другие.

Примеры предложений

Фреймы связаны с примерами предложений, а элементы фреймов отмечены внутри предложений. Таким образом, предложение

Она родилась около 460 г.

связан с рамкой Being_born, в то время как «Она» помечена как элемент рамки, Childа «около 460 г. н.э.» помечена как Time. (См аннотаций отчета FrameNet для born.v.) С самого начала проект FrameNet был совершен смотреть на доказательствах от фактического использования языка, которые содержатся в текстовых коллекциях , таких как British National Corpus . На основе таких примерных предложений инструменты автоматического присвоения семантических ролей могут определять фреймы и отмечать элементы фреймов в новых предложениях.

Валентности

FrameNet также предоставляет статистические данные о валентности этих кадров , то есть количество и расположение элементов каркаса внутри примеров предложений. Предложение

Она родилась около 460 г.

попадает в структуру валентности

НП Внеш, ИНИ -, НП Деп

который встречается два раза в примерах предложений в FrameNet, а именно в:

Она была родилась около 460 г. н.э. , дочери и внучки римских и византийских императоров, чья семья была видным в римской политике на протяжении более 700 лет.
Вскоре он был отправлен в Северную Африку и так и не встретил их единственного ребенка, дочь, родившуюся 8 июня 1941 года .

Фреймовые отношения

FrameNet дополнительно фиксирует отношения между различными фреймами с помощью отношений. К ним относятся следующие:

  • Наследование: когда один кадр является более конкретной версией другого, более абстрактного родительского кадра. Все, что истинно в отношении родительского фрейма, должно быть истинным и в отношении дочернего фрейма, и между элементами фрейма родительского и дочернего фрейма указывается соответствие.
  • Perspectivized_in: нейтральный кадр (например, Commerce_transfer-goods) связан с кадром с определенной перспективой того же сценария (например, Commerce_sellкадр, который предполагает перспективу продавца, или Commerce_buyкадр, который предполагает перспективу покупателя)
  • Подрамник: Некоторые кадры , как Criminal_processкадр относятся к сложным сценариям , которые состоят из нескольких отдельных состояний или событий , которые могут быть описаны отдельными кадрами , как Arrest, Trialи так далее.
  • Precedes: отношение Precedes фиксирует временной порядок, который сохраняется между подкадрами сложного сценария.
  • Causative_of и Inchoative_of: существует довольно систематическая взаимосвязь между статическими описаниями (например, Position_on_a_scaleфрейм, например, «У нее высокая зарплата») и каузативными описаниями (например, Cause_change_of_scalar_positionфрейм, например, «Она повысила его зарплату») или начальными описаниями (например, Change_position_on_a_scaleфрейм, например: Ее зарплата увеличилась »).
  • Использование: отношение, которое сохраняется между кадром, который каким-то образом включает другой кадр. Например, Judgment_communicationфрейм использует и Judgmentфрейм, и Statementфрейм, но не наследуется ни от одного из них, потому что нет четкого соответствия элементов фрейма.
  • See_also: соединяет кадры, которые имеют некоторое сходство, но требуют тщательного различения.

Приложения

FrameNet оказалась полезной в ряде вычислительных приложений, потому что компьютерам необходимы дополнительные знания, чтобы распознать, что «Джон продал машину Мэри» и «Мэри купила машину у Джона» описывают, по сути, одну и ту же ситуацию, несмотря на то, что они использовали два совершенно разные глаголы, разные предлоги и другой порядок слов. FrameNet использовался в таких приложениях, как ответы на вопросы , перефразирование , распознавание текстового следования и извлечение информации , либо напрямую, либо с помощью инструментов семантической маркировки ролей . Первая автоматическая система маркировки семантических ролей (SRL, иногда также называемая «неглубоким семантическим анализом») была разработана Дэниелом Гилдеа и Даниэлем Джурафски на основе FrameNet в 2002 году. С тех пор маркировка семантических ролей стала одной из стандартных задач естественного языка. обработка, последняя версия (1.7) FrameNet теперь полностью поддерживается в Natural Language Toolkit .

Поскольку фреймы по сути являются семантическими описаниями, они похожи для разных языков, и за эти годы возникло несколько проектов, которые полагались на исходную FrameNet в качестве основы для дополнительных неанглийских FrameNets, в том числе для испанского, японского, немецкого и польского языков. .

Смотрите также

Рекомендации

дальнейшее чтение

Внешние ссылки