FrameNet - FrameNet
FrameNet | |
---|---|
Заявление о миссии | Создание лексической базы данных на основе теории значения, называемой семантикой фреймов . |
Коммерческий? | Нет (доступно для скачивания в свободном доступе) |
Тип проекта | Лексическая база данных (содержащая: фреймы, элементы фрейма (FE), лексические единицы (LU), примеры предложений и отношения фреймов) |
Место расположения | Международный институт компьютерных наук в Беркли, Калифорния |
Владелец | Коллин Бейкер (нынешний руководитель проекта) |
Основатель | Чарльз Дж. Филмор |
Учредил | 1997 |
Веб-сайт | framenet |
В компьютерной лингвистике , FrameNet проект размещен в Международном институте компьютерных наук в Беркли, штат Калифорния , который производит электронный ресурс , основанный на теории означая называемые фреймы семантики . FrameNet показывает, например, что предложение «Джон продал машину Мэри» по существу описывает ту же базовую ситуацию (семантический фрейм), что и «Мэри купила машину у Джона», только с другой точки зрения. Семантический фрейм можно рассматривать как концептуальную структуру, описывающую событие, отношение или объект и его участников. Лексическая база данных FrameNet содержит более 1200 семантических фреймов , 13 000 лексических единиц (соединение слова со значением ; многозначные слова представлены несколькими лексическими единицами ) и 202 000 предложений-примеров. FrameNet - в значительной степени создание Чарльза Дж. Филлмора , который разработал теорию семантики фреймов, на которой основан проект, и первоначально был руководителем проекта, когда проект начался в 1997 году. Коллин Бейкер стал менеджером проекта в 2000 году. Проект FrameNet оказал влияние как на лингвистику, так и на обработку естественного языка, где привел к задаче автоматической семантической разметки ролей .
Концепции
Кадры
Фрейм - это схематическое изображение ситуации с участием различных участников, опор и других концептуальных ролей. Примеры имен фреймов: Being_born
и Locative_relation
. Фрейм в FrameNet содержит текстовое описание того, что он представляет (определение фрейма), связанные элементы фрейма, лексические единицы, примеры предложений и межкадровые отношения.
Элементы каркаса
Элементы фрейма (FE) предоставляют дополнительную информацию к семантической структуре предложения. Каждый фрейм имеет ряд основных и дополнительных FE, которые можно рассматривать как семантические роли. Ключевые FE важны для значения кадра, тогда как неосновные FE обычно описательны (например, время, место, способ и т. Д.).
Вот некоторые примеры:
- Вызывается единственный основной FE
Being_born
кадраChild
; неосновные FES бытьTime
,Place
,Relatives
и т.д. - Ядро FES из
Commerce_goods-transfer
включают в себяSeller
,Buyer
,Goods
, среди прочего, в то время как неосновные FES включают в себяPlace
,Purpose
и т.д.
FrameNet включает мелкие данные о синтаксических ролях, которые элементы фрейма играют в примерах предложений. Например, для такого предложения, как «Она родилась около 460 г. н.э.», FrameNet пометит «Она» как именную фразу, относящуюся к Child
FE, и «около 460 г. нашей эры» как именную фразу, соответствующую Time
элементу фрейма. Детали того, как элементы фрейма могут быть реализованы в предложении, важны, потому что это раскрывает важную информацию о фреймах подкатегории, а также возможных чередованиях диатез (например, «Джон разбил окно» против «Разбил окно») глагола.
Лексические единицы
Лексические единицы (ЛЕ) - это леммы с их частью речи, которые вызывают определенный фрейм. Другими словами, когда LU идентифицируется в предложении, этот конкретный LU может быть связан с его конкретным кадром (ами). Для каждого кадра может быть много LU, связанных с этим кадром, а также может быть много кадров, которые совместно используют конкретный LU, это обычно случается с LU, которые имеют несколько значений слов. Наряду с фреймом каждая лексическая единица связана с конкретными элементами фрейма посредством аннотированных примеров предложений.
Пример:
Лексические единицы, которые вызывают Complaining
фрейм (или, если быть точнее, его перспективные версии), включают глаголы «жаловаться», «рябчик», «сетовать» и другие.
Примеры предложений
Фреймы связаны с примерами предложений, а элементы фреймов отмечены внутри предложений. Таким образом, предложение
- Она родилась около 460 г.
связан с рамкой Being_born
, в то время как «Она» помечена как элемент рамки, Child
а «около 460 г. н.э.» помечена как Time
. (См аннотаций отчета FrameNet для born.v
.) С самого начала проект FrameNet был совершен смотреть на доказательствах от фактического использования языка, которые содержатся в текстовых коллекциях , таких как British National Corpus . На основе таких примерных предложений инструменты автоматического присвоения семантических ролей могут определять фреймы и отмечать элементы фреймов в новых предложениях.
Валентности
FrameNet также предоставляет статистические данные о валентности этих кадров , то есть количество и расположение элементов каркаса внутри примеров предложений. Предложение
- Она родилась около 460 г.
попадает в структуру валентности
- НП Внеш, ИНИ -, НП Деп
который встречается два раза в примерах предложений в FrameNet, а именно в:
- Она была родилась около 460 г. н.э. , дочери и внучки римских и византийских императоров, чья семья была видным в римской политике на протяжении более 700 лет.
- Вскоре он был отправлен в Северную Африку и так и не встретил их единственного ребенка, дочь, родившуюся 8 июня 1941 года .
Фреймовые отношения
FrameNet дополнительно фиксирует отношения между различными фреймами с помощью отношений. К ним относятся следующие:
- Наследование: когда один кадр является более конкретной версией другого, более абстрактного родительского кадра. Все, что истинно в отношении родительского фрейма, должно быть истинным и в отношении дочернего фрейма, и между элементами фрейма родительского и дочернего фрейма указывается соответствие.
- Perspectivized_in: нейтральный кадр (например,
Commerce_transfer-goods
) связан с кадром с определенной перспективой того же сценария (например,Commerce_sell
кадр, который предполагает перспективу продавца, илиCommerce_buy
кадр, который предполагает перспективу покупателя) - Подрамник: Некоторые кадры , как
Criminal_process
кадр относятся к сложным сценариям , которые состоят из нескольких отдельных состояний или событий , которые могут быть описаны отдельными кадрами , какArrest
,Trial
и так далее. - Precedes: отношение Precedes фиксирует временной порядок, который сохраняется между подкадрами сложного сценария.
- Causative_of и Inchoative_of: существует довольно систематическая взаимосвязь между статическими описаниями (например,
Position_on_a_scale
фрейм, например, «У нее высокая зарплата») и каузативными описаниями (например,Cause_change_of_scalar_position
фрейм, например, «Она повысила его зарплату») или начальными описаниями (например,Change_position_on_a_scale
фрейм, например: Ее зарплата увеличилась »). - Использование: отношение, которое сохраняется между кадром, который каким-то образом включает другой кадр. Например,
Judgment_communication
фрейм использует иJudgment
фрейм, иStatement
фрейм, но не наследуется ни от одного из них, потому что нет четкого соответствия элементов фрейма. - See_also: соединяет кадры, которые имеют некоторое сходство, но требуют тщательного различения.
Приложения
FrameNet оказалась полезной в ряде вычислительных приложений, потому что компьютерам необходимы дополнительные знания, чтобы распознать, что «Джон продал машину Мэри» и «Мэри купила машину у Джона» описывают, по сути, одну и ту же ситуацию, несмотря на то, что они использовали два совершенно разные глаголы, разные предлоги и другой порядок слов. FrameNet использовался в таких приложениях, как ответы на вопросы , перефразирование , распознавание текстового следования и извлечение информации , либо напрямую, либо с помощью инструментов семантической маркировки ролей . Первая автоматическая система маркировки семантических ролей (SRL, иногда также называемая «неглубоким семантическим анализом») была разработана Дэниелом Гилдеа и Даниэлем Джурафски на основе FrameNet в 2002 году. С тех пор маркировка семантических ролей стала одной из стандартных задач естественного языка. обработка, последняя версия (1.7) FrameNet теперь полностью поддерживается в Natural Language Toolkit .
Поскольку фреймы по сути являются семантическими описаниями, они похожи для разных языков, и за эти годы возникло несколько проектов, которые полагались на исходную FrameNet в качестве основы для дополнительных неанглийских FrameNets, в том числе для испанского, японского, немецкого и польского языков. .
Смотрите также
- BabelNet : многоязычная семантическая сеть, интегрирующая FrameNet
- PropBank
- Нулевое создание
- Язык фрейма
- UBY : база данных из 10 ресурсов, включая FrameNet
Рекомендации
дальнейшее чтение
- Руппенхофер, Йозеф; Эллсуорт, Майкл; Петрук, Мириам Р.Л . ; Джонсон, Кристофер Р .; Бейкер, Коллин Ф .; Шеффчик, янв (1 ноября 2016 г.). FrameNet II: Расширенная теория и практика (пересмотренное издание). Беркли, Калифорния: Международный институт компьютерных наук.