Семантическая тройка - Semantic triple

Семантическая тройка , или RDF тройной или просто тройной , атомный объект данных в Описании Resource Framework (RDF) модели данных. Как видно из названия, тройка - это набор из трех сущностей, которые кодируют утверждение о семантических данных в форме выражений субъект-предикат-объект (например, «Бобу 35 лет» или «Боб знает Джона»).

Субъект, сказуемое и объект

Этот формат позволяет представлять знания в машиночитаемом виде. В частности, каждая часть тройки RDF адресуется индивидуально с помощью уникальных URI - например, утверждение «Боб знает Джона» может быть представлено в RDF как:

http://example.name#BobSmith12 http://xmlns.com/foaf/0.1/knows http://example.name#JohnDoe34 .

При таком точном представлении семантические данные могут быть однозначно запрошены и обоснованы .

Изображение, изображающее объектное отношение субъект-предикат.
Базовая семантическая тройная модель.

Компоненты тройки, такие как утверждение «Небо имеет синий цвет», состоят из субъекта («небо»), предиката («имеет цвет») и объекта («синий»). Это похоже на классическую нотацию модели сущность-атрибут-значение в объектно-ориентированном дизайне , где этот пример может быть выражен как сущность (небо), атрибут (цвет) и значение (синий).

Из этой основной структуры, тройки могут состоять в более сложные модели , с помощью троек в качестве объектов или субъектов других троек - например, Mike → said → (triples → can be → objects) .

Учитывая их особую согласованную структуру, набор троек часто хранится в специально созданных базах данных, называемых Triplestores .

Отличие от реляционных баз данных

Реляционная база данных является классической формой для хранения информации. Он работает с разными таблицами, которые состоят из строк. Хорошо известный язык SQL может извлекать информацию из базы данных. Напротив, тройное хранилище RDF работает с логическими предикатами. Никаких таблиц и строк не требуется, но информация хранится в текстовом файле. Хранилище RDF-triple может быть преобразовано в базу данных SQL и наоборот. Если знания сильно неструктурированы, а выделенные таблицы недостаточно гибки, вместо классического хранилища SQL используются семантические тройки.

В отличие от традиционной базы данных SQL, тройное хранилище RDF не создается с помощью редакторов таблиц, но предпочтительным инструментом является редактор знаний , например Protégé. Protégé похож на приложение для объектно-ориентированного моделирования, используемое для разработки программного обеспечения , но оно ориентировано на информацию на естественном языке. Тройки RDF объединены в базу знаний, которая позволяет внешнему синтаксическому анализатору выполнять запросы. Возможные приложения находятся в видеоиграх для создания неигровых персонажей.

Ограничения

Простой способ решить проблему тройного хранения - это отсутствие масштабируемости базы данных для больших наборов данных. Проблема стала очевидной, если не только немного информации, но и миллионы троек хранятся и извлекаются в базе данных. Время поиска больше, чем для классических баз данных на базе SQL.

Немного сложнее исправить недостающую способность предсказывать будущую ситуацию с помощью данной модели знаний. Даже если вся информация доступна в виде логических предикатов , модель не может ответить на вопросы « что, если» . Например, предположим, что в RDF-формате очень хорошо описан мир робота. Робот знает, где находится стол, знает расстояние до стола, а также знает, что стол - это мебель. Прежде чем робот сможет спланировать следующее действие, ему потребуются способности к временному рассуждению . Это означает, что модель знаний должна отвечать на гипотетические вопросы заранее, прежде чем будет предпринято действие.

Смотрите также

Рекомендации

Внешние ссылки