Семантическая совместимость - Semantic interoperability

Семантическая совместимость - это способность компьютерных систем обмениваться данными с однозначным общим смыслом. Семантическая совместимость - это требование для обеспечения возможности машинно-вычислимой логики , вывода, обнаружения знаний и объединения данных между информационными системами .

Таким образом, семантическая совместимость касается не только упаковки данных ( синтаксиса ), но и одновременной передачи значения с данными ( семантики ). Это достигается путем добавления данных о данных ( метаданных ), связывания каждого элемента данных с управляемым общим словарем . Смысл данных передается вместе с самими данными в одном самоописывающем « информационном пакете », который не зависит от какой-либо информационной системы. Именно этот общий словарь и связанные с ним связи с онтологией обеспечивают основу и возможности машинной интерпретации, вывода и логики.

Синтаксическая совместимость (см. Ниже ) является предпосылкой семантической совместимости. Синтаксическая совместимость относится к механизмам упаковки и передачи данных. В здравоохранении HL7 используется более тридцати лет (что предшествовало появлению Интернета и веб-технологий) и использует вертикальную черту (|) в качестве разделителя данных. Текущим интернет-стандартом разметки документов является XML , в котором в качестве разделителя данных используется «<>». Разделители данных не передают никакого смысла, кроме как структурировать данные. Без словаря данных для перевода содержимого разделителей данные остаются бессмысленными. Несмотря на то, что было много попыток создания словарей данных и информационных моделей для связи с этими механизмами упаковки данных, ни одна из них не была реализована на практике. Это только увековечило продолжающуюся «бабелизацию» данных и неспособность обмениваться данными со смыслом.

С момента введения Тимом Бернерсом-Ли концепции семантической паутины в 1999 г. наблюдается растущий интерес и применение стандартов W3C (Консорциума всемирной паутины) для обеспечения возможности обмена семантическими данными в масштабе сети, объединения и логического вывода.

Семантика как функция синтаксической совместимости

Синтаксическая совместимость, обеспечиваемая, например, стандартами XML или SQL , является предпосылкой семантики. Он включает в себя общий формат данных и общий протокол для структурирования любых данных, чтобы способ обработки информации можно было интерпретировать из структуры. Это также позволяет обнаруживать синтаксические ошибки, что позволяет принимающим системам запрашивать повторную отправку любого сообщения, которое кажется искаженным или неполным. Семантическая связь невозможна, если синтаксис искажен или не может представить данные. Однако информация, представленная в одном синтаксисе, в некоторых случаях может быть точно переведена в другой синтаксис. Там, где возможен точный перевод синтаксиса, системы, использующие другой синтаксис, также могут точно взаимодействовать. В некоторых случаях возможность точного перевода информации между системами с использованием разных синтаксисов может быть ограничена одним направлением, когда используемые формализмы имеют разные уровни выразительности (способности выражать информацию).

Единая онтология, содержащая представления каждого термина, используемого в каждом приложении, обычно считается невозможной из-за быстрого создания новых терминов или присвоения новых значений старым терминам. Однако, хотя невозможно предвидеть каждую концепцию, которую пользователь может пожелать представить на компьютере, существует возможность найти некоторый конечный набор «примитивных» концептуальных представлений, которые можно комбинировать для создания любых более конкретных концепций, которые пользователи может потребоваться для любого заданного набора приложений или онтологий. Наличие базовой онтологии (также называемой верхней онтологией ), которая содержит все эти примитивные элементы, обеспечит прочную основу для общей семантической совместимости и позволит пользователям определять любые новые термины, которые им нужны, используя базовый перечень элементов онтологии, и при этом иметь эти новые определенные термины, правильно интерпретируемые любой другой компьютерной системой, которая может интерпретировать основную онтологию. Вопрос о том, действительно ли число таких примитивных представлений понятий конечно, или будет расти бесконечно, является предметом активного исследования. Если он конечен, то стабильная базовая онтология, подходящая для поддержки точной и общей семантической совместимости, может развиваться после того, как некоторая исходная базовая онтология была протестирована и использована широким кругом пользователей. В настоящее время ни одна фундаментальная онтология не была принята широким сообществом, поэтому такая стабильная фундаментальная онтология все еще находится в будущем.

Слова и значения

При обсуждении семантики постоянно возникает недоразумение - это «смешение слов и значений». Значения слов меняются, иногда быстро. Но формальный язык , используемый в онтологии, может кодировать значения (семантику) концепций в неизменяемой форме. Чтобы определить, что означает конкретное слово (например, термин в базе данных ), необходимо пометить каждое фиксированное представление концепции в онтологии словом (ами) или термином (ами), которые могут относиться к этому концепция. Когда несколько слов относятся к одному и тому же (фиксированному) понятию в языке, это называется синонимией ; когда одно слово используется для обозначения более чем одного понятия, это называется двусмысленностью .

Двусмысленность и синонимия являются одними из факторов, затрудняющих понимание языка компьютером. Использование слов для обозначения концепций (значений используемых слов) очень чувствительно к контексту и цели любого использования многих понятных человеку терминов. Использование онтологий для поддержки семантического взаимодействия заключается в предоставлении фиксированного набора концепций, значения и отношения которых стабильны и могут быть согласованы пользователями. Задача определения , какие условий , в которых контексты (каждая база данных представляет собой другой контекст) затем отделяются от задачи создания онтологии, и должны быть приняты до проектировщика базы данных, или конструктор формы ввода данных , или разработчик программы для понимания языков. Когда значение слова, используемого в некотором интероперабельном контексте, изменяется, то для сохранения интероперабельности необходимо изменить указатель на элемент (ы) онтологии, который определяет значение этого слова.

Требования к представлению знаний и языки

Язык представления знаний может быть достаточно выразительным, чтобы описывать нюансы значения в хорошо понятных областях. У них как минимум пять уровней сложности.

Для общих полуструктурированных данных можно использовать язык общего назначения, такой как XML.

Для многих задач могут потребоваться языки с полной мощью логики предикатов первого порядка .

Человеческие языки очень выразительны, но считаются слишком неоднозначными, чтобы обеспечить желаемую точную интерпретацию, учитывая текущий уровень технологии человеческого языка.

Предварительное согласие не требуется

Семантическую интероперабельность можно отличить от других форм интероперабельности, учитывая, имеет ли передаваемая информация в переданной форме все значение, необходимое для правильной интерпретации принимающей системой, даже если алгоритмы, используемые принимающей системой, неизвестны система отправки. Рассмотрите возможность отправки одного числа:

Если это число предназначено как сумма денег, которую одна компания должна другой, это подразумевает действие или бездействие со стороны как тех, кто его отправляет, так и тех, кто его получает.

Он может быть правильно интерпретирован, если отправлен в ответ на конкретный запрос и получен в то время и в ожидаемой форме. Эта правильная интерпретация зависит не только от самого числа, которое может представлять почти любой из миллионов типов количественных измерений, но и зависит строго от обстоятельств передачи. То есть интерпретация зависит от того, ожидают ли обе системы, что алгоритмы в другой системе используют это число в точно таком же смысле, и дополнительно зависит от всего пакета передач, которые предшествовали фактической передаче голого числа.

Напротив, если передающая система не знает, как информация будет использоваться другими системами, необходимо иметь общее соглашение о том, как информация с определенным значением (из многих возможных значений) будет отображаться в сообщении. Для конкретной задачи одним из решений является стандартизация формы, например, запроса на оплату; этот запрос должен будет стандартным образом закодировать всю информацию, необходимую для его оценки, такую ​​как: агент должен деньги, агент должен деньги, характер действия, приводящего к возникновению долга, агенты, товары , services и других участников этого действия; время действия; сумма задолженности и валюта, в которой она рассчитана; время, отведенное для оплаты; требуемая форма оплаты; и другая информация. Когда две или более системы договорились о том, как интерпретировать информацию в таком запросе, они могут достичь семантической совместимости для этого конкретного типа транзакции . Для семантической совместимости в целом необходимо предоставить стандартизованные способы описания значений гораздо большего, чем просто коммерческие транзакции, а количество концепций, представление которых необходимо согласовать, составляет как минимум несколько тысяч.

Онтологические исследования

Как достичь семантической совместимости для более чем нескольких ограниченных сценариев в настоящее время является предметом исследований и обсуждений. Для проблемы общей семантической совместимости требуется некоторая форма базовой онтологии (« верхняя онтология »), которая является достаточно всеобъемлющей, чтобы обеспечить определение понятий для более специализированных онтологий в нескольких областях. За последнее десятилетие было разработано более десяти базовых онтологий, но ни одна из них еще не была принята широкой пользовательской базой.

Потребности в единой всеобъемлющей всеобъемлющей онтологии для поддержки семантического взаимодействия можно избежать, создав общую базовую онтологию как набор базовых («примитивных») концепций, которые можно комбинировать для создания логических описаний значений терминов, используемых в онтологии локального домена или локальные базы данных. Эта тактика основана на том принципе, что:

Если:

(1) значения и использование примитивных элементов онтологии в базовой онтологии согласованы, и 
(2) элементы онтологии в онтологиях предметной области конструируются как логические комбинации элементов в базовой онтологии,

Потом:

Предполагаемые значения элементов онтологии предметной области могут быть вычислены автоматически с использованием логики логики FOL (логики первого порядка) любой системой, которая принимает значения элементов в базовой онтологии и имеет как базовую онтологию, так и логические спецификации элементы в онтологии предметной области.

Следовательно:

Любая система, желающая точно взаимодействовать с другой системой, должна передавать только подлежащие передаче данные, а также любые логические описания терминов, используемых в этих данных, которые были созданы локально и еще не входят в общую базовую онтологию.

Эта тактика затем ограничивает необходимость предварительного согласования значений только теми элементами онтологии в общей онтологии основания (FO). По ряду соображений для этого может потребоваться менее 10 000 элементов (типов и отношений). Однако для простоты понимания и использования дополнительные элементы онтологии с дополнительными деталями и спецификой могут помочь найти точное место в FO, где можно найти или добавить определенные концепции предметной области.

На практике, вместе с FO, сфокусированным на представлении примитивных концепций, вероятно, также будет использоваться набор онтологий расширения предметной области для FO с элементами, заданными с помощью элементов FO. Такие уже существующие расширения снизят стоимость создания онтологий предметной области, предоставив существующим элементам предполагаемое значение, и уменьшат вероятность ошибки при использовании элементов, которые уже были протестированы. Онтологии доменных расширений могут быть логически несовместимы друг с другом, и это необходимо определить, используются ли разные доменные расширения в любом обмене данными.

Также исследуется вопрос о том, можно ли избежать использования такой единой базовой онтологии с помощью сложных методов отображения среди независимо разработанных онтологий.

Важность

Практическое значение семантического взаимодействия было измерено несколькими исследованиями, в которых оценивается стоимость (в потерянной эффективности) из-за отсутствия семантического взаимодействия. В одном исследовании, посвященном потерям эффективности в передаче медицинской информации, было подсчитано, что 77,8 млрд долларов США в год можно сэкономить, внедрив эффективный стандарт совместимости в этой области. Другие исследования, посвященные строительной отрасли и цепочке поставок автомобилестроения, оценивают затраты в размере более 10 миллиардов долларов США в год из-за отсутствия семантической совместимости в этих отраслях. В целом эти цифры могут быть экстраполированы, чтобы показать, что ежегодно теряется более 100 миллиардов долларов США из-за отсутствия широко используемого стандарта семантической совместимости только в США.

Еще не проводилось исследование каждой области политики, которая могла бы обеспечить значительную экономию средств за счет применения стандартов семантической совместимости. Но чтобы увидеть, какие области политики могут извлечь выгоду из семантической совместимости, см. « Взаимодействие » в целом. К таким областям политики относятся электронное правительство , здравоохранение, безопасность и многие другие. В июне 2007 года ЕС также учредил Европейский центр семантической совместимости .

Семантическая совместимость для Интернета вещей

Цифровая трансформация дает огромные преимущества, позволяя организациям быть более эффективными, гибкими и более гибкими в реагировании на изменения в условиях ведения бизнеса и эксплуатации. Это подразумевает необходимость интеграции разнородных данных и сервисов во всех организациях. Семантическая совместимость удовлетворяет потребность в общем понимании смысла и контекста.

Чтобы поддержать это, межорганизационная группа экспертов, включающая ISO / IEC JTC1, ETSI, oneM2M и W3C, сотрудничает с AIOTI по ​​ускорению внедрения семантических технологий в IoT. Совсем недавно группа опубликовала две совместные официальные документы по семантической совместимости, соответственно названные «Решения семантического Интернета вещей - перспектива разработчика» и «На пути к стандартам семантической совместимости, основанным на онтологиях». Это следует за успехом более раннего официального документа «Семантическая совместимость для сети вещей».


Источник:

«Семантические решения Интернета вещей - перспектива разработчика»

«К стандартам семантической совместимости, основанным на онтологиях».

Это следует за успехом более раннего официального документа «Семантическая совместимость для сети вещей».

https://www.w3.org/blog/2019/10/aioti-iso-iec-jtc1-etsi-onem2m-and-w3c-collaborate-on-two-joint-white-papers-on-semantic-interoperability- ориентированные на разработчиков и инженеров по стандартизации /

Смотрите также

использованная литература

внешние ссылки