Связанные данные - Linked data
В вычислении , связанные данные (часто капитализированные как Linked Data ) структурированы данные , которые взаимосвязаны с другими данными , поэтому она становится более полезной с помощью семантических запросов . Он основан на стандартных веб- технологиях, таких как HTTP , RDF и URI , но вместо того, чтобы использовать их для обслуживания веб-страниц только для людей, читающих, он расширяет их, чтобы делиться информацией таким образом, чтобы компьютеры могли ее автоматически прочитать. Часть видения связанных данных заключается в том, чтобы Интернет стал глобальной базой данных .
Тим Бернерс-Ли , директор Консорциума Всемирной паутины (W3C), ввел этот термин в заметку о дизайне проекта Semantic Web в 2006 году .
Связанные данные также могут быть открытыми данными , и в этом случае их обычно называют связанными открытыми данными ( LOD ).
Принципы
В своей заметке 2006 г. «Связанные данные» Тим Бернерс-Ли изложил четыре принципа связанных данных, перефразируя их следующим образом:
- Унифицированные идентификаторы ресурсов (URI) следует использовать для именования и идентификации отдельных вещей.
- Следует использовать HTTP URI, чтобы эти вещи можно было найти, интерпретировать и впоследствии «разыменовать».
- Полезная информация о том, что идентифицирует имя, должна предоставляться через открытые стандарты, такие как RDF , SPARQL и т. Д.
- При публикации данных в Интернете следует ссылаться на другие объекты, используя их имена на основе HTTP URI.
Тим Бернерс-Ли позже повторил эти принципы на конференции TED 2009 года , снова перефразируя следующим образом:
- Все концептуальные вещи должны иметь имя, начинающееся с HTTP .
- Поиск имени HTTP должен возвращать полезные данные о рассматриваемом объекте в стандартном формате.
- Все остальное, с чем эта же вещь связана через свои данные, также должно иметь имя, начинающееся с HTTP.
Компоненты
- URI
- HTTP
- Структурированные данные с использованием терминов контролируемого словаря и определений наборов данных, выраженных в форматах сериализации Resource Description Framework , таких как RDFa , RDF / XML , N3 , Turtle или JSON-LD
- Платформа связанных данных
Связанные открытые данные
Связанные открытые данные - это связанные данные, которые являются открытыми данными . Тим Бернерс-Ли дает самое четкое определение связанных открытых данных в отличие от связанных данных.
Связанные открытые данные (LOD) - это связанные данные, которые выпускаются под открытой лицензией, что не препятствует их повторному использованию бесплатно.
- Тим Бернерс-Ли, Связанные данные
Большие связанные наборы открытых данных включают DBpedia и Wikidata .
5-звездочные связанные открытые данные
Тим Бернерс-Ли предложил 5-звездочную схему оценки качества открытых данных в сети, для которой наивысший рейтинг имеют связанные открытые данные:
- 1 звезда: данные доступны в любом формате в открытом доступе.
- 2 звезды: данные доступны в структурированном формате, например в формате файла Microsoft Excel (.xls).
- 3 звезды: данные доступны в непатентованном структурированном формате, например в значениях, разделенных запятыми (.csv).
- 4 звезды: данные соответствуют стандартам W3C , таким как использование RDF и использование URI .
- 5 звезд: все остальные, а также ссылки на другие связанные источники открытых данных.
История
Термин «связанные открытые данные» используется по крайней мере с февраля 2007 года, когда был создан список рассылки «Связанные открытые данные». Список рассылки изначально размещался в рамках проекта SIMILE Массачусетского технологического института .
Связывание проекта сообщества Open Data
Целью проекта сообщества Linking Open Data группы W3C Semantic Web Education and Outreach является расширение Интернета за счет общего доступа к данным путем публикации различных открытых наборов данных в виде RDF в Интернете и путем установки связей RDF между элементами данных из разных источников данных. В октябре 2007 года наборы данных состояли из более чем двух миллиардов RDF- троек , которые были связаны между собой более чем двумя миллионами RDF-ссылок. К сентябрю 2011 года это число выросло до 31 миллиарда троек RDF, связанных между собой примерно 504 миллионами ссылок RDF. Подробная статистическая разбивка была опубликована в 2014 году.
Проекты Европейского Союза
Есть ряд проектов Европейского Союза, связанных с данными. К ним относятся проект связанных открытых данных круглосуточно (LATC), проект PlanetData, проект DaPaaS (данные и платформа как услуга) и проект связанных открытых данных 2 (LOD2). Связывание данных - одна из основных целей портала открытых данных ЕС , который предоставляет тысячи наборов данных для повторного использования и связывания.
Онтологии
Онтологии - это формальные описания структур данных. Некоторые из наиболее известных онтологий:
- FOAF - онтология, описывающая людей, их свойства и отношения
- UMBEL - облегченная ссылочная структура из 20 000 классов предметных понятий и их взаимосвязей, производных от OpenCyc , которые могут действовать как классы привязки к внешним данным; также имеет ссылки на 1,5 миллиона именованных сущностей из DBpedia и YAGO
Наборы данных
- DBpedia - набор данных, содержащий извлеченные данные из Википедии; он содержит около 3,4 миллиона концепций, описанных 1 миллиардом троек , включая аннотации на 11 разных языках.
- GeoNames - предоставляет RDF-описания более 7 500 000 географических объектов по всему миру.
- Викиданные - совместно созданный связанный набор данных, который действует как центральное хранилище для структурированных данных дочерних проектов Фонда Викимедиа.
- Глобальная база данных идентификаторов исследований ( GRID ) - международная база данных 89 506 учреждений, занимающихся академическими исследованиями, с 14 401 отношениями, моделирует два типа отношений: отношения родитель-потомок, которые определяют подчиненную ассоциацию, и связанные отношения, описывающие другие ассоциации.
Отношения экземпляра набора данных и класса
Доступны интерактивные диаграммы, которые показывают отдельные наборы данных и их отношения в созданном DBpedia облаке LOD (как показано на рисунках справа).
Смотрите также
- American Art Collaborative - консорциум художественных музеев США, стремящийся создать критическую массу связанных открытых данных об американском искусстве.
- Авторитетный контроль - о контролируемых рубриках в каталогах библиотек
- Анализ цитирования - для цитирования между научными статьями
- Гиперданные
- Сетевая модель - старый тип системы управления базами данных
- Schema.org
- VoID - Словарь взаимосвязанных наборов данных
- Язык веб-онтологий
использованная литература
дальнейшее чтение
- Ахмет Сойлу, Феликс Мёдритшер и Патрик де Каусмеккер. 2012. «Повсеместная веб-навигация через сбор встроенных семантических данных: мобильный сценарий». Интегрированная компьютерная инженерия 19 (1): 93–109.
- Связанные данные: превращение Интернета в глобальное пространство данных (2011) Тома Хита и Кристиана Бизера, Лекции по синтезу семантической сети: теория и технология, Morgan & Claypool
- Как опубликовать связанные данные в Интернете , Крис Байзер, Ричард Циганиак и Том Хит, Учебное пособие по связанным данным, Свободный университет Берлина, Германия, 27 июля 2007 г.
- Интернету исполняется 20 лет: связанные данные дают людям силу , часть 1 из 4, Марк Фишетти, Scientific American 2010, 23 октября
- Связанные данные - это просто больше данных - Пратик Джайн, Паскаль Хитцлер , Питер З. Йе, Кунал Верма и Амит П. Шет. В: Дэн Брикли, Виней К. Чаудри, Гарри Халпин и Дебора МакГиннесс: Связанные данные и искусственный интеллект . Технический отчет SS-10-07, AAAI Press, Менло-Парк, Калифорния, 2010 г., стр. 82–86.
- Выходя за рамки того же, что и с PLATO: обнаружение партономии для связанных данных - Пратик Джайн, Паскаль Хитцлер , Кунал Верма, Питер З. Йе, Амит Шет. В: Материалы 23-й конференции ACM по гипертексту и социальным сетям (HT 2012), Милуоки, Висконсин, США, 25–28 июня 2012 г.
- Фрейтас, Андре, Эдвард Карри, Жоао Габриэль Оливейра и Шон О'Риэн. 2012. «Запросы гетерогенных наборов данных в сети связанных данных: проблемы, подходы и тенденции». IEEE Internet Computing 16 (1): 24–33.
- Связывание открытых данных в сети - Крис Байзер, Том Хит, Дэнни Эйерс, Ив Раймонд. In Proceedings Poster Track, ESWC2007, Инсбрук, Австрия
- Согласование онтологий для связанных открытых данных - Пратик Джайн, Паскаль Хитцлер , Амит Шет, Кунал Верма, Питер З. Йе. В трудах 9-й Международной конференции по семантической паутине, ISWC 2010, Шанхай, Китай
- Связанные открытые данные о лекарствах для фармацевтических исследований и разработок - J Cheminform. 2011; 3:19. Самвальд, Йенч, Бутон, Каллесо, Виллигхаген, Хаджагос, Маршалл, Прюдоммо, Хассензаде, Пихлер и Стивенс (май 2011 г.)
- Интервью с Сереном Ауэром, руководителем проекта LOD2 о продолжении LOD2 в 2011 г. , июнь 2011 г.
- Связанные открытые данные: основы - Флориан Бауэр и Мартин Кальтенбек (январь 2012 г.)
- Взмах крыла бабочки - semanticweb.com Ричард Уоллис (февраль 2012 г.)
внешние ссылки
У Scholia есть тематический профиль для связанных данных . |
- LinkedData в W3C Wiki
- LinkedData.org
- Официальные документы по программному обеспечению OpenLink
- постоянная мертвая ссылка ] Данные из схемы Northwind SQL в виде связанных данных, демонстрационный пример использования
- Связанные данные для дисциплины нумизматика , демонстрационный пример использования
- Интерактивная демонстрация LOD
- OptiqueVQS - инструмент визуального формулирования запросов на основе онтологий