EIDR - EIDR

Ассоциация регистрации идентификаторов развлечений
Логотип EIDR 1.png
Формирование 2010 г.
Тип 501 (c) (6) некоммерческая членская корпорация
Главное управление Редвуд-Сити, Калифорния
Исполнительный директор
Кип Уэлч
Веб-сайт www .eidr .org

Identifier Registry Entertainment , или EIDR , глобальный уникальный идентификатор системы для широкого спектра аудио - визуальных объектов, в том числе кинофильмы , телевидение и радио программ. Система идентификации преобразует идентификатор в запись метаданных, которая связана с заголовками верхнего уровня, изменениями, DVD , кодировками, клипами и мэш-апами . EIDR также предоставляет идентификаторы для поставщиков видеоуслуг, таких как вещательные и кабельные сети.

По состоянию на июнь 2020 года EIDR содержит более 2 миллионов записей, в том числе почти 400 тысяч фильмов и почти один миллион эпизодов из более чем 40 000 телесериалов.

EIDR - это реализация идентификатора цифрового объекта (DOI).

История

Системы идентификации медиаактивов существуют десятилетиями. Общей мотивацией для их создания является обеспечение возможности управления медиаресурсами посредством присвоения уникального идентификатора набору метаданных, представляющих основные характеристики каждого актива. Со временем такие системы имеют тенденцию к распространению, и каждая из них решает определенный набор проблем. В результате существуют значительные различия между системами с точки зрения того, какие активы классифицируются, какие метаданные связаны с каждым активом, и по самому определению актива. Приведу несколько примеров: должна ли « режиссерская версия» фильма отличаться от оригинального театрального выпуска? Как следует учитывать региональные различия (например, перевод заголовка или диалога на иностранные языки)? Дальнейшие сложности включают процедуры (и необходимые учетные данные) для добавления новых активов, редактирования существующих активов и создания производных активов.

EIDR был создан для решения этих проблем, а также других проблем, возникающих в рабочих процессах видеоресурсов , как в контексте взаимодействия между предприятиями, так и в процессе внутренней постпроизводственной деятельности производителей контента. EIDR имеет следующие характеристики:

  • Центральный реестр доступен для всех участников
  • Возможность легко регистрировать новые активы
  • Неизменяемый идентификатор актива (в частности, в отношении изменений в праве собственности на актив или местонахождении метаданных или самого актива)
  • Обнаружение / предотвращение дублирования одного и того же создаваемого актива
  • Возможность создания набора видеоресурсов на основе абстрактного произведения (например, оригинальный театральный релиз, режиссерская версия, языковые варианты)
  • Возможность группировать видеоресурсы по более общим отношениям (например, эпизоды сезона сериала)
  • Основной набор метаданных для различения активов, даже если они тесно связаны
  • Масштабируемый, неизменный, постоянный

EIDR предназначен для дополнения, а не замены существующих систем идентификации активов. Напротив, ключевой особенностью является разрешение записи EIDR включать ссылки на идентификатор этого актива в других системах. Эта функция особенно полезна для кино- и телевизионных архивов, облегчая им перекрестные ссылки на свои фонды с другими источниками работы и метаданными о ней. По своей конструкции EIDR не копирует функции других систем идентификации активов, например коммерческих систем, которые стремятся повысить ценность за счет расширенных метаданных (например, сводок графиков, деталей производства). Это также не является целью отслеживания информации о владении и правах, которая, однако, может быть реализована в виде приложений, использующих идентификатор EIDR.

Модель контента

EIDR основан на наборе записей (которые далее подразделяются на поля), которые хранятся в центральном реестре. На эти записи ссылаются извне с помощью DOI, которые присваиваются при создании записи, и каждый идентификатор после этого остается неизменным. Система разрешения идентификаторов, лежащая в основе DOI, - это система дескрипторов, и поэтому каждый собственный идентификатор содержимого EIDR представляет собой дескриптор, отформатированный с большей специфичностью для обработки стандартов DOI и EIDR.

Формат Content ID

Каноническая форма из EIDR Content ID представляет собой экземпляр ручки и имеет следующий формат:

10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C

где

  • 10.5240 - это префикс DOI для актива EIDR. «10» указывает, что дескриптор является DOI; другие префиксы присваиваются другим типам активов (например, академическим публикациям ). Цифры между "." и "/" образуют субпрефикс, который указывает, какое регистрационное агентство в рамках Международного фонда DOI (IDF) имеет права управлять этими дескрипторами. «5240» присвоен ассоциации EIDR.
  • XXXX-XXXX-XXXX-XXXX-XXXX-C - суффикс DOI. Каждый «X» обозначает шестнадцатеричную цифру (AF), а «C» - контрольную цифру ISO 7064 Mod 37,36 .

Существует также 96-битная компактная двоичная форма, предназначенная для встраивания в небольшие полезные данные, такие как водяные знаки . Эта форма генерируется из канонического формата следующим образом:

  • 16-битный субпрефикс: создается путем интерпретации субпрефикса как двоичного значения, например, B'0001010001111000 '
  • 80-битный суффикс: часть суффикса, отличная от контрольной суммы, представленная как 10 байтов.

Форма унифицированного имени ресурса для идентификатора EIDR ID указана в RFC   7302 .

Для использования в Интернете идентификатор содержимого EIDR может быть представлен как URI в одной из следующих форм:

  • https://doi.org/10.5240/XXXX-XXXX-XXXX-XXXX-XXXX-C : это идентификатор EIDR, представленный как ссылка на прокси-сервер DOI (он будет перенаправлен из DOI в реестр EIDR)
  • info: doi: 10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C [устарело] : это идентификатор EIDR, представленный как информационный URI, соответствующий RFC 4452 (помня, что все идентификаторы EIDR также являются идентификаторами DOI, но не обратное).

Типы записей

Есть четыре типа записей содержимого, каждый из которых связан с зарезервированным префиксом:

  • Content ID (10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C): связан с развлекательным активом, например фильмом или сериалом. Записи контента имеют иерархическую структуру, что позволяет выражать отношения, например, серию, дочерние элементы которой будут временами года, а дочерние элементы которой, в свою очередь, будут отдельными эпизодами. Поддерживаются многие другие отношения, как описано ниже. Записи содержимого составляют основную часть данных в реестре EIDR.
  • Идентификатор стороны (10.5237 / XXXX-XXXX): идентифицирует такие лица, как зарегистрированные лица, производители контента и распространители.
  • ID видеоуслуги (10,5239 / XXXX-XXXX): идентифицирует видеоуслугу, в просторечии известную как «канал» или «сеть»: (обычно) линейная последовательность контента, запланированная для трансляции в определенное время (например, ID службы для Cartoon Network - 10.5239 / 8BE5-E3F6). Видеоуслуги являются иерархическими: например, у одного из родителей может быть несколько детей, чтобы учитывать региональные или языковые различия).
  • Идентификатор пользователя (10.5238 / [0-9a-zA-Z _. # ()] {2-32}): идентифицирует пользователя, используя строку из 2–32 буквенно-цифровых и выбранных специальных символов (показано здесь с синтаксисом Perl ). Пользователь - это прежде всего административное понятие, подчиненное Сторонам (от которых они наследуют права доступа). В отличие от других DOI EIDR, User ID можно использовать только в EIDR (например, программные API).

Подпрефиксы 5237, 5238, 5239 и 5240 присвоены ассоциации EIDR.

Записи содержимого

Записи содержимого - это объекты, классифицированные по их типам и отношениям. У каждого есть три разных (ортогональных) типа:

  • Тип объекта : всего их 10. Первый - это базовый тип, который имеет минимальное количество полей, необходимых для описания записи содержимого. Остальные 9 являются производными от основного типа и содержат дополнительные поля для описания более сложных объектов.
  • Структурный тип : они различают представления произведения и перечислены в порядке возрастания специфичности:
    • Абстракция : используется для объектов, не имеющих реальности, таких как контейнер серии или самая основная концепция оригинальной работы. Это соответствует Международному стандартному коду музыкальных произведений (ISWC) для музыкальных произведений, Международному стандартному текстовому коду (ISTC) для текстовых произведений или Международному стандартному аудиовизуальному номеру (ISAN) для аудиовизуальных произведений.
    • Перформанс : используется для элементов, которые являются конкретными версиями произведения, такими как оригинальная театральная постановка или режиссерская версия фильма, или версия телешоу, подвергшаяся местной цензуре. Это примерно соответствует Международному стандартному коду записи (ISRC) для музыкальных произведений и некоторым вариантам использования версии ISAN (V-ISAN) для аудиовизуальных произведений.
    • Цифровой : конкретное цифровое представление произведения, такое как кодирование фильма в формате MPEG-2 . Это соответствует некоторым видам использования V-ISAN.
  • Тип референта : тип объекта контента, не зависящий от конкретного проявления (например, фильм, показанный по телевизору, остается фильмом):
    • Серия : Абстракция, содержащая упорядоченные или неупорядоченные отдельные элементы.
    • Сезон : второй уровень группировки под серией, обычно охватывающий временной интервал.
    • ТВ : материалы, впервые появившиеся в эфир.
    • Фильм : длинное содержание, впервые появившееся в кинотеатре или кинотеатре.
    • Краткий : Свободно определяется для охвата произведения продолжительностью 40 минут или меньше, например музыкальных видеоклипов , театральной кинохроники или короткометражных фильмов о театральных постановках или DTV.
    • Интернет : контент, впервые появившийся в сети. Это отличается от контента из других источников, который был доступен в Интернете.
    • Интерактивный материал : контент, который не является строго аудиовизуальным. Он охватывает меню DVD, интерактивные ТВ-наложения, индивидуальные проигрыватели и т. Д.
    • Компиляция : контент, состоящий из множества других активов, которые невозможно описать более точно, например, бокс-сет франшизы фильма.
    • Дополнительный : этот тип предназначен для вторичного контента, основной целью которого является поддержка, расширение или продвижение другого контента. Примеры включают в себя трейлеры, отрывки и рекламные документальные фильмы ("изготовление из пьес").

Основные метаданные

Следующие поля (взятые из большего набора) содержат данные базового объекта записи содержимого:

  • Структурный тип : например, абстракция.
  • Режим : например, AudioVisual (для фильма или телепрограммы); «Аудио» для радиопрограммы; «Визуал» для тихой работы.
  • Тип референта : например, фильм
  • Заголовок : основной заголовок. Заголовки и альтернативные титулы также различаются по:
    • Lang : язык названия, выраженный в виде кода ISO 639-1.
    • Класс : релиз или региональный
  • Альтернативный заголовок 1..N : одно или несколько альтернативных заголовков (часто региональные или языковые варианты)
  • Исходный язык : язык оригинальной версии, обозначенный как код ISO 639-1.
  • Associated Org 1..N : идентификатор группы продюсера, студии и т. Д.
  • Дата выпуска : дата первоначального выпуска названия
  • Страна происхождения : код ISO 3166-1 alpha 2 с расширениями для несуществующих стран
  • Приблизительная длина : выражается в виде XML-схемы xs: duration datatype.
  • Альтернативный идентификатор 1..N : один или несколько эквивалентных идентификаторов, выраженных в другой системе идентификаторов активов (см. Обсуждение ниже).
  • Авторы : предоставляются только скелетные титры, обычно ограниченные режиссером и до четырех основных актеров. Как уже отмечалось, целью EIDR не является конкурировать с проприетарными системами с обширными метаданными (например, сводками графиков). Основная цель - помочь с устранением неоднозначности в названии и помочь с проверкой и устранением дубликатов.
  • Регистрант : сторона, создавшая эту запись содержания (например, "10.5237 / superparty").
  • Дата создания : дата создания этой записи содержимого.
  • Статус : обычно "действителен" (есть особые случаи для удаленных записей)
  • Дата последнего изменения : последний раз эта запись содержимого была изменена

Удаленные записи содержимого

Идентификатор EIDR должен быть всегда разрешимым, поэтому при нормальных обстоятельствах соответствующая запись содержимого будет постоянной. Доступны два механизма для устранения ошибок или других необычных обстоятельств. Предпочтительным является псевдоним, при котором идентификатор EIDR прозрачно перенаправляется на другую запись содержимого. Псевдонимы обычно используются для двукратной регистрации актива.

Другой механизм - использование записей-надгробий. Это используется, когда запись содержимого повреждена или случайно был зарегистрирован недействительный ресурс. В этом случае идентификатор будет привязан к специальной записи надгробия. Приложения могут распознать надгробие, поскольку в его поле EIDR ID будет задано отличительное значение « 10.5240 / 0000-0000-0000-0000-0000-X ». Обратите внимание, что «X» означает 24-ю букву латинского алфавита ( ASCII 0x58 или Unicode U + 0058).

Альтернативный идентификатор

Наличие богатого набора альтернативных идентификаторов для контента - одна из основных целей EIDR. Это позволяет использовать идентификаторы EIDR ID везде в рабочих процессах контента; если требуется альтернативный идентификатор, его можно найти в метаданных для идентификатора EIDR. EIDR поддерживает включение как проприетарных, так и других стандартных (например, ISAN) ссылок на идентификаторы. Дополнительные альтернативные идентификаторы могут быть добавлены при необходимости (например, сторонами, желающими поддерживать новые рабочие процессы). Ниже приведен пример альтернативных идентификаторов для актива EIDR 10.5240 / EA73-79D7-1B2B-B378-3A73-M (фильм « Бегущий по лезвию» ). Если альтернативный идентификатор можно разрешить алгоритмически, например, поместив его соответствующим образом в URL-адрес шаблона, EIDR делает эту ссылку доступной.

Альтернативные идентификаторы для 10.5240 / EA73-79D7-1B2B-B378-3A73-M
Альтернативный идентификатор 0000-0000-14A9-0000-K-0000-0000-E
Тип: ISAN
Альтернативный ID # 2 89
Тип: IVA
Альтернативный ID # 3 B000SW4DLM
Тип: Собственный домен: amazon.com
Альтернативный ID # 4 12886
Тип: Собственный домен: flixster.com
Альтернативный ID # 5 15042
Тип: Собственный домен: thecinemasource.com
Альтернативный ID # 6 tt0083658
Тип: IMDB Отношение: IsSameAs
Альтернативный ID # 7 E0087486000
Тип: Собственный домен: spe.sony.com/MPM
Альтернативный ID # 8 3929
Тип: Собственный домен: spe.sony.com/ProductID
Альтернативный ID # 9 2002029
Тип: Собственный домен: warnerbros.com/MPM
Альтернативный ID # 10 389785
Тип: Собственный домен veronicamagazine.nl
Альтернативный ID # 11 B001EC2J1G
Тип: Собственный домен: amazon.com
Альтернативный ID # 12 150002645
Тип: Собственный домен: bfi.org.uk

Альтернативные идентификаторы делятся на непатентованные и проприетарные. Первые различают предопределенные типы (например, выданные ISAN, IMDb и IVA), тогда как все проприетарные идентификаторы относятся к типу «Собственные» и, кроме того, различаются по соответствующему домену DNS. По состоянию на июль 2017 года через EIDR напрямую доступно более 2 миллионов альтернативных идентификаторов.

Отношения между объектами

Объекты содержимого могут быть связаны друг с другом в соответствии со следующей таблицей. Эти отношения выражаются как дополнительные поля в записи содержимого и, таким образом, относятся к этому объекту. Обратите внимание, что субъектный объект является дочерним, а целевой - родительским (например, субъектом является <тип-отношения> родительского). Дополнительные ограничения указаны в таблице.

Отношения наследования : объект, для которого существует связь, может наследовать основные поля метаданных от объекта, к которому относится отношение. Для объекта может существовать только одно отношение наследования. Эти отношения создают древовидную структуру, основанную на идентификаторе EIDR ID для абстракции.
isSeasonOf Группа серий сериалов, выпущенных за непрерывный промежуток времени (например, год трансляции), например 10.5240 / AB95-8734-5D98-A282-2DF0-C («Сезон 9») - это сезон 10.5240 / C272-DA64-E2B5-0A78. -2AC3-Z ("Секретные материалы")
isEpisodeOf например, 10.5240 / E008-224D-0397-0560-6300-8 («Солнечные дни») - это серия 10.5240 / AB95-8734-5D98-A282-2DF0-C («Сезон 9»).
isEditOf Экземпляр заголовка с уникальными характеристиками, которые отличают его от любой другой версии. Например, 10.5240 / 7290-C8AD-12BA-4F93-3B07-7 («Бегущий по лезвию: Режиссерская версия») является редакцией 10.5240 / EA73-79D7-1B2B-B378-3A73-M.
isManifestationOf Проявление - это более конкретный экземпляр произведения, которое можно продавать, передавать, передавать или воспроизводить. Родителем проявления должно быть редактирование. Например, 10.5240 / 9CE1-DE39-5F3E-073D-4307-7 - это ультрафиолетовый стандартный CFF (стандартное разрешение, английское аудио и субтитры) для фильма «Бегущий по лезвию: Режиссерская версия». Это проявление абстрактной работы 10.5240 / EA73-79D7-1B2B-B378-3A73-M .
isClipOf Один (и только один) непрерывный фрагмент актива.
Отношения зависимости : объекты, к которым относятся отношения, имеют сильное отношение к основной природе объекта, на котором существует связь. Это означает, что объекты, указанные в связи, должны приниматься во внимание при проверке дубликатов при создании или изменении объекта. Эти отношения создают ориентированные графы внутри и между деревьями.
isCompositeOf Одно произведение, состоящее из частей нескольких других записей.
isCompilationOf Собрание нескольких целых произведений, которые не поддаются более точному описанию.
Легкие отношения : нет наследования; объекты, к которым они относятся, не влияют на основную природу объекта, на котором существует связь. Эти отношения используются в основном при перемещении по дереву объектов и соединении деревьев объектов друг с другом, создавая ориентированный граф по элементам этих деревьев.
isPackagingOf Для создания коллекции активов, которые выпускаются вместе, например, 10.5240 / F219-975E-5990-4570-BA75-2 («Ханна Монтана и Майли ...») - это упаковка 10.5240 / 9ABE-2BF1-ACE7-EBA2-8E57 -N .
isPromotionOf Рекламные объекты, например, трейлер.
isSupplementTo Вспомогательный материал, который можно найти на DVD, например отрывок из фильма или закулисный фильм.
isAlternateContentFor Контент, синхронизированный с основным активом, например звук или альтернативный ракурс камеры.

Использование в стандартах и ​​приложениях

EIDR включен во многие стандарты. Некоторые из наиболее значимых перечислены здесь:

  • SMPTE / AMWA : RP 2079, рекомендованная SMPTE, стандартизирует использование EIDR в контейнерах мультимедиа MXF , что составляет основу рабочих процессов профессионального контента, включая спецификации AMWA AS-03 и AS-11. Рекомендуемая практика SMTPE 2021-5 позволяет переносить идентификатор EIDR везде, где BXF используется для обмена данными между системами вещания.
  • Европейский вещательный союз (EBU) : EBUCore - это общий базовый набор описательных и технических метаданных, которые описывают медиаресурсы (аудио, видео, неподвижные изображения, субтитры и т. Д.). Сотрудники EBU и EIDR составили сопоставление EBUCore для базовых записей с корневыми объектами EIDR: .. EIDR и EBU совместно работают в рабочей группе SMPTE Core над определением описательных метаданных для спецификаций и рабочих процессов на основе SMPTE. EIDR - один из стандартов, поддерживаемых EBU Core.
  • DVB : EIDR упоминается в проекте спецификаций DVB для сопутствующих экранов (tm-sm-css-0017r14).
  • MPEG : EIDR был предложен в качестве идентификатора контента в формате приложения для сохранения мультимедиа, который определяется для использования в архиве.
  • CableLabs (США) : EIDR является частью стандарта метаданных CableLabs для распространения видео по запросу. EIDR - это идентификатор программы, который может присутствовать в дескрипторе сегментации SCTE-35 2013, стандарте, используемом при распределении IP по кабелю. EIDR также используется в продуктах с динамической вставкой рекламы (DAI) с использованием стандартной архитектуры SCTE 130.
  • EIDR и альтернативные идентификаторы : для обеспечения взаимодействия EIDR с широким спектром систем, EIDR включает поле «AlternateID» для перекрестных ссылок на существующие системы идентификаторов. Альтернативные идентификаторы могут включать, например, CRID ( RFC 4078 ), ISAN, ISRC, UPC или URI , а также коммерческие системы идентификации, такие как Ad-ID , Baseline, IMDb и т. Д. В настоящее время около половины записей EIDR содержат идентификатор. по крайней мере из одной другой системы.
  • Сопоставление других стандартных метаданных и идентификаторов с EIDR : другие системы метаданных и идентификаторов могут быть напрямую сопоставлены с EIDR:
    • EN 15907 и EN 15744 : эти стандарты находятся под эгидой Европейского комитета по стандартизации CEN / TC 372 и filmstandards.org. Для корневых объектов EN 15907 и EN 15744 доступны передовые методы и сопоставления. EIDR также работает с архивами фильмов, чтобы расширить совместимость с этими стандартами до более детального уровня детализации, включая проект с Британским институтом кино (BFI) по регистрации своих записей на основе EN 15907 в EIDR.
    • Международный стандартный аудиовизуальный номер (ISAN) : ISAN широко используется в системах управления правами и сбора информации. Доступно полное сопоставление регистрации ISAN с регистрацией EIDR. UK Audio-Visual Registration Agency, совместное предприятие EIDR и ISAN-UK, предоставляет услуги совместной регистрации для обоих идентификаторов. Предшественники этой службы использовались для получения идентификаторов EIDR и ISAN для широковещательного контента от ITV (коммерческая телевизионная сеть в Соединенном Королевстве).

Идентификаторы EIDR находят свое применение во все большем числе коммерческих приложений. Ниже приведены некоторые из преимуществ использования EIDR:

  • Интеграция Warner Brothers и Xbox : EIDR использовался для улучшения реализации системы электронных продаж (EST) для доставки фильмов Warner Theatrical клиентам Microsoft Xbox Live . Для работы электронной витрины требуется, чтобы несколько групп в Warner Brothers координировали свои действия с командой Xbox. Исходящая сторона дистрибьюторской цепочки включала публикацию «Avails» (названия, доступные для продажи) и отслеживание выполнения заказов; входящая сторона включала размещение заказов. Другие функции, такие как отчеты, охватывают обе стороны цепочки распределения. Исходная система требовала ручного вмешательства и контроля, особенно на границах между организациями. Примером необходимости ручной обработки может быть проверка того, что была доставлена ​​правильная версия актива (которая может варьироваться в зависимости от субтитров или контента). В новой системе Warner Brothers создали новый идентификатор EIDR для каждого варианта содержания, который использовался на всех последующих этапах обработки. Это устранило двусмысленность и упростило автоматизацию входящих и исходящих этапов. Еще одним преимуществом была возможность создавать отчеты на лету.
  • Интеграция Swisscom EPG : Swisscom управляет услугой платного телевидения в Швейцарии. В 2014 году компания завершила развертывание электронного руководства по программированию (EPG) для своих клиентов на основе EIDR. Это сквозная система, в которой идентификаторы EIDR используются для представления активов, отображаемых в EPG. Ключевым элементом системы было то, что идентификаторы EIDR также использовались в метаданных руководства, предоставленных Swisscom через media-press.tv. Это включало настройку системы назначения идентификаторов EIDR для активов, которых еще нет в реестре. Ключевым преимуществом использования EIDR является отсутствие необходимости преобразования между разными системами идентификаторов.

Операции и администрирование

EIDR находится в ведении некоммерческой ассоциации EIDR Association, которая была основана в октябре 2010 года компаниями MovieLabs , CableLabs , Comcast и Rovi . С тех пор количество участников неуклонно росло: по состоянию на конец 2014 года в нем 79 членов, разделенных между уровнями промоутеров и участников отрасли. Самая быстрорастущая категория - это неамериканские компании, на которые сейчас приходится около 20% членства. Ассоциация EIDR управляет двумя реестрами EIDR: производственной и песочницей. Первый является официальным сайтом, а второй зарезервирован для тестирования и разработки. Обе системы общедоступны в Интернете, но не гарантируется, что содержимое песочницы будет правильным, полным или даже относится к существующим активам. Только члены ассоциации EIDR могут изменять реестр.

Регистрация

Регистрация новых активов может производиться индивидуально или массово (до 100 000 активов за раз). В любом случае рабочий процесс включает комбинацию автоматизированных (для выполнения четко определенных, но утомительных задач) и ручных (где требуется человеческое мнение) процессов. Он также является итеративным, поскольку первоначальный процесс сопоставления может выявить множество пробелов и ошибок, которые необходимо устранить.

Регистрация новых активов - сложный процесс, требующий некоторой подготовки, особенно в случае массовой подачи. Автоматизированные процессы проверят синтаксис, обеспечат предоставление основных метаданных и соблюдение любых зависимостей (например, записи сериалов, созданные до составных эпизодов). Ручные шаги включают в себя проверку того, что с активом связаны правильные стороны. Один из наиболее важных шагов - убедиться, что новый актив еще не существует в реестре: это рассматривается в следующем разделе.

Чтобы зарегистрировать новый актив, пользователь должен быть связан с стороной, которой оператором EIDR была предоставлена ​​роль «Регистрант». Регистрант может быть основным агентом, таким как студия или студия кодирования, но это также может быть Сторона, осуществляющая массовую регистрацию элементов бэк-каталога, или Сторона, действующая от имени кого-то еще. Также требуется, чтобы регистрант был членом EIDR. В общем, владение контентом, авторитет метаданных и возможность регистрации - это отдельные и не связанные между собой концепции.

Дедупликация

Это относится к пометке активов, представленных в реестр, как относящихся к одной из следующих трех категорий:

  • Актив-кандидат уникален (по сравнению с существующими активами реестра).
  • Актив-кандидат - это копия существующей записи.
  • Актив-кандидат имеет высокую вероятность дублирования.

Эта оценка основана на применении (большого) набора правил к активу-кандидату, что приводит к числовой оценке. Группирование происходит в результате сравнения оценки с двумя пороговыми значениями:

  • Низкий порог : любой актив с рейтингом ниже этого значения не считается дубликатом. Это единственный случай, когда предложенное добавление или изменение записи будет успешным.
  • Высокий порог : любой актив с рейтингом выше этого значения считается (почти наверняка) дубликатом. Предлагаемое добавление / изменение записи не будет продолжено, и будет возвращен статус ошибки. Регистранты обычно используют уже существующий идентификатор для элемента, который они пытались зарегистрировать, и могут добавлять недостающую информацию и альтернативные идентификаторы к существующей записи.

Считается, что активы, попадающие между нижним и верхним порогом, имеют высокую вероятность дублирования: предлагаемое добавление / изменение записи не будет продолжено до тех пор, пока персонал EIDR не проверит вручную.

Архитектура

Компоненты системы EIDR показаны ниже.

Архитектура реестра EIDR

Основные функциональные блоки:

  • Основной реестр : этот модуль представляет собой настройку и конфигурацию репозитория цифровых объектов CNRI. Он выполняет различные функции, включая регистрацию, создание уникальных идентификаторов, индексацию, управление хранилищем объектов и контроль доступа.
  • Репозиторий : хранит и предоставляет доступ к зарегистрированным объектам; для EIDR эти объекты представляют собой коллекции метаданных, а не сами медиаресурсы. Метаданные включают стандартную информацию об объекте, взаимосвязи и настройки управления доступом.
  • REST AP I: интерфейс REST, который обеспечивает доступ ко всему набору неадминистративных функций реестра. Службы могут выполнять индивидуальные или групповые вызовы, которые могут отправляться синхронно или асинхронно. Общий синтаксис запроса позволяет извлекать (а в некоторых случаях изменять) записи реестра, удовлетворяющие набору критериев, заданных вызывающей стороной.
    • EIDR SDK : предоставляется разработчикам для облегчения создания сторонних приложений (обычно для поддержки B2B или внутреннего рабочего процесса). Он состоит из Java SDK, .NET SDK и примеров программ, созданных на основе этих двух SDK. Рекомендуется использовать SDK вместо прямых вызовов REST API.
    • Инструменты командной строки : это простые приложения Java и .NET, построенные на SDK, каждое из которых предоставляет одну функцию, такую ​​как разрешение, запрос, сопоставление и регистрация.
    • Веб-интерфейс : веб-интерфейс пользователя, предназначенный в первую очередь для поиска, просмотра и просмотра иерархии объектов. Он также поддерживает простую регистрацию.
  • Прокси-сервер DOI : с помощью префикса дескриптора он пересылает запросы разрешения EIDR DOI в реестр EIDR.
  • Система обработки : предоставляет услуги распределенного поиска и разрешения

Связь с DOI и системой обработки

EIDR ID - это специализированный пример идентификатора цифрового объекта (DOI), который, в свою очередь, построен на основе системы обработки, разработанной Корпорацией национальных исследовательских инициатив (CNRI). Аспекты нижних уровней, специфичные для EIDR, более подробно описаны ниже.

Идентификатор цифрового объекта (аспекты EIDR)

Идентификатор цифрового объекта, стандартизированный как ISO 26324, предназначен для уникальной идентификации широкого спектра цифровых артефактов, включая книги, записи, данные исследований и другой цифровой контент. Цель состоит не только в том, чтобы идентификаторы были уникальными, но и в том, чтобы они были постоянными и неизменными. В отличие от URL-адресов идентификаторы DOI остаются неизменными, даже если объекты перемещаются в другое место или становятся принадлежащими другой организации. Вот некоторые характеристики DOI:

  • Международный фонд DOI (IDF) применяет ранее согласованные правила в отношении входящих в его состав регистрационных агентств (например, EIDR) для обеспечения непрерывности. В частности, если RA прекращает работу, имена, которые он размещает, будут переданы другому RA.
  • IDF определяет правила, которым должны соответствовать все имена DOI (какие типы объектов могут быть названы конкретным RA)
  • Система DOI предоставляет модель данных, основанную на словаре данных, чтобы обеспечить структурированные средства выражения метаданных (и межобъектных отношений).
  • Система DOI имеет собственный распределенный набор дескрипторов и прокси-серверов с высокой степенью резервирования.
  • Все префиксы DOI имеют форму «10.NNNN», где 10 - это индикатор каталога, а «NNNN» - это код регистранта в диапазоне 1-65535 (например, использование записей содержимого EIDR - 10,5240).

Модель данных DOI предоставляет средства для связывания метаданных с каждым объектом, а также политики, регулирующие их использование. Говоря словами DOI Handbook, метаданные могут включать «имена, идентификаторы, описания, типы, классификации, местоположения, время, измерения, взаимосвязи и любую другую информацию, относящуюся к [объекту]». Метаданные передаются между следующими объектами:

  • Поставщик ресурсов : обычно владелец медиаресурса, который отвечает за ввод метаданных в систему.
  • Регистрационное агентство : объекты, которые служат хранилищем активов (и связанных метаданных). Как уже отмечалось, DOI поддерживает федерацию независимых RA, каждый из которых отвечает за набор активов. EIDR - одно из таких RA. Другие включают CrossRef для научных статей, DataCite для данных исследований и OPOCE для официальных публикаций Европейского Союза.
  • Пользователь службы : объекты, выполняющие запросы к RA, извлекают метаданные, связанные с активами. Структура разрешения DOI отвечает за отправку запроса соответствующему RA (пользователю службы не обязательно знать об этом).

Чтобы способствовать взаимодействию между RA, DOI имеет концепцию ядра метаданных. Это основной набор метаданных, которые должны иметь все объекты, хранящиеся в структуре DOI. Полный набор можно найти в справочнике DOI. Совместимость - большая тема, выходящая за рамки EIDR, но следующее подмножество особенно актуально для активов EIDR:

  • референт : объект, поддерживаемый в системе DOI.
  • referentName : имя референта (например, название фильма)
  • primaryReferentType : для EIDR это включает создание (например, развлекательные объекты) и вечеринку (например, их создателя).
  • структурный тип : это взаимоисключающие категории, определяющие форму актива. Два, особенно актуальных для ресурсов EIDR, - это абстракция (объект, такой как фильм, который может существовать в нескольких формах) и производительность (конкретный экземпляр объекта, например Director's Cut).
  • PrincipalAgent : для творений - сущность, которая несет основную ответственность за свое существование.
  • registrationAuthorityCode : обозначает агентство, выдавшее DOI. Это будет RA EIDR для активов EIDR.

Метаданные EIDR доступны в стандартном формате метаданных ядра DOI, а также в форматах, специфичных для EIDR. DOI для схемы метаданных DOI - doi: 10.1000 / 276 .

Система управления (аспекты EIDR)

DOI, в свою очередь, реализован поверх системы обработки, распределенной, хорошо масштабируемой службы разрешения имен. Дескриптор определяется как:

<Handle> :: = <Handle Naming Authority> "/" <Handle Local Name>

Центр именования является глобально уникальным и определяет как административное пространство, так и синтаксис Обработки локального имени. Для EIDR в приведенном выше определении «10.5240» является органом по присвоению имен EIDR, который отвечает за разрешение суффикса (в том числе за то, что он соответствует ожидаемому синтаксису для актива EIDR). Диапазон допустимых органов по присвоению имен является более общим, чем используется DOI (или EIDR).

Распределенный характер системы управления позволяет размещать каждое локальное пространство имен на нескольких географически распределенных сайтах обслуживания. Это федеративная модель, в которой каждое локальное пространство имен имеет полный контроль над размещением и работой своих сервисных сайтов. Кроме того, каждый сервисный сайт может содержать несколько серверов разрешения: запросы, направленные на конкретный сервисный сайт, будут равномерно отправляться по составляющим его серверам.

Модель данных Handle System проста, но гибка. С каждым дескриптором может быть связано произвольное количество значений. Со временем эти ценности могут быть созданы, изменены и уничтожены. Каждый такой элемент данных имеет следующие атрибуты:

  • index : целое число без знака, которое идентифицирует значение данных из других, которые могут существовать для этого дескриптора.
  • type : строка UTF-8, определяющая тип. Система типов является расширяемой, а общие типы поддерживаются как дескрипторы в центре именования «0.TYPE». Ограничений на создание новых типов нет, хотя рекомендуется использовать разрешаемые дескрипторы в качестве имен типов. Общие типы включают URL-адрес для одного или косвенного обращения, «10320 / loc» для набора альтернативных вариантов разрешения на основе контекста и различные административные типы для управления системой управления, все из которых основаны на разрешении дескрипторов.
  • данные : само значение, представленное как последовательность октетов, которые интерпретируются в контексте связанного типа
  • разрешение : права доступа к этому конкретному значению. Обратите внимание, что разные значения данных дескриптора могут иметь разные разрешения.
  • TTL : целое число, указывающее, как долго значение может быть кэшировано.
  • отметка времени : целое число (выраженное в миллисекундах с эпохи Unix), которое записывает время последнего обновления значения.
  • ссылка : список ссылок на другие значения дескриптора. Обычно они используются для добавления учетных данных (например, цифровой подписи).

Доступ к системе управления осуществляется через проводной протокол, определенный в RFC 3652 ; Приложения EIDR не должны беспокоиться об этом из-за многоуровневости протоколов.

Смотрите также

дальнейшее чтение

  1. Р. Крун, Р. Дрюри, А. Ли, С. МакКонначи. «Идентификация содержания для аудиовизуальных архивов». Журнал Международной ассоциации звуковых и аудиовизуальных архивов, лето 2015 (№ 45).
  2. Р. Крун. «Наведение порядка в цифровых идентификаторах». Журнал Media and Entertainment, зима 2014-2015: 148–150.
  3. Р. Дрюри, Д. Дульчинос. «Преобразование развлечений с помощью технологий». Журнал «Медиа и развлечения» Зима 2013–2014: 81–88.
  4. Д. Агранов, В. Мишель, Т. Вакаи. «Оптимизированная интеграция и управление метаданными контента с использованием реестра идентификаторов развлечений (EIDR)». SCTE Cable-Tec Expo 2012.

внешние ссылки

Рекомендации

  1. ^ ISO / IEC 7064: 2003 : Информационные технологии - Методы безопасности - Проверка систем символов. 2002 г.
  2. ^ Схема XML W3C, часть 2: Типы данных, второе издание
  3. ^ SMPTE RP 2079 . Имя DOI и представление идентификатора EIDR.
  4. ^ Спецификация доставки программы Advanced Media Workflow Association AS-03 MXF .
  5. ^ Advanced Media Workflow Association AS-11 MFX для спецификации вклада .
  6. ^ SMPTE RP 2021-5: 2013 . Использование Ad-ID и EIDR в качестве альтернативных идентификаторов в SMPTE BXF и ATSC PMCP.
  7. ^ EBU TECH 3293 . НАБОР МЕТАДАННЫХ CORE EBU Версия 1.5.
  8. ^ Документ DVB A167-2. Цифровое видеовещание (DVB); Сопутствующие экраны и потоки; Часть 2: Идентификация контента и синхронизация мультимедиа, июль 2014 г. с. 52.
  9. ^ ISO / IEC CD 23000-15 . Информационные технологии - Формат мультимедийного приложения (MPEG-A) - Часть 15: Формат приложения для сохранения мультимедиа.
  10. ^ MD-SP-AMIv3.0-I02-121210 Архивировано 2 апреля 2015 г. в Wayback Machine . Спецификация интерфейса управления активами CableLabs 3.0.
  11. ^ ANSI / SCTE 35 2013 . Сообщение-метка вставки цифровой программы для кабеля.
  12. ^ SCTE 130-10 2013 . Вставка цифровых программ - Интерфейсы рекламных систем, часть 10.
  13. ^ TC 372 Workshop компендиум . Как возникли стандарты EN 15744 и EN 15907.
  14. ^ Пресс-релиз . Swisscom завершает первое европейское развертывание реестра идентификаторов развлечений с помощью media-press.tv.
  15. ^ ISO 26324: 2012 : Информация и документация - Система идентификации цифровых объектов, 2012.