Dolby Digital Plus - Dolby Digital Plus

Логотип Dolby Digital Plus

Dolby Digital Plus , также известный как Enhanced AC-3 (и обычно сокращенно DD + или E-AC-3 или EC-3 ), представляет собой схему сжатия цифрового звука, разработанную Dolby Labs для транспортировки и хранения многоканального цифрового звука. Он является преемником Dolby Digital (AC-3), также разработанного Dolby, и имеет ряд улучшений, включая поддержку более широкого диапазона скоростей передачи данных (от 32 кбит / с до 6144 кбит / с), увеличенное количество каналов и мульти -программная поддержка (через подпотоки) и дополнительные инструменты (алгоритмы) для представления сжатых данных и противодействия артефактам. В то время как Dolby Digital (AC-3) поддерживает до пяти аудиоканалов с полной полосой пропускания с максимальной скоростью передачи 640 кбит / с, E-AC-3 поддерживает до 15 аудиоканалов с полной полосой пропускания с максимальной скоростью передачи данных 6,144  Мбит / с. .

Полный набор технических спецификаций для E-AC-3 (и AC-3) стандартизирован и опубликован в Приложении E к ATSC A / 52: 2012, а также в Приложении E к ETSI TS 102 366 V1.2.1 (2008–08). ), опубликованный Комитетом по передовым телевизионным системам .

Технические детали

Характеристики

Dolby Digital Plus может:

  • Кодированный битрейт: от 0,032 до 6,144 Мбит / с
  • Аудиоканалы: от 1,0 до 15,1 (т.е. от моно до 15 полнодиапазонных каналов и канала низкочастотных эффектов)
  • Количество аудиопрограмм на битовый поток: 8
  • Частота дискретизации: 32, 44,1 или 48 кГц

Структура

Сервис Dolby Digital Plus состоит из одного или нескольких подпотоков . Есть три типа подпотоков:

  • Независимые подпотоки, которые могут содержать одну программу до 5.1 каналов. В потоке Dolby Digital Plus может присутствовать до восьми зависимых подпотоков. Каналы, присутствующие в независимом субпотоке, ограничены традиционными каналами 5.1: левым (L), правым (R), центральным (C), левым (Ls) и правым объемным (Rs) каналами, а также низкочастотным Канал эффектов (Lfe).
  • Устаревшие подпотоки, которые содержат одну программу 5.1 и напрямую соответствуют контенту Dolby Digital. В потоке DD + может присутствовать не более одного устаревшего субпотока.
  • Зависимые подпотоки, которые содержат дополнительные каналы помимо традиционных каналов 5.1. Поскольку зависимые подпотоки имеют ту же структуру, что и независимые подпотоки, каждый зависимый подпоток может содержать до пяти каналов с полной полосой пропускания и одного низкочастотного канала; однако эти каналы могут быть назначены для разных мест размещения динамиков. Метаданные в подпотоке описывают назначение каждого включенного канала.

Все потоки DD + должны содержать по крайней мере один независимый подпоток или устаревший подпоток, который содержит первые (или только) 5.1-канальные каналы основной аудиопрограммы. Дополнительные независимые субпотоки могут использоваться для вторичных аудиопрограмм, таких как звуковые дорожки на иностранном языке, комментарии или описания / озвучка для слабовидящих. Зависимые субпотоки могут быть предоставлены для программ, которые имеют дополнительные каналы звуковой сцены помимо 5.1.

Внутри каждого подпотока предусмотрено кодирование пяти каналов с полной полосой пропускания, одного низкочастотного канала и одного канала связи. Канал связи используется для передачи информации от средних до высоких частот, которая является общей для нескольких каналов с полной полосой пропускания. Его контент смешивается с другими каналами способом, предписанным метаданными, он не воспроизводится декодером как дискретный канал.

Dolby Digital Plus включает исчерпывающие метаданные битового потока для управления декодером выходной громкости (через dialnorm), понижающего микширования и реверсивного управления динамическим диапазоном (через DRC).

Синтаксис

Dolby Digital Plus номинально является протоколом с 16-битным выравниванием, хотя очень немногие поля в синтаксисе учитывают границы байтов или слов. Поскольку многие элементы синтаксиса являются необязательными или имеют переменную длину, в том числе некоторые, наличие или длина которых зависит от сложных предыдущих вычислений, и в синтаксисе имеется небольшая избыточность, DD + может быть чрезвычайно сложно правильно проанализировать, с синтаксически правильным, но неправильным синтаксическим анализом, который легко производится неисправными энкодерами.

Поток DD + представляет собой набор пакетов синхронизирующих кадров фиксированной длины , каждый из которых соответствует 256, 512, 768 или 1536 последовательным выборкам звука во временной области. (Случай с 1536 выборками является наиболее распространенным случаем и соответствует Dolby Digital; более короткие субкадры предназначены для использования в интерактивных приложениях, таких как видеоигры, где уменьшение задержки кодировщика является важной проблемой). Каждый синхронизирующий кадр декодируется независимо и принадлежит определенному подпотоку внутри службы. Кадр синхронизации состоит из следующих элементов синтаксиса (некоторые из которых могут быть опущены, когда служба Dolby Digital Plus инкапсулируется в другой формат или транспорт):

  • 16-битовое слово синхронизации, имеющее значение 0x0b77.
  • Раздел Bitstream Info (BSI), который включает ключевые метаданные, такие как размер кадра, идентификатор битового потока (который указывает версию используемого синтаксиса), режим канала, идентификатор субпотока, уровень закодированного диалога (dialnorm) и метаданные для руководства декодер производства понижающего микширования.
  • Раздел аудиокадра, который содержит информацию о декодировании, общую для всех аудиоблоков в кадре синхронизации, включая необходимую информацию для определения того, как упакованы экспоненты и мантиссы .
  • Один, два, три или шесть разделов аудиоблока. Эти разделы содержат дополнительные метаданные декодирования, а также кодированные и квантованные частотные коэффициенты. Каждый аудиоблок соответствует 256 выборкам PCM в каждом канале.
  • Последний раздел, содержащий определяемые пользователем вспомогательные данные, любые необходимые дополнения для получения одинаковых длин синхрокадра и 16-битный код проверки циклическим избыточным кодом для обнаружения ошибок.

Хранение коэффициентов преобразования

В основе как Dolby Digital, так и DD + лежит модифицированное дискретное косинусное преобразование (MDCT), которое используется для преобразования аудиосигнала в частотную область; в каждом блоке может передаваться до 256 частотных коэффициентов. Коэффициенты передаются в двоичном формате с плавающей запятой, а показатели передаются отдельно от мантисс. Это обеспечивает высокоэффективное кодирование.

Экспоненты для каждого канала кодируются в сильно упакованном дифференциальном формате с дельтами между последовательными элементами разрешения по частоте (кроме первого), заданными в потоке. Используются три формата или стратегии экспоненты ; они известны как «D15», «D25» и «D45». В D15 каждая ячейка имеет уникальный показатель степени, в то время как в D25 и D45 значения дельты соответствуют парам или четырем элементам разрешения по частоте. Аудиоблоки, отличные от первого в кадре синхронизации, могут дополнительно повторно использовать набор показателей предыдущего блока (это требуется для каналов, которые используют адаптивное гибридное преобразование).

Декодированные экспоненты вместе с набором параметров метаданных используются для получения указателей распределения битов (BAP), которые определяют количество битов, выделенных каждой мантиссе. Бинам, которые соответствуют частотам, на которых человеческий слух более точен, выделяется больше битов; бинов, которые соответствуют частотам, к которым люди менее чувствительны, выделяется меньше. Для каждой мантиссы может быть выделено любое место от нуля до 16 бит; если передаются нулевые биты, необязательно может применяться функция дизеринга для генерации частотного коэффициента.

Алгоритм

Dolby Digital Plus, как и многие аудиокодеки с потерями, использует сильно квантованное представление сигнала в частотной области для достижения усиления кодирования ; В этом разделе описывается операция базового преобразования, а также различные дополнительные «инструменты», определенные стандартом, которые используются для достижения большего сжатия или уменьшения слышимых артефактов кодирования.

Модифицированное дискретное косинусное преобразование

Кодер Dolby Digital и DD + преобразует многоканальный аудиосигнал в частотную область с использованием модифицированного дискретного косинусного преобразования (MDCT) с переключаемой длиной блока 256 или 512 отсчетов (последний используется со стационарными сигналами, первый - с переходными сигналами. ). Затем представление частотной области квантуется в соответствии с психоакустической моделью и передается. Для частотных коэффициентов используется формат с плавающей запятой, а мантиссы и экспоненты хранятся и передаются отдельно, причем оба они сильно сжимаются.

Адаптивное гибридное преобразование (AHT)

Для очень стационарных сигналов, таких как длинные ноты в музыкальном исполнении, используется адаптивное гибридное преобразование (AHT). Этот инструмент является уникальным для Dolby Digital Plus (и не поддерживается в Dolby Digital) и использует дополнительное дискретное косинусное преобразование типа II (DCT) для объединения шести смежных блоков преобразования (расположенных внутри кадра синхронизации) в эффективный более длинный блок. В дополнение к двухэтапному преобразованию используется другая структура распределения битов, и используются два способа представления закодированных мантисс: использование векторного квантования , которое дает наивысший коэффициент кодирования, и использование квантования с адаптацией к усилению (GAQ). когда требуется большая точность воспроизведения сигнала. Квантование с адаптацией к усилению может быть независимо включено для каждого частотного бина в канале и позволяет кодировать мантиссу переменной длины.

Связь

Поскольку многие многоканальные аудиопрограммы имеют высокую степень корреляции между отдельными каналами, обычно используется канал связи. Высокочастотная информация, которая является общей для двух или более каналов, передается в отдельном канале (который не воспроизводится декодером, а только смешивается обратно в исходные каналы), известном как канал связи; вместе с коэффициентами, известными как «координаты связи», которые указывают декодеру, как восстанавливать исходные каналы.

Dolby Digital Plus поддерживает более сложную версию инструмента связи, известную как Enhanced Coupling (ECPL). Этот алгоритм, который значительно дороже в обработке (как для кодеров, так и для декодеров), позволяет включать фазовую информацию в координаты связи, что позволяет сохранять фазовые соотношения между связанными каналами.

Спектральное расширение

Dolby Digital Plus предоставляет еще один инструмент для высоких частот. Поскольку высокочастотные компоненты часто являются гармониками низкочастотных звуков, Spectral Extension (SPX) позволяет алгоритмически синтезировать высокочастотные компоненты из низкочастотных компонентов. Этот инструмент также является уникальным для Dolby Digital Plus и не поддерживается в Dolby Digital.

Повторная матрица

Стерео программы, как правило, повторно матрицируются и кодируются как канал L + R и LR. Это делается как для увеличения усиления кодирования (канал LR обычно может быть сильно сжат, и последующая нематрица вызывает отмену многих артефактов сжатия), так и для сохранения фазовых соотношений, необходимых для правильного воспроизведения материала, закодированного в формате Dolby Surround .

Переходная предварительная шумовая обработка

Предварительная обработка шума (TPNP) - это специальный инструмент для Dolby Digital Plus, предназначенный для уменьшения результирующих артефактов квантования сигнала и других методов сжатия. В отличие от других описанных выше инструментов, которые работают в частотной области и предшествуют обратному преобразованию в выборки PCM, TPNP - это инструмент, который по существу выполняет оконную операцию вырезания и вставки сигнала временной области для удаления определенных предсказуемых артефактов квантования.

Отношение к Dolby Digital и Dolby Atmos

Битовые потоки Dolby Digital Plus не имеют прямой обратной совместимости с устаревшими декодерами Dolby Digital . Однако Dolby Digital Plus является функциональным надмножеством Dolby Digital, а декодеры включают обязательный компонент, который напрямую преобразует (без декодирования и перекодирования) битовый поток Dolby Digital Plus в битовый поток Dolby Digital (работающий со скоростью 640 кбит / с) для передачи. через устаревшие подключения S / PDIF (включая S / PDIF через HDMI) к внешним декодерам (например, AVR и т. д.). Все декодеры Dolby Digital Plus могут декодировать битовые потоки Dolby Digital.

Однако битовые потоки Dolby Atmos кодируются для обеспечения обратной совместимости с декодерами Dolby Digital Plus, и поэтому Dolby Atmos может декодироваться устройствами, совместимыми с Dolby Digital Plus. Это было продано Dolby как вариант сжатия Dolby Atmos с потерями под названием «Dolby Digital Plus Atmos», чтобы отличить его от оригинала на основе DolbyHD без потерь. Большинство битовых потоков Dolby Digital Plus теперь закодированы в кодировке Atmos.


Сжатие динамического диапазона

Одной из целей разработки DD + является качественное воспроизведение в различных средах, начиная от домашних кинотеатров и других акустически контролируемых сред, где возможно воспроизведение с широким динамическим диапазоном, до портативных и автомобильных сред, где присутствует много фонового шума, и может потребоваться сжатие динамического диапазона. чтобы сделать слышными все части аудиопрограммы.

DD + предоставляет следующие режимы работы для различных сред слушателя / зрителя.

Режимы работы декодера Dolby Digital Plus:

Режим Эталонная громкость (LKFS) Заявление
Линия −31 LKFS Воспроизведение в домашнем кинотеатре - Обеспечивает полный "кинематографический" динамический диапазон
РФ −20 LKFS Воспроизведение через динамик телевизора - обеспечивает типичный динамический диапазон "вещания"
Портативный −11 LKFS Портативное устройство для воспроизведения через динамики и наушники - обеспечивает минимальный динамический диапазон (аналогично технологиям создания / микширования / мастеринга музыки)

Примечание. Все режимы работы декодера (перечисленные выше) доступны в каждом декодере Dolby Digital Plus. Режим работы по умолчанию зависит от категории устройства и приложения. На некоторых устройствах у пользователей также может быть выбор (через меню) для выбора альтернативного режима, который соответствует их конкретному вкусу и / или применению.

Кроме того, Dolby Digital и DD + содержат дополнительные метаданные для обеспечения безошибочного преобразования в нисходящие каналы с ограниченным диапазоном, такие как радиочастотная модуляция, где чрезмерная амплитуда выходного сигнала может привести к значительным искажениям или ошибкам модуляции.

Инкапсуляция, использование и хранение потоков Dolby Digital

Физический транспорт для потребительских устройств

IEC 61937-3: определяет, как передавать потоки битов Dolby Digital (AC-3) и Dolby Digital Plus (E-AC-3) через интерфейс IEC 60958/61937 (S / PDIF). Однако у интерфейса S / PDIF недостаточно полосы пропускания для передачи потоков битов Dolby Digital Plus (E-AC-3) со скоростью 3,0 Мбит / с, указанной в HD DVD; возможны более низкие значения данных.

Многие потребительские устройства и даже некоторые профессиональные устройства не распознают Dolby Digital Plus как закодированный формат и обрабатывают сигналы DD + через S / PDIF или аналогичный интерфейс или хранятся в файле .WAV или аналогичном формате контейнера, как если бы они были данные линейной ИКМ. Это не проблема, если данные передаются без изменений, но любое масштабирование усиления или преобразование частоты дискретизации, операции, которые на слух безвредны для данных PCM, повредят и уничтожат поток Dolby Digital Plus. (Более старые кодеки, такие как DTS или AC-3, с большей вероятностью будут распознаны как сжатые форматы и защищены от такой обработки).

Dolby Digital Plus может передаваться через HDMI 1.3 или новее, в соответствии с IEC 61937-3.

Физический транспорт для профессиональных устройств и приложений

Поскольку интерфейс AES-3 является профессиональным аналогом S / PDIF, потоки Dolby Digital Plus могут передаваться через соединения AES-3 с достаточной пропускной способностью и / или через другие интерфейсы, которые инкапсулируют AES-3 (например, SMPTE 259M и SMPTE 299M). встроенный звук). Дополнительные стандарты, опубликованные SMPTE, определяют кодирование транспорта Dolby, включая Dolby Digital, Dolby Digital Plus и Dolby E (кодек только для профессионалов, используемый в аудио / видео приложениях) в интерфейсе AES. Стандарт SMPTE 337 определяет сигнализацию и передачу сигналов, которые не являются звуком PCM, через интерфейс AES-3, а стандарт SMPTE 340-2008 определяет, как Dolby Digital Plus и Dolby Digital должны передаваться через этот интерфейс. Комбинация SMPTE 340-2008 и 337M позволяет хранить и передавать поток битов Dolby Digital Plus в рамках профессиональных рабочих процессов производства, распространения и распространения до передачи потребителям.

Потребительское вещание в системах цифрового телевидения

DD + или Dolby Digital определены Комитетом по передовым телевизионным системам в качестве основного аудиокодека для системы цифрового телевидения ATSC и обычно используются для других приложений DTV (таких как кабельное и спутниковое вещание) в странах, которые используют ATSC для цифрового телевидения.

Для вещания (передачи) потребителям поток битов Dolby Digital Plus упаковывается в элементарный поток MPEG и мультиплексируется (с видео) в транспортный поток MPEG. В системах ATSC спецификация для переноса Dolby Digital Plus описана в ATSC A / 53 Part 3 & Part 6. В системах DVB спецификация для переноса Dolby Digital Plus описана в ETSI TS 101 154 и ETSI EN 300 468.

Dolby Digital Plus все чаще используется в системах цифрового телевидения, особенно в кабельных и спутниковых системах, в качестве замены Dolby Digital. Многие такие приложения не используют преимущества большего количества каналов или способности поддерживать несколько независимых программ; вместо этого он используется как более эффективный кодек, чем AC-3.

HD DVD и Blu-ray Disc

И ныне несуществующий стандарт HD DVD, и диск Blu-ray включают Dolby Digital Plus. Это обязательный компонент HD DVD и дополнительный компонент Blu-ray. Максимальное количество дискретно кодированных каналов одинаково для обоих форматов: 7.1. Однако HD DVD и Blu-ray налагают различные технические ограничения на поддерживаемые аудиокодеки. Следовательно, использование DD + существенно отличается в HD DVD и Blu-ray Disc.

Сравнение битрейта Dolby Digital (AC-3) и Dolby Digital Plus (E-AC-3)
Кодек HD DVD Blu-ray Disc
Расшифровка каналы Битрейт Расшифровка каналы Битрейт
AC-3 обязательный 1 к 5.1 448 кбит / с обязательный 1 к 5.1 640 кбит / с
E-AC-3 обязательный От 1 до 7,1 3,024 Мбит / с опционально, доступно только для тыловых каналов От 6.1 до 7.1 1,664 Мбит / с
TrueHD обязательный
необязательный
1 или 2 от
3 до 8
18,0 Мбит / с
18,0 Мбит / с
необязательный От 1 до 8 18,0 Мбит / с

На HD DVD DD + обозначен как обязательный аудиокодек. Фильм HD DVD может использовать DD + в качестве основной (или единственной) звуковой дорожки. Требуется проигрыватель HD DVD для поддержки звука DD + путем его декодирования и вывода на выходные гнезда проигрывателя. При сохранении на диске битовый поток DD + может переноситься для любого количества аудиоканалов до максимально допустимого с любой скоростью передачи до 3,0 Мбит / с.

На дисках Blu-ray DD + является дополнительным кодеком, который используется как расширение «основной» аудиодорожки AC-3 5.1. Ядро AC-3 кодируется со скоростью 640 кбит / с, несет 5 основных каналов (и 1 LFE) и может независимо воспроизводиться как звуковая дорожка фильма на любом проигрывателе дисков Blu-ray. Битовый поток расширения DD + используется на проигрывателях, которые его поддерживают, заменяя задние каналы в настройке 5.1 на версии с более высокой точностью воспроизведения, а также обеспечивая возможное расширение канала до 6.1 или 7.1. Для всей звуковой дорожки допускается комбинированный битрейт 1,7 Мбит / с: 640 кбит / с для ядра AC-3 5.1 и 1 Мбит / с для расширения DD +. Во время воспроизведения как основной, так и дополнительный потоки битов вносят вклад в окончательный аудиовыход в соответствии с правилами, заложенными в метаданные потока битов.

Медиа-плееры и понижающее микширование

Как правило, битовый поток Dolby Digital Plus может передаваться только по каналу HDMI 1.3 или выше. Более старые приемники поддерживают более ранние версии HDMI или поддерживают только систему S / PDIF для цифрового звука или аналоговых входов.

Для каналов, отличных от HDMI 1.3, проигрыватель может декодировать звук, а затем передавать его различными способами.

  • Более ранние версии HDMI, такие как HDMI 1.1, поддерживают звук PCM , когда проигрыватель декодирует звук и передает его без потерь как PCM через HDMI на ресивер.
  • Некоторые ресиверы и плееры поддерживают аналоговый объемный звук, и проигрыватель может декодировать звук и передавать его на ресивер как аналоговый звук.

Большинство ресиверов и плееров поддерживают S / PDIF. Это цифровое соединение с меньшей пропускной способностью не способно передавать звук PCM без потерь с более чем двумя каналами, но проигрыватель может передавать аудиопоток, совместимый с S / PDIF, на приемник одним из следующих способов:

  • Проигрыватели дисков Blu-ray могут использовать устаревший битовый поток 5.1 AC-3, встроенный в битовый поток E-AC-3, передавая только битовый поток AC-3 без каких-либо модификаций.
  • Плееры, поддерживающие стандарт HD DVD, могут перекодировать декодированный звук в другой формат. В зависимости от метода и опций, доступных игроку, это можно сделать с относительно небольшой потерей качества. Эталонный декодер Dolby, доступный всем лицензиатам, использует общее наследие между AC-3 и E-AC-3, выполняя операции в частотной области. Гибридное повторное сжатие позволяет избежать ненужной сквозной декомпрессии и последующей повторной компрессии (E-AC-3 → LPCM → AC-3). Помимо AC-3, некоторые проигрыватели HD DVD перекодируют звук, совместимый с S / PDIF, в звук DTS со скоростью 1,5 Мбит / с . В то время как S / PDIF может передавать Dolby Digital Plus с более низкой скоростью передачи данных, стандарт HD DVD определяет скорость передачи данных для DD +, которая слишком высока для передачи через интерфейс S / PDIF.

Если проигрывателю необходимо декодировать звук для приемника без HDMI 1.3, результаты должны быть предсказуемыми. Спецификация DD + явно определяет режимы понижающего микширования и механику, поэтому любое исходное звуковое поле (до 14,1) может быть предсказуемо воспроизведено для любой среды прослушивания (вплоть до одного канала).

Смотрите также

Рекомендации