Стандарт Аудио Видео - Audio Video Standard

Стандарт кодирования аудио и видео ( AVS ) относится к стандарту сжатия цифрового аудио и цифрового видео, сформулированному китайской рабочей группой по стандарту кодирования аудио и видео в соответствии с открытыми международными правилами. Завершена разработка стандартов AVS 3-го поколения.

Стандарт AVS первого поколения включает «Информационные технологии, усовершенствованное кодирование аудио-видео, часть 2: видео» ( сокращенно AVS1 ) и «информационные технологии, усовершенствованное кодирование аудио-видео, часть 16: видео для радио и телевидения» (сокращенно AVS +).

Для стандарта AVS второго поколения, называемого AVS2 , основной целью приложения является видео Ultra HD (высокой четкости), поддерживающее эффективное сжатие видео сверхвысокого разрешения (4K выше), HDR (расширенный динамический диапазон) и т. Д. был представлен для применения в соответствии с международным стандартом IEEE (номер стандарта: IEEE1857.4).

«Патентный пул AVS» обеспечивает авторизацию стандарта AVS, который взимает лишь небольшую сумму роялти за конечные продукты (например, телевизоры), за исключением поставщиков контента и операторов. Плата за стандарт AVS первого поколения составляет один юань за терминал.

Чтобы способствовать развитию и продвижению стандарта AVS, Huawei, TCL, Skyworth и другие компании создали альянс инновационных технологий аудиовизуальной индустрии Zhongguancun (аббревиатура: отраслевой альянс AVS), который посвящен развитию и продвижению стандарта AVS.

Связанные организации

Рабочая группа AVS

Рабочая группа AVS - это аббревиатура рабочей группы по стандартизации цифрового аудио и видео кодирования, основанной в июне 2002 года. Ее миссия заключается в сотрудничестве с отечественными предприятиями и научно-исследовательскими учреждениями, отвечающими требованиям информационной индустрии, для разработки (пересмотра) общих технических стандартов. такие как сжатие, распаковка, обработка и представление цифрового аудио и цифрового видео, чтобы обеспечить эффективные и экономичные технологии кодирования / декодирования для цифровых аудио- и цифровых видеоустройств и систем, обслуживающих цифровое вещание с высоким разрешением, цифровые лазерные носители с высокой плотностью записи , беспроводная широкополосная мультимедийная связь, широкополосная потоковая передача в Интернете и другие основные приложения информационной индустрии. В настоящее время рабочая группа AVS состоит из 81 члена из университетов, предприятий и научно-исследовательских институтов, которые возглавляет Гао Вэнь, академик Китайской инженерной академии, профессор и доктор философии. руководитель Пекинского университета и заместитель директора комитета Национального фонда естественных наук, состоящий из группы требований, системной группы, видеогруппы, аудиогруппы, тестовой группы, группы интеллектуальной собственности и других отделов. С момента своего создания рабочая группа AVS упорно разрабатывала стандарты серии AVS в соответствии с открытыми международными правилами. И стандарты AVS для двух поколений уже сформулированы.

Комитет по управлению патентным пулом AVS

Что касается управления интеллектуальной собственностью, AVS создала механизм управления «патентным пулом» с управлением и авторизацией патентного пула, находящимся в ведении «Комитета по управлению патентным пулом AVS», независимой корпоративной ассоциации, основанной 20 сентября 2004 года. Комитет также является первым учреждением по управлению патентным пулом в Китае. Опираясь на независимую корпоративную ассоциацию Beijing Haidian District Digital Audio and Video Standard Promotion Center, зарегистрированную в Бюро по гражданским делам района Хайдянь города Пекина, она установила универсальные и недорогие принципы выдачи патентных разрешений и правила управления для патентных технологий, включенных в стандарт, как экспертный комитет и главный институт, принимающий бизнес-решения в центре продвижения. Роялти за стандарт AVS первого поколения взимается только один юань за терминал, и тот же режим будет принят для второго поколения, чтобы взимать небольшую сумму роялти только за терминал, за исключением содержимого, а также за программные услуги. в Интернете.

Промышленный альянс AVS

Отраслевой альянс AVS - это аббревиатура от Zhongguancun audio-visual industry Technology Innovation Alliance. В мае 2005 года двенадцать предприятий (подразделений) TCL Group Co., Ltd., Skyworth Group Research Institute, Huawei Technology Co., Ltd., Hisense Group Co., Ltd., Haier Group Co., Ltd., Beijing Haier Guangke Co., Ltd., Inspur Group Co., Ltd., Joint Source Digital Audio Video Technology (Beijing) Co., Ltd., Ассоциация мобильной связи района Нью-Пудун, Sichuan Changhong Co., Ltd., Шанхай SVA (Group) Central Научно-исследовательский институт Zte Communication Co., Ltd., Ассоциация индустрии высоких технологий Чжунгуаньцунь, вызвались совместно запустить и создать отраслевой альянс AVS в Пекине, чтобы как можно скорее ускорить прогресс индустриализации AVS и сформировать полностью промышленный союз. сеть и среда поставок с несколькими производителями в ближайшее время, чтобы придать мощный импульс развитию китайской аудио- и видеоиндустрии. Английское название организации - «AVS Industry Alliance», именуемое «AVSA», представляющее собой взаимно независимые и поддерживающие «Три кареты» с «AVS Workgroup» и «Комитетом по управлению патентным пулом AVS». AVSA стремится создать полную отраслевую цепочку цифровых аудио и видео «технология → патент → стандарт → микросхема и программное обеспечение → производство целых машин и систем → производство цифровых носителей и культуральная промышленность», создавая всесторонний прорыв в стандартной формулировке, быстрой технологической прогресс и скачкообразное развитие индустрии, достижение общего подъема индустрии цифрового AV и формирование группы предприятий цифрового AV, оказывающей значительное влияние на мир. В настоящее время общее количество членов альянса составляет 117, включая 81 стандартного члена и 36 промышленных промоутеров.

Стандарт AVS первого поколения

Стандарт AVS первого поколения включает в себя китайский национальный стандарт «Информационные технологии, улучшенное кодирование аудио-видео, часть 2: видео» (сокращенно AVS1, этикетка GB ： GB ／ T 20090.2-2006) и «Информационные технологии, расширенное кодирование аудио-видео, часть 16: Radio Television Video »(сокращенно AVS +, маркировка GB: GB / T 20090.16-2016). Тест стандарта видео AVS, организованный Институтом планирования радио и телевидения SARFT (Государственное управление радио, кино и телевидения), показывает: если битрейт AVS1 составляет половину от стандарта MPEG-2, качество кодирования будет отличным для обоих стандартов стандартной четкости. или высокое разрешение; если битрейт меньше 1/3, он также достигает уровня "хорошо-отлично". Стандартная видеочасть AVS1 была провозглашена национальным стандартом Китая в феврале 2006 года.

В течение 7–11 мая 2007 г. четвертая встреча ITU-T (Сектор стандартизации электросвязи МСЭ) IPTV FG дала понять, что AVS1 стал одним из стандартов, доступных для выбора IPTV, с рейтингом MPEG-2, H.264 и ВК-1. 4 июня 2013 года видеочасть AVS1 была выпущена самой влиятельной академической организацией IEEE (Институт инженеров по электротехнике и электронике) в области международной электронной информации со стандартным номером IEEE1857-2013, означающим, что серия стандартов AVS важный шаг на пути интернационализации.

AVS + - это не только стандарт индустрии радио, кино и телевидения GY / T 257.1-2012 «Усовершенствованное кодирование аудио и видео для радио и телевидения, часть 1: видео», выпущенный SARFT 10 июля 2012 года, но и расширенная версия AVS1. . До сих пор китайский стандарт AVS появился в Шри-Ланке, Лаосе, Таиланде, Кыргызстане и других странах, так что тысячи наборов HD-контента с применением кодирования AVS + транслировались по спутниковым каналам по всему миру.

Стандарт AVS второго поколения

Стандарт AVS второго поколения включает серию китайских национальных стандартов «Информационные технологии, эффективное кодирование мультимедиа» (сокращенно AVS2). AVS2 в основном занимается передачей дополнительных программ HD TV, стремясь стать лидером в развитии индустрии цифровых медиа в ближайшие пять-десять лет и стремясь играть ключевую роль в разработке соответствующих международных стандартов. Одновременно с продвижением и применением стандарта AVS первого поколения активно продвигается работа по непрерывному развитию технологии AVS, и завершена разработка технологии стандарта AVS2 второго поколения. SARFT выпустил видео AVS2 в качестве отраслевого стандарта в мае 2016 года и в качестве национального стандарта Китая 30 декабря 2016 года. В настоящее время он представлен для применения в соответствии с международным стандартом IEEE (номер стандарта: IEEE1857.4).

Тест авторитетных организаций показывает, что эффективность кодирования AVS2 улучшена более чем вдвое, чем у AVS +, а степень сжатия превосходит последний международный стандарт HEVC (H.265). По сравнению со стандартом AVS первого поколения, второй может сэкономить половину полосы пропускания и будет поддерживать продвижение и применение дополнительных телевизоров высокой четкости в ближайшие несколько лет.

Возможности AVS2

AVS2 использует структуру гибридного кодирования, и весь процесс кодирования включает в себя такие модули, как внутрикадровое прогнозирование, межкадровое прогнозирование, преобразование, квантование, обратное квантование и обратное преобразование, контурный фильтр и энтропийное кодирование. Он обладает следующими техническими характеристиками:

Гибкое разделение структуры кодирования
- Чтобы удовлетворить требования видео с разрешением HD и Ultra HD к эффективности сжатия, AVS2 использует структуру блочного разделения на основе квадродерева, включая CU (блок кодирования), PU (блок прогнозирования) и TU (блок преобразования). Изображение разбивается на LCU (наибольший CU) фиксированного размера, который повторяется и разбивается на серию CU в форме квадродерева. Каждый CU содержит блок кодирования яркости и два соответствующих блока кодирования цветности (размер блока ниже относится к блоку кодирования яркости). По сравнению с традиционным макроблоком структура разделов, основанная на дереве квадрантов, более гибкая, с размером CU, увеличенным с 8 × 8 до 64 × 64.
- PU определяет все режимы прогнозирования CU и является базовой единицей прогнозирования, включая внутрикадровое и межкадровое прогнозирование. Максимальный размер PU не может превышать размер текущего CU, которому он принадлежит. На основе блоков квадратного внутрикадрового предсказания AVS1 добавляется раздел блока неквадратного внутрикадрового предсказания. Между тем, на основе разделения блока симметричного предсказания межкадровое предсказание также добавляет 4 способа асимметричного разделения.
- Помимо CU и PU, AVS2 также определяет блок преобразования TU для предсказания остаточного преобразования и квантования. TU - это базовая единица преобразования и квантования, определяемая в CU как PU. Выбор размера зависит от соответствующей формы PU. Если текущий CU разделен на неквадратный PU, неквадратное разделение будет применено к соответствующему TU; в противном случае будет применен тип квадратного раздела. Размер TU может быть больше, чем размер PU, но не больше, чем размер CU, которому он принадлежит.
Кодирование с внутренним прогнозированием
- По сравнению с AVS1 и H.264 / AVC, AVS2 разрабатывает 33 режима для кодирования блоков яркости с внутрикадровым предсказанием, включая режим предсказания DC, режим предсказания плоскости, режим билинейного предсказания и 30 режимов предсказания ангела. Имеется 5 режимов для блоков цветности: режим постоянного тока, режим горизонтального прогнозирования, режим вертикального прогнозирования, режим билинейной интерполяции, а также недавно добавленный режим на основе яркости (DM).
Кодирование с внутренним предсказанием
- По сравнению с AVS1, AVS2 увеличивает максимальное количество опорных кадров-кандидатов до 4, чтобы адаптироваться к многоуровневому управлению опорными кадрами, которое также полностью использует преимущества избыточного пространства буфера.
- Чтобы удовлетворить требования управления множеством опорных кадров, AVS2 использует своего рода многоуровневый режим управления опорными кадрами. В этом режиме кадры в каждой GOP (группе изображений) разделены на несколько уровней в соответствии с ссылочными отношениями между кадрами.
Режим межкадрового предсказания
- На основе трех типов изображений AVS1 I, P, B, в соответствии с требованиями приложения, AVS2 добавляет изображение F прямого прогнозирования с несколькими гипотезами. Нацеленное на видеонаблюдение, воспроизведение сцены и другие конкретные приложения, AVS2 проектирует кадры сцены ( Изображение G и изображение GB) и опорный кадр сцены S.
- Для кадра B, в дополнение к традиционному прямому, обратному, двустороннему режиму и режиму пропуска / прямого доступа, добавлен новый симметричный режим. В симметричном режиме требуется кодировать только векторы движения вперед, а затем векторы движения назад будут выводиться из векторов движения вперед.
- Чтобы полностью реализовать производительность режима пропуска / прямого кадра B, AVS2 также использует многонаправленный режим пропуска / прямого перехода при условии сохранения исходного режима пропуска / прямого режима кадра B: двусторонний режим пропуска / прямого, симметричный режим пропуска / прямого перехода, режим обратного пропуска / прямой режим и режим прямого пропуска / прямой режим. Для четырех конкретных режимов один и тот же блок режима прогнозирования между соседними блоками обнаруживается в соответствии с режимом прогнозирования текущего блока, и векторы движения соседних блоков с одним и тем же режимом прогнозирования, которые обнаруживаются первыми, будут считаться таковыми. текущего блока.
- Для кадра F блоки кодирования могут относиться к двум прямым опорным блокам, что эквивалентно предсказанию двойной гипотезы кадра P.
- AVS2 делит прогнозирование с несколькими гипотезами на две категории, а именно временный и пространственный режим с несколькими гипотезами.
- Текущий блок кодирования двойной гипотезы во временной области применяет средневзвешенное значение блоков предсказания в качестве текущего значения предсказания, но есть только один как для MVD (разность векторов движения), так и для индекса опорного изображения, в то время как другой MVD и опорное изображение индексы получаются из линейного масштабирования на основе расстояния во временной области.
- Двойное прогнозирование в пространственной области также называется DMH (направленная мультигипотеза), которое получается путем объединения двух точек прогнозирования вокруг начальной точки прогнозирования, а начальная точка расположена на линии между двумя точками прогнозирования. В дополнение к начальной точке прогнозирования всего существует 8 точек прогнозирования, которые необходимо объединить только с двумя точками прогнозирования, расположенными на одной прямой с начальной точкой прогнозирования. Помимо четырех различных направлений, регулировка также будет проводиться в соответствии с расстоянием, и четыре режима с расстоянием 1/2 пикселя и расстоянием 1/4 пикселя будут соответственно рассчитаны, плюс начальная точка прогнозирования, чтобы отработать в общей сложности 9 режимов. для сравнения, чтобы выбрать оптимальный режим прогнозирования.
- Кадр сцены предлагается AVS2 на основе метода кодирования видеонаблюдения для моделирования фона. Когда инструмент наблюдения не открыт, кадр I используется только для справки для изображений до следующей точки произвольного доступа. Когда инструмент наблюдения открыт, AVS2 применяет определенный кадр в видео как кадр G изображения сцены, который можно рассматривать как долгосрочную ссылку для последующих изображений.
- AVS2 может генерировать кадр GB изображения сцены с некоторыми кадрами в видео, и кадр GB также может применяться в качестве долгосрочной ссылки.
- Чтобы упростить компенсацию движения, AVS2 использует 8-ступенчатый интерполяционный фильтр, основанный на преобразовании DCT , который требует только одну фильтрацию и поддерживает генерацию вектора движения с более высокой точностью, чем 1/4 пикселя.
Трансформация
- Кодирование с преобразованием в AVS2 в основном применяет целочисленное преобразование DCT , которое непосредственно выполняется для блоков преобразования размера 4 × 4, 8 × 8, 16 × 16, 32x32.
- Для одного блока преобразования с размером больше 64, для проведения вейвлет-преобразования применяется логическое преобразование LOT, за которым следует целочисленное преобразование DCT.
- После того, как преобразование DCT достигнуто, AVS2 проведет второе преобразование 4 x 4 для блоков 4 x 4 с низкими частотными коэффициентами, таким образом дополнительно уменьшая корреляцию между коэффициентами и позволяя более концентрировать энергию.
Энтропийное кодирование
- Энтропийное кодирование AVS2 сначала делит коэффициенты преобразования на CG (группа коэффициентов) размером 4 x 4, а затем выполняет кодирование и зигзагообразное сканирование в соответствии с CG.
- При кодировании коэффициентов сначала кодируется позиция CG, содержащая последний ненулевой коэффициент, а затем кодируется каждый CG до тех пор, пока не будут завершены все коэффициенты CG, чтобы обеспечить более высокую концентрацию нулевых коэффициентов в процессе кодирования.
- Двоичное арифметическое кодирование и двумерное кодирование с переменной длиной слова на основе контекста по-прежнему применяются в AVS2.
Петлевой фильтр
- Модули контурного фильтра AVS2 содержат три части: фильтр устранения блочности, адаптивное смещение точки выборки и фильтр компенсации выборки.
- Блоки фильтрации фильтра удаления блочности имеют размер 8 × 8, которые проводят фильтрацию сначала по вертикальному краю, а затем по горизонтальному краю. И для каждого края выбираются различные методы фильтрации в соответствии с разной интенсивностью фильтрации.
- После фильтра удаления блочности адаптивная компенсация смещения выборки применяется для дальнейшего уменьшения искажения.
- AVS2 добавляет адаптивный фильтр после фильтра удаления блочности и компенсации смещения выборки, фильтр Винера с пересечением 7 × 7 плюс квадратная центросимметрия 3 × 3, который применяет исходное неискаженное изображение и кодирует восстановленное изображение, чтобы вычислить коэффициент фильтра наименьших квадратов, и проводят фильтрацию декодированного восстановленного изображения, таким образом, чтобы уменьшить искажение сжатия в декодируемом изображении и повысить качество опорного изображения.

Реализация AVS

БПЛА

uAVS2 - это первый в мире кодировщик HD в реальном времени, основанный на стандарте AVS2, успешно разработанный центром исследований цифровых медиа Шэньчжэньской высшей школы Пекинского университета, с производительностью, значительно превосходящей кодировщик x265 HEVC / H.265, который устранил технические препятствия. для включения стандарта AVS2 в промышленное применение. Впоследствии были последовательно запущены видеокодер AVS2 Ultra HD в реальном времени и кодировщик HD для мобильных устройств.

OpenAVS2

OpenAVS2 - это набор зрелых промышленных наборов для кодирования, транскодирования и декодирования аудио и видео, основанный на стандарте AVS2, охватывающий мобильный Интернет, основные приложения Интернета и вертикальные отрасли, разрабатывающий зрелые универсальные отраслевые аудиовизуальные решения AVS2.

xAVS2 и dAVS2

xAVS2 и dAVS2 - это кодировщик и декодер с открытым исходным кодом, опубликованный Лабораторией кодирования видео Пекинского университета ( PKU-VCL ) на основе стандарта кодирования видео AVS2-P2 / IEEE 1857.4 , который предлагается под любой версией 2 Стандартной общественной лицензии GNU (GPL). или коммерческая лицензия.

Languages

In other projects