ЧАСТЬ 3
Использование Dolby Digital в DVD-производстве принципиально не отличается от чисто "киношного". Применяется тот же кодек AC-3,
частота дискретизации 48 кГц, однако производителям дисков доступна здесь большая свобода. Во-первых, это свобода выбора битрейта (от 32
до 448 Кбит/с, в кино только 320) и количества закодированных каналов (от 1 до 6). При этом можно, допустим, закодировать
стереофонограмму с битрейтом 448 Кбит/с, тем самым повысив ее качество. В метаданнных AC-3 указывается, какой тип фонограммы
кодируется, чтобы DVD проигрыватель или декодер знали, как с ней обращаться - например, двухканальная фонограмма может быть как
обычной стерео, так и матричной Dolby Surround (Dolby Stereo). В первом случае декодер подает на выход два канала, а во втором
раскодирует матричную фонограмму в четыре. При издании старых фильмов с фонограммой в Dolby Stereo на DVD категорически не
рекомендуется раскодировать ее в студии, с последующим переводом в "фальшивый" 5.1 (с четырьмя работающими каналами). Выигрыша в
качестве при такой операции никакого, но у некоторых пользователей могут возникнуть проблемы, особенно если "фальшивый" 5.1 будет
смикширован обратно в матричный формат декодером.
Несмотря на возможность автоматического микширования в форматы с меньшим количеством каналов (так называемый "downmixing"), при
работе с DVD также рекомендуется делать отдельное сведение для слушателей, у которых пока нет декодера Dolby Digital и они
используют аналоговый Pro Logic. Обычно стереодорожка с матрично закодированным звуковым сопровождением размещается на DVD в виде
несжатого PCM-звука как альтернативная.
Dolby Digital в вещании, Dolby E
Dolby Digital был принят в качестве стандартного для многих форматов цифрового телевещания и телевидения высокой четкости (HDTV).
Этому способствовало наличие метаданных, а также "записываемость" потока AC-3 на аудиодорожки современных цифровых видеомагнитофонов. Однако использование Dolby
Digital в чистом виде создает ряд проблем для вещателей - закодированный звук нельзя редактировать (при этом нарушается
целостность потока), а после нескольких циклов кодирования-раскодирования стремительно теряется качество звука.
Поэтому специально для нужд вещателей Dolby разработала формат Dolby E, который лишен перечисленных недостатков.
В Dolby E используется повышенный битрейт, поэтому звук, записанный в этом формате, может без существенной потери в качестве
проходить цикл кодирования-раскодирования до 10 раз (по крайней мере, так утверждает Dolby). Кроме того, звук в Dolby E можно
редактировать напрямую, без раскодирования, так как размер блока данных в нем установлен таким, чтобы на протяжении одного видеокадра
число блоков было целым (соответственно, не нарушается структура потока). При этом все достоинства "обычного" Dolby Digital сохранены
- Dolby E так же хорошо "живет" на цифровых видеомагнитофонах и в нем полностью поддерживаются метаданные. Стоит отметить, что Dolby E
разрабатывался исключительно для профессионального применения, бытовых декодеров этого формата не существует, непосредственно перед
вещанием звук из Dolby E перекодируется в Dolby Digital. Для работы с Dolby E выпускаются кодер Dolby DP 571 и декодер DP 572, а также
DP 583 - прибор для синхронизации аудиопотока с видеокадрами.
Метаданные
Важной особенностью кодека AC-3, которая во многом определила выбор его в качестве основного
способа доставки многоканального цифрового звука в вещании и на DVD, является возможность включения в поток AC-3 метаданных
(metadata). Метаданные позволяют управлять следующими параметрами при декодировании: уровнем диалогов, динамическим
диапазоном фонограммы, параметрами микширования из шести каналов в меньшее их количество (например, из 5.1 в двухканальное стерео).
Управление каналом диалогов (или нормализация диалогов) применяется, в основном, в вещании. Использование этого
параметра позволяет уравнять субъективную громкость разных программ и телеканалов без какой-либо модификации звука
(компрессии, лимитирования и т. п.). Вещатель самостоятельно устанавливает значение этого параметра, а декодер пользователя
настраивает громкость в соответствии с полученными метаданными. Если в следующей программе (или даже в течение
текущей) параметр нормализации диалогов меняется, то декодер тоже соответственно изменяет громкость. Это избавляет
пользователя от необходимости постоянно регулировать громкость, а вещателя - от компрессии (последнее положительно
сказывается на качестве звука, так что опять выигрывает потребитель).
Хотя в любом декодере Dolby Digital есть возможность автоматического микширования в форматы, отличные от 5.1,
качество работы автоматики зачастую оставляет желать лучшего. Поэтому в AC-3 предусмотрен контроль за таким микшированием со
стороны звукоинженера. В метаданных кодируются уровни микширования каждого из шести каналов в каждый из "нижних"
форматов (Dolby Surround, стерео и моно) и, таким образом, не всегда корректная работа автоматики в этом тонком вопросе
заменяется творческими решениями звукоинженера. При этом сам звук, опять-таки, не меняется.
Контроль за динамическим диапазоном позволяет адаптировать одну и ту же фонограмму к разным условиям прослушивания.
Например, часто пользователю хочется послушать программу с невысоким уровнем громкости (скажем, поздно вечером, чтобы не
беспокоить домочадцев). Но фонограммы к фильмам, как правило, имеют большой динамический диапазон, поэтому в данном случае,
если пользователь установит комфортную громкость по диалогам героев, спецэффекты все равно будут звучать излишне громко, а
тихие звуки он просто не услышит. Естественным решением этой проблемы была бы компрессия, но это лишило бы пользователей
возможности насладиться звуком в полном динамическом диапазоне. К тому же, автоматические установки компрессии для
всех фонограмм не могут подойти во всех случаях. На помощь приходят метаданные - не изменяя собственно содержимого
звукового потока, звукоинженер может установить параметры компрессии громких звуков и усиления тихих, и если слушатель
выберет в декодере "тихий" режим прослушивания, он получит именно тот звук, который был сделан звукоинженером, а не "тупой" автоматикой.
Для работы с метаданными фирма Dolby выпускает процессор DP 570 Multichannel Audio Tool. На него подаются шесть каналов
несжатого цифрового звука, регулируются нужные параметры, из прибора же выходит также несжатый звук и по отдельному кабелю
метаданные. После чего звук можно закодировать в Dolby Digital или Dolby E, используя соответствующие кодеры, которые имеют
вход для метаданных.
|
Dolby Surround EX
Этот новый формат кинозвука был разработан Dolby в сотрудничестве с THX и Skywalker Sound Studios. Он был представлен публике в 1999 году с
фильмом "Star Wars: Episode I - The Phantom Menace" Джорджа Лукаса. В Dolby Surround EX звук записан по схеме 6.1, дополнительная шестая
дорожка используется как центральный канал эффектов (он располагается сзади, между левым и правым
surround-громкоговорителями). Однако закодирован шестой канал не дискретно, а старым добрым матричным способом - он записывается в
противофазе в левый и правый surround-каналы. С одной стороны, дополнительная звуковая дорожка добавляет в палитру звукоинженера
новый инструмент, но возврат к матричному кодированию (и присущим ему ограничениями) понравился не всем. Для Dolby такой способ
добавки звукового канала, несомненно, выгоден - не требуется полного переоборудования кинотеатра, а только покупка небольшого "довеска" к
декодеру; соответственно, распространился новый формат довольно быстро. К тому же полностью сохранилась совместимость с
кинотеатрами, оборудованными Dolby Digital 5.1. В настоящее время уже доступны и бытовые декодеры Dolby Surround EX, поэтому новый
формат все чаще находит себе место и на DVD.
Схема расположения громкоговорителей в кинотеатре, оборудованном для воспроизведения звука в формате Dolby Surround EX или DTS ES.
Для бытовых устройств Dolby выпустила также новую систему Pro Logic II, которая (по утверждению производителя) позволяет получить
из аналоговой Dolby Stereo или даже обычной стерео полноценную программу 5.1. Естественно, качество получается не таким, как при
прослушивании Dolby Digital, но многие предпочитают Pro Logic II старому матричному декодеру Dolby Pro Logic.
THX
Вопреки распространенному заблуждению, THX вовсе не является каким-то самостоятельным форматом кинозвука. Это подразделение компании
Lucas Films, созданное совместно Джорджем Лукасом и Томлинсоном Холманом. Свое название подразделение получило от первого фильма Лукаса, "THX
1138". Основной задачей, поставленной Лукасом перед THX, стала выработка строгих правил для кинотеатров и студий звукозаписи,
при выполнении которых звуковая картина в кинотеатре не отличалась бы от той, что режиссер слышит в студии при
создании фильма (Лукаса не удовлетворяла строгость сертификации Dolby), и при этом имела бы максимально возможное
качество. Такие правила были разработаны, и с 1983 года началась программа THX-сертификации для студий звукозаписи,
кинотеатров и фильмов. Первой THX-кинокартиной стала Return of the Jedi (Возвращение Джедая) из цикла "Звездные войны". В
программу входили (и входят) жесткие правила по акустике помещения, расположению, мощности, качеству и настройке
громкоговорителей и усилителей, в THX даже создали специальный высококачественный кроссовер, так как на рынке в то время не
было подобного устройства, удовлетворявшего строгим требованиям компании. Для звукозаписывающих студий требования
к сертификации примерно те же, кроме того, предъявляются требования по организации процесса пост-производства звука для
фильмов. THX сертифицирует также различное профессиональное студийное оборудование, в основном это мониторы и усилители
(естественно, чтобы сертифицировать студию необходимо получить "добро" от THX по поводу своих мониторов и усилителей). С 1990
года началась программа сертификации бытового оборудования для домашних кинотеатров - это также усилители, акустические системы и декодеры.
|
DTS
Формат DTS (от одноименной компании Digital Theatre Systems) был впервые представлен публике в
1993 году вместе с фильмом Jurassic Park (Парк Юрского периода) Стивена Спилберга. В разработке и тестировании нового формата
активно участвовали как сам Спилберг, так и компания Universal, являющиеся совладельцами DTS. Следует иметь в виду, что
DTS-кодирование для показа в кинотеатрах и для записи звука на бытовые носители (CD, LD и DVD) сильно между собой различаются. Сама
компания DTS этот факт не слишком афиширует, называются обе разновидности совершенно одинаково, хотя способы кодирования,
степени сжатия и качество звука у них довольно ощутимо разнятся. Делается это, видимо, из каких-то маркетинговых соображений, но
зачастую вносит немалую путаницу в представления широкой публики (да и многих профессионалов) о возможностях DTS в его разных ипостасях.
DTS в кино
Мы же постараемся отделить зерна от плевел и начнем рассмотрение DTS в ее "киношной" реинкарнации. Разработчики формата посчитали, что
выкраивать на кинопленке (где уже разместились аналоговая дорожка и Dolby Digital) дополнительное место для записи многоканального
цифрового звука не имеет смысла, поэтому было принято решение записать звук на CD-ROM, и с него воспроизводить фонограмму в
кинотеатрах. Для точной синхронизации с изображением на кинопленку печатается временной код (он расположен рядом с аналоговой звуковой
дорожкой). Таймкод содержит не только стандартную синхронизационную информацию (часы, минуты, секунды, кадры), но и кодовый номер фильма
и рулона кинопленки. Кинопроцессор сверяет эту информацию из кода на кинопленке с информацией, которая содержится на диске, и допускает
воспроизведение только в том случае, если диск соответствует демонстрируемому фильму. Для считывания временного кода с кинопленки
требуется относительно простая (и недорогая) насадка на проектор, которая подключается к DTS-кинопроцессору со встроенными дисководами
CD-ROM. Сам таймкод из-за больших размеров сигнальных точек очень устойчив к износу и может быть считан даже при повреждениях пленки.
Если же временной код в силу каких-то причин перестает поступать на процессор, он воспроизводит звук с CD-ROM еще четыре секунды, после
чего (если не восстановился временной код) переключается на резервную аналоговую дорожку с Dolby Stereo. Интересно, что своим
успехом формат DTS во многом обязан разработанному контейнеру для дисков (caddy). Этот контейнер содержит два диска и удобно
помещается в коробку для кинопленки. Такое решение успокоило прокатные компании, опасавшиеся, что диски могут быть утеряны при
перевозке или доставлены в кинотеатр не вовремя.
Как и во всех современных системах доставки многоканального цифрового звука в кинотеатры, в DTS используется деструктивное
сжатие данных. В DTS для кинопоказа применяется схема компрессии apt-X100, разработанная компанией Advanced Processing Technology.
Эта компания, в настоящее время принадлежащая небезызвестной Solid State Logic, занимается передачей высококачественного звука по
телефонным сетям ISDN. Собственно, apt-X100 изначально был разработан именно для этой цели, DTS лишь адаптировала кодек для
передачи многоканального звука. В стандартном варианте DTS кодируются пять независимых каналов цифрового звука с разрядностью
16 бит и частотой дискретизации 44,1 кГц. Шестой (субвуферный) канал просто подмешивается в левый и правый surround-каналы, частота
раздела - 80 Гц. Таким образом, в "киношном" DTS субвуферный канал не является полностью независимым, однако это обстоятельство не
сильно сказывается на результате - в большинстве кинотеатров surround-громкоговорители и не рассчитаны на передачу частот ниже 80 Гц.
Apt-X100 является довольно простой схемой сжатия звука. В ее основе лежит способ кодирования ADPCM (Adaptive Differential Pulse
Code Modulation). Этот способ не предусматривает использования каких-либо психоакустических моделей, основанных на особенностях
человеческого слуха, и является довольно простым как при кодировании, так и декодировании, что позволяет использовать
недорогие кодеры-декодеры, а также снижает задержку между поступлением сигнала и его кодированием/декодированием (это
обстоятельство и обусловило успех алгоритмов ADPCM при передаче звука по ISDN-сетям).
Принцип кодирования, вкратце, таков. Входящий сигнал кроссовером разбивается на четыре равные частотные полосы, затем для каждого
поступающего семпла в полосе кодер предсказывает его значение, основываясь на предыдущих 122 семплах. Затем из предсказанного
значения семпла вычитается его реальное (поступившее) значение, после чего эта разница передается по ISDN или, как в случае с DTS,
записывается на диск. Естественно, для записи разницы между предсказанным и реальным значением семпла тратится намного меньше
бит, чем на запись исходного значения семпла, что и позволяет уменьшать поток передаваемых данных. Единственная
"психоакустичность" в кодеке apt-X100 - это то, что для высоких и низких частот применяются несколько отличающиеся механизмы
предсказания, и этим частотным полосам выделяется меньшее количество бит по сравнению со средними частотами (в соответствии с известным
фактом, что человеческий слух менее чувствителен к высоким и низким частотам).
Основным недостатком apt-X100 является то, что алгоритм кодирования невозможно улучшать без смены всего парка декодеров -
если применить более совершенный метод предсказания, то его необходимо использовать одновременно и в кодере, и в декодере. Не
предусмотрено использование метаданных, что усложняет использование этого кодека в вещании и бытовых носителях (впрочем, он там и не
используется). Эффективность и качество звучания данного алгоритма сильно зависят от исходного сигнала - почти идеальный результат
достигается при кодировании чистых синусоидальных сигналов (где легко с приемлемой точностью предсказать, какое значение будет иметь
следующий семпл), а при кодировании случайного шума эффективность падает почти до нуля. В реальных фонограммах соотношение этих двух
типов сигналов может сильно отличаться в зависимости от ситуации на экране (например, если кодируется шум дождя, сильно возрастает
случайная компонента), соответственно и меняется качество звука. Однако в ситуациях, когда случайного шума в сигнале много, точность
передачи (как в том же шуме дождя) не играет большой роли.
С помощью apt-X100 при кодировании в DTS удается добиться степени сжатия данных 4:1 и потока данных 882 Кбит/с без заметной потери
качества звучания. Таким образом, на один CD-ROM (а используется именно CD-ROM, а не аудио-CD, из-за большей избыточности и,
следовательно, надежности первого) помещается до 100 минут многоканального звука. Если фильм длится дольше 100 минут, то
звуковое сопровождение размещается на двух или более дисках (современные кинопроцессоры DTS имеют два или три встроенных дисковода CD-ROM).
Часть [1] [2] [3] [4]
Антон БАЛАБАН
Музыкальное Оборудование
|