ЧАСТЬ 2
Чтобы обеспечить высокий уровень качества кинопродукции, выпускаемой с логотипом Dolby, фирма ввела строгую сертификацию
кинотеатров, звукозаписывающих студий и собственно фильмов. Ведь даже двухканальная фонограмма, воспроизведенная в разных помещениях
и с разных громкоговорителей, звучит по-разному (изменяется общий частотный баланс, а также положение кажущихся источников звука), что
уж тут говорить о четырехканальном окружающем звуке, закодированном матричным способом. Поэтому сертификация, для получения которой
кинотеатр должен был обеспечить достаточно высокое качество звуковоспроизводящей аппаратуры, нужное звуковое давление во всех
точках зала и хорошую акустику помещения, помогла сделать звучание фильма примерно одинаковым во всех сертифицированных кинотеатрах.
Сертификация студий звукозаписи необходима для того, чтобы звук, сделанный в этой студии и слышимый режиссером, был таким же, как и в
кинотеатрах. Для студий требования примерно такие же, как и для кинотеатров - наличие микшерного пульта с surround-панорамированием,
правильная акустика аппаратной, наличие кинопроектора и большого экрана (что автоматически требовало помещения соответствующих
размеров), линейность звуковоспроизводящего тракта и обеспечение заданного уровня звукового давления в точке прослушивания. Такая
сертификация и рекламная кампания сделали логотип Dolby приманкой для зрителя, который знал, что, придя в кинотеатр, носящий такой
логотип, он услышит высокое качество окружающего звука и получит зрелище, недостижимое в домашних условиях. Именно с широким
распространением Dolby Stereo связывают расцвет киноиндустрии, произошедший в начале восьмидесятых.
Наряду с внедрением Dolby Stereo компания усовершенствовала звук и для широкоэкранного кино. Способ записи был тот же, на магнитную
полосу на 70-мм кинопленке, но теперь уже с шумопонижением Dolby A. Кроме того, шестиканальный формат Todd-AO был модифицирован: две из
пяти фронтальных дорожек (а именно левая и правая дополнительные) были убраны, так как время гигантских киноэкранов уже прошло, и
вполне хватало одного центрального канала, а место удаленных занимали теперь два канала низкочастотных эффектов. Применение
низкочастотных каналов для специальных "громоподобных" эффектов было продемонстрировано впервые, такая инновация была хорошо воспринята
индустрией и используется по сей день. С тех пор в обозначении формата канал LFE (Low Frequency Effects) из-за ограниченного
частотного диапазона (не выше 300 Гц, обычно до 125 Гц) принято писать через точку, например, 5.1. В 1978 году формат был еще раз
модифицирован: теперь surround-каналов стало два, левый и правый, и, таким образом, этот формат звука на 70-мм кинопленке стал
предвестником современного окружающего звука, построенного по схеме 5.1. Первой картиной, выпущенной в этом обновленном звуковом формате
(он был назван Dolby Stereo 70mm), стала Apocalypse Now (Апокалипсис сегодня) Френсиса Копполы, но, в связи с закатом популярности
широкоэкранного кино, фильмов с новым типом фонограммы вышло немного.
Схема расположения громкоговорителей в кинотеатре, оборудованном для воспроизведения звука в формате Dolby Stereo 70mm.
В начале восьмидесятых стало бурно развиваться домашнее видео, сначала с моно-, а затем и со стереозвуком, в 1980-м появился
лазерный видеодиск (Laser Disc). К тому времени уже получили широкое распространение домашние стереосистемы класса Hi-Fi, и в 1982 году
Dolby представила домашний декодер для окружающего звука. Сначала этот декодер (для потребителей он был назван Dolby Surround) мог
декодировать только три канала - левый, правый и surround, так как в нем использовался пассивный декодер без логических функций. Для
большей части зрителей этого было достаточно, так как при небольшом экране телевизора вполне хватало "фантомного" центра, который
обеспечивали левый и правый громкоговорители. В связи с распространением телевизоров с большой диагональю (27-32 дюйма), с
которыми "фантомный" центр уже не удовлетворял пользователей, в 1987 году был представлен Dolby Surround Pro Logic, способный извлекать
из двухканальной фонограммы на видеокассете все четыре дорожки окружающего звука. С этого момента "домашние кинотеатры" стали
стремительно завоевывать рынок, и из предметов роскоши превратились в обычное явление.
В 1986 году Dolby представила новый аналоговый формат записи звука на кинопленку - Dolby SR (Spectral Recording). От обычного
Dolby Stereo он отличался только применением новой системы шумоподавления (SR), в два раза более эффективной, чем Dolby A.
Благодаря этому динамический диапазон звуковой дорожки к фильмам увеличился, но все еще применялся матричный способ кодирования. В
настоящее время большая часть фильмов выходит со звуком в Dolby SR (наряду с одним или несколькими цифровыми форматами), кроме того,
эта система шумоподавления до сих пор используется в профессиональной аналоговой звукозаписи и послужила основой для
Dolby S, которая применяется в кассетных магнитофонах. Девяностые годы характеризуются развитием цифровых технологий, и
киноиндустрия не стояла в стороне. Первым на ниве доставки в кинотеатры цифрового звука стал формат Cinema Digital Sound (CDS),
разработанный компанией Optical Radiation Corporation совместно с Eastman Kodak. Дорожка цифрового звука в этом формате помещалась
вместо аналоговой, а роль бит выполняли мельчайшие точки (пикселы) на кинопленке. Размер этих точек был очень мал, так как формат
разрабатывался при поддержке фирмы Kodak, которая создала для CDS специальную кинопленку. Благодаря малому размеру пикселов и тому,
что они были расположены по всей длине кинопленки, на цифровую дорожку удалось "втиснуть" шесть (а, точнее, 5.1) каналов звука с
разрешением 12 бит (правда, эти биты были не линейные, как на компакт-диске, а логарифмические, то есть квантование звука было
более адаптировано к особенностям человеческого слуха, что делало динамический диапазон записи в таком формате практически равным
"обычным", линейным 16-ти битам). В CDS, в отличие от всех современных цифровых форматов, применялось сжатие данных без потерь,
то есть звуковые данные на выходе декодера были идентичны данным на входе кодера. Но, несмотря на то, что этот формат был достаточно
"продвинутым" для своего времени (например, там применялась схема обнаружения и коррекции ошибок), особого успеха он не снискал, и в
нем успело выйти всего несколько фильмов. Причина этому - полный отказ от аналоговой оптической дорожки. Из-за того, что она была
вытеснена цифровой, CDS остался без подстраховки, и когда цифровая дорожка давала сбой (что случалось, в том числе, из-за малого
размера пикселей), то, в лучшем случае, в зале воцарялась тишина. Отсутствие аналоговой дорожки также требовало изготовления
специальных прокатных копий для цифровых кинотеатров, что было накладно и неудобно.
Схема расположения громкоговорителей в кинотеатре, оборудованном для воспроизведения звука в формате Dolby Digital, DTS или CDS.
На этом историческая часть данного обзора заканчивается, и мы приступаем к более детальному рассмотрению современных цифровых
форматов многоканального звука. Все они используют сжатие цифровых потоков, причем сжатие с потерями. То есть звук после
кодирования-раскодирования уже не идентичен исходному. Хотя изначально разрабатывались эти форматы именно для кинопленки, они
нашли применение и в других областях, например, в вещании, DVD или компьютерных играх (исключение тут составляет лишь SDDS). Начнем же
мы рассмотрение с самого распространенного формата - Dolby Digital.
Dolby Digital, SR-D
Цифровой формат Dolby SR-D был представлен публике в 1992 году, на премьере фильма Batman
Returns (Возвращение Бэтмена), и в настоящее время этот формат является самым распространенным (в том числе и в домашних
кинотеатрах). Широкой публике он больше известен под торговой маркой Dolby Digital, профессионалы же от кинопроизводства обычно называют
его SR-D. Звук в Dolby Digital записывается в пространство между перфорациями, при помощи таких же "точек" (пикселей), как и в
системе CDS. Место для аналоговой дорожки (с Dolby Stereo или SR) сохраняется, и она выполняет роль резервной, если вдруг что-то
случится с цифровой. Совмещение цифровой и аналоговой записи звука на одной пленке позволило использовать одну и ту же копию фильма как
в продвинутых цифровых, так и в старых аналоговых кинотеатрах (вплоть до моно), к тому же не требовалось какой-то специальной
пленки из-за того, что пикселы в Dolby Digital довольно большие и вполне воспроизводятся на обычной кинопленке Fuji, Kodak или Agfa.
Из-за большой величины пикселей и малого пространства между перфорациями поток данных, который удается туда "запихнуть"
сравнительно небольшой - 320 Кбит/с (напомню, что поток данных с обычного аудио-CD составляет более 1400 Кбит/с). Поэтому для
размещения в этом тесном цифровом пространстве шести (а точнее 5.1) каналов компания Dolby применила сжатие звуковых данных с помощью
алгоритма AC-3. В принципе в AC-3 можно закодировать и большее количество дискретных каналов (до 8), однако ни один из существующих
декодеров не позволяет их раскодировать.
Этот алгоритм кодирования обладает очень высокой эффективностью (коэффициент сжатия может быть более 12:1, поддерживаемые битрейты
от 32 до 640 Кбит/с, в кино обычно используется 320 Кбит/с) и при этом довольно высоким субъективным качеством звука. AC-3, как и
большая часть современных схем сжатия звуковых потоков (в частности, MP3), использует в своей работе особенности слухового восприятия
человека. Например, в присутствии громкого сигнала менее громкие и имеющие немного более высокую или низкую частоту звуки маскируются
громким сигналом, то есть не слышны или слышны очень плохо. Также маскируются сигналы, звучащие после, и даже перед громким звуком.
Это явление позволяет маскируемые звуки не кодировать или кодировать с меньшей разрядностью. Совокупность правил, используемых кодером
для удаления малозначительной информации из аудиопотока, называется психоакустической моделью. Компрессия данных осуществляется также
путем недеструктивного избавления от избыточной информации, примерно по тем же алгоритмам, которые применяются в архиваторах ZIP или RAR.
Перед собственно кодированием аудиосигнал (хотя AC-3 допускает кодирование звука с частотами дискретизации 32, 44,1 и 48 кГц, в
Dolby Digital используется только последняя, 48 кГц) попадает в буферную память кодера. Затем убирается постоянная составляющая
сигнала (DC offset, с помощью фильтра низких частот на 3 Гц) и фильтруется низкочастотный канал (убирается все, что выше 120 Гц).
Следующий этап - детектирование коротких (транзиентных) звуковых импульсов. По результатам работы детектора звуковой поток
разбивается на блоки - 512 семплов, если транзиентных сигналов не обнаружено, или 256 семплов, если таковые есть в сигнале. Это
делается для того, чтобы улучшить передачу резких громких звуков (таких, как выстрелы или резкая атака некоторых музыкальных
инструментов, например, барабанов). Временные блоки перекрываются между собой на 50% для создания избыточности и более точного кодирования.
Цифровым кроссовером звук в блоке разбивается на 256 частотных полос, что дает ширину одной полосы в 93,75 Гц. При этом цифровой
сигнал преобразуется в формат чисел с плавающей запятой. Такое представление данных позволяет кодеру AC-3 использовать звук с
разрядностью 20-24 бита. И хотя результат кодирования будет звучать чуть хуже, чем несжатый 16-битный звук, для более качественного
результата Dolby рекомендует подавать на кодер именно 20/24-разрядную фонограмму.
После этого кодер анализирует информацию в каждой из частотных полос блока и, в соответствии с заданной психоакустической моделью,
распределяет биты между ними - если, по мнению кодера, звук в данной частотной полосе несет важную для человеческого слуха информацию, то
ей отводится больше бит для кодирования (изменяется разрядность как целочисленной мантиссы, так и экспоненты), а если кодер считает, что
сигнал мы не услышим или услышим плохо, то частотная полоса не кодируется вовсе или ей выделяется меньшее количество бит.
Психоакустическая модель используется не только для кодирования отдельных частотных полос в каждом канале, но и для распределения
доступных бит между каналами. У кодера есть в распоряжении некое фиксированное количество бит (bit pool), которым необходимо
закодировать блок данных в 512 семплов для всех шести каналов. Для распределения битов из общего пула каждому каналу и используется
психоакустическая модель - во время диалога больше битов отдается центральному, а во время звучания музыки - левому и правому каналам.
Это позволяет еще эффективнее упаковать сигнал, не сильно влияя на восприятие звуковой картины.
Механизм следующей ступени сжатия звука, используемой только когда всеми остальными способами не удалось сжать информацию до
нужного размера, основан на особенности восприятия направления звучания высоких частот (выше 2,5 кГц). Человек не способен
определить положение источника звука высокой частоты по разности фаз между приходящими в левое и правое ухо сигналами. Вместо этого мы
определяем направление по огибающей звука, и разница в огибающих несет для нас пространственную информацию. Поэтому в AC-3
применяется объединение высоких частот из разных каналов, для каждого канала в отдельности кодируется лишь огибающая несущей
частоты. В современных версиях кодеров AC-3 объединение высоких частот происходит, как правило, не ниже 10 кГц, поэтому заметного
влияния на локализацию звука не оказывает (в ранних версиях были жалобы на плохое качество при объединении частот порядка 3-3,5 кГц).
Объединяться высокие частоты могут в любом количестве каналов (от 2 до 5) и в любом сочетании, это решает алгоритм кодера.
Поток данных Dolby Digital считывается с пленки специальной насадкой на кинопроектор, а затем поступает на декодер, встроенный в
кинопроцессор. В декодер данные поступают блоками (по 512 или 256 семплов), и сначала проверяется целостность данных в блоке. В Dolby
Digital нет схемы коррекции ошибок, а только их обнаружения, поэтому если блок данных признан дефектным, то кодер использует предыдущий
блок, прошедший такой контроль. Так как блоки перекрываются на 50%, это не вызывает слышимых проблем, более того, декодер может
использовать один и тот же блок несколько раз подряд (если поступают поврежденные данные). Если же цифровой звук перестает поступать на
протяжении некоторого количества блоков, то декодер переключает кинопроцессор на аналоговую дорожку с Dolby SR. Таким образом, даже
при серьезных повреждениях цифровой аудиодорожки звук при показе в кинотеатре все равно не прерывается. Еще одним плюсом AC-3 является
то, что кодер может включать в поток данных некоторые особенности использованной им психоакустической модели; соответственно, декодер,
используя эти данные, более качественно раскодирует звук. Это позволяет совершенствовать алгоритм кодирования, не модифицируя существующие декодеры.
Таким образом, система сжатия AC-3 обладает высокой эффективностью (коэффициент сжатия, использующийся в
кинопроизводстве, составляет почти 13:1) при минимальных потерях в качестве звучания. Однако стоит иметь в виду, что алгоритмы и
психоакустические модели AC-3 разрабатывались именно для кинозвука и не предназначены для чисто музыкальных фонограмм (это подтверждает и
сама фирма Dolby). Погрешности, вносимые процессом кодирования, малозаметны при демонстрации фильма, в то же время в музыке они
становятся слышны и иногда неприятны (это в особенности касается тех случаев, когда кодер применяет технику объединения высоких частот).
Хотя Dolby Digital оперирует с шестью дискретными каналами, артефакты кодирования зачастую проявляют себя самым неожиданным
образом. Поэтому для серьезной работы с окружающим звуком, который впоследствии будет закодирован в Dolby Digital, при мониторинге
необходимо применять такую же цепочку кодер-декодер. Для этой цели Dolby выпускает два прибора - DP 569 (кодер) и DP 562 (декодер). С
помощью DP 569 можно также кодировать фонограммы для DVD (но не для кинопленки, для этого требуется специальный кодер DS 10, который
Dolby не продает, а только дает студиям в аренду), так как поток Dolby Digital может быть записан на любой надежный цифровой
двухканальный аудионоситель (рекомендуется применение систем записи на жесткий диск, так как при ошибках считывания, которые могут
случиться, например, в DAT-магнитофоне, целостность AC-3 может быть нарушена). Кроме того, можно установить кодер в режим Dolby Stereo,
чтобы послушать, как фонограмма будет звучать при матричном кодировании. Не стоит "подгонять" микс так, чтобы он хорошо звучал и
с матричной системой кодирования, и с дискретной цифровой. Гораздо продуктивнее будет сделать отдельное сведение для аналоговой дорожки
(со всеми ее ограничениями) и отдельное для Dolby Digital, благо на кинопленке они могут вполне мирно сосуществовать.
Dolby Digital и DVD
Особенностью Dolby Digital и AC-3 является то, что они изначально разрабатывались не только для
кино, но и как универсальный формат многоканального цифрового звука для разных носителей. В AC-3 была заложена возможность кодирования
разного количества каналов (от 1 до 6) с различным битрейтом, а, кроме того, предусмотрено использование метаданных - очень мощного
средства адаптации звука под конкретного пользователя без модификации звука (подробнее про метаданные смотрите во врезке).
Из-за авторитета фирмы Dolby в киноиндустрии и гибкости кодека AC-3, Dolby Digital стал одним из обязательных форматов звуковой дорожки
на DVD. Второй обязательный формат - несжатый PCM-звук, третий (правда, только для Европы) - MPEG, который из-за малой
распространенности де-факто уже перестал быть таковым. "Обязательный" означает, что звук в одном из этих форматов должен
быть на любом произведенном DVD, остальные, например DTS, являются дополнительными.
Часть [1] [2] [3] [4]
Антон БАЛАБАН
Музыкальное Оборудование
|