ЧАСТЬ 4
DTS для CD, LD и DVD
Система кодирования DTS нашла довольно широкое применение и на бытовых носителях. Изначально DTS дебютировала на видеодисках формата
LaserDisc (такие большие "блины" с аналоговым видео и цифровым звуком). Впоследствии довольно широко распространились чисто музыкальные программы с
многоканальным (5.1) звуком, записанным с применением DTS на обычные аудио-CD. С приходом DVD система DTS заняла свое место и на этом носителе, хотя
так и не стала для него обязательным звуковым форматом. Однако для размещения многоканального звука на бытовых носителях DTS применила
другой способ кодирования звука - Coherent Acoustics (разработан фирмой AlgoRhythmic Technology). В его основе лежит все тот же
ADPCM, но при кодировании учитываются особенности человеческого слуха (психоакустическая модель). Кроме того, алгоритм Coherent
Acoustics очень гибок в применении - с его помощью можно закодировать от одного до восьми независимых звуковых каналов с
разрядностью от 16 до 24 бит и частотой дискретизации от 8 до 192 кГц. Диапазон возможных битрейтов - от 32 до 4096 Кбит/с.
Естественно, в DTS используются не все эти возможности - в классическом варианте этой системы кодируется звук в формате 5.1 (на
этот раз субвуферный канал независимый) с частотой дискретизации 44,1 кГц (для LD и CD) или 48 кГц (для DVD). Разрядность кодируемого
источника может быть различной, от 16 до 24 бит, при этом кодер использует преимущества 20/24-битного звука. Сама фирма DTS
утверждает, что звук, закодированный с помощью Coherent Acoustics, примерно соответствует по качеству 20-битному несжатому PCM (то есть
лучше, чем у классического CD), но это все-таки "небольшое маркетинговое преувеличение".
В процессе кодирования в Coherent Acoustics, входящий PCM-звук так же, как и в AC-3, разбивается на блоки. Размер блоков может быть
разным: 256, 512, 1024, 2048 или 4096 семплов. Конкретное значение длительности блока определяется кодером в зависимости от нужного
битрейта и сложности материала - чем больше блок, тем эффективнее сжатие, но хуже качество звука. На больших битрейтах (с которыми в
основном и приходится иметь дело в нашем случае) размер блока, как правило, не превышает 1024 семплов. Затем в каждом блоке происходит
разбиение на 32 равные частотные полосы, причем для этой задачи могут применяться два типа фильтров. Первый тип - non-perfect
reconstructing (NPR) - использует фильтры с более крутой характеристикой (соответственно, обеспечивается лучшее разделение
между соседними частотными полосами), и сжатие информации в данном случае происходит более эффективно. Однако при декодировании такой
тип фильтров не позволяет точно восстановить исходный материал, что, естественно, сказывается на качестве звучания. Во втором типе -
perfect reconstructing (PR) - фильтры более пологие, и информация в двух соседних частотных полосах перекрывается сильнее. В этом случае
сжатие менее эффективно, зато при декодировании использование такого типа фильтров позволяет точно восстановить исходный материал. Какой
из этих двух типов будет применен в каждом конкретном блоке, кодер решает "по обстоятельствам" и включает информацию о типе фильтров в
поток данных DTS, чтобы декодер впоследствии мог правильно раскодировать материал. На высоких битрейтах, как правило, используется второй тип фильтров.
Затем в каждой частотной полосе происходит ADPCM-сжатие, построенное по такому же принципу, что и в apt-X100. Однако в
Coherent Acoustics сжимаются не все частотные полосы подряд и с одинаковой степенью, как в случае с apt-X100. Перед стадией
ADPCM-кодирования звук анализируется кодером и, в соответствии с заданной психоакустической моделью, определяются необходимость и
степень (количество выделенных битов) ADPCM-сжатия. При этом в поток данных включается информация для декодера о том, было ли
использовано сжатие или нет. Такая техника позволяет совершенствовать психоакустическую модель (и, соответственно, качество кодирования) без смены парка декодеров.
Для улучшения передачи транзиентных сигналов в Coherent Acoustics применяется детектор быстрой смены громкости звука (детектирование
применяется для каждой частотной полосы отдельно). Если кодер замечает транзиентный сигнал, то он вычисляет коэффициент громкости
и расположение такого сигнала в блоке, и эти данные передаются в потоке DTS-декодеру. Используя эту информацию, декодер может
восстановить исходный транзиентный сигнал более качественно.
В Coherent Acoustics используются также алгоритмы распределения доступной пропускной способности между каналами (тот канал, который
считается кодером вносящим больше значимой звуковой информации в общую картину, получает больший "кусок", а для малозначительного, с
точки зрения кодера, канала отводится меньший), однако эти алгоритмы не такие изощренные, как в Dolby Digital, и используются в гораздо
меньшей степени. На низких битрейтах допускается объединение высоких частот (так же, как и в Dolby Digital), но к DTS на CD, LD и DVD это
не относится. В Coherent Acoustics предусмотрено использование метаданных, управляющих автоматическим микшированием и динамическим
диапазоном фонограммы, однако из-за недостатка инструментария для работы с метаданными они в настоящее время практически не используются.
DTS-звук записывается на CD и LD с битрейтом 1235 Кбит/с, степень сжатия при этом варьируется от 2,9:1 (если использовался 16-битный
исходный материал) до 4,3:1 (при 24-битных исходниках). На DVD, из-за использования рабочей частоты дискретизации 48 кГц, битрейт
возрастает до 1509 Кбит/с. В DTS предусмотрен также уменьшенный битрейт для DVD (он может использоваться, например, для
дополнительной звуковой дорожки) - 754 Кбит/с, естественно, качество звука при таком битрейте ухудшается.
Для мониторинга и кодирования DTS-звука (не для кино) компания выпускает два прибора: CAE 4 (кодер) и CAD 4 (декодер). Кодирование
в DTS может осуществляться также рядом программных средств, например, программой SurCode компании Minnetoka Audio или специальным подключаемым модулем для Pro Tools.
DTS-ES
Естественно, компания DTS не смогла не ответить на выход системы Dolby Surround EX и создала
систему DTS-ES. В исполнении для кинотеатров (а это лишь небольшая насадка на существующие кинопроцессоры) способ получения
дополнительного шестого канала такой же, как и в Surround EX - матричное кодирование в левый и правый surround-каналы (кстати,
аббревиатуры EX и ES означают одно и то же - Extended Surround). Однако для декодеров, применяющихся в домашних кинотеатрах, DTS
предусмотрела еще один режим - с независимым шестым каналом. Эти два режима называются, соответственно, DTS ES 6.1 Matrix и DTS ES 6.1
Discrete. Еще раз повторюсь, что в кинотеатрах (из-за особенностей примененного алгоритма сжатия) возможен только матричный способ.
Одновременно DTS представила систему NEO 6 (в пику Pro Logic II), которая предназначена для "разворачивания" полноценного (насколько
это возможно) 5-6-канального окружающего звука из старых стереофонограмм (в том числе чисто музыкальных) и фонограмм Dolby
Stereo. Естественно, NEO 6 применяется только в домашних кинотеатрах.
Качество звучания различных форматов
По поводу качества звучания различных форматов единого мнения в настоящее время не существует. В области бытовых носителей
идет речь, в основном, о сравнении Dolby Digital и DTS. К сожалению, сравнить качество звука напрямую (прослушивая одну
и ту же фонограмму, закодированную в разных форматах) практически невозможно. Во-первых, потому, что для одного и
того же фильма (даже на одном DVD) исходники для изготовления фонограмм DTS и Dolby Digital чаще всего разные. Обычно
многоканальную фонограмму немного "подстраивают" под конкретный кодек, чтобы максимально использовать его
преимущества и скрыть недостатки. Если же "подстройки" не происходит, то возможна ситуация, когда одна фонограмма при
прочих равных звучит лучше в DTS, а другая - в Dolby Digital. Кроме того, многое зависит от мастерства человека,
закодировавшего звук. Если в кодерах DTS практически нет управляемых оператором параметров (кроме битрейта и количества
каналов), то кодирование в Dolby Digital довольно тонкий процесс, позволяющий оператору динамически управлять,
например, громкостью центрального канала (с помощью метаданных). И в этом случае слушатель может предпочесть один
кодек другому только из соображений громкости (или разборчивости), а не общего качества звучания. Делать выводы,
исходя только из битрейта, тоже некорректно - мы ведь имеем дело с разными алгоритмами (после изучения документации обеих
фирм у меня лично сложилось впечатление, что DTS берет "числом", - высокие битрейты, довольно простые алгоритмы, а
Dolby - "умением", все-таки, если при в три раза меньшем битрейте, по сравнению с конкурентами, нет единого мнения о
превосходстве одного из форматов, это кое о чем говорит). В общем, однозначного выбора не существует, хотя для чисто
музыкальных фонограмм предпочтение, в большинстве случаев, отдается DTS (правда, это может быть вызвано и активным
продвижением DTS своего кодека на музыкальный рынок, в то время как Dolby в своей маркетинговой политике больше ориентируется на кино).
В связи с обсуждением сравнительного качества звучания разных форматов интересна история о "ссоре" Dolby и DTS. Все
происходит довольно тихо, компании просто периодически выкладывают на свои сайты PDF-файлы с контраргументами
(кстати, спор этот не закончен до сих пор). Началось все с того, что фирма Dolby, недовольная сложившейся ситуацией,
когда для кодирования "чистой" музыки ее кодек обычно даже и не рассматривается (кстати, это действительно несколько
несправедливо и является следствием маркетинговой политики обоих участников), решила провести собственное тестирование.
Dolby приобрела кодер и декодер от DTS и провела сравнение субъективного качества звука на одном и том же оборудовании и
на одном материале со своими кодером и декодером ("при участии квалифицированных экспертов"). Как и следовало ожидать,
большая часть экспертов предпочла Dolby Digital. DTS такие результаты, естественно, не удовлетворили, и она представила
свои аргументы, почему результатам этих тестов доверять нельзя (досталось и "квалифицированным экспертам"). Dolby не
замедлила объяснить, почему аргументы DTS некорректны. И так далее. В общем, пока не будет квалифицированного независимого
тестирования, этот спор, похоже, продолжится до бесконечности. К сожалению, пока ни одна из фирм-конкурентов по каким-то
своим причинам не идет на проведение независимого теста.
|
DTS 96/24
Весной 2001 года компания DTS представила новое поколение своей системы сжатия звука, названной DTS 96/24 (она основана на Coherent
Acoustics и, соответственно, предназначена для бытовых носителей, в основном для DVD). Как следует из названия, эта система позволяет
кодировать многоканальный звук с частотой дискретизации 96 кГц и разрядностью 24 бит (последнее, впрочем, было возможно и в более
ранних версиях DTS). Предполагается, что новая система найдет свое место на дисках DVD-Audio в качестве дополнительной фонограммы.
Звук, закодированный в DTS 96/24, предполагается размещать в видеозону DVD и, таким образом, он может быть прослушан практически
на любом DVD-проигрывателе (при наличии DTS-декодера). А несжатый PCM-звук располагается в аудиозоне диска, она "видна" только
специальным проигрывателям для DVD-Audio, которые пока еще не слишком распространены. Особенностью системы DTS 96/24 является то,
что она полностью обратно совместима со старыми версиями DTS. То есть фонограмма, закодированная в DTS 96/24, может быть
раскодирована и предыдущими поколениями DTS-декодеров (правда, только с частотой дискретизации 48 кГц, вся "ультразвуковая"
составляющая сигнала теряется). Это стало возможным благодаря самой природе алгоритма Coherent Acoustics - первые 32 частотные полосы
передаются в DTS-потоке как обычно, а дополнительная информация о частотах от 24 до 48 кГц кодируется в дополнительные частотные
полосы, которые не "видят" декодеры предыдущих поколений, но зато могут использовать новые модели. Пока декодеры (равно как и диски)
DTS 96/24 еще не появились на рынке, однако новый формат в силу своей совместимости с имеющимся парком оборудования (а это и
проигрыватели DVD-Video, и декодеры) имеет все шансы в ближайшем будущем стать довольно популярным.
SDDS
Система SDDS (Sony Dynamic Digital Sound) была представлена в 1993 году с фильмом Last Action Hero (Последний киногерой). SDDS доступна
только для кинопленки, и это принципиальная позиция Sony - адаптации системы для DVD и прочих бытовых носителей не предвидится, поэтому мы рассмотрим ее лишь
вкратце. Физически SDDS размещается на кинопленке между ее краем и перфорациями. Информация записывается посредством пикселей, причем
эти пиксели имеют меньший размер по сравнению с Dolby Digital. По этой причине, а также из-за того, что SDDS записывается по всей
длине пленки (а не только между перфорациями), достигается довольно большой поток данных - до 1235 Кбит/с (степень сжатия около 5:1).
Схема физического расположения различных форматов на кинопленке. Как видно, Dolby Digital, DTS и SDDS вполне могут сосуществовать на одной прокатной
копии фильма.
В SDDS можно закодировать до восьми независимых звуковых каналов (семь полнодиапазонных и один низкочастотный), два дополнительных
громкоговорителя при этом располагаются за киноэкраном между центральным и левым-правым (так же, как и в системе Todd-AO). По
этой причине SDDS нашла широкое применение в больших широкоэкранных кинотеатрах (которые в последнее время опять начали набирать
популярность). Естественно, в этой системе тоже теоретически возможно закодировать матричным способом дополнительный (девятый по
счету) центральный канал эффектов (так же, как в Dolby Surround EX или DTS ES). Как утверждает Sony, работы в этом плане ведутся,
однако готовый стандарт пока еще не вышел в свет (соответственно, нет и необходимого оборудования).
Схема расположения громкоговорителей в кинотеатре, оборудованном для воспроизведения звука в формате SDDS.
В SDDS используется система сжатия ATRAC (Adaptive TRansform Acoustic Coding), хорошо известная нам по минидискам той же Sony.
Основная рабочая частота дискретизации ATRAC (как для кино, так и для минидиска) - 44,1 кГц. Кодирование в ATRAC построено примерно по
тем же принципам, что и в AC-3 или Coherent Acoustics, то есть звуковой поток разбивается на блоки по времени, а затем по частоте,
после чего с применением психоакустической модели "отсекаются" лишние для нашего слуха, по мнению кодера, данные. Временные блоки в
ATRAC не имеют фиксированного значения, а варьируются кодером в пределах от 1,45 до 11,6 мс, что позволяет качественно кодировать
быстрые транзиентные сигналы. Количество частотных полос - 52. ATRAC со времени своего представления широкой публике постоянно
совершенствовался, и последние версии этого кодека звучат довольно хорошо (в том числе и на чисто музыкальном материале).
Для обеспечения надежности воспроизведения в SDDS предусмотрены три уровня "защиты": все-таки самый край пленки за перфорациями - не
лучшее место на кинопленке для записи звука. Во-первых, это мощная система коррекции ошибок, способная исправить небольшие выпадения в
считываемом цифровом потоке. Во-вторых - дублирование звуковой дорожки (SDDS записывается по обоим краям пленки, так что если
возникают проблемы со считыванием звука с одной стороны, декодер начинает считывать информацию с другой). Ну и в-третьих - если ничто
не помогает, и цифровой звук не может быть считан с кинопленки, декодер переходит на аналоговую звуковую дорожку. Таким образом,
SDDS в настоящее время является одним из самых "продвинутых" форматов, сочетающим в себе высокое качество звука, большое
количество доступных каналов, "пуленепробиваемую" надежность воспроизведения и простоту производства прокатных копий. Однако все
это доступно только в кинотеатрах, да и то за пределами нашей страны.
Заключение
Собственно, мы рассмотрели практически все форматы сжатого цифрового многоканального звука для
кинотеатров (в том числе и домашних). За рамками этой статьи остались малораспространенные специализированные форматы (типа
панорамного IMAX с его десятью каналами звука), но это уже совсем экзотика. Я надеюсь, что технологии окружающего звука постепенно
будут находить все большее распространение в нашей стране. И тогда эта статья поможет вам использовать многоканальный звук не
"вслепую", а понимая механизмы работы выбранного формата.
Часть [1] [2] [3] [4]
Антон БАЛАБАН
Музыкальное Оборудование
|