Антон БАЛАБАНМузыкальное Оборудование
март 2002
История и современность.Окружающий звук (он же объемный, он же surround) в настоящее время стремительно распространяется по планете. Он используется в кино, на видео и DVD, на презентациях, в просто музыкальных записях, и даже на телевидении. Слушателям он сулит новые ощущения, музыкальным лейблам - переиздание старых записей в новом формате, музыкантам - новые способы выразить себя, а звукозаписывающим студиям - переоборудование и приток клиентов. В общем, окружающий звук нужен и выгоден многим. Однако с его производством (особенно при ограниченном бюджете) все еще связано немало проблем, также ряд сложностей возникает на пути доставки многоканального звука слушателям. Форматы DVD Audio и Super Audio CD, которые позволяют записать шестиканальный (или более) звук в несжатом виде, пока еще не завоевали широкой популярности, так что сейчас неизбежным является использование одного из способов сжатия звуковых данных, адаптированных для surround-фонограмм. Все эти способы сжатия пришли к нам из кино, так что, предваряя рассказ о современных цифровых способах кодирования многоканального звука, хотелось бы немного отвлечься и рассказать об истории развития окружающего звука.
А начиналось все в 1941 году, когда вышел фильм студии Диснея "Fantasia". От моно создатели картины прыгнули сразу к трем каналам звука: левому, правому и центральному. Формат записи был назван "Fantasound", и по тем временам это было нечто невиданное - ведь и моно звук в кино появился совсем недавно, а тут сразу три независимых канала, которые записывались на кинопленку оптическим способом. Но трудности производства подобного рода фонограмм (тогда в Америке еще не было магнитофонов, да и другая звукозаписывающая техника была в зачаточном состоянии), сложная и дорогая система воспроизведения и начавшаяся Вторая Мировая война остановили проникновение многоканального звука в киноиндустрию более чем на десять лет.
[attachmentid=69]
Появление коммерчески успешных форматов стереозвука в кинопроизводстве было обусловлено развитием в США магнитной звукозаписи. Первые ленточные магнитофоны были привезены в качестве трофеев из побежденной Германии (в русском языке слово "магнитофон" также обязано своим появлением названию одной из немецких моделей этого устройства - Magnetofon), и вскоре фирма Ampex выпустила американский аппарат для записи на ленту Ampex Model 200, являвшийся копией немецкого AEG Model K-4 Magnetofon. Магнитная запись стремительно развивалась, вскоре появился многодорожечный магнитофон, изобретенный легендарным гитаристом Лес Полом (немного ранее этот разносторонний музыкант придумал электрогитару, да и использовать монофонические магнитофоны для записи музыки в США начал именно он). Первые форматы окружающего звука были основаны именно на магнитной записи (вместо старой оптической монодорожки) - прямо на кинопленку наносился магнитный слой, на который записывалось звуковое сопровождение к фильмам. Кинопроекторы оснащались магнитофонными головками для снятия этого звука. В те годы киноиндустрия США процветала, и публике был представлен новый широкоэкранный кинематограф (использовавший пленку шириной 70 мм вместо обычных 35), а в дополнение к громадным широким экранам требовалась соответствующая звуковая картина. Тогда существовали два основных формата: Cinemascope, разработанный компанией 20th Century Fox для 35-мм пленки (четыре канала - левый, центральный, правый и surround-канал, который воспроизводился с боков и позади зрителя, первый фильм - The Robe, 1953 год) и Todd-AO для широкоформатной 70-мм кинопленки (шесть каналов - левый, дополнительный левый, центральный, дополнительный правый, правый и surround-канал, первый фильм - Oklahoma!, 1955 год). Необходимость центрального канала обусловлена большими размерами киноэкрана и тем, что зрители сидят не только по центру зала, - если использовать только два громкоговорителя (левый и правый), то диалоги актеров для зрителя, сидящего в боковой части зала, будут звучать не посередине экрана, где обычно и происходит основное действие, а сбоку, так как ближайший громкоговоритель будет слышен лучше всего. Поэтому всю речь героев фильма обычно располагают в центральном канале, иногда его так и называют - канал диалогов. А для огромных широкоформатных (70 мм) кинотеатров потребовалось установить за экраном аж пять независимых громкоговорителей, чтобы обеспечить равномерное распределение звука для всех зрителей в зале.
[attachmentid=70]
Схема расположения громкоговорителей в кинотеатре, оборудованном для воспроизведения звука в формате Cinemascope, Dolby Stereo или Dolby SR.[attachmentid=71]
Схема расположения громкоговорителей в кинотеатре, оборудованном для воспроизведения звука в формате ToddAO.Параллельно возникали и другие форматы, не нашедшие широкого распространения. Например, VistaVision, в котором на монофоническую оптическую дорожку записывались специальные управляющие сигналы (30, 35 и 40 Гц), под воздействием которых декодер переключал монозвук на центральный, левый или правый громкоговорители. Это было, конечно, не стерео, но обеспечить, например, выстрел или взрыв справа от зрителя с помощью VistaVision было возможно.
Справедливости ради необходимо отметить, что звуковая картина и в системе Cinemascope, и в системе Todd-AO сильно отличалась от того, что мы слышим в современных фильмах (хотя количество звуковых каналов практически такое же). Дело в том, что звукозаписывающая техника тогда была на начальной стадии своего развития, многодорожечных магнитофонов и сложных микшерных пультов еще не было, да и магнитные дорожки на кинопленке ощутимо шипели, что сокращало доступный звукоинженерам динамический диапазон. Поэтому создание сложных спецэффектов было просто технически невозможным, к тому же "идеология" кинозвука была отличной от нынешней - головокружительные звуковые трюки не были тогда важной частью фильма, и их влияние на аудиторию еще не было оценено. Распространение этих форматов тоже не было повсеместным - оснащение кинотеатров нужным оборудованием стоило недешево, и его могли позволить себе только крупные, успешные залы.
Форматы с магнитной записью звука на пленку просуществовали до середины 70-х годов, когда на сцену вышла фирма Dolby. Dolby заработала известность своими системами шумопонижения, появившимся в 1970 году: Dolby B, которая используется в бытовых магнитофонах, и Dolby A - более сложная и эффективная система, применяющаяся и по сей день в профессиональной звукозаписи. Не удовлетворившись успехом в области обычной звукозаписи, основатель фирмы Рей Долби устремил свои взоры на звук для кинофильмов. Уже в 1971 году появился первый фильм (A Clockwork Orange - Заводной апельсин), звук для которого был записан с применением шумопонижения Dolby A, заметно расширившего динамический диапазон. А в 1974 году была представлена технология Dolby Stereo, использующаяся в большинстве фильмов и поныне. Взамен магнитных звуковых дорожек, которые довольно сильно шумели и со временем изнашивались, фирма Dolby предложила использовать старую добрую оптическую дорожку, но уже с двумя каналами звука. Эти две дорожки расположены там же, где и старая монодорожка (которую продолжали использовать для совместимости со старыми кинопроекторами), и поэтому фонограмма могла быть считана любым киноаппаратом если не в стерео, то хотя бы в моноварианте. Для уменьшения шумов на оптических дорожках использовалась система шумоподавления Dolby A.
Однако очевидно, что двух каналов звука для киноиндустрии было мало, поэтому в системе Dolby Stereo было применено матричное кодирование - четыре канала звука (левый, правый, центральный и surround-канал эффектов) "загонялись" в две аналоговые оптические дорожки. Левый и правый каналы (Lt и Rt, так принято обозначать два канала звука, закодированного матричным способом) подаются в финальную фонограмму Dolby Stereo неизменными. Канал эффектов делится на две части, одна часть поворачивается по фазе на +90 градусов, другая - на -90 градусов (или одна на 180 градусов, другая же не изменяется), и каждая из частей подмешивается в Lt и Rt соответственно. Перед этой операцией у канала эффектов отрезаются все частоты выше 7 кГц и ниже 100 Гц, также он обрабатывается системой шумопонижения. Центральный же канал с пониженным на 3 дБ уровнем в равной пропорции подмешивается в Lt и Rt. Таким образом, кодирование в Dolby Stereo - довольно простая операция, которую несложно провести даже на обычном микшерном пульте, а вот с обратным преобразованием в четыре канала звука дело обстоит несколько сложнее.
Цитата
Стерео
Термин "стерео" (от греческого stereos - пространственный, объемный), в настоящее время ассоциирующийся с двумя каналами, изначально имел более широкий смысл. Например, первые эксперименты с объемным звучанием в Bell Labs в тридцатые годы прошлого столетия проводились с тремя каналами, окружающий звук в кино (даже если там использовалось шесть дорожек) тоже долгое время назывался стерео, в общем, стерео называли все, что обеспечивало пространственность воспроизводимой фонограмме (все, что не моно). Ассоциация слова "стерео" именно с двухканальными фонограммами была вызвана тем, что первые стереопластинки были именно с двумя каналами (больше просто не позволяла технология того времени), и появившееся в 1961 году стереофоническое FM-радиовещание также было двухканальным (впрочем, вещали они с тех же стереопластинок). Однако в кинопроизводстве еще долго пользовались термином "стерео" для названия многоканальной фонограммы к фильмам, даже четырехканальная система Dolby, вышедшая в 1976 году, называлась Dolby Stereo. Термин "surround sound" был придуман, когда многоканальные фонограммы к фильмам стали проигрываться в домашних условиях (с помощью стереофонических видеомагнитофонов и декодера Dolby Surround). Так как у широкой публики к тому времени слово "стерео" прочно ассоциировалось с двумя каналами, а для продвижения технологии на рынок уже в названии должно было быть нечто особенное, ранее не виданное, этим особенным и стало словосочетание "surround sound".
При декодировании Lt и Rt, как правило, подаются неизменными (почему "как правило" - см. далее) на левый и правый громкоговорители. Канал эффектов получается вычитанием (путем переворота фазы) Rt из Lt, такой же фильтрацией всего, что выше 7 кГц и ниже 100 Гц, обработкой системой шумопонижения, и после небольшой задержки (величина задержки настраивается для конкретного помещения, обычно составляет 20-100 мс) подается в surround-громкоговорители. Задержка нужна для того, чтобы добиться большего субъективного разделения между фронтальными и surround-каналом. Здесь используется эффект Хааса - если один сигнал приходит чуть позже и звучит чуть громче другого, то "другой" маскируется, и мы его практически не слышим. Поэтому, хотя звук из канала эффектов присутствует и в левом, и в правом громкоговорителях (хоть и с повернутой фазой), мы слышим эффекты именно сзади. Задержка также помогает в больших кинозалах. Часто эхо (или реверберация) от какого-то сигнала, записанного в одном из фронтальных каналов, находится в канале эффектов. Поэтому зрители на задних рядах из-за большого расстояния до экрана могут оказаться в такой ситуации, когда они слышат сначала эхо, а уже потом основной сигнал. Задержка в канале эффектов, настроенная на конкретную акустику помещения, позволяет решить эту проблему.
С центральным же каналом все не так просто. В принципе он получается из сложения Lt и Rt с последующим поднятием уровня на 3 дБ. Но при этом, например, когда звучат только диалоги, звук центрального канала будет раздаваться также и из левого и правого, причем всего на 3 дБ тише. Чтобы улучшить разделение каналов в Dolby Stereo применяются несколько логических схем - для разных звуковых ситуаций. Когда звучат только диалоги из центрального канала, декодер для улучшения локализации понижает уровень в левом и правом. Однако, если голоса звучат одновременно с музыкой, такая технология дает неудовлетворительный результат - во время диалога музыка слышна плохо и "выпрыгивает" в паузах между фразами. Для примирения диалогов и музыки декодер к левому каналу подмешивает правый в противофазе, и наоборот, к правому - левый; соответственно, звук, содержащийся в центральном канале, вычитается из левого и правого. Таким образом, получается, что во время диалогов музыка звучит практически в моноварианте (точнее, воспроизводится только S-составляющая стереосигнала), а левый и правый каналы находятся в противофазе. Техника заглушения соседних каналов применяется не только в работе с диалогами, но и в других случаях. Очень часто в фонограммах к фильмам бывает, что один из звуков является доминантным, то есть все внимание слушателя поглощается именно им, - например, это может быть взрыв, выстрел или другой спецэффект. Когда декодеру удается распознать такой доминантный сигнал (причем, он может быть не только жестко панорамирован в какой-то канал, но и находиться между громкоговорителями), он приглушает соседние каналы, чтобы усилить направленность эффекта. Иногда же, например, в сценах, когда вокруг идет дождь и четкая локализация источников не важна, декодер отключает свои хитроумные логические схемы и раскодирует звук пассивно.
Естественно, обеспечить правильное применение каждого из этих режимов довольно сложно, и Dolby не сразу удалось обеспечить должное разделение каналов. Но фирма постоянно совершенствовала алгоритмы и кинопроцессоры, так что довольно скоро качество кинозвука в новом формате достигло высокого уровня.
Из-за такой системы кодирования сведение фонограмм в Dolby Stereo невозможно без мониторинга через цепочку кодер-декодер. Если этого не сделать, то в кинотеатре (в домашнем, в частности) фонограмма будет звучать совершенно непохоже на то, что вы слышали в студии - некоторые инструменты в музыке могут "провалиться" или уйти в канал эффектов, а выразительные эффекты могут оказаться непонятным "побулькиванием". Матричную природу кодирования нужно учитывать и для моносовместимости фонограммы - например, канал эффектов в моно полностью пропадает (так как он находится в Lt и Rt в противофазе), поэтому в него не следует помещать какой-то важной для восприятия картины звуковой информации. Для мониторинга можно использовать внешний кодер и декодер (в настоящее время выпускаются кодер SEU 4 и декодер SDU 4) или подключаемые модули для Pro Tools производства Dolby.
После выхода в 1976 году фильма Джорджа Лукаса "Звездные войны", продемонстрировавшего потрясающие звуковые и визуальные эффекты, формат Dolby Stereo довольно быстро распространился, что было обусловлено, среди прочего, неважным состоянием киноиндустрии в то время. Телевидение уже пришло в каждый американский дом, и зрители не особенно ходили в кинотеатры, ведь все те же фильмы можно было увидеть через некоторое время у себя в гостиной. Соответственно, поток денег в кино постоянно снижался, при том, что производство прокатных копий фильмов по технологиям, использующим магнитную запись на кинопленке, было очень сложным и дорогим. Производство прокатных копий по старой технологии состояло из трех этапов: сначала пленку проявляли, затем на нее наносились магнитные дорожки, а уже потом на ленту записывался звук (в реальном времени). Все это стоило очень дорого - в 5-8 раз дороже простой печати фильма с монозвуком. Оптическая же дорожка Dolby Stereo упростила производство до предела - звук печатается вместе с изображением, и все.
Еще одна причина успеха - применение звукового кинопроцессора. Для переоборудования кинотеатра под Dolby Stereo, при условии наличия нужного количества громкоговорителей, требовалось лишь обеспечить считывание стереофонической оптической дорожки с кинопленки и подключить к выходу с этой дорожки процессор, а он уже выполнял все функции декодирования и управления звуком в кинотеатре. До появления таких кинопроцессоров для переоборудования кинотеатра под какой-либо новый звуковой формат требовалось приобретать множество разных приборов, дорогих, да к тому же сложных в установке и эксплуатации. Один из первых кинопроцессоров, Dolby CP 100, кроме звука Dolby Stereo мог еще работать и со старыми магнитными аудиоформатами, чем облегчал кинотеатрам переход на новый стандарт.
Чтобы обеспечить высокий уровень качества кинопродукции, выпускаемой с логотипом Dolby, фирма ввела строгую сертификацию кинотеатров, звукозаписывающих студий и собственно фильмов. Ведь даже двухканальная фонограмма, воспроизведенная в разных помещениях и с разных громкоговорителей, звучит по-разному (изменяется общий частотный баланс, а также положение кажущихся источников звука), что уж тут говорить о четырехканальном окружающем звуке, закодированном матричным способом. Поэтому сертификация, для получения которой кинотеатр должен был обеспечить достаточно высокое качество звуковоспроизводящей аппаратуры, нужное звуковое давление во всех точках зала и хорошую акустику помещения, помогла сделать звучание фильма примерно одинаковым во всех сертифицированных кинотеатрах. Сертификация студий звукозаписи необходима для того, чтобы звук, сделанный в этой студии и слышимый режиссером, был таким же, как и в кинотеатрах. Для студий требования примерно такие же, как и для кинотеатров - наличие микшерного пульта с surround-панорамированием, правильная акустика аппаратной, наличие кинопроектора и большого экрана (что автоматически требовало помещения соответствующих размеров), линейность звуковоспроизводящего тракта и обеспечение заданного уровня звукового давления в точке прослушивания. Такая сертификация и рекламная кампания сделали логотип Dolby приманкой для зрителя, который знал, что, придя в кинотеатр, носящий такой логотип, он услышит высокое качество окружающего звука и получит зрелище, недостижимое в домашних условиях. Именно с широким распространением Dolby Stereo связывают расцвет киноиндустрии, произошедший в начале восьмидесятых.
Наряду с внедрением Dolby Stereo компания усовершенствовала звук и для широкоэкранного кино. Способ записи был тот же, на магнитную полосу на 70-мм кинопленке, но теперь уже с шумопонижением Dolby A. Кроме того, шестиканальный формат Todd-AO был модифицирован: две из пяти фронтальных дорожек (а именно левая и правая дополнительные) были убраны, так как время гигантских киноэкранов уже прошло, и вполне хватало одного центрального канала, а место удаленных занимали теперь два канала низкочастотных эффектов. Применение низкочастотных каналов для специальных "громоподобных" эффектов было продемонстрировано впервые, такая инновация была хорошо воспринята индустрией и используется по сей день. С тех пор в обозначении формата канал LFE (Low Frequency Effects) из-за ограниченного частотного диапазона (не выше 300 Гц, обычно до 125 Гц) принято писать через точку, например, 5.1. В 1978 году формат был еще раз модифицирован: теперь surround-каналов стало два, левый и правый, и, таким образом, этот формат звука на 70-мм кинопленке стал предвестником современного окружающего звука, построенного по схеме 5.1. Первой картиной, выпущенной в этом обновленном звуковом формате (он был назван Dolby Stereo 70mm), стала Apocalypse Now (Апокалипсис сегодня) Френсиса Копполы, но, в связи с закатом популярности широкоэкранного кино, фильмов с новым типом фонограммы вышло немного.
[attachmentid=72]
Схема расположения громкоговорителей в кинотеатре, оборудованном для воспроизведения звука в формате Dolby Stereo 70mm.В начале восьмидесятых стало бурно развиваться домашнее видео, сначала с моно-, а затем и со стереозвуком, в 1980-м появился лазерный видеодиск (Laser Disc). К тому времени уже получили широкое распространение домашние стереосистемы класса Hi-Fi, и в 1982 году Dolby представила домашний декодер для окружающего звука. Сначала этот декодер (для потребителей он был назван Dolby Surround) мог декодировать только три канала - левый, правый и surround, так как в нем использовался пассивный декодер без логических функций. Для большей части зрителей этого было достаточно, так как при небольшом экране телевизора вполне хватало "фантомного" центра, который обеспечивали левый и правый громкоговорители. В связи с распространением телевизоров с большой диагональю (27-32 дюйма), с которыми "фантомный" центр уже не удовлетворял пользователей, в 1987 году был представлен Dolby Surround Pro Logic, способный извлекать из двухканальной фонограммы на видеокассете все четыре дорожки окружающего звука. С этого момента "домашние кинотеатры" стали стремительно завоевывать рынок, и из предметов роскоши превратились в обычное явление.
В 1986 году Dolby представила новый аналоговый формат записи звука на кинопленку - Dolby SR (Spectral Recording). От обычного Dolby Stereo он отличался только применением новой системы шумоподавления (SR), в два раза более эффективной, чем Dolby A. Благодаря этому динамический диапазон звуковой дорожки к фильмам увеличился, но все еще применялся матричный способ кодирования. В настоящее время большая часть фильмов выходит со звуком в Dolby SR (наряду с одним или несколькими цифровыми форматами), кроме того, эта система шумоподавления до сих пор используется в профессиональной аналоговой звукозаписи и послужила основой для Dolby S, которая применяется в кассетных магнитофонах.
Девяностые годы характеризуются развитием цифровых технологий, и киноиндустрия не стояла в стороне. Первым на ниве доставки в кинотеатры цифрового звука стал формат Cinema Digital Sound (CDS), разработанный компанией Optical Radiation Corporation совместно с Eastman Kodak. Дорожка цифрового звука в этом формате помещалась вместо аналоговой, а роль бит выполняли мельчайшие точки (пикселы) на кинопленке. Размер этих точек был очень мал, так как формат разрабатывался при поддержке фирмы Kodak, которая создала для CDS специальную кинопленку. Благодаря малому размеру пикселов и тому, что они были расположены по всей длине кинопленки, на цифровую дорожку удалось "втиснуть" шесть (а, точнее, 5.1) каналов звука с разрешением 12 бит (правда, эти биты были не линейные, как на компакт-диске, а логарифмические, то есть квантование звука было более адаптировано к особенностям человеческого слуха, что делало динамический диапазон записи в таком формате практически равным "обычным", линейным 16-ти битам). В CDS, в отличие от всех современных цифровых форматов, применялось сжатие данных без потерь, то есть звуковые данные на выходе декодера были идентичны данным на входе кодера. Но, несмотря на то, что этот формат был достаточно "продвинутым" для своего времени (например, там применялась схема обнаружения и коррекции ошибок), особого успеха он не снискал, и в нем успело выйти всего несколько фильмов. Причина этому - полный отказ от аналоговой оптической дорожки. Из-за того, что она была вытеснена цифровой, CDS остался без подстраховки, и когда цифровая дорожка давала сбой (что случалось, в том числе, из-за малого размера пикселей), то, в лучшем случае, в зале воцарялась тишина. Отсутствие аналоговой дорожки также требовало изготовления специальных прокатных копий для цифровых кинотеатров, что было накладно и неудобно.
[attachmentid=73]
Схема расположения громкоговорителей в кинотеатре, оборудованном для воспроизведения звука в формате Dolby Digital, DTS или CDS.На этом историческая часть данного обзора заканчивается, и мы приступаем к более детальному рассмотрению современных цифровых форматов многоканального звука. Все они используют сжатие цифровых потоков, причем сжатие с потерями. То есть звук после кодирования-раскодирования уже не идентичен исходному. Хотя изначально разрабатывались эти форматы именно для кинопленки, они нашли применение и в других областях, например, в вещании, DVD или компьютерных играх (исключение тут составляет лишь SDDS). Начнем же мы рассмотрение с самого распространенного формата - Dolby Digital.