Dolby Stereo
В середине 1970-х Dolby Laboratories разработала технологию объемного звучания для кинопленок формата 35 мм, получившую впоследствии название Dolby Stereo. В отличие от предыдущих систем звука, использующих в качестве носителей звука магнитные дорожки, новая технология предполагала использование оптических дорожек (фото-дорожек) и фотоэлементов вместо магнитных головок. Кинопленки с такими дорожками существовали еще на заре кинематографа, в 30-х годах. На пленке размещалась всего одна дорожка и традиционно она использовалась для передачи монофонического звука. Чтобы обеспечить совместимость стереофонической пленки с монофоническими проекторами, необходимо было разместить две стерео дорожки на том же пространстве, которое раньше занимала одна. Эксперименты показали, что это возможно, если звуковой сигнал перед записью обработать процессором Dolby A-type Noise Reduction. Однако разместить на этом же пространстве более двух звуковых дорожек оказалось невозможным: даже с использованием шумопонижения Dolby уровень шума увеличивался до неприемлемых значений.
Dolby Surround
Экраны кинозалов к 80-м годам стали огромными. Кроме традиционных правой и левой акустических систем потребовалась третья, центральная, чтобы обеспечить пространственное восприятие для зрителей, сидящих не в центральной части зала. Кроме того, в киноиндустрии термины «stereo» и «surround» с самого начала были синонимами. Следовательно, для кинозала, анонсирующего стереозвук, обязательно требовался четвертый канал - surround channel. Так сформировалась традиционная схема объемного звука в кино: четыре канала - левый (Left, L), правый (Right, R), центральный (Center, C) и пространственный (Surround, S). В распоряжении разработчиков было только два физических канала, в которых необходимо было передать четыре.
Приемлемым решением оказалась матричная технология, первоначально разработанная для домашних систем квадро. Принципиальных изменения было внесено два. Первое - расположение акустических систем и, следовательно, назначение каналов соответствовали теперь уже традиционной схеме для кинематографа - L,C,R,S. Второе - была серьезно усовершенствована схема аналогового декодера (процессора), в нем были реализованы более интеллектуальные алгоритмы. Так появилась технология Dolby Surround.
Сегодня формат Dolby Stereo Optical является стандартом пространственного звука для полноэкранного кино. Он используется повсеместно, процессорами Dolby оборудованы десятки тысяч кинотеатров во всем мире. Даже теперь, с появлением цифрового формата Dolby Digital, на кинопленках остаются две аналоговых оптических дорожки Dolby Surround - для обеспечения совместимости со всеми существующими проекторами.
В Dolby Surround кодируется звуковое сопровождение вещательного телевидения, причем не только художественных фильмов, но музыкальных, спортивных передач и даже новостей. Dolby Surround используется и в областях, не связанных с видео - например, звукозаписывающие компании RCA Victor, BMG Classic, Concord Jazz выпустили на рынок CD и аудиокассеты с музыкальными записями в Dolby. Многими разработчиками ведутся успешные эксперименты по внедрению Dolby Surround в видеоигры и другие мультимедийные приложения. Другими словами, системы объемного звука Surround Sound стали традиционными не только в кинотеатрах и в домашней аудио-видео аппаратуре, но и в компьютерах.
Кодер Dolby Surround
Сразу оговоримся: система не предназначена для передачи четырех независимых сигналов звука, каждый из которых надо прослушивать раздельно (например, звука одной ТВ программы на разных языках). В этом случае развязка между двумя любыми каналами должна была бы быть максимальной, а амплитуды и фазы сигналов могли бы быть совершенно не связаны между собой. Напротив, задача Dolby Surround - передать четыре канала звука (soundtrack), которые будут прослушиваться одновременно и при этом воссоздавать в сознании слушателя пространственную звуковую картину (soundfield). Эта картина составляется из нескольких звуковых образов (sound images) - звуков, которые слушатель воспринимает связанными со зрительными образами на экране. Звуковой образ характеризуется не только содержанием и мощностью звука, но и направлением в пространстве.
На входе кодера Dolby Surround присутствуют сигналы четырех каналов - L, C, R и S, а на выходах - два канала Lt (left-total) и Rt (right-total). Слово «total» (общий) означает, что каналы содержат не только «свой» сигнал (левый и правый), но и кодированные сигналы других каналов - C и S. Функциональная схема кодера показана на рисунке.
Сигналы каналов L и R передаются на выходы Lt и Rt без каких-либо изменений. Сигнал канала С делится поровну и складывается с сигналами каналов Lt и Rt. Предварительно сигнал С ослабляется на 3 дБ (чтобы сохранить неизменной акустическую мощность сигнала после сложения его «половинок» в матрице декодера). Сигнал канала S также ослабляется на 3 дБ, но, кроме того, перед сложением с сигналами Lt и Rt он подвергается следующим преобразованиям:
- Полоса частот ограничивается полосовым фильтром (BPF) от 100 Гц до 7 кГц
- Сигнал обрабатывается шумоподавителем - процессором Dolby B-type Noise Reduction
- Сигнал S сдвигается по фазе на +90 и -90 градусов, таким образом, составляющие сигнала S, предназначенные для сложения с Lt и Rt, оказываются в противофазе друг с другом.
Совершенно ясно, что сигналы L и R не влияют друг на друга, они совершенно независимы. На первый взгляд не столь очевидно, но факт - между сигналами C и S развязка теоретически также идеальная. Действительно: в декодере сигнал S получается как разность сигналов Lt и Rt. Но в этих сигналах присутствуют совершенно одинаковые компоненты сигнала С, которые при вычитании взаимно компенсируются. Напротив, сигнал C выделяется декодером, как сумма Lt и Rt. Так как компоненты сигнала S, присутствующие в этих сигналах, находятся в противофазе, при сложении они также взаимно компенсируются.
Такое кодирование позволяет передать сигналы S и C с высокой степенью развязки при одном условии: если амплитудные и фазовые характеристики физических каналов, по которым передаются сигналы Lt и Rt, абсолютно идентичны. Если имеется некоторый дисбаланс между каналами, развязка уменьшается. Например, если компоненты сигнала С в каналах Rt и Lt из-за разных характеристик каналов передачи окажутся неодинаковыми, произойдет нежелательное проникновение (crosstalk) части сигнала С в канал S.
Из описания кодера понятно, что кодирование реализуется простыми аналоговыми методами. Сигнал, кодированный в Dolby Surround, не содержит каких - либо управляющих сигналов или инструкций для декодера. По своим электрическим характеристикам он ничем не отличается от обычного двухканального сигнала стерео, и опознать кодированный сигнал простыми «аппаратными» методами (например, с помощью осциллографа или анализатора спектра) невозможно. Представим себе, что сигнал, кодированный в Dolby Surround, прослушивается на обычной стереофонической аппаратуре, без декодера Surround. Сигнал Lt поступает на акустическую систему левого канала, сигнал Rt - на систему правого. При записи двухканального звука сигнал от источника, расположенного у левого микрофона, поступает преимущественно в левый канал, от источника, расположенного у правого микрофона - преимущественно в правый канал. Если источник равно удален от левого и правого микрофонов, его сигнал делится поровну между правым и левым каналами. В кодере Dolby Surround сигнал С делится между каналами Lt и Rt именно таким образом, но не на акустическом, а на электрическом уровне. Поэтому при прослушивании на две акустические системы L и R звук канала С воспринимается, как сигнал виртуальной акустической системы, расположенной между реальными системами L и R. Кроме сигнала С, в каналах Lt и Rt присутствуют компоненты сигнала S, но они находятся в противофазе, и акустические сигналы, соответствующие этим компонентам, компенсируются в пространстве между акустическими системами. Поэтому звук канала Surround воспринимается как едва заметный, «призрачный» звук (phantom sound), витающий где-то между акустическими системами L и R. Таким образом, сигнал Dolby Surround совместим с любой аппаратурой стерео, как с декодером surround, так и без него.
Пассивный декодер Dolby Surround
Простейший декодер Surround выделяет только один дополнительный канал - канал S. Функциональная схема декодера показана на рисунке. Сигнал Lt без каких-либо изменений поступает на выход L декодера. Сигнал Rt таким же образом поступает на выход декодера R. Сигналы Lt и Rt содержат «половинки» сигнала центрального канала С, которые создают виртуальную акустическую систему между реальными акустическими системами L и R. Узел вычитания L-R выделяет сигнал surround, который поступает на отдельную акустическую систему. Компоненты сигнала S воспроизводятся также акустическими системами R и L, но, так как они в противофазе, слушателем не воспринимаются. Так как основу декодера составляет простой дифференциальный усилитель, выполняющий операцию вычитания L-R, такой декодер получил название «пассивного декодера».
На рисунке показаны взаимные развязки (separation) между каналами простейшего декодера Диаметральное расположение каналов на схеме относится только к электрическим сигналам. Реальное расположение акустических систем иное - системы трех каналов расположены в одной фронтальной плоскости, а системы четвертого канала - по бокам сзади слушателя. Заметим, что акустическая система С - виртуальная, ее сигнал формируется пространственно акустическими системами правого и левого каналов. Поэтому для такого декодера очень важно положение слушателя относительно акустических систем L и R и- в идеальном случае он должен быть равно удален от них. Эксперименты показали, что прослушивание сигналов фронтальных каналов в громкоговорителях surround, особенно речи, в большой степени портит впечатления от саундтрека. Для того чтобы обеспечить развязку центральных каналов и канала surround, в реальном пассивном декодере используются дополнительные преобразования:
- Временная задержка (около 10 миллисекунд) устраняет так называемый эффект Хааса (Haas effect). Если слушатель располагается ближе к акустическим системам Surround, чем к системам фронтальных каналов, он сперва слышит компоненты сигналов L и R, проникшие в канал surround, и только затем эти же сигналы, излученные громкоговорителями фронтальных систем. Несмотря на то, что мощность звука на фронтальном направлении больше, из-за временного опережения звуковой образ в сознании слушателя связывается с направлением тыла. Задержка гарантирует, что звук фронтальных каналов достигнет слушателя раньше, чем тот же звук, попавший в канал surround.
- ФНЧ 7 кГц используется по нескольким причинам. Основная из них: если источник звука смещен вправо или в лево от центра, то чем выше частота звука, тем выше амплитуда сигнала, проникающего в канал surround. Это естественно, так как при одинаковой геометрической разности хода разность фаз зависит от частоты, а при одинаковой амплитуде L и R амплитуда разностного сигнала L-R (т. е. сигнала, проникающего в канал S) определяется только разностью фаз. Поэтому на более высоких частотах труднее добиться эффективного разделения каналов. Вторая причина: чем выше частота звука, тем более точно слушателем определяется направление на его источник (тем острее «диаграмма направленности» ушей). Исключение высокочастотной составляющей «размазывает» звуковые образы в канале surround, благодаря этому слушатели, сидящие рядом с акустическими системами surround, не связывают звуки в этом канале с направлением на громкоговорители.
- Система шумопонижения Dolby Noise Reduction типа «В» используется для подавления проникающих сигналов каналов L и R, если их уровни значительно ниже уровня сигнала surround.
Как видно из вышесказанного, технологии Dolby Surround используют особенности восприятия звуков человеком - психоакустические эффекты.
Активный декодер Dolby Surround Pro Logic
Пассивный декодер обеспечивает высокую степень воспринимаемой развязки между фронтальными каналами, но только для слушателей, равноудаленных от акустических систем. Кроме того, несмотря на специальную обработку сигнала surround, в пассивном декодере невозможно добиться полного разделения сигналов surround и R/L. Использование пассивных декодеров ограничено, поскольку они не способны обеспечить корректное восприятие для любого положения слушателя в зале.
Активные декодеры предполагают пространственную фокусировку (Directional Enhancement)* (*автор не уверен в точности перевода) звуковых образов. Этим термином обозначается любая технология, используемая для устранения проникновения сигналов одного канала в другой (crosstalk) и основанная на изменении выходных сигналов декодера. Активный декодер представляет собой комбинацию пассивного декодера и регулирующей цепи (enhancement circuit). Чтобы понять сам принцип, рассмотрим простейшую технику активного декодирования - регулировку усиления каналов (gain riding). На рисунке показана функциональная схема активного декодера. На каждом выходе декодера установлен усилитель, управляемый напряжением (Voltage Controlled Amplifier, VCA).
Для примера возьмем случай, когда источник звука - единственный, и он расположен непосредственно у микрофона центрального канала С. Из рисунка 4 видно, что пассивный декодер передаст сигнал центрального канала в выходной канал С, а также и в каналы R и L с ослаблением всего 3 дБ. Управляющая цепь активного декодера определяет, в каких каналах необходимо уменьшить усиление, чтобы подавить проникающие сигналы соседних каналов до необходимого уровня. В данном примере декодеру необходимо уменьшить усиление в каналах L и R, оставив слышимым сигнал канала С. Таким же образом можно развязать выход левого канала, уменьшив усиление в каналах C и S, когда на входе декодера присутствует только сигнал Lt. Фактически, сигнал может приходить с любого направления в пределах всех 360 градусов. Таким «прямым» методом проблема решается только для единственного звукового образа. Реальный саундтрек содержит звуки нескольких независимых источников. Рассмотрим случай, когда речь звучит на фоне музыки. Музыка должна воспроизводиться акустическими системами левого и правого каналов, а речь - только системой центрального канала. Пассивный декодер с такой задачей не справится вообще. Речь будет воспроизводиться как системой центрального канала, так и системами левого и правого каналов. Стереофоническая музыка будет воспроизводиться системами L и R, кроме того, суммарный сигнал L+R будет прослушиваться через систему С, а разностный L-R - через систему S.
Полагаем, что активный декодер считает речь доминирующим звуковым образом (dominant sound), и уменьшает усиление каналов L и R, чтобы сфокусировать этот образ в направлении С. Но при этом теряется стереофоническая музыка, остается только монофонический звук суммы (L+R) в канале С и «фантомный» звук разности (L-R) в канале S. Если говорящие герои замолкают, декодер восстанавливает усиление каналов L и R, и музыка становится слышимой и наоборот, при возобновлении речи музыка пропадает. Такое явление «качания» (pumping) мощности не доминирующих звуковых образов в зависимости от мощности доминирующего хорошо ощутимо.
Другой способ избавиться от проникновения речевого сигнала в левый и правый каналы показан на рисунке. Если взять сигнал правого канала, инвертировать его полярность и сложить с выходным сигналом левого канала - компоненты сигнала С в левом и правом каналах окажутся противофазными и взаимно компенсируются, таким образом, в канал L компоненты сигнала С не попадут.
Принцип взаимной компенсации (cancellation concept) - основной принцип активного декодирования и в том или ином виде используется во всех реальных активных декодерах.
После исключения сигнала центрального мощность звука в левом канале не уменьшается, часть сигнала левого канала заменяется инвертированным сигналом правого канала. Кроме того, в центральном канале по-прежнему прослушивается суммарный сигнал L+R. В результате доминирующий звуковой образ (речь в канале С) фокусируется в направлении акустической системы С, а образы, соответствующие направлениям R и L, наоборот, «размазываются» в пространстве. Декодером используется один из принципов психоакустики, принцип маскирования (signal masking concept): воздействие доминирующего звукового образа временно снижает способность слушателя определять направления на другие звуковые образы. Так как мощность звуков, соответствующих этим образам, остается неизменной, «качание» (модуляция) этих звуков не наблюдается. В этом заключается другой принцип психоакустики - принцип постоянства мощности (constant-power concept). Выполняя принцип постоянства мощности в сочетании с активной взаимной компенсацией только в те моменты, когда требуется передача точного направления на звуковой образ, можно эффективно скрыть факт перераспределения мощности не доминирующих звуков.
В примере мы предполагали, что громкость речи намного выше громкости музыки, поэтому сигнал речи используется, как управляющий, сигнал музыки - как управляемый. В реальности разница уровней подобных сигналов может быть менее значительной. Если два разных звука близки по уровню, один из них становится маскирующим для компонентов другого, попавших не в «свои» каналы и наоборот, и требования к степени развязки снижаются. В таком случае требуется меньшая степень активной компенсации, и, соответственно, меньшая степень перераспределения не доминирующих сигналов по направлению.
Иногда желательно вообще исключить регулировку усиления, сделав декодер «пассивным». Например, звуки дождя или ветра воспринимаются слушателем на подсознательном уровне. Они не связываются с конкретным источником и могут воспроизводиться всеми громкоговорителями одновременно. В этом случае не требуется пространственной фокусировки звука, следовательно, и активного декодирования.
Крайнее проявление доминирования: все присутствующие на саундтреке звуки в данный момент связаны с одним направлением. Если сигнал обрабатывается пассивным декодером, из-за перетекания части мощности сигнала в соседние каналы возникает ошибка направления. Так как звуковой образ один, то в сигнале нет других звуков, способных маскировать эту ошибку. Таким образом, если доминирующий звуковой образ - единственный звуковой образ, перераспределение мощности по направлению становится особенно заметным. Но именно при этом условии легче всего компенсировать проникновение сигнала в другие каналы, используя технику компенсации. Так как сигналов с других направлений нет, нет и эффекта модуляции их мощности.
Другой крайний случай: два или более звуковых образа присутствуют одновременно на разных направлениях и имеют примерно одинаковую мощность. В этом случае способность слушателя к определению направления на образы притупляется, поэтому технику компенсации можно не использовать или использовать не в полной мере.
Чтобы обеспечить эффективное декодирование для обоих случаев, декодер Pro Logic автоматически выбирает один из режимов декодирования, «быстрый» или «медленный». «Быстрый» режим используется, если доминирующий звуковой образ намного мощнее других образов. Если такие образы возникают на разных направлениях последовательно во времени, декодер должен последовательно воспроизвести их на соответствующих направлениях. В любой момент времени декодер регулирует усиление выходов, исходя из наличия одного источника доминирующего звука, но в течение некоторого времени все источники последовательно воспринимаются раздельно. Для этого необходимо, чтобы время реакции управляющей цепи декодера на изменение входных сигналов было минимальным. Второй режим, «медленный», включается декодером, если мощности разных образов отличаются незначительно. В «медленном» режиме декодер отслеживает изменения входных сигналов с большей задержкой. В таких условиях маскирование проявляется слабо, поэтому, если декодер продолжит работу в «быстро»" режиме, модуляция мощности не доминирующих образов станет заметной.
По определению, в каждый момент времени может существовать только один доминирующий образ, и ему соответствует единственное направление. Декодеру необходимо в любой момент времени иметь информацию о точном направлении на доминирующий образ, независимо от того, как быстро меняется пространственная звуковая картинка. Анализируя две пары электрических сигналов, соответствующих ортогональным осям декодера (левый-правый каналы, центральный канал-surround) можно однозначно идентифицировать любое направление в пространстве.
Основой декодера Pro Logic является адаптивная матрица Pro Logic. В адаптивной матрице существуют два параллельных канала: канал прохождения входных сигналов Lt и Rt к суммирующей цепи и сложный канал управления. Большая часть электронных компонентов декодера используются для анализа входных сигналов и генерации сигналов управления, и относительно небольшая их часть занята собственно в обработке сигнала.
Главная задача управляющей цепи - определить параметры вектора доминирующего звукового образа. Сначала входные сигналы декодера нормируются, чтобы исключить ошибки, связанные с различием характеристик каналов передачи. Полосовой фильтр отсекает низкочастотные составляющие, не несущие информацию о направлении, и высокочастотные составляющие, и фазы которых сильно зависят от фазовых характеристик физических каналов.
Вторым этапом определяются отношения амплитуд пар сигналов, соответствующих осям декодера. Для этого четыре сигнала Lt, Rt, (Lt-Rt) и (Lt+Rt) детектируются амплитудными детекторами, полученные огибающие подаются на входы дифференциальных усилителей с логарифмической характеристикой. На выходах двух дифференциальных усилителей выделяются два ортогональных управляющих сигнала, пропорциональные разности логарифмов от амплитуд, т. е. пропорциональные отношению самих амплитуд. Хотя управляющих сигнала всего два, каждый из них биполярный - он может принимать как положительные, так и отрицательные значения. Например, если сигнал на выходе дифференциального усилителя оси «левый-правый каналы» положителен, доминирующий образ расположен слева от оси «центр-surround», если этот сигнал отрицателен, образ расположен справа от оси «центр - surround». Если сигнал нулевой, доминирования по оси «левый-правый» в данный момент нет.
Мгновенное значение управляющих сигналов постоянно сравнивается с пороговым значением, чтобы определить степень доминирования по той или иной оси в данный момент. Если сигнал хотя бы одной оси превышает пороговое значение, управляющая цепь переключает тракты обеих осей по принципу «ИЛИ» в «быстрый» режим. Преобразователи полярности делают из двух биполярных сигналов четыре униполярных управляющих сигнала - El, Er, Ec и Es. Теперь вектор доминирующего образа представлен четырьмя электрическими сигналами, которые можно использовать для управления компенсирующими регулируемыми усилителями (VCA). Имеем: на входе сигнала - два входных сигнала Lt и Rt, на входе управления - четыре управляющих сигнала El, Er, Ec и Es. Получаем матрицу из восьми VCA и восемь выходных сигналов ElL, ElR, ErL, ErR, EcL, EcR, EsL и EsR. Вместе со входными сигналами Lt и Rt получается десять сигналов. Для получения выходных сигналов декодера четыре комбинирующих цепи суммируют и вычитают все десять сигналов с определенными весовыми коэффициентами. Выбор амплитуды и полярности каждого из сорока сигналов на входах комбинирующих цепей обеспечивает точную передачу направления на доминирующий образ, перераспределение мощности не доминирующих сигналов по направлению и сохранение мощности каждого звукового образа постоянной.
Декодер Dolby Surround Pro Logic - II
Pro Logic II - активный декодер Dolby Surround следующего поколения. Он также использует пространственную фокусировку, но реализован принципиально другими методами. Новый декодер получился намного проще и при этом эффективнее.
Вспомним: задача декодера - предотвратить проникновение сигналов L и R в канал S, независимо от того, где находится источник сигнала - точно между микрофонами L и R, смещен от центра в ту или иную сторону или вообще находится непосредственно рядом с микрофоном одного из каналов. Например, если герои ведут диалог между микрофонами каналов R и C (права от центра), то уровень сигнала в каналах C и R будет одинаковым. В этом случае часть сигнала неизбежно проникнет на выход S пассивного декодера, так как уровень в канале L ниже, чем в канале R, и при вычитании одного сигнала из другого результат не будет нулевым.
Чтобы полностью компенсировать сигналы L и R на входах декодера surround, необходимо перед подачей на сумматор выровнять их уровни. Для этого между входами Lt и Rt и входами сумматора устанавливаются два регулируемых усилителя (VCA). Усиление VCA двух каналов изменяется одним и тем же управляющим сигналом, но в разной полярности. Если увеличивается усиление одного VCA, усиление второго уменьшается. Если такую регулировку осуществлять достаточно точно и достаточно синхронно с изменениями самого сигнала, можно полностью подавить разностный сигнал каналов Lt и Rt в канале Surround.
Чтобы автоматически отследить изменения входных сигналов, используется специальная цепь отрицательной обратной связи (feedback servo circuit). Выходные сигналы обоих VCA поступают на амплитудные детекторы (Full-Wave Rectifier, FWR), которые выделяют огибающую звуковых сигналов. Сигналы постоянного тока, пропорциональные амплитудам сигналов L и R, сравниваются дифференциальным усилителем. Сигнал с выхода усилителя, пропорциональный разности амплитуд, используется для управления VCA. На рисунке показана только одна ось декодера (ось «левый - правый»). Вторая пара VCA с такой же управляющей цепью выравнивает уровни сигналов суммы L+R (фронтальный) и разности L-R (тыловой) для подавления сигналов С и S в каналах R и L (ось «центр - surround»). Сигнал центрального канала С получается сложением (вместо вычитания) двух сигналов Lt и Rt, выровненных по уровню усилителями VCA. Благодаря использованию управляющих цепей с обратными связями, декодер Pro Logic II приобрел следующие преимущества:
- Простыми и дешевыми аппаратными средствами достигается более эффективная компенсация противофазных сигналов в выходной матрице, и, как результат, высокая степень развязки между каналами разных осей.
- В декодере Pro Logic обе оси контролируются единой переключающей цепью «быстро/медленно». Если хотя бы по одной оси существует значительное доминирование, переключающая цепь переводит обе оси в «быстрый» режим, принудительно изменяя постоянную времени управляющих цепей VCA. Только при условии, что в обеих осях амплитуды сигналов примерно одинаковы, обе они переходят в «медленный» режим. В декодере Pro Logic II две оси функционируют независимо друг от друга, поэтому их управляющие цепи сами «решают», насколько быстро необходимо изменять усиление VCA, анализируя только собственные сигналы. Кроме того, постоянная времени управляющей цепи в декодерах Pro Logic II изменяется непрерывно, тогда как в Pro Logic предусмотрено только два фиксированных значения.
В таблице приведены основные отличия декодера Pro Logic II от декодера Pro Logic.
Характеристика |
Pro Logic |
Pro Logic II |
Источники сигнала |
Программы в Dolby Surround |
Программы в Dolby Surround |
Обычные стерео программы |
Режимы работы |
3/1 "полный" surround |
3/2 "полный" surround |
2/1 surround with phantom center - surround с "виртуальным" центральным каналом |
2/2 surround with phantom center - surround с "виртуальным" центральным каналом |
3/0 стерео с центральным каналом |
3/0 стерео с центральным каналом |
3/1 with filtered surround - режим эмуляции surround для сигналов обычного стерео |
Полоса пропускания канала Surround |
<7 кГц |
Не ограниченная |
Режим панорамы |
нет |
есть |
Регулировка глубины |
нет |
есть |
Регулировка ширины |
нет |
есть |
|
Декодер Pro Logic II может быть использован как универсальный декодер не только для фильмов, но и для других звуковых записей в Dolby Surround. Он идеально подходит для простой и недорогой бытовой аппаратуры. Именно поэтому в декодер Pro Logic II, кроме «штатного» режима Movie, был добавлен «пользовательский» режимы работы - Music. В таблице приведены сравнительные характеристики для двух режимов работы декодера Pro Logic-II и декодера Pro Logic.
Характеристика/режим |
Pro Logic |
Movie |
Music |
Частотный фильтр в канале surround |
ФНЧ 7 кГц |
Нет. |
Ступенчатый ФВЧ |
Временная задержка в канале surround |
Да |
Да |
Нет |
Режим панорамы |
Нет |
Нет |
Польз. |
Регулировка глубины |
Нет |
Нет |
Польз. |
Регулировка ширины |
Нет |
Нет |
Польз. |
Режим автобаланса |
Да |
Да |
Нет |
|
Известно, что характеристики звука на саундтреках фильмов и на музыкальных записях отличаются. Главное отличие в том, что саундтрек пишется на калиброванной аппаратуре Dolby, поэтому при прослушивании через калиброванный декодер точность воспроизведения гарантируется. При записи музыки, как правило, не используется аппаратура Dolby Surround, поэтому невозможно предугадать, как конкретная запись будет воспроизводиться декодером. Поэтому режим Movie декодера Pro Logic II имеет фиксированные параметры, а режим Music, напротив, предполагает несколько настроек пользователя. Эти настройки могут быть использованы в любой аппаратуре с декодером Pro Logic II, но особенно они актуальны в автомобильной акустике, где положение акустических систем фиксировано, а положение «основного» слушателя может изменяться.
- Регулировка глубины. Позволяет виртуально перемещать положение слушателя в направлении фронт-тыл. С помощью этой настройки можно добиться оптимального баланса между фронтальными каналами и surround для каждой музыкальной записи.
- Регулировка положения центра и ширины стереобазы. С помощью этой настройки пользователь может сконфигурировать декодер таким образом, что звук, соответствующий центральному положению звукового образа, будет прослушиваться только в акустической системе центрального канала, только в системах левого и правого каналов (виртуальный центральный канал) или во всех трех системах с любой комбинацией уровней. Таким образом можно изменять баланс трех фронтальных каналов для оптимального прослушивания, например, водителем и пассажиром автомобиля. В домашней системе можно таким изменять ширину стереобазы - расстояния между акустическими системами фронтальных каналов, не перемещая сами системы.
- Режим панорамы. В этом режиме создается впечатление «звучания со всех сторон сразу». Такой эффект достигается использованием естественного отражения акустической энергии систем surround от боковых стен помещения.
В режиме Music предусмотрен ступенчатый фильтр высоких частот в канале surround. Он обеспечивает более верное, реалистичное восприятие звука. Благодаря фильтру устраняются искажения на высоких частотах, связанные с многократными отражениями от стен и поглощением звука в элементах интерьера. Временная задержка канала surround в режиме Music не нужна, т. к. звуковые образы не обязательно должны восприниматься слушателем преимущественно на фронтальных направлениях. И, наконец, в режиме Music отключается автоматический баланс, потому что музыканты и певцы иногда намеренно вносят дисбаланс каналов.
Цифровой формат Dolby Digital
В конце 1980-х, на волне возобновившегося интереса к кино, Dolby Laboratories разработала цифровую технологию записи и воспроизведения многоканального звука для 35мм целлулоидной пленки. Несколько аналоговых сигналов звука преобразовывались в цифровой поток, который затем подвергался информационному сжатию по алгоритму Dolby AC-3. Было использовано весьма оригинальное решение. Так как к этому времени огромное число существующих проекторов использовали двухканальный стерео или аналоговую систему Dolby Pro Logic, две аналоговых оптических дорожки на ленте необходимо было сохранить. Цифровая информация была размещена на «нерабочей» части пленки - между окошками перфорации.
Система использовала шесть каналов звука, поэтому получила наименование «Dolby Digital 5.1» что означает 5 полноценных каналов звука в полном диапазоне - левый, правый, центральный, пространственный правый (Right Surround, RS), пространственный левый (Left Surround, LS) - плюс шестой канал с ограниченной полосой частот. Этот канал получил название канала низкочастотных звуковых эффектов (Low Frequency Effects, LFE). Акустическая система канала LFE (для нее также распространено название - Subwoofer) располагается перед экраном кинозала, между системами каналов L и C. Для канала LFE требовалась полоса частот примерно в 10 раз меньшая, чем для 5 основных каналов. Отсюда обозначение, соответствующее шестому каналу « .1» (одна десятая).
Используемая в Dolby Digital схема компрессии данных AC3 обладает очень высокой эффективностью (коэффициент сжатия может быть более 12:1, поддерживаемые битрейты от 64 до 448 кбит/с) и при этом довольно высоким субъективным качеством звука. AC3, как и все современные схемы сжатия данных звуковых потоков (в частности, MP3), использует в своей работе особенности слухового восприятия человека, или психоакустическую модель. Например, в присутствии громкого сигнала некоторой частоты более тихие и имеющие немного более высокую или низкую частоту звуки маскируются громким сигналом, то есть не слышны или слышны очень плохо. Также маскируются сигналы, звучащие после и даже перед громким звуком. Это явление позволяет не кодировать или кодировать с меньшей разрядностью маскируемые звуки. Компрессия данных осуществляется также путем недеструктивного избавления от избыточной информации, примерно по тем же алгоритмам, которые применяются в архиваторах ZIP или RAR. Для реализации этих схем входящий поток аудиоданных разбивается во времени - на перекрывающиеся блоки (фреймы) по 512 сэмплов, при частоте дискретизации 48 кГц это составляет 10,66 мс, если же в сигнале присутствуют резкие перепады уровня, то размер блока уменьшается вдвое, чтобы качественно передать эти быстрые скачки; и по частоте - весь звуковой диапазон в 24000 Гц разбивается на 256 сегментов, что дает ширину каждой полосы в 93,75 Гц. Затем звуковая информация в каждой частотной полосе из блока данных переводится в формат числа с плавающей запятой , и по определенной психоакустической модели производится обработка входящих значений (какие-то частотные полосы вообще не несут значимой информации и не кодируются, какие-то нужно закодировать с большей разрядностью, какие-то с меньшей), результатом которой является существенное уменьшение потока данных. Интересно, что психоакустическая модель, используемая кодером, может меняться, так как параметры модели передаются в потоке AC3 и затем могут использоваться декодером для восстановления исходного звучания. Еще одним способом уменьшения потока данных является объединение данных из разных каналов. В реальной многоканальной фонограмме в нескольких каналах звуковая информация зачастую пересекается, и ее можно закодировать один раз для всех, а не для каждого канала в отдельности. Эта техника применяется только для частот ниже 10 кГц, что позволяет сохранить локализацию источников звука, а при том, что в распоряжении кодера есть целых пять полноценных звуковых каналов и, соответственно, широкое поле для маневра, поток данных этим способ можно уменьшить довольно значительно.
Первое коммерческое использование систем Dolby Digital состоялось в кинотеатрах в 1992 году, и на сегодняшний день этот формат звука используется не только в кино, но в цифровом вещательном телевидении (спутниковом и кабельном), в DVD и множестве мультимедийных приложений.Появление Dolby Digital практически уравняло возможности кинозала и «домашнего кинотеатра». Так же, как в настоящем кинотеатре, в домашнем кинотеатре с Dolby Digital реализуются шесть каналов - L, C, R, LS, RS и LFE. Если в аналоговой системе Dolby Surround использовался только один канал surround с ограниченной полосой частот (как правило, для его воспроизведения используются две акустических системы, синфазно излучающие один и тот же сигнал), то Dolby Digital предоставляет пользователю два раздельных канала surround с такой же полосой частот, как у трех фронтальных каналов. Благодаря такому набору, системы с Dolby Digital создают наиболее реалистичные ощущения и позволяют использовать сложные пространственные эффектов.
Другое важное достоинство технологии Dolby Digital - масштабируемость аппаратуры. В рамках одной технологии производится целый ряд аппаратно и программно совместимых декодеров. В декодерах высшего уровня возможности Dolby Digital реализованы полностью - на выходе декодера шесть звуковых каналов по схеме «5» или «5.1» - L, C, R, LS, RS, (LFE - если имеется subwoofer - система). Декодеры уровнем ниже формируют из цифрового потока Dolby AC-3 два аналоговых канала в Dolby Pro Logic - Lt и Rt, из которых декодер Pro Logic затем выделяет четыре канала Dolby Surround - L, C, R, S. Более простые декодеры имеют на выходе традиционный двухканальный стерео - R и L. Наконец, самый простой декодер предназначен для монофонической аппаратуры - на выходе единственный канал звука. Разумеется, декодеры высших уровней могут работать в режимах, соответствующих более простым декодерам. С одной стороны, это позволяет пользователю выбрать оптимальную по стоимости аппаратуру, соответствующую его возможностям и потребностям. С другой стороны, пользователь, купив аппаратуру со сложным декодером, может постепенно наращивать возможности своего аудио-видео комплекса - от монофонического звука до «домашнего кинотеатра» «5.1».
Возможности Dolby Digital на этом не исчерпываются. Например, декодер предусматривает управляемую компрессию (сжатие динамического диапазона). Использование компрессии удобно, если слушателю по какой-либо причине необходимо ограничить общую громкость звука. Компрессор повышает уровень слабых звуков, чтобы они были отчетливо слышимы, и наоборот, ослабляет слишком сильные звуки. Пользователь может сконфигурировать цифровой декодер таким образом, чтобы низкочастотные составляющие присутствовали только в тех каналах, для которых предусмотрены subwoofer-ы или широкополосные акустические системы с отдельными низкочастотными громкоговорителями.
Dolby Digital EX и Dolby-E
Только для кинотеатров изначально была разработана расширенная система Dolby Digital EX - семиканальная, по схеме «6.1». В Dolby Digital EX предусмотрено не два, а три канала surround - пространственный левый LS, пространственный правый RS и пространственный центральный CS. Акустические системы канала CS размещаются вдоль задней стены кинозала, а системы каналов LS и RS - вдоль боковых стен.
Dolby Digital использует цифровую компрессию звука, обеспечивающую минимальную необходимую скорость цифрового потока - до 320 кбит/сек. Это позволяет наиболее эффективно использовать информационную емкость носителей или каналов связи - пространство на пленке, магнитной ленте, частотную полосу эфирного или спутникового канала и т. п. Платой за низкую скорость является то обстоятельство, что формат Dolby Digital рассчитан только на один цикл кодирования - декодирования. Кроме того, цифровой поток AC-3 не привязан по времени к кадровой структуре изображения, поэтому редактировать видеоматериалы со звуком Dolby Digital сложно. В профессиональных приложениях зачастую возникает необходимость в многократном кодировании-декодировании. Например, станции-ретранслятору необходимо получить материал с цифровым звуком Surround по спутниковому каналу связи, сохранить его на цифровом носителе, отредактировать, смонтировать и затем ретранслировать в распределительную сеть (или тиражировать и распространить). Для таких задач Dolby Laboratories разработала профессиональный цифровой формат Dolby-E. Цифровой поток Dolby-E может содержать до восьми каналов звука с полной полосой частот. Кроме собственно сжатых данных звука, в поток вводятся метаданные (metadata) - «данные, описывающие данные». Это инструкции для декодера Dolby-E, которые носят необязательный, рекомендательный характер. Например, специальная инструкция может автоматически установить в декодере то или иное ограничение динамического диапазона выходных сигналов. В зависимости от оборудования, используемого для приема и обработки сигнала Dolby-E, метаданные могут использоваться полностью, частично или не использоваться вообще. Поток Dolby-E делится на два потока, которые могут быть переданы по двум физическим линиям стандарта AES-3 или записаны на цифровой магнитофон вместо двух каналов несжатого звука. Структура потока соответствует кадровой структуре видео, поэтому материал со звуком Dolby-E можно легко монтировать и редактировать, не нарушая синхронность аудио и видео. Формат допускает до 10 последовательных циклов кодирования - декодирования.
DTS Digital Surround
Стандарт DTS (Digital Theater System) был разработан Стивеном Спилбергом во время выпуска «Парка юрского периода» в 1993 году и больше подходит для широкого экрана, чем для квартир. Однако сейчас DTS приобретает все большую популярность, тем более что он может декодироваться программно.
DTS применяется в CD, LD и DVD. Она использует ту же 5.1-конфигурацию, что и Dolby Digital, однако меньший уровень сжатия сигнала придает звуку большую глубину, улучшает разделение каналов и отношение сигнал/шум.
DTS кодирует звук в 24 битах, против 18-ти в Dolby Digital. Компрессия динамическая, с плавающим коэффициентом сжатия от 1:1 до 1:4. В результате мы получаем значительно лучший звук по сравнению с Dolby Digital, при потоке до 1,5 Мбит/с. Главным недостатком DTS является большее занимаемое пространства (примерно в три раза больше), чем у Dolby. Поэтому DTS DVD обычно выпускаются на одном языке и с ограниченным числом бонусов. Сейчас на рынке не так много DVD с DTS, хотя наблюдается тенденция увеличения их числа.
Обратите внимание: все DVD-плееры смогут воспроизводить звуковые DTS компакт-диски.
Проигрыватели с маркировкой DTS Digital Surround имеют встроенный декодер DTS, а продукты с маркировкой DTS Digital OUT обладают возможностью передавать выходной сигнал этой звуковой системы на внешний процессор.
DTS-ES
Появление новой технологии записи звуковой фонограммы Dolby Digital Surround EX, привело к новой разработке DTS, показанной на выставке ShoWest в Лас-Вегасе в 1999 году. Это - декодер DTS-ES, который добавляет третий - центральный - канал окружающего звука (surround). Основанный на технологии DSP (Digital Signal Processing), новый декодер полностью совместим со всеми текущими цифровыми форматами и системами.
Адаптер дополнительного канала окружающего звука DTS-ES разработан для воспроизведения кинокопий в формате записи 6.1 (Surround-EX). Модернизация цифрового кинопроцессора DTS-ES обеспечивает цифровое однооктавное выравнивание всех каналов с использованием отдельных установочных параметров эквализации для различных звуковых форматов.
Принцип работы адаптера состоит в том, что два раздельных приходящих сигнала левого и правого каналов окружающего звука, поступают в ES декодер и разделяются на три сигнала (три канала окружающего звука), центральный из которых поступает в усилитель центрального канала окружающего звука (BS).
Общие характеристики:
- DTS-ES адаптер формирует дополнительный канал окружающего звука (BS) дешифруя звуковые дорожки двух каналов окружающего звука
- Адаптер совместим со всеми моделями DTS процессоров
- Считыватель timecode позволяет генерировать спецэффекты
- Адаптер управляется компьютером по протоколу RS 232
- Динамический диапазон - более 100 dB
Сертификация THX
THX - это не звуковой стандарт, подобный DTS или Dolby Digital. Это сертификация, марка качества, созданная Lucasfilm - своего рода критерий для коллекционеров домашнего видео.
В свое время Джордж Лукас обнаружил, что звуковое оборудование в кинотеатрах часто бывает слишком низкого качества. Как и любой режиссер, Лукас хотел, чтобы фильм проигрывался с хорошим звуком независимо от кинотеатра. Так и родилась сертификация THX. Сейчас вы можете встретить ее во многих кинотеатрах по всему миру.
Термин THX произошел от «THX 1138», первого научно-фантастического фильма, снятого Джорджом Лукасом, который быстро стал культовым. Фильмы про Индиану Джонса, «Звездные войны» и прочие постепенно развивали марку THX, главным образом на большом экране.
Сертификация THX опирается на три главных критерия:
Качество звука. Оценивается на основе полосы пропускаемых частот, баланса частот, целостности звучания фронтальных и тыловых динамиков, качества позиционирования. Также проверяется соответствие звуковой системы указанным параметрам мощности.
Эргономика интерфейса. Звуковая система должна быть простой в установке и использовании.
Качество изготовления. На системе, сертифицированной по THX, два передних динамика и средний динамик обычно одинаковы и диполярны (две диафрагмы). Создаваемый звук должен быть направлен напрямую на слушателя, он не должен отражаться от стен или потолка. Нижняя граница частотной характеристики не должна быть хуже 80 Гц, так что все каналы THX-системы должны быть оснащены сабвуфером.
Виртуальный Surround
Существует множество приложений, в основном «домашних», в которых по тем или иным причинам невозможно или нецелесообразно использовать более двух акустических систем. Типичный пример - носимая аппаратура с головными телефонами: количество телефонов естественно ограничено количеством ушей у генетически нормального человека. Сложно использовать более двух громкоговорителей в компьютерных системах, поскольку рабочее место оператора (в данном контексте - слушателя) пространственно ограничено. Для таких приложений Dolby Laboratories была разработана технология Virtual Surround. Она позволяет прослушивать звук, кодированный в Dolby Surround или Dolby Digital, на двух акустических системах и при этом субъективно воспринимать его, как полноценный surround. Принцип виртуального surround показан на рисунке.
Сигналы каналов L и R с выходов декодера Dolby Surround Pro Logic или Dolby Digital 5.1 поступают на акустические системы L и R без изменений. Сигнал канала С ослабляется на 3 дБ и суммируется с сигналами каналов L и R, создавая виртуальную акустическую систему центрального канала (см. выше описание пассивного декодера). Сигнал одного (Pro Logic) или двух (Dolby Digital) каналов S также суммируется с сигналами L и R, но предварительно обрабатывается специальным процессором - виртуализатором (virtualizer). Этот процессор вносит в сигнал изменения, благодаря которым звук канала S связывается в сознании слушателя с виртуальной акустической системой, расположенной сзади. Эксперименты показали, что субъективные ощущения от прослушивания Virtual Surround практически не уступают ощущениям зрителя полноценного домашнего кинотеатра. Однако использование Virtual Surround ограничено одним немаловажным обстоятельством. В отличие от «настоящего» surround, создающего пространственное восприятие звука на некоторой площади, виртуальная технология применима только для одного фиксированного положения слушателя относительно двух акустических систем L и R. Для головных телефонов это условие обеспечивается автоматически, а при прослушивании на два громкоговорителя неудобства очевидны. Даже небольшое смещение головы слушателя приводит к искажениям звуковой картины.