Dolby Digital Plus - Dolby Digital Plus

Logotipo Dolby Digital Plus

Dolby Digital Plus , também conhecido como Enhanced AC-3 (e comumente abreviado como DD + ou E-AC-3 , ou EC-3 ) é um esquema de compressão de áudio digital desenvolvido pela Dolby Labs para transporte e armazenamento de áudio digital multicanal. É um sucessor do Dolby Digital (AC-3), também desenvolvido pela Dolby, e tem uma série de melhorias, incluindo suporte para uma faixa mais ampla de taxas de dados (32 kbit / s a ​​6144 kbit / s), contagem de canais aumentada e multi -suporte a programas (via subfluxos) e ferramentas adicionais (algoritmos) para representar dados compactados e neutralizar artefatos. Enquanto o Dolby Digital (AC-3) suporta até cinco canais de áudio de largura de banda total a uma taxa de bits máxima de 640 kbit / s, E-AC-3 oferece suporte a até 15 canais de áudio de largura de banda total a uma taxa de bits máxima de 6.144  Mbit / s .

O conjunto completo de especificações técnicas para E-AC-3 (e AC-3) é padronizado e publicado no Anexo E do ATSC A / 52: 2012, bem como no Anexo E do ETSI TS 102 366 V1.2.1 (2008-08 ), publicado pelo Comitê de Sistemas de Televisão Avançada .

Detalhes técnicos

Especificações

Dolby Digital Plus é capaz de fazer o seguinte:

  • Taxa de bits codificada: 0,032 a 6,144 Mbit / s
  • Canais de áudio: 1,0 a 15,1 (ou seja, de mono a 15 canais de faixa completa e um canal de efeitos de baixa frequência)
  • Número de programas de áudio por fluxo de bits: 8
  • Taxa de amostragem: 32, 44,1 ou 48 kHz

Estrutura

Um serviço Dolby Digital Plus consiste em um ou mais subfluxos . Existem três tipos de substreams:

  • Subfluxos independentes, que podem conter um único programa de até 5.1 canais. Até oito substreams dependentes podem estar presentes em um stream Dolby Digital Plus. Os canais presentes em um substream independente são limitados aos canais 5.1 tradicionais: canais esquerdo (L), direito (R), central (C), surround esquerdo (Ls) e surround direito (Rs), bem como canais de baixa frequência Canal de efeitos (Lfe).
  • Substreams legados, que contêm um único programa 5.1 e que correspondem diretamente ao conteúdo Dolby Digital. No máximo, um único subfluxo legado pode estar presente em um fluxo DD +.
  • Subfluxos dependentes, que contêm canais adicionais além dos canais 5.1 tradicionais. Como os subfluxos dependentes têm a mesma estrutura que os subfluxos independentes, cada subfluxo dependente pode conter até cinco canais de largura de banda total e um canal de baixa frequência; entretanto, esses canais podem ser atribuídos a diferentes posicionamentos de alto-falante. Os metadados no substream descrevem a finalidade de cada canal incluído.

Todos os streams DD + devem conter pelo menos um substream independente ou substream legado, que contém os primeiros (ou apenas) canais 5.1 do programa de áudio principal. Substreams independentes adicionais podem ser usados ​​para programas de áudio secundários, como trilhas sonoras em idiomas estrangeiros, comentários ou descrições / narrações para deficientes visuais. Subfluxos dependentes podem ser fornecidos para programas que possuem canais de palco de som adicionais além de 5.1.

Dentro de cada subfluxo, é feita provisão para codificação de cinco canais de largura de banda total, um canal de baixa frequência e um canal de acoplamento. O canal de acoplamento é usado para informações de frequência média a alta, que são comuns a vários canais de largura de banda total. Seu conteúdo é misturado com os outros canais da maneira prescrita pelos metadados, não sendo reproduzido como um canal discreto pelo decodificador.

Dolby Digital Plus inclui metadados de fluxo de bits abrangentes para controle de decodificador sobre volume de saída (via dialnorm), downmixing e controle de faixa dinâmica reversível (via DRC).

Sintaxe

Dolby Digital Plus é nominalmente um protocolo alinhado a 16 bits, embora muito poucos campos na sintaxe respeitem qualquer limite de byte ou palavra. Como muitos elementos de sintaxe são opcionais ou de comprimento variável, incluindo alguns cuja presença ou comprimento depende de cálculos anteriores complexos e há pouca redundância na sintaxe, DD + pode ser extremamente difícil de analisar corretamente, com análises sintaticamente válidas, mas incorretas produzidas facilmente por codificadores defeituosos.

Um fluxo DD + é uma coleção de pacotes de syncframe de comprimento fixo , cada um dos quais corresponde a 256, 512, 768 ou 1536 amostras de áudio consecutivas no domínio do tempo. (O caso de amostra de 1536 é o caso mais comum e corresponde ao Dolby Digital; os comprimentos de subframe mais curtos destinam-se ao uso em aplicativos interativos como videogames onde reduzir a latência do codificador é uma preocupação importante). Cada syncframe pode ser decodificado de forma independente e pertence a um substream específico dentro do serviço. Um syncframe consiste nos seguintes elementos de sintaxe (alguns dos quais podem ser omitidos quando um serviço Dolby Digital Plus é encapsulado em outro formato ou transporte):

  • Uma palavra de sincronização de 16 bits, que possui o valor 0x0b77.
  • Uma seção Bitstream Info (BSI), que inclui metadados chave, como o tamanho do quadro, o identificador de fluxo de bits (que especifica a versão da sintaxe usada), o modo de canal, o identificador de fluxo secundário, o nível de diálogo codificado (dialnorm) e metadados para orientar produção do decodificador de um downmix.
  • Uma seção de quadro de áudio, que contém informações de decodificação comuns a todos os blocos de áudio dentro do syncframe, incluindo as informações necessárias para determinar como expoentes e mantissas são compactados.
  • Uma, duas, três ou seis seções de Bloco de Áudio. Essas seções contêm metadados de decodificação adicionais, bem como os coeficientes de frequência codificados e quantizados. Cada bloco de áudio corresponde a 256 amostras PCM em cada canal.
  • Uma seção final contendo dados auxiliares definidos pelo usuário, qualquer preenchimento necessário para produzir comprimentos de quadro de sincronização uniformes e um código de verificação de redundância cíclica de 16 bits para detecção de erros.

Armazenamento de coeficientes de transformação

No coração de Dolby Digital e DD + está uma transformada discreta de co-seno modificada (MDCT), que é usada para transformar o sinal de áudio no domínio da frequência; dentro de cada bloco, até 256 coeficientes de frequência podem ser transmitidos. Os coeficientes são transmitidos em formato de ponto flutuante binário, com expoentes transmitidos separadamente das mantissas. Isso permite uma codificação altamente eficiente.

Os expoentes para cada canal são codificados em um formato diferencial altamente compactado, com os deltas entre os bins de frequência consecutivos (diferente do primeiro) sendo fornecidos no fluxo. Três formatos, ou estratégias de expoente , são usados; estes são conhecidos como "D15", "D25" e "D45". Em D15, cada compartimento tem um expoente exclusivo, enquanto em D25 e D45, os valores delta correspondem a pares ou quads de compartimentos de frequência. Os blocos de áudio diferentes do primeiro em um syncframe podem reutilizar adicionalmente o conjunto de expoentes do bloco anterior (isso é necessário para canais que usam a Adaptive Hybrid Transform).

Os expoentes decodificados, junto com um conjunto de parâmetros de metadados, são usados ​​para derivar os ponteiros de alocação de bits (BAPs), que especificam o número de bits alocados para cada mantissa. Caixas que correspondem às frequências nas quais a audição humana é mais precisa recebem mais bits; caixas que correspondem a frequências às quais os humanos são menos sensíveis são menos alocadas. Qualquer lugar entre zero e 16 bits pode ser alocado para cada mantissa; se bits zero são transmitidos, uma função de pontilhamento pode ser aplicada opcionalmente para gerar o coeficiente de frequência.

Algoritmo

Dolby Digital Plus, como muitos codecs de áudio com perdas, usa uma representação de domínio de frequência altamente quantizada do sinal para obter ganho de codificação ; esta seção descreve a operação da transformação de base, bem como várias "ferramentas" opcionais especificadas pelo padrão, que são usadas para obter maior compactação ou para reduzir artefatos de codificação audíveis.

Transformada discreta de cosseno modificada

Tanto o codificador Dolby Digital quanto o DD + convertem um sinal de áudio multicanal para o domínio da frequência usando a transformada discreta de cosseno modificada (MDCT), com um comprimento de bloco selecionável de 256 ou 512 amostras (o último é usado com sinais estacionários, o primeiro com sinais transitórios ) A representação do domínio da frequência é então quantizada de acordo com um modelo psicoacústico e transmitida. Um formato de ponto flutuante para coeficientes de frequência é usado, e mantissas e expoentes são armazenados e transmitidos separadamente, ambos fortemente compactados.

Transformada híbrida adaptativa (AHT)

Para sinais altamente estacionários, como notas longas em apresentações musicais, a Adaptive Hybrid Transform (AHT) é usada. Esta ferramenta é exclusiva para Dolby Digital Plus (e não suportada em Dolby Digital) e usa uma transformada discreta cosseno (DCT) Tipo II adicional para combinar seis blocos de transformação adjacentes (localizados dentro de um syncframe) em um bloco efetivamente mais longo. Além da transformação de dois estágios, uma estrutura de alocação de bits diferente é usada e duas maneiras de representar mantissas codificadas são implantadas: uso de quantização vetorial , que dá o maior ganho de codificação, e uso de quantização adaptada a ganho (GAQ) quando uma maior fidelidade de sinal é necessária. A quantização adaptativa de ganho pode ser ativada independentemente para cada categoria de frequência dentro de um canal e permite a codificação de mantissa de comprimento variável.

Acoplamento

Como muitos programas de áudio multicanal têm altos graus de correlação entre canais individuais, um canal de acoplamento é normalmente usado. As informações de alta frequência que são comuns entre dois ou mais canais são transmitidas em um canal separado (um que não é reproduzido por um decodificador, mas apenas mixado de volta nos canais originais) conhecido como canal de acoplamento; junto com coeficientes conhecidos como "coordenadas de acoplamento" que orientam o decodificador sobre como reconstruir os canais originais.

Dolby Digital Plus oferece suporte a uma versão mais elaborada da ferramenta de acoplamento conhecida como Enhanced Coupling (ECPL). Este algoritmo, que é consideravelmente mais caro para processar (tanto para codificadores quanto para decodificadores), permite que informações de fase sejam incluídas nas coordenadas de acoplamento, permitindo que as relações de fase entre os canais acoplados sejam preservadas.

Extensão espectral

Dolby Digital Plus oferece outra ferramenta para altas frequências. Como os componentes de alta frequência geralmente são harmônicos de sons de baixa frequência, Spectral Extension (SPX) permite que componentes de alta frequência sejam sintetizados algoritmicamente a partir de componentes de baixa frequência. Essa ferramenta também é exclusiva para Dolby Digital Plus e não é compatível com Dolby Digital.

Rematrixagem

Os programas estéreo são tipicamente rematrixados e codificados como um canal L + R e LR. Isso é feito para aumentar o ganho de codificação (o canal LR normalmente pode ser fortemente compactado e a remoção da matriz subsequente causará o cancelamento de muitos artefatos de compactação) e para preservar as relações de fase necessárias para a reprodução adequada de material codificado por Dolby Surround .

Processamento de pré-ruído transiente

O processamento pré-ruído transiente (TPNP) é uma ferramenta específica do Dolby Digital Plus para reduzir os artefatos resultantes da quantização do sinal e outras técnicas de compressão. Ao contrário das outras ferramentas descritas acima, que operam no domínio da frequência e precedem a conversão de volta em amostras PCM, o TPNP é uma ferramenta que essencialmente executa uma operação de cortar e colar em janela no sinal de domínio do tempo para apagar certos artefatos de quantização previsíveis.

Relação com Dolby Digital e Dolby Atmos

Os fluxos de bits Dolby Digital Plus não são diretamente compatíveis com os decodificadores Dolby Digital legados . No entanto, Dolby Digital Plus é um superconjunto funcional de Dolby Digital, e os decodificadores incluem um componente obrigatório que converte diretamente (sem decodificação e recodificação) o fluxo de bits Dolby Digital Plus em um fluxo de bits Dolby Digital (operando a 640 kbit / s) para transporte via conexões S / PDIF herdadas (incluindo S / PDIF sobre HDMI) para decodificadores externos (por exemplo, AVRs, etc.). Todos os decodificadores Dolby Digital Plus podem decodificar fluxos de bits Dolby Digital.

No entanto, os fluxos de bits Dolby Atmos são codificados para serem compatíveis com os decodificadores Dolby Digital Plus e, como tal, o Dolby Atmos pode ser decodificado por dispositivos compatíveis com Dolby Digital Plus. Isso foi comercializado pela Dolby, como a variação de compressão com perdas do Dolby Atmos sob o rótulo "Dolby Digital Plus Atmos" para diferenciá-lo do original sem perdas baseado em DolbyHD. A maioria dos fluxos de bits Dolby Digital Plus agora são codificados na codificação Atmos.


Compressão de faixa dinâmica

Um objetivo do design do DD + é a reprodução de qualidade em uma variedade de ambientes, desde home theaters e outros ambientes acusticamente controlados onde a reprodução de alta faixa dinâmica é viável, até ambientes portáteis e automotivos onde muito ruído de fundo está presente e a compressão de faixa dinâmica pode ser necessária para tornar audíveis todas as partes de um programa de áudio.

DD + fornece os seguintes modos operacionais para diferentes ambientes de ouvinte / visualizador.

Modos de operação do decodificador Dolby Digital Plus:

Modo Loudness de referência (LKFS) Inscrição
Linha -31 LKFS Reprodução de home theater - oferece faixa dinâmica de "cinema" completa
RF -20 LKFS Reprodução de alto-falantes de TV - Fornece faixa dinâmica de "transmissão" típica
Portátil -11 LKFS Reprodução de alto-falante e fone de ouvido do dispositivo portátil - fornece faixa dinâmica mínima (semelhante às técnicas de produção / mixagem / masterização de música)

Nota: Todos os modos de operação do decodificador (listados acima) estão disponíveis em cada decodificador Dolby Digital Plus. O modo de operação padrão é controlado pela categoria do dispositivo e pelo aplicativo. Em alguns dispositivos, os usuários também podem ter uma escolha (via menu) para selecionar um modo alternativo que se adapte a seu gosto e / ou aplicação particular.

Além disso, Dolby Digital e DD + contêm metadados adicionais para permitir a tradução sem erros em canais downstream de faixa restrita, como modulação de RF, onde a amplitude excessiva do sinal de saída pode resultar em distorção significativa ou erros de modulação.

Encapsulamento, uso e armazenamento de streams Dolby Digital

Transporte físico para dispositivos de consumo

IEC 61937-3: define como transmitir fluxos de bits Dolby Digital (AC-3) e Dolby Digital Plus (E-AC-3) por meio de uma interface IEC 60958/61937 (S / PDIF). No entanto, a interface S / PDIF tem largura de banda insuficiente para transportar fluxos de bits Dolby Digital Plus (E-AC-3) no datarate de 3,0 Mbit / s especificado pelo HD DVD; datarates mais baixos são possíveis.

Muitos equipamentos de consumo, e até mesmo alguns equipamentos profissionais, não reconhecem Dolby Digital Plus como um formato codificado e tratam os sinais DD + em um S / PDIF ou interface semelhante, ou armazenados em um arquivo .WAV ou formato de contêiner semelhante, como se eles eram dados PCM lineares. Isso não é problemático se os dados são transmitidos inalterados, mas qualquer escala de ganho ou conversão de taxa de amostragem, operações que são auditivamente inofensivas para os dados PCM, irão corromper e destruir um fluxo Dolby Digital Plus. (Codecs mais antigos, como DTS ou AC-3, têm maior probabilidade de serem reconhecidos como formatos compactados e protegidos desse processamento).

Dolby Digital Plus pode ser transmitido através de HDMI 1.3 ou mais recente, de acordo com IEC 61937-3.

Transporte físico para dispositivos e aplicativos profissionais

Como a interface AES-3 é analógica profissional para S / PDIF, os streams Dolby Digital Plus podem ser transportados por conexões AES-3 com largura de banda suficiente e / ou por outras interfaces que encapsulam AES-3 (como SMPTE 259M e SMPTE 299M áudio incorporado). Os padrões adicionais promulgados pelo SMPTE especificam a codificação de transportes Dolby, incluindo Dolby Digital, Dolby Digital Plus e Dolby E (um codec apenas profissional usado em aplicativos de áudio / vídeo) em uma interface AES. O padrão SMPTE 337 especifica a sinalização e o transporte de sinais que não são áudio PCM em uma interface AES-3, e o padrão SMPTE 340-2008 especifica como Dolby Digital Plus e Dolby Digital devem ser transmitidos por essa interface. A combinação de SMPTE 340-2008 e 337M permite que o fluxo de bits Dolby Digital Plus seja armazenado e transportado dentro de fluxos de trabalho de produção, contribuição e distribuição profissionais antes da emissão para os consumidores.

Transmissão do consumidor em sistemas de televisão digital

DD + ou Dolby Digital é especificado pelo Comitê de Sistemas de Televisão Avançada como o codec de áudio principal para o sistema de televisão digital ATSC e é comumente usado para outras aplicações DTV (como transmissão por cabo e satélite) em países que usam ATSC para televisão digital.

Para transmissão (emissão) aos consumidores, o fluxo de bits Dolby Digital Plus é empacotado em um fluxo elementar MPEG e multiplexado (com vídeo) em um fluxo de transporte MPEG. Em sistemas ATSC, a especificação para transportar Dolby Digital Plus é descrita em ATSC A / 53 Parte 3 e Parte 6. Em sistemas DVB, a especificação para transportar Dolby Digital Plus é descrita em ETSI TS 101 154 e ETSI EN 300 468.

O Dolby Digital Plus está vendo um uso crescente em sistemas de televisão digital, particularmente em sistemas de cabo e satélite, como um substituto para Dolby Digital. Muitos desses aplicativos não tiram proveito de sua contagem de canais mais alta ou capacidade de oferecer suporte a vários programas independentes; em vez disso, é usado como um codec de maior eficiência do que o AC-3.

HD DVD e disco Blu-ray

Tanto o padrão HD DVD, agora extinto, quanto o disco Blu-ray incluem Dolby Digital Plus. É um componente obrigatório do HD DVD e um componente opcional do Blu-ray. O número máximo de canais codificados discretos é o mesmo para ambos os formatos: 7.1. No entanto, o HD DVD e o Blu-ray impõem diferentes restrições técnicas aos codecs de áudio suportados. Portanto, o uso de DD + difere substancialmente entre HD DVD e Blu-ray Disc.

Comparação de taxa de bits Dolby Digital (AC-3) e Dolby Digital Plus (E-AC-3)
Codec HD DVD Disco de blu-ray
Decodificação Canais Taxa de bits Decodificação Canais Taxa de bits
AC-3 obrigatoriedade 1 a 5.1 448 kbit / s obrigatoriedade 1 a 5.1 640 kbit / s
E-AC-3 obrigatoriedade 1 a 7,1 3.024 Mbit / s opcional, disponível apenas para canais traseiros 6,1 a 7,1 1.664 Mbit / s
TrueHD
opcional obrigatório
1 ou 2
3 a 8
18,0 Mbit / s
18,0 Mbit / s
opcional 1 a 8 18,0 Mbit / s

No HD DVD, DD + é designado um codec de áudio obrigatório. Um filme em HD DVD pode usar DD + como a trilha de áudio primária (ou única). É necessário um HD DVD player para suportar áudio DD +, decodificando e enviando-o para os conectores de saída do player. Conforme armazenado no disco, o fluxo de bits DD + pode transportar para qualquer número de canais de áudio até o máximo permitido, em qualquer taxa de bits de até 3,0 Mbit / s.

No disco Blu-ray, DD + é um codec opcional e é implantado como uma extensão para um audiotrack AC-3 5.1 "central". O núcleo AC-3 é codificado a 640 kbit / s, carrega 5 canais primários (e 1 LFE) e pode ser reproduzido de forma independente como trilha de áudio de filme por qualquer reprodutor de disco Blu-ray. O bitstream de extensão DD + é usado em reprodutores que o suportam, substituindo os canais traseiros na configuração 5.1 por versões de maior fidelidade, além de fornecer uma possível extensão de canal para 6.1 ou 7.1. A trilha de áudio completa tem uma taxa de bits combinada de 1,7 Mbit / s: 640 kbit / s para o núcleo AC-3 5.1 e 1 Mbit / s para a extensão DD +. Durante a reprodução, os fluxos de bits de núcleo e extensão contribuem para a saída de áudio final, de acordo com as regras incorporadas aos metadados de fluxo de bits.

Players de mídia e downmixing

Geralmente, um fluxo de bits Dolby Digital Plus só pode ser transportado por um link HDMI 1.3 ou superior. Receptores mais antigos oferecem suporte a versões anteriores de HDMI ou apenas têm suporte para o sistema S / PDIF para áudio digital ou entradas analógicas.

Para links não HDMI 1.3, o player pode decodificar o áudio e transmiti-lo por meio de uma variedade de métodos diferentes.

  • Versões anteriores de HDMI, como HDMI 1.1, suportam áudio PCM , onde o player decodifica o áudio e o transmite sem perdas como PCM via HDMI para o receptor.
  • Alguns receptores e reprodutores oferecem suporte a som surround analógico, e o reprodutor pode decodificar o áudio e transmiti-lo ao receptor como áudio analógico.

A maioria dos receptores e reprodutores oferece suporte a S / PDIF. Esta conexão digital de largura de banda inferior não é capaz de transmitir áudio PCM sem perdas com mais de dois canais, mas um player pode transmitir um fluxo de áudio compatível com S / PDIF para o receptor de uma das seguintes maneiras:

  • Os reprodutores de disco Blu-ray podem aproveitar as vantagens do fluxo de bits 5.1 AC-3 legado incorporado no fluxo de bits E-AC-3, transmitindo apenas o fluxo de bits AC-3 sem modificações.
  • Os jogadores que suportam o padrão HD DVD podem transcodificar o áudio decodificado em outro formato. Dependendo do método e das opções disponíveis para o jogador, isso pode ser feito com relativamente pouca perda de qualidade. O decodificador de referência da Dolby, disponível para todos os licenciados, explora a herança comum entre AC-3 e E-AC-3 executando a operação no domínio da frequência. A recompressão híbrida evita a descompressão ponta a ponta desnecessária e a recompressão subsequente (E-AC-3 → LPCM → AC-3). Além do AC-3, alguns HD DVD players transcodificam o áudio compatível com S / PDIF em áudio DTS de 1,5 Mbit / s . Enquanto S / PDIF pode transportar Dolby Digital Plus em taxas de bits mais baixas, o padrão HD DVD especifica uma taxa de bits para DD + que é muito alta para uma interface S / PDIF transmitir.

Caso o player precise decodificar o áudio para um receptor não HDMI 1.3, os resultados devem ser previsíveis. A especificação DD + define explicitamente os modos de downmix e a mecânica, de modo que qualquer campo de som de origem (até 14,1) pode ser reproduzido de forma previsível para qualquer ambiente de audição (até um único canal).

Veja também

Referências