A história do áudio digital é bem mais fascinante do que o seu lançamento. Desenvolvido em tempos recentes pela BBC, e depois licenciado e desenvolvido para o lado prático pela Denon, a adoção absoluta do áudio digital só foi levada a termo durante a introdução do Compact Disc, pela Philips, em 1983.
Antes disso, a Denon havia lançado o conceito de fabricar LPs a partir de matrizes digitais e foi copiada durante algum tempo por vários estúdios, preocupados em contornar as limitações do som analógico – coisas como saturação de alta freqüência, limitações de dinâmica, distorções de fasamento e um monte de outros problemas que não nos compete desfilar agora.
Até esta época, a mim me parecia que os ouvidos de ouro de plantão ainda não haviam se tocado para as diferenças de som entre o LP convencional e aqueles fabricados com masters digitais. Isto tudo mudou, entretanto, quando o CD apareceu no mercado. O som do CD foi considerado “antisséptico”, “serrilhado”, “áspero”, “mid-fi”, “sem harmônicos” e vai por aí. E, acreditem se quiserem, mas esta mesma comunidade de exegetas ainda afirmou que até o LP feito a partir de som digital era melhor do que o CD.
Eu agora confesso aos leitores que, por conta de atitudes deste tipo, uma das coisas mais saudáveis que eu já fiz na minha vida foi nunca me engajar numa discussão sobre áudio, e o faço assim até hoje, graças a Deus, o que me rendeu a vantagem de acabar por notar que pessoas que se arrogam a ser melhores ouvintes do que outras adotam hoje sem pudor o áudio digital comprimido sem qualquer hesitação ou arrependimento.
Mas a história do áudio é assim mesmo: numa outra vez muitas pessoas reclamaram do som do amplificador a transistor, quando já se sabia que a válvula era cheia de distorção harmônica. Portanto o ideal pragmático que eu adoto até hoje é de que cada um seja feliz com o que ouve! Até porque a minha profissão me ensinou que, quando a gente acha que alguma coisa deu errado por um problema qualquer, a gente pára tudo para analisar onde está o erro e como consertá-lo, ao invés de ficar reclamando dele!
Um dos grandes empecilhos para a maioria dos audiófilos, na apreciação do áudio digital, é a formidável quantidade de modelos matemáticos e fórmulas que alguém vai ter que digerir para poder avaliar corretamente parâmetros de reprodução.
E mesmo entre aqueles que entendem e discutem tudo isso com proficiência não há consenso suficiente para garantir ou tirar dali alguma coisa conclusiva ou útil. Por isso, eu não me atrevo, em hipótese alguma, em me apresentar como entendido na matéria. O que eu vou fazer, espero, é colocar alguns conceitos sobre áudio digital, de forma a que o leitor saiba onde está pisando. Mais importante ainda, eu espero que, ao final da leitura, o leitor se dê conta de que está lidando com algo complexo, e que, por isso, a maioria das opiniões ou avaliações lidas ou ouvidas ao longo do tempo é fruto de puro “achismo” ou de exagerada apreciação pessoal e subjetiva.
Tendo dito tudo isso, o que eu posso recomendar a quem me lê é manter sempre a cabeça aberta. E com este espírito em mente, vamos então atacar o problema:
Thomas Stockham, cientista americano, desenvolveu um dos primeiros gravadores de som digital, o Soundstream, e com ele foram feitas, ainda na época do LP, as primeiras gravações interessantes com orquestras sinfônicas, entre as quais se pode destacar as do selo americano Telarc, que aliás foram recentemente repassadas para SACD, sem qualquer perda do sinal original, a 50 kHz de amostragem.
A transposição mais próxima dos padrões de sinal digital daquela época concretizou-se no Compact Disc, cujas especificações demandam uma amostragem de 44.1 kHz e resolução de 16 bits. O sinal digital adotado foi o PCM (Pulse Code Modulation, também chamado de LPCM, ou Linear Pulse Code Modulation), que está em uso até hoje, em vários formatos.
A evolução do processamento do sinal digital acompanhou a do desenvolvimento de novos microchips pela indústria de informática. Hoje em dia, a grossa maioria dos estúdios de gravação opera com sistemas em 96 kHz e 24 bits, e as gravações não mais envolvem fitas magnéticas, elas vão diretas para um disco rígido. O limite do áudio digital não é, entretanto, 96 kHz e sim 192 kHz, e é possível se obter este tipo de som em casa, se o ouvinte dispuser de um reprodutor de DVD-Audio.
A vantagem, no caso, de se usar 96 kHz é a de se poder multiplicar o número de canais, sem grandes sacrifícios de espaço de memória e processamento. Estes dois últimos fatores são importantes, e se constituem no motivo pelo qual é muito comum um disco Blu-Ray, por exemplo, vir acompanhado de trilha sonora LPCM multicanal a 48 kHz e 24 bits ou 48 kHz e 16 bits, ao invés de 96 kHz e 24 bits.
Note que o importante, na obtenção de mais qualidade no áudio digital, no caso LPCM, é conjugar esses dois fatores (amostragem e resolução), num sinal cujo processamento não deve resultar em perda, quando comparado à fonte.
A prática tem demonstrado que sinais de resolução mais alta são mais bem transcritos para mídia de resolução mais baixa, como por exemplo, matrizes de 20 ou 24 bits usadas para fazer o CD (16 bits) destinado aos audiófilos (exemplos desses CDs são os feitos pelo processo K2 da JVC ou o Super Bit Mapping, da Sony, usado no SACD).
E em se tratando da reprodução de um CD qualquer, cujas especificações, por convenção, não podem ser mudadas, a solução é se introduzir um pós-processamento, com o objetivo exclusivo de impedir a degradação do sinal gravado.
A reprodução de um CD pode se tornar problemática, nos estágios de saída do seu reprodutor. Ali serão executadas operações de conversão do sinal digital, cujas etapas exigem uma correta integração (reconstituição) do sinal senoidal analógico e uma filtragem, para evitar a passagem de qualquer ruído que possa adulterar o sinal original gravado.
O problema aqui é que, durante o processo de amostragem, são criadas “imagens”, que são duplicatas dos sinais amostrados, mas em faixas de freqüência mais acima da faixa do sinal gravado, como, por exemplo, a imagem de 22.05 kHz a 44.1 kHz. Embora a imagem criada esteja na faixa inaudível do espectro sonoro, ela pode intermodular com a faixa audível, e com isso criar distorções por intermodulação, que são desagradáveis aos ouvidos do ouvinte. Por isso, é empregado um filtro “anti-imagem”, cuja função é remover sinais acima da faixa de audição.
O método ortodoxo, usado originalmente pela Sony quando da introdução do CDP-101 em janeiro de 1983, foi usar um filtro de barreira. Este tipo de filtro corta abruptamente a passagem de qualquer freqüência acima da freqüência de corte. O uso do filtro de barreira introduz artefatos irreparáveis na reprodução do som, tais como oscilações (“ringing”) ou alterações de fase.
Para contornar isso, o que se fez na época foi usar um processo matemático para multiplicar a freqüência de amostragem padrão do CD (44.1 kHz), de modo a levar a imagem para bem longe do espectro de audição. Um deles, usado desde os primeiros leitores da Philips, é o oversampling: trata-se de multiplicar por 2, 4 ou mais vezes o sinal de amostragem, e no caso específico dos leitores da Philips 44.1 x 4 = 176.4 kHz, gerando um espectro que seria posteriormente cortado por um filtro de terceira ordem (tipo filtro Bessel), bem mais suave e sem os efeitos de fasamento acima mencionados.
Note que o processo de oversampling de 4 vezes também criará uma imagem, mas a 176.4 kHz, portanto bem afastado do limite da faixa de audição (22.05 kHz). Assim, o uso de um filtro ultrassônico poderá ser efetivado, afetando bem menos o espectro de audição do que o filtro de barreira.
Os métodos de oversampling são preferidos no desenvolvimento dos leitores de alta qualidade para CDs, podendo alcançar atualmente freqüências em torno de 256 vezes a amostragem padrão. O oversampling é possível porque, na prática, a única coisa que é feita é interpolar dados sobre a onda senoidal, por aproximação estatística, que não existiam anteriormente na amostragem convencional. O resultado é uma onda senoidal igual à anterior, porém mais refinada:
.
.
.
.
De forma matematicamente similar, o upsampling consiste no aumento do número de medidas, porém este processo é feito antes que o sinal amostrado chegue ao estágio de conversão digital-analógico.
Todo o processamento de upsampling é feito no ambiente digital, e se ampara na capacidade dos chips mais modernos de trabalhar com sinais de alta freqüência de batimento, como por exemplo, 96 kHz ou acima. Na prática, o upsampling é uma operação de conversão do sinal digital, digamos de 44.1 kHz para 48 kHz, e assim por diante. Sinais convertidos chegam, atualmente, a 192 kHz, na maioria dos chips.
O upsampling produz resultados de performance bastante audíveis, mas a explicação concreta sobre porque isto ocorre não é muito clara. Na realidade, o sinal musical original continua rigorosamente o mesmo. A conversão per se não implica na transformação de um sinal de 44.1 kHz para outro de 96 kHz, porque o sinal já está no ambiente digital no momento da conversão. Uma possível explicação sobre a melhoria da qualidade do áudio estaria no fato de que a filtragem de um sinal convertido a analógico seria bem menos drástica no sentido de deteriorar fasamento ou de introduzir outros tipos de distorção.
Na melhor das hipóteses, o upsampling apareceu no mercado como benefício dos melhoramentos de processadores mais sofisticados, como uma espécie assim de subproduto ou efeito colateral benéfico, para quem adquire hoje um leitor de DVD ou Blu-Ray.
E isso o torna um presente mais do que bem-vindo para aqueles ouvintes que ainda gostam de ouvir música com um sinal de áudio de boa qualidade. Por outro lado, para que estes benefícios possam ser totalmente percebidos pelo ouvinte, é mandatório o uso de um equipamento de reprodução de boa qualidade, lembrando sempre que o som ouvido percorre uma cadeia de elementos, que influenciam (melhoram ou deterioram) a sua reprodução. [Webinsider]
.
Paulo Roberto Elias
Paulo Roberto Elias é professor e pesquisador em ciências da saúde, Mestre em Ciência (M.Sc.) pelo Departamento de Bioquímica, do Instituto de Química da UFRJ, e Ph.D. em Bioquímica, pela Cardiff University, no Reino Unido.
2 respostas
Olá, Pedro,
Até recentemente, os leitores de CD com upsampling implementados no seu design eram todos das linhas high-end. O recurso começou a ser usado em leitores de DVD, em função da sofisticação e integração que veio a acontecer nos DACs mais modernos.
É importante que se note que o resultado final não depende exclusivamente do upsampling, mas também do refinamento dos estágios de saída do leitor e do equipamento de reprodução usados, motivo pelo qual nos leitores de DVD com upsampling de áudio é possível alterar o valor da amostragem ou desligar completamente o recurso.
Uma outra abordagem que me parece uma das melhores, e a que eu uso já de algum tempo é passar o sinal de áudio (CD, SACD, DVD-Audio, etc.) pela conexão HDMI, até um decodificador externo competente, dotado da mesma entrada. A vantagem, no caso, é a velocidade de transmissão de dados por HDMI, eliminando qualquer tipo de compressão entre fonte e destino.
No caso específico do SACD, a saída pode ser padronizada em múltiplos de 44.1 kHz (o sinal original divido por um certo valor). No caso do leitor que eu uso, a saída foi fixada em 88.2 kHz, para todos os canais.
Gostei bastante do conteúdo do seu artigo e aproveito a oportunidade para juntar comentário que hoje fiz em fórum de música clássica, sob o codinome “migrando”.
“… Com pedido de desculpas pela citação com recurso à memória lembro-me de que neste site http://www.geocities.com/capecanaveral/9096/rapsodia.htm já extinto, do audiófilo Fábio, havia a informação de que para que se pudesse obter níveis de excelente reprodução sonora, seria necessário que os equipamentos leitores de mídia (CD players) possuíssem recursos de oversampling de, no mínimo, 256 vezes a taxa de amostragem padrão de 44.100Hz, ou seja, 11.289.600Hz.
Neste outro site é feita a seguinte referência àquela taxa de oversampling:
“…Os métodos de oversampling são preferidos no desenvolvimento dos leitores de alta qualidade para CDs, podendo alcançar atualmente freqüências em torno de 256 vezes a amostragem padrão.
A oversampling é possível porque, na prática, a única coisa que é feita é interpolar dados sobre a onda senoidal, por aproximação estatística, que não existiam anteriormente na amostragem convencional. O resultado é uma onda senoidal igual à anterior, porém mais refinada. …”, porém sem nenhuma informação adicional a respeito de CD players possuidores de recursos para tal façanha!
Apesar de assunto um tanto esotérico, porém não menos interessante, poderia citar que
“… A Meridian não acompanhou a atitude das gravadoras ▬ que estão adotando a sampling do DAC
(48.000kHz) e estão prensando CDs em 24/96 ▬ e preferiu continuar utilizando em seus CDs players
a do próprio CD-PCM, e lê o CD de 16/44.100Hz fornecendo esses dados à entrada do pré, em tempo
real, quadruplicados para 24/176.4kHz. Como o CD tem capacidade de armazenamento de
705.600 amostras do sinal sonoro por segundo, o pré “estaria enxergando” uma entrada de sinal de
4.233.600 amostras, 9,6 vezes a do CD, o que não deixa de ser surpreendente.
Pelo visto, parece-me que o topo do pinheiro continua um tanto distante, mas parafraseado nosso amigo Paulo Roberto “… Portanto o ideal pragmático que eu adoto até hoje é de que cada um seja feliz com o que ouve! …”