Com o suposto desinteresse por parte do mercado consumidor de música pela mídia rotativa e com a crescente demanda de downloads, a indústria vem se adaptando a isto oferecendo os últimos com o rótulo de alta resolução, além de outros formatos. Somando o desaparecimento virtual do DVD-Audio comercial e a escassez de SACDs, a solução dos downloads de arquivos de alta resolução parece contemplar os dois lados: quem quer constrói um disco, quem não quer coloca seus arquivos em um flash drive e os leva para tocar em um equipamento competente.
Resta saber, e aí um dilema que parece não ter mais fim, se o que se está oferecendo como “alta resolução de áudio” tem alguma consequência prática para o entusiasta de música e áudio.
Dias atrás, eu tive a informação de que o meu ex-futuro fornecedor americano de downloads continua impedido de abrir espaço para residentes fora do território ianque. Recorrendo a conhecidos, entretanto, eu consegui arquivos de uma gravação que conheço bem, e com ela fui traçar alguns paralelos, com os recursos de que disponho.
A base das comparações foi a de um dos arquivos, disponibilizado em 192 kHz e 24 bits, o topo da resolução disponível em PCM, e a mesma faixa, vinda de um CD masterizado cerca de 20 e poucos anos atrás.
O resultado bem que poderia ser melhor! Colocando inicialmente todo o álbum original em um DVD-Audio, e mantendo a resolução em 192/24, a primeira comparação com o CD foi feita diretamente no equipamento de reprodução da sala.
A primeira coisa observada (e depois confirmada na tela do meu computador) foi a diferença de amplitude, bem mais baixa para a gravação de 192/24. Como esta diferença pode facilmente enganar os ouvidos, eu tive que estabelecer um nível ótimo de reprodução das duas mídias.
Depois disto, ficou claro que o CD oferece um som mais, digamos assim, “encorpado”, com melhor reprodução de baixa frequência e vocais com mais presença. O DVD-Audio mostra um ligeiro aumento no nível de alta frequência dos vocais e, no geral, com um pouco mais de dinâmica.
Nada disto tem um significado maior, em termos de um possível diagnóstico de qualidade relativa: primeiro, porque a minha análise é pessoal e subjetiva, segundo porque eu não posso determinar qual é a fonte usada em ambas as edições.
Supondo, apenas para fins de raciocínio, que as duas fontes usaram a master analógica original da gravação, que foi feita em 1962, pela Verve Records, mesmo assim a comparação é complicada. O CD foi editado pela falecida Polygram, masterizado nos Estados Unidos, e prensado na Alemanha. A masterização em 192/24 foi feita em solo americano, imagino eu. Em qualquer hipótese, a fonte é analógica e, como tal, precisa ser convertida para PCM.
Nos tempos de outrora, módulos de masterização analógico-digital (ADC) eram usados para fazer esta conversão, e mais recentemente todo o trabalho já é feito em computadores, rodando programas profissionais que não só remasterizam como limpam, restauram ou convertem.
Aqui cabe observar que a introdução de computadores no tratamento do áudio de fonte analógica é infinitamente mais preciso e atualizável do que aquele feito com equipamentos instalados nos estúdios. Entretanto, não se pode descartar, de forma simplista, a qualidade intrínseca de processadores antigos, muitos dos quais alcançam até hoje justificada reputação pelos engenheiros de áudio.
Então, que atitude tomar, para tentar explicar a ausência de uma diferença maior na reprodução das duas mídias? Não há muito que um leigo incipiente como eu possa fazer, exceto analisar o sinal das fontes. Para fazer isto, é preciso lançar mão de um analisador digital de espectro, e ele está contido em programas especializados, incluindo o gratuito Audacity, que qualquer um pode aprender a usar.
O olhar espectral
A análise espectral do arquivo 192/24 de uma das faixas mostra a presença de frequências até 96 kHz, coerente com o que foi postulado com o teorema de amostragem de Nyquist-Shannon, que demonstra que a topo da resposta de frequência é a metade do valor de amostragem, neste caso 192 ÷ 2 = 96 kHz:
Tomando a mesma faixa do CD como referência, a análise espectral nos mostra o topo da resposta de frequência a 22.05 kHz, já que o PCM do CD é amostrado em 44.1 kHz:
Pegando esta mesma faixa do CD e fazendo o upsampling para 192 kHz, o espectro nos mostra que acima de 22.05 kHz não há nenhum conteúdo de áudio presente:
O que nos leva a concluir que o processo de upsampling per se não introduz áudio onde não existe. E se é assim, porque então a análise da faixa 192/24 mostra sons na faixa superior do espectro?
A primeira coisa que parece evidente é que quem preparou o arquivo para 192/24 não usou nenhuma master digital prévia, já que esta pessoa estaria limitada à amostragem da fonte digitalizada, como foi o caso acima. E sendo assim, é mais provável que a masterização para 192/24 tenha vindo de uma fonte analógica, a master original, se quiserem.
Mas aí, surge outra dúvida, referente a esta fonte: até os melhores gravadores analógicos de estúdio se limitam a pouco mais de 20 kHz de resposta de frequência. No caso de uma gravação restrita a um pequeno grupo de músicos, composto de guitarra, piano, baixo e bateria, acompanhando uma vocalista, é improvável que qualquer captura além do segundo harmônico tenha relevância na reprodução. Isto significa dizer que a barreira dos 20 kHz da gravação analógica não teria influência na qualidade da reprodução.
Supostamente, para uma master analógica da década de 1960, não deveria haver captura de nada além dos vinte e poucos kHz. E se isto é verdade, porque então a masterização de 192/24 da fonte analógica exibe conteúdo acima de 20 kHz?
A discussão dos harmônicos
Harmônicos são múltiplos do som fundamental. Quando uma nota de um instrumento é tocada, o som desta nota se desdobra em valores inteiros. Por exemplo, para um som de 6 kHz (médio agudo) o seu primeiro harmônico é 12 kHz, o segundo 24 kHz, e assim por diante.
Advogados ortodoxos da mídia analógica (Lp incluso) reclamaram, e muito, quando o CD foi lançado, que a resposta de frequência estava limitada a 22.05 kHz. Segundo eles, a ausência de harmônicos na faixa superior desta frequência estaria tirando a sensação do “ar” que vem junto com a reprodução dos diversos instrumentos, e que conferem um som mais macio e agradável de ouvir. Tudo isto foi categoricamente afirmado, e o é até hoje, sem nenhuma prova ou evidência de que o ouvido humano é capaz de perceber frequências tão altas.
A propósito, o ouvido humano perde a sensibilidade auditiva nos extremos de frequência. Em se tratando de alta frequência, esta perda é particularmente sentida por homens, ainda em uma idade precoce e se deteriora, à medida que a idade avança.
Nada disto, entretanto, impede a pessoa de ouvir música de forma satisfatória. Com uma perda natural de sensibilidade para algo acima de 10 kHz, mesmo assim a percepção auditiva para a música instrumental é mantida e sua resolução nativa também. E a explicação para este fenômeno é muito simples:
A música é formada por sons transientes: a onda sonora, que obedece a uma função senoidal, durante a reprodução da música atinge picos altíssimos que se extinguem rapidamente. Cada instrumento produz uma série interminável de sons transientes, com velocidade na onda de subida e queda variável. A mistura destes transientes é o que caracteriza o timbre do instrumento e ajuda a determinar a sua posição no espaço. Em última análise, a correta reprodução de transientes é o que efetivamente contribui para uma audição de música satisfatória.
Em tese, a resposta de frequência que se estende até cerca de 20 kHz, como na gravação analógica, é mais do que suficiente para a percepção de qualidade da música gravada. E partindo então deste princípio, o que se vê acima desta faixa de frequência no arquivo com 192/24 oferecido para download, seja lá o que for, não resolve o problema de resolução que o audiófilo ou amante de música iria desejar, quando à procura do que é rotulado como “alta resolução”.
Quando 192/24 faz sentido ou não
A amostragem de 192 kHz a 24 bits de resolução tem sido mais usada ultimamente, como forma de conversão, restauração e armazenamento de material analógico. O objetivo não é só aumentar a acuidade da conversão da onda analógica, mas também de evitar artefatos durante esta conversão.
Vários donos de gravadoras, entre eles David Chesky, têm argumentado a favor de não só usar 192/24 no estúdio, mas de oferecer ao público também, pelos motivos citados acima.
No aspecto da reprodução de fontes digitais, o uso de amostragem alta falaria a favor da necessidade de filtragem na saída do conversor digital-analógico (DAC) bem mais elaborado e com menos artefatos também. Estes artefatos dizem respeito à possibilidade de interação de imagens de frequências elevadas na parte de baixo do espectro audível, deteriorando a reprodução correta de instrumentos e vozes.
Argumentos contra a reprodução em 192/24 dizem respeito ao fato de que frequências muito elevadas tendem a saturar desnecessariamente os circuitos de amplificação e as caixas acústicas. E neste ponto, ultra-tweeters, capazes de reproduzir sons acima de 18 kHz, poderiam até ajudar a isolar frequências indesejáveis dos outros drivers das caixas. Tudo isto, é claro, são especulações, que podem ou não serem capazes de revelar algum problema nesta direção, mas que em nada contribuem na discussão de que um arquivo contendo material não musical acima de 20 kHz vale a pena ser usado ou não.
Até mesmo David Chesky admite que não há conteúdo musical que justifique uma resposta de frequência até 96 kHz. Na realidade, existem testes feitos por terceiros que revelam não haver nada relevante acima de uma determinada frequência, e esta é, por acaso, muito acima da capacidade de audição do ouvido humano.
No frigir do ovos…
O objetivo, entendo eu, de se fazer uma amostragem alta de fonte analógica seria o de aumentar a precisão da representação digital da onda sonora. Exegetas do métier têm sido veementes quanto à precisão de cálculo na amostragem usada para o CD (44.1 kHz a 16 bits), dentro da faixa de 20 Hz a 20 kHz. E se mesmo assim não se está satisfeito, é possível, até mesmo em casa, aumentar a palavra digital para 20, 24 ou 32 bits e a frequência de amostragem bem acima de 44.1 kHz.
Qualquer pessoa de um mínimo de bom senso consideraria alta resolução o sinal PCM acima de 48 kHz, digamos 88.2 ou 96 kHz. E a prática nos tem demonstrado que a reprodução multicanal, mesmo em 44.1/16, pode nos dar resultados satisfatórios.
A indústria de cinema adotou o padrão 48 kHz e 24 bits para os programas multicanais de trilhas sonoras, e os estúdios de música 96 kHz e 24 bits para a gravação, com redução para a masterização de fontes diversas.
Se for para se pagar uma nota e fazer download de arquivos de 192 kHz e 24 bits e não ver nestes qualquer benefício na reprodução do conteúdo, mesmo com equipamento capaz de responder até 100 kHz, então se estará, salvo melhor juízo, jogando dinheiro fora!
Na minha avaliação pessoal, eu tenho tido evidências claríssimas de que o tratamento cuidadoso de originais analógicos se beneficiam muito da conversão de alta resolução, seja para PCM ou DSD.
Parece que, enquanto este objetivo não for atingido, não adianta oferecer material de áudio com amostragem alta. Acho também que o comércio na forma de discos ou downloads não deveria morrer, apenas que os seus proponentes sejam coerentes e esclarecedores, no momento de oferecer qualidade. Eu sou um que até me conformaria de investir um valor que considero injusto, se fosse para resgatar trabalhos de álbuns clássicos, que o tempo e o mercado pareceram esquecer, mas jamais sem uma contrapartida que não frustrasse as minhas expectativas de um som melhorado. [Webinsider]
…………………………
Leia também:
- Perspectivas para o áudio de alta resolução em um futuro próximo
- Anatomia de um Blu ray player
- Processadores de áudio
…………………………
Acompanhe o Webinsider no Twitter e no Facebook.
Assine nossa newsletter e não perca nenhum conteúdo.
Paulo Roberto Elias
Paulo Roberto Elias é professor e pesquisador em ciências da saúde, Mestre em Ciência (M.Sc.) pelo Departamento de Bioquímica, do Instituto de Química da UFRJ, e Ph.D. em Bioquímica, pela Cardiff University, no Reino Unido.
2 respostas
Ótimo artigo, na minha opinião as pessoas precisam de downloads, ninguem quer pagar para baixar alguma coisa.
gostei