Perspectivas para o áudio de alta resolução em um futuro próximo

Share on facebook
Share on twitter
Share on linkedin
Share on whatsapp
Share on telegram
Share on pocket

Nada de muito novo na tecnologia do áudio digital de alta resolução vem aparecendo, mas aquele lado sombrio que vinha indicando o desaparecimento e obsolescência de alguns codecs está aos poucos se dissipando.

O leitor desta coluna poderá ter reparado o súbito bloqueio do site Megaupload.com, de propriedade da Megaupload de Hong Kong. O banimento se baseou em processo da justiça norte-americana, acusando o site de infringir direitos autorais de terceiros e vários outros delitos.

A briga promete continuar e retaliações já foram vistas na internet, dirigidas ao território norte-americano. Mas uma das consequências imediatas foi o autobanimento de inúmeros sites de hospedagem de arquivos, permitindo acesso somente ao usuário que tivesse feito o upload de seus arquivos. Em outras palavras, diminuiu a farra do compartilhamento de arquivos.

Tudo isto é a continuação da queda de braços entre hackers, proponentes da liberdade de expressão na internet e grupos afins, contra as diversas administrações públicas e entidades privadas, detentoras de algum tipo de direito autoral. A exceção, neste episódio, fica por conta da escalada da guerra entre ambos, que começou mais ou menos no final do ano passado.

Uma das possíveis consequências desta escalada terá que ter, em algum momento do futuro próximo, uma contrapartida por quem defende seus direitos autorais, seja literatura, vídeo ou música.

Neste último segmento, o da música, a questão originalmente levantada pelo Napster (se alguém aqui ainda se lembra dele…) era de que discos fora de catálogo poderiam ser compartilhados entre usuários do mundo todo. E o sucesso imediato do Napster mostrava claramente que a indústria de discos nunca se renovou totalmente, quando da passagem do som analógico para o digital. Mesmo decorridos vários anos do aparecimento do compact disc, apenas uma pequena parte do acervo das gravadoras se tornou disponível no novo formato, e eu desafiaria pacificamente qualquer um a me contestar, afirmando o contrário.

Entretanto, 2012 promete mudar pelo menos um pouco o rumo desta história infeliz. Eu creio que existe consciência nos mandatários e técnicos das gravadoras de que os seus catálogos correm o risco de desaparecimento, caso discos e fitas armazenados nos arquivos não forem resgatados imediatamente. E se fizerem o resgate agora com mais intensidade, o farão com atraso considerável. Os estúdios de cinema já fazem isto há décadas e o resultado é que a comercialização deste trabalho em home vídeo acabou por dar uma parada na quebradeira!

Então, não se trata apenas da preservação do catálogo, trata-se de torná-los disponíveis para todas as gerações de amantes de música e de áudio.

O projeto recente da EMI

O site Audiophile Audition, dedicado à apreciação de música e de projetos de áudio, nos mostra uma entrevista recente com Simon Gibson, onde ele fala sobre o gigantesco projeto de resgate feito pela EMI.

O projeto da EMI, intitulado “Signature Series”, tem o seguinte fluxograma de trabalho:

 

Inicialmente é feita uma pesquisa nos arquivos da gravadora. As fontes tanto podem ser acetatos ou matrizes em disco, quanto fitas magnéticas de primeira geração, mono, estéreo ou multicanal. É importante que sejam escolhidas as fitas desta geração, em virtude da perda de frequências altas nas fitas de segunda geração em diante.

A seguir, os engenheiros da EMI decidiram não transcrever este material para DSD diretamente, que seria o ideal, mas que dificultaria o processo de restauração. Isto ocorre porque os principais softwares avançados de limpeza e restauração trabalham em ambiente PCM.

O padrão de PCM usado nos estúdios já de algum tempo é o do formato 96 kHz e 24 bits. Alguns engenheiros de áudio não vêm vantagem em fazer esta remasterização em 192 kHz, achando que a melhoria é inaudível. O projeto da EMI usa 96/24 exclusivamente. O estúdio usa o formato DA-8, gerada pelo modelo ADA-8XR, da Prism Sound, para todas as matrizes.

Uma vez em PCM, o áudio original é submetido a tratamento para redução de ruído e correção ou retirada de artefatos diversos. A prática mostra que aumentando a relação sinal/ruído de uma fonte analógica a acuidade de reprodução (fidelidade) aumenta proporcionalmente.

No caso de matrizes de disco, este tratamento é fundamental para eliminar a interação toca-discos – agulha – disco, ou pelo menos reduzir a influência eletro-mecânica desta reprodução. Além disso, os ruídos de impulso, conhecidos pelo usuário como “estalidos”, precisam ser retirados, mas sem adulteração da onda musical. Este processo é delicado, e em muitos casos o técnico dará preferência a retirar este tipo de ruído individualmente, ao invés de usar métodos automáticos.

As fitas magnéticas são lidas em decks Studer (no caso deste projeto, em um Studer A80), com a possibilidade de intercâmbio de cabeças de leitura mais adequadas para tipos específicos de gravação.

O interessante neste tratamento de restauração é que ele é facilmente reversível. O técnico pode (e deve) trabalhar em uma cópia do arquivo digital, e se algo der errado, ele poderá corrigir o erro ou recomeçar o trabalho a partir de uma cópia nova.

Uma vez terminada a restauração do material fonte, o arquivo resultante é submetido a uma transcodificação de PCM para DSD, com o objetivo de criar uma matriz para SACD, e paralelamente reduzir por conversão o arquivo PCM de 96/24 para 44.1/16, que é padrão do CD, que não pode ser alterado.

Ambas as matrizes são usadas para criar um disco híbrido SACD-CD, que tem a vantagem de poder ser reproduzido em qualquer aparelho para CD, DVD ou SACD. Vai depender deste último a chance de poder reproduzir fontes de som multicanal, vindas da camada SACD.

É também importante assinalar que neste projeto da EMI não há notícia sobre o uso de limitadores ou compressores, e é bem possível que os técnicos da empresa tenham uma clara percepção de que o uso destes tipos de equipamento condena o usuário a ouvir o material da fonte sem a dinâmica alcançada no momento da gravação das matrizes. Pois se uma das principais vantagens do áudio digital é justamente a da extensão da faixa dinâmica de reprodução, em valores muito acima do qualquer mídia analógica, é um contrassenso frequentemente praticado por técnicos em remasterização a submissão do sinal analógico a este tipo de processamento.

E seria, neste aspecto, interessante lembrar que uma das principais acusações aos provedores de download de arquivos de áudio de alta resolução é justamente que, pela análise da dinâmica dos arquivos baixados, feita por usuários domésticos e analistas, nota-se uma compreensão que não poderia ser proveniente do processo de captura.

 A disponibilidade de downloads aumentou significativamente em tempos recentes

O número de sites que disponibilizam arquivos de áudio de alta resolução aumentou bastante, desde o ano passado para cá. O site Audiophile Audition oferece um guia para downloads, e que inclui a lista das revendas especializadas.

Para o leitor que for se aventurar com arquivos de alta resolução eu posso dar uma ideia do que fazer para se obter uma reprodução correta com eles:

No momento, vários blu-ray players de mesa são capazes de reproduzir áudio de alta resolução, partindo de 44.1 kHz, até pelo menos 96 kHz/24 bits, incluindo arquivos multicanal. Alguns equipamentos permitem até reproduzir 88.2, 176.4 ou 192 kHz, os dois últimos em estéreo.

Na maioria dos casos é suficiente transferir os arquivos para um drive USB, do tipo flash drive (pen drive ou assemelhado), ou hard disks ligados à controladoras com saída USB ou até E-sata, se esta entrada estiver disponível.

Outra opção são os chamados servidores do tipo media player, que podem ser conectados por rede sem fio ou direto, por USB, no equipamento.

O streaming de arquivos direto de um computador, por rede sem fio funciona bem com arquivos de pequena demanda de tráfego (bitrate baixo). Para saber qual é o limite de cada rede local, só mesmo testando. Nas redes DLNA, o princípio é o mesmo. Normalmente, arquivos de resolução alta têm dificuldade de tráfego pela rede local do usuário.

A melhor opção, para quem tem um pouco de paciência, é queimar uma mídia em disco. O áudio de alta resolução pode ser facilmente transportado em DVD-R/RW. Discos DVD-RW são excelentes para fazer testes.

Se o usuário ficar satisfeito com arquivos estéreo 96 kHz/24 bits, uma opção excelente é o Lplex, já comentado nesta coluna. Dá um pouco de trabalho para acertar o “ini” do programa, mas o resultado compensa amplamente. O programa aceita tanto arquivos PCM (.wav) quando PCM comprimido em flac.

Para situações diferentes da acima descrita, a melhor opção é construir um DVD-Audio, mas aí é preciso que o reprodutor de mesa seja capaz de ler este tipo de disco.

O DVD-Audio transporta qualquer arquivo de áudio, limitado apenas para dois canais, quando a amostragem atinge a 192 kHz/24 bits.

É possível comprimir o conteúdo com a ajuda do codec MLP, mas o custo operacional para o usuário doméstico não é pequeno. Quando não for o caso, ou seja, PCM multicanal sem compressão, aplicativos mais baratos estão disponíveis no mercado. Um dos melhores, na minha opinião, é o HD-Audio Solo Ultra, da Cirlinca. O programa permite praticamente tudo, desde montar discos DVD-Audio, DVD-Video ou híbridos, com o uso nestes dois últimos, de transcrição em PCM estéreo ou AC-3 (Dolby Digital). Além disto, o usuário pode montar CDs, Blu-Rays ou arquivos iso, que podem ser lidos por qualquer programa de queima de mídia.

O grande mérito deste aplicativo é poder trabalhar com fontes de áudio fora do âmbito da simples gravação em disco ou flash drive. Operações de upsampling são bem vindas e por terem excelente desempenho com qualquer fonte permitem a experimentação de melhoria de material de áudio bem gravado, a partir de qualquer formato.

 Cuidados com os dowloadings e com a escolha do codec certo

Já foi comentado aqui neste espaço que no passado recente acontecia uma prática condenável de revendas de downloads de fazerem upsampling de arquivos de áudio e de disponibilizá-los como de alta resolução. E mesmo que a prática tenha parado, depois dos protestos de muitos usuários, é sempre bom ficar com o ouvido aberto.

Eu mesmo já tive a experiência de ouvir música com resolução mais alta, sem quase ou nenhuma contribuição na fidelidade da reprodução, e em alguns casos, de discos adquiridos com resolução de 192/24, comparados com a mesma edição em CD (44.1/16).

A questão mais importante, creio eu, seria a escolha correta da resolução do arquivo a ser baixado, para evitar desperdício financeiro e perda de tempo. Para muitos usuários, o compromisso com a resolução não é tão importante assim, e por isto codecs comprimidos, como MP3 ou AAC, são perfeitamente aceitáveis. Na verdade, dependendo da aplicação, eles podem até ser o formato ideal de uso.

Para os arquivos de alta resolução propriamente ditos é preciso levar em conta a diferença relativa de qualidade entre eles. Não é incomum se observar que a diferença na qualidade do áudio entre 96/24 e 192/24 é quase imperceptível, na grande maioria dos casos.

Embora exista uma tendência natural de se conseguir mais acuidade em amostragens mais altas na reprodução das frequências mais altas do espectro auditivo, o fato é que grande parte desta faixa é de difícil discernimento, particularmente para o ouvinte casual.

Exegetas deste campo de trabalho têm demonstrado, e os nossos ouvidos também, que o formato 44.1 kHz e 16 bits, escolhido para o CD, é perfeitamente adequado para representar a faixa audível do espectro sonoro. A subida de amostragem para 96 kHz e 24 bits, se de fato resultante do processamento da fonte analógica de áudio, deverá exibir a qualidade desejada, sem precisar ir muito além de qualquer outro processamento, e esta é a razão pela qual 96/24 se tornou padrão nos estúdios de gravação já faz algum tempo.

Em se tratando de áudio multicanal, eu chamaria a atenção para o fato de que a imensa maioria dos trabalhos feitos com trilhas sonoras de filmes e até de gravações de concertos ou show, a amostragem de 48 kHz e 24 bits é plenamente satisfatória.

A decisão de que resolução de áudio o usuário deve baixar seria respondida pela sua capacidade e/ou interesse, em conseguir o melhor som possível, para a aplicação a que se destina.

Se a fonte de download for confiável, eu entendo que dois canais a 96/24 ou múltiplos canais a 48/24, darão conta do recado na maior parte das gravações. Mas, não se trata de uma regra que não possa ser quebrada. O problema é que o usuário final dificilmente terá noção da qualidade do som de origem (master), e assim um julgamento mais apurado sobre o que é a qualidade do download desejada é virtualmente impossível.

Na dúvida, não se pode esquecer que a escolha de selos de audiófilos, no que se refere à qualidade potencial do som gravado, se tornou referência para a escolha mais correta, porque os seus estúdios partem da premissa que a reputação alcançada com um trabalho de melhor nível é difícil de ser conquistada.

Para quem realmente gosta de música, e sente falta de um catálogo com melhores opções, resta torcer para que este cenário não se altere. O recente fracasso do DVD-Audio como mídia comercial deixou em todos nós um certo desapontamento e frustração, que se espera ser compensada com a permanência do SACD e dos downloads de alta resolução. Este ano parece que estamos indo bem, mas só o desenrolar dos recentes acontecimentos dirá se vamos caminhar no rumo certo [Webinsider]

. . .

Anatomia de um Blu-Ray player

 

Processadores de áudio

Paulo Roberto Elias é professor e pesquisador em ciências da saúde, Mestre em Ciência (M.Sc.) pelo Departamento de Bioquímica, do Instituto de Química da UFRJ, e Ph.D. em Bioquímica, pela Cardiff University, no Reino Unido.

Share on facebook
Share on twitter
Share on linkedin
Share on whatsapp
Share on telegram
Share on pocket

Mais lidas

7 respostas

  1. Oi, Victor,

    Eu vou chamar a atenção do nosso editor-chefe para verificar a possibilidade de tranca nas áreas de comentários. Volta e meia eu ainda respondo em colunas muito antigas, mas com estas trocas de versão do editor que o site usa tudo é possível.

    Se você me permite, eu sugeriria que quando você quiser citar um texto, é conveniente fazer uma referência de onde ele veio. Este é, aliás, o procedimento rotineiro nas publicações de qualquer manuscrito na área acadêmica.

    Sobre o seu comentário anterior, não há problema algum que você escreva o que achou ou o que pensa. E cabe a mim, se for o caso, retificar alguma coisa que não esteja correta, não que eu queira educar ninguém, mas porque eu acho que se alguém se dá ao trabalho de ler um texto que eu escrevo, esta pessoa merece de mim a atenção se algum ponto for interpretado de outra maneira diferente daquela que eu escrevi.

    Eu também não sou o dono da verdade, nem quero. Se você ler os textos com atenção vai notar que eu tenho uma preocupação didática constante. Caso contrário, seria apenas um desfilar de cultura e ego, coisas que, aliás, eu detesto.

    O 70 mm é um formato que ainda vive nas mãos de alguns poucos cineastas (veja, por exemplo, Baraka), mas para exibição mesmo são poucos países que ainda mantém equipamentos em funcionamento.

    Há pouco tempo atrás, um leitor nosso me chamou a atenção para o estado do Philips DP-70 do Windsor e eu acabei publicando um pequeno texto no in70mm: http://www.in70mm.com/news/2012/windsor/index.htm

    Todos nós somos vítimas de consternação e preocupação com o desaparecimento destas máquinas. E não há um meio sequer, que eu saiba, aqui no Brasil, de se viabilizar exibições ocasionais de cópias de filmes em 70 mm. E entretanto, os projetores estão por aí, e com a digitalização do cinema, vão acabar em uma sucata, o que profundamente lamentável, na minha opinião.

  2. Oi, Paulo,

    Eu não publiquei no texto original por dois motivos: 1) Falta de atenção (mea culpa, rsrs); 2) Aparentemente a área de comentários lá está trancada.

    Bom, de qualquer modo, você está correto. Eu imaginei que este processo de 35mm expandido para 70mm não se aplica ao caso de Vertigo, já que a definição do VistaVision é excelente. E eu imaginei (mea culpa, novamente) que houvesse uma queda de qualidade nesta expansão (mas de um filme em 35mm comum; não Super 35 ou com outro processo de captação) simplesmente porque é algo similar a pegar um filme captado em 16 mm e expandi-lo para 35 – aliás, acho que o melhor exemplo que eu posso dar é aquele de A Rainha de Stephen Frears: a edição em Blu-ray deixa bem clara o contraste entre a das sequências em 16 mm e a elegância daquelas em 35.

    Bom, eu simplesmente usei aquele velho achismo. Desculpa se tiver falado alguma bobagem, rsrs.

    Grato.

  3. Oi, Victor,

    Antes de mais nada: eu tive que me virar para achar de onde você tirou a citação do meu texto, e, você me desculpe, ela está totalmente fora de contexto.

    A citação refere-se à restauração de Vertigo, a partir de negativo VistaVision, e duplicada em 70 mm, de modo a manter a resolução original da foto. Os restauradores tinham consciência de que esta seria a melhor maneira de preservar a qualidade do original. Um dos méritos do VistaVision é rodar o filme lateralmente, aumentando a área de exposição.

    Você então se refere a filmes rodados em 70 mm, que obviamente são de melhor qualidade que os rodados em 35 mm.

    Eu não me lembro de ter afirmado, e aí você pode me corrigir se eu estiver enganado, que não há diferença entre filmes rodados originalmente em 70 mm e aqueles rodados em 35 mm e ampliados para exibição em 70 mm.

    Aliás, um dos casos excepcionais onde esta regra é quebrada é na ampliação de Dr. Jivago, que durante anos muitos julgaram ter sido rodado em 70 mm e não em 35 mm.

    Em alguns processos de filmagem, como por exemplo no Super 35, consegue-se uma pureza fotográfica em 35 mm muito boa, mas note que a área de captura fotográfica não é a mesma do negativo em 65 mm. O Super 35 tem a vantagem de rodar em Panavision, porém com lente esférica, que elimina qualquer distorção ótica.

  4. “Esta estratégia foi usada por restauradores mais de uma vez, e um exemplo notório disso foi o trabalho feito com o negativo VistaVision de “Vertigo” (“Um Corpo Que Cai”, de Alfred Hitchcock), transferido para negativo de 65 mm, e depois exibido nos cinemas americanos em 70 mm, com trilha sonora DTS 5.1″.

    Gostaria, Paulo, que você pudesse me esclarecer uma questão: À parte da trilha sonora em DTS, este não era o mesmo processo que Hollywood utilizava em suas produções durante os anos 70-80? É sabido que muitos filmes eram rodados em 35 mm e depois sofriam expansões (blow-ups) para 70 mm quando exibidos em grandes cidades.

    Eu posso ter compreendido isso errado, mas me parece que há sim uma diferença relativamente notável entre filmar em 65 mm e expandir o 35 mm em 70 mm. Tiro isso por esta citação na crí­tica de Roger Ebert para Lawrence da Arábia:

    “‘Lawrence of Arabia’ was one of the last films to actually be photographed in 70mm (as opposed to being blown up to 70 from a 35mm negative)”.

    (Ok, admito que talvez Ebert esteja falando da “pureza” em se filmar em 70 mm desde a “natividade”).

    Agradeço pela atenção desde já!

  5. Oi, Andre,

    Eu entendo o seu entusiasmo pelo som obtido com o uso de 96/24, e eu compartilho dele sem hesitação.

    Entretanto, é preciso assinalar que o CD tem dinâmica de mais de 90 dB, ou seja, dá e sobra para qualquer peça clássica gravada com orquestra, coral, órgão, o que for.

    As fitas analógicas antigas chegavam a uns 60 dB de dinâmica ou um pouco mais, dependendo da velocidade de gravação (em geral 15 i.p.s.). Se você pegar hoje um SACD com gravações Living Stereo de peças classicas, uma das coisas que você não vai sentir falta é de dinâmica.

    Um amigo meu tem uma colossal coleção de discos clássicos, em tudo quanto é formato e já cansou de me mostrar gravações excepcionais em CD.

    Os teóricos, e isto você até lê em forums de profissionais a todo instante, insistem, e com razão, que as especificações do redbook (CD) são suficientes para representar a onda musical completamente.

    Na grande maioria das vezes, o uso de compressores e limitadores é o grande responsável pelos erros que você percebe, tanto assim que a HDTracks e outros provedores de 96/24 precisaram se comprometer em somente disponibilizar arquivos direto das fitas originais, sem manipulações ou adaptações. Porque, se não fosse deste jeito, qual seria o sentido de você baixar as gravações com eles?

    Um dos principais benefícios do aumento de amostragem é a modificação da filtragem após a decodificação. Entretanto, vários leitores de mesa hoje apresentam contornos eficientes para resolver isto. Se você tiver um leitor com saída bem desenhada, o CD soa de forma completamente diferente. Eu me lembro desta corrida ter começado quando a Philips lançou o DAC-7, no início da década de 1990, e este chip foi inclusive usado em muitos aparelhos high end da época. Eu tive o primeiro player Philips com DAC-7 e posso atestar a qualidade do mesmo. Na época, por coincidência, eu troquei mensagens por carta com o Jack Renner, produtor da Telarc, comentando o assunto, e recebi resposta dele, afirmando ter verificado a mesma coisa.

    E, finalmente, seu eu pudesse te passar uma sugestão que acredito ser útil seria a de ler com cuidado os reviews de sites com boa reputação (eu indicaria o site do Secrets, por exemplo) e observar a análise deles com mídias separadas, o que já te dá uma ideia de como o CD soa nestes equipamentos.

  6. Ola Paulo Elias,

    Eu gosto bastante de música erudita (a chamada clássica) desde muito tempo, e no vasto repertório, prefiro a música do Sec 18, barroca, pela sua leveza e sofisticaçāo, como Vivaldi e Bach.
    Sempre achei que o som de um CD é mais que suficiente para a gravaçāo e reproduçāo da música deste período, em geral tocadas por orquestras enxutas ou orquestras de câmara, pois a música barroca nāo tem muita dinâmica. Como o jazz e a Mpb tradicional, o nível de som é quase sempre o mesmo. Já a música do Sec 19 sobretudo aquela do seu final, de Stravinsky Mahler e Dvorak, nunca me agradaram sob CD e nunca entendi o porquê.
    Depois de muitas idas a concertos, nos teatros de Sāo Paulo adquiri o hábito de re-ouvir a obra em casa. A obra de Mahler é impossível de ouvir em Cd porque a orquestra faz uso de mais de duzentos músicos, coral e até órgāo, tudo junto e ao mesmo tempo. No Cd esta massa sonora precisa ser comprimida para nāo estourar o som, o que resulta num som embolado, longe do prazer ao vivo de escutar a obra.
    Depois que descobri os arquivos de alta resoluçāo, da HDTracks, tudo mudou.
    Agora percebo nitidamente como essas peças tāo dinâmicas podem ser gravadas e reproduzidas sem grandes perdas pois a dinâmica é preservada, embora ainda ligeiramente comprimida. A música grandiloquente, épica e colossal de Mahler, assim como a música que o sucedeu, a do cinema por exemplo, como Ennio Morricone, só para citar um, beneficia-se muito da amostragem  a 96 K. Claro que depende-se também de todo o circuito, caixas e amplificador.  O CD serve perfeitamente para música popular cuja dinâmica é constante e mesmo arquivos mp3 a 320 servem sem causar prejuízos a audiçāo, a nāo ser nos casos em que os tambores rugem e onde há muitos metais. Tudo depende do estilo que você preferir. Mas, cá para nós, 96 K é uma maravilha, sobretudo por captar todas as nuances e a atmosfera do local de gravaçāo. Obrigado, mais uma vez pelo artigo.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *