O áudio digital é apenas um meio de armazenar e transportar áudio. O som, entretanto, começa e termina em ambiente analógico! Na captura e na reprodução tudo pode acontecer, e uma coisa que me parece verdadeira a respeito da reprodução do áudio é que gravações de relativa baixa qualidade podem se beneficiar significativamente de equipamentos de reprodução de alta qualidade, mas a recíproca é também verdadeira: quando o som é bem gravado, ele tende a reproduzir significativamente melhor em equipamentos de relativa baixa qualidade.
E quando se contempla estes dois cenários – baixa ou alta qualidade de gravação versus baixa ou alta qualidade de reprodução – pode-se pensar que seria sempre preferível começar com uma alta qualidade do som gravado, porque ele tende a ter ótima reprodução no melhor equipamento possível e uma reprodução aceitável naqueles equipamentos feitos com uma eletrônica nem sempre de bom nível.
É neste ponto que se insere o upsampling: por definição, ele é método feito com o objetivo de aumentar a resolução da fonte de áudio, de maneira a minimizar ou até eliminar as potenciais limitações impostas pela amostragem (medida em kHz) e o número de bits usado para armazenar a informação digital (bit depth).
O som é representado graficamente por ondas senoidais. Este tipo de onda é o que melhor representa a variação de energia do sinal musical, em função do tempo.
Em ambiente analógico, o que acontece a todo instante são processos de transdução (transferência) desta energia, de um meio para o outro. Por exemplo: o som, propagado na forma de rarefação e presença de ar, choca-se contra o diafragma de um microfone. A energia da onda é então transformada em impulsos elétricos, analogamente, e estes são transmitidos por um circuito eletrônico, até encontrar uma fita magnética. A energia da onda original é então armazenada na forma de pulsos magnéticos. Na reprodução, o processo é invertido, e o som é obtido de volta pelo movimento vibratório dos alto-falantes do sistema.
Em ambiente digital, esta transdução de energia se reduz a umas poucas etapas. Na realidade, com o advento das mesas digitais, no momento em que o som (analógico) é capturado por um microfone, a onda musical é medida e cada medição dessas é armazenada na forma de uma informação digital, ou seja, em bits.
Como a onda senoidal varia continuamente em função do tempo, fica implícito que quanto maior for o número de medições por segundo, maiores serão as chances de se conseguir acompanhar o formato original da onda. Essas medições são na verdade amostras de pontos específicos da onda, e o processo é, por isso mesmo, chamado de amostragem. A cada amostra tomada é associado um valor, contido na informação digital, e o processo de medição é então chamado de quantização.
Os valores da quantização dependem, por outro lado, do número de bits usados para compor a “palavra digital”, ou seja, quanto mais bits forem usados, maior o número de combinações que podem representar um valor de medição contínua. Na prática, isto determina a resolução de medição da onda senoidal, ou seja, traduzindo a mesma em valores digitais mais precisos e mais próximos do valor real.
Quando a gravação digital é feita, essas informações são guardadas em mídia magnética ou ótica. Durante a reprodução, elas são trazidas de volta, para reconstituir a onda senoidal original amostrada, ou seja, o som retorna ao ambiente analógico, passando por um amplificador e caixas acústicas do sistema.
No processo de volta, um outro fator entra em jogo: a quantidade de bits transmitida em função do tempo: o bitrate. Para um CD, por exemplo, que segue uma amostragem padrão de 44.1 mil amostras por segundo (44.1 kHz), com 16 bits de resolução e dois canais, o bitrate será: 44 100 x 16 x 2 = 1 411 200 bits por segundo, ou 1411.2 kbits/seg (kbps).
Vantagens do som digital:
Ao contrário do analógico, que torna obrigatória a transdução correta de energia de um meio para o outro, o som digital se baseia apenas em valores calculados, ou seja, não há nenhuma variação de amplitude de onda envolvida, e sim de números que a representarão. Com isso, todos os efeitos potencialmente negativos, elétricos e eletrônicos, dos processos de transdução, como por exemplo, a saturação de sinal, são automaticamente eliminados.
Um dos benefícios imediatos desta eliminação é a possibilidade de representar freqüências de qualquer valor, independente da sua amplitude. Enquanto no domínio analógico, freqüências elevadas exibem maior distorção quando em amplitude alta, no digital este problema não existe. Não há chance, por exemplo, de limitar a reprodução de agudos, por conta da saturação da mídia magnética. Em conseqüência, o aumento da faixa dinâmica, em qualquer programa, do som digital, é nitidamente superior ao analógico.
As qualidades do processo digital não isentam, entretanto, nem estúdios nem ouvintes, de tomarem uma série de cuidados. Como método de gravação, ele demanda uma programação sofisticada, mas sujeita a erros, o que explica porque existe uma enorme diferença de desempenho entre os vários sistemas usados para o processamento de sinal, mesmo a nível doméstico.
Isto implica em dizer que não é o método de trabalho em si, mas a maneira como os programas que fazem isso são escritos, que provocam a grande diferença! Por outro lado, dentro do ambiente digital, a manipulação de sinal é infinitamente mais tranqüila e isenta de artefatos, pelo fato singular de que todo o processamento é feito com aquilo que os computadores conseguem fazer melhor: cálculo!
Na prática, isto significa que é interessante manter o sinal de áudio o maior tempo possível dentro do ambiente digital. A indústria musical já tentou vários métodos para alcançar este intento, como por exemplo, digitalizar o sinal logo na saída dos microfones. E no lado do consumidor, a alta integração entre os vários processadores digitais tem sido usada como recurso para melhorar a reprodução em equipamentos com custo muito menor do que aqueles feitos para o áudio esotérico. No passado não muito distante, tentou-se usar caixas acústicas que podiam receber o sinal digital e transformá-lo em analógico um pouco antes de chegar aos alto-falantes!
As características da onda musical
Os algoritmos e princípios, fórmulas mirabolantes e programas usados, variam de um formato digital para outro. Até agora, um deles, o da gravação em PCM, reina supremo. Mesmo o DSD, usado como base para o SACD, passa pelo PCM, antes de ser reproduzido.
Tomando o PCM como referência, nós podemos abordar a maneira como o sinal de áudio musical é seguido, sem precisar recorrer a uma matemática complicada e desinteressante para nós leigos.
Antes, é preciso saber como a onda musical é formada, depois que o som é produzido por um instrumento ou voz. Cada som tem características em comum com outros, no que se refere à subida da onda senoidal (ataque), atingindo o pico uma fração de segundo depois, e descendo para o seu nível mais baixo (“decay” ou queda), e assim sucessivamente.
A música é fundamentalmente composta por sons transientes: que são aqueles cujo período de ataque, pico e queda ocorrem muito rapidamente. E é exatamente por causa desta rapidez, e pelo fato de que cada instrumento possui a sua própria sucessão de transientes, que os maiores desafios do áudio são encontrados.
Para se ter uma idéia da complexidade de como os sons transientes ocorrem no programa musical, basta olhar a representação gráfica a seguir, com o canal esquerdo em cima e direito em baixo:
E agora, com um zoom de um trecho de 2.8 segundos deste mesmo programa, quando então fica mais fácil observar alguns picos:
No processo original da captura dessas ondas, com o uso de um formato digital como o PCM, é sempre interessante colher o maior número de amostras, de forma a ter uma representação o mais aproximado possível da onda musical original. O processo em si não é totalmente perfeito: podem existir erros de quantização, capazes de arredondar, mas não se aproximar dos valores reais da representação binária da onda. Bem verdade que esses e vários artefatos criados durante o processo de amostragem são depois filtrados durante a conversão digital para analógico, e dependendo da competência desta filtragem, eles dificilmente são percebidos!
Vantagens do upsampling:
O ideal seria que, quando o som de estúdio é capturado, fosse usada a maior amostragem disponível, o que nem sempre é possível, por conta da enorme quantidade de memória (bytes) necessária para armazenar a informação musical. Atualmente, um padrão consistente usado em muitos estúdios é o do registro da gravação digital em 96 kHz e 24 bits.
No mundo do consumo, a realidade é bem outra: o usuário final normalmente se defronta com o som produzido pelo Compact Disc, que foi criado numa época em que se procurou contemporizar qualidade de áudio com espaço em disco, diante as limitações da mídia naquele momento. Hoje em dia, existem métodos de masterização (XRCD ou SBM, por exemplo), que diminuem ou até eliminam por completo as limitações físicas do CD.
E o que fazer com outras fontes, que não são beneficiárias de qualquer processo de melhoramento? A resposta é: aumentar o upsampling, antes da decodificação digital-analógico. E porque antes? Porque a necessidade de uma filtragem drástica diminui significativamente. Na prática, se tem observado que, quanto maior for o valor de amostragem, menor será a necessidade de se proceder a uma filtragem radical de artefatos diversos.
E é importante notar que o uso de upsampling nada tem a ver com os filtros digitais, do tipo oversampling, por exemplo, usados próximos dos estágios de saída dos reprodutores. Na realidade, alguns fabricantes têm observado que a simplificação dos estágios de filtragem pós-upsampling dispensam, e até evitam, os efeitos deste tipo de manipulação. É possível, inclusive, que uma filtragem exagerada possa destruir os benefícios do upsampling, ao invés de aumentar a resolução do som reproduzido.
O que fazer para se conseguir upsampling de uma gravação já existente?
Por incrível que pareça, os meios para se conseguir upsampling de áudio estão mais próximos do usuário do que se imagina:
1 – Por Hardware:
Dentre eles, o mais prático e direto é o uso de um leitor de CD, DVD ou Blu-Ray, que faça uso do método diretamente. Existem no mercado modelos que vão desde o high-end, até aqueles vendidos para o mercado de massa.
É importante que o leitor saiba que, se ele tomar a decisão de investir num equipamento com este tipo de recurso, o aparelho deve permitir a ele configurar e até mesmo desligar, para chegar ao ponto de uma audição plenamente satisfatória, em qualquer tipo de disco. Normalmente, as opções variam entre as amostragens que são valores múltiplos dos 44.1 kHz usados no CD: 88.2 e 176.4 kHz.
Todos os circuitos de conversão digital-analógico hoje em dia são capazes de operar em até 192 kHz e 24 bits. A qualidade desta conversão, entretanto, é muito variável, sendo até possível que, em alguns casos, a inserção de upsampling não vá resultar em absolutamente nada de útil!
Uma outra maneira, um pouco mais cara, porém mais versátil, porque pode ser usada com qualquer fonte sonora, é a instalação de um processador externo. Esses aparelhos são preparados para fontes 5.1 de sinal, se desejável, e com um maior número de recursos de configuração, para usuários avançados.
2 – Por Software:
O uso de programas de computador para fazer upsampling é fascinante, eclético e trabalha com uma enorme variedade de formatos, além do PCM. Ele é particularmente indicado para os casos onde o material já está gravado e armazenado em algum arquivo, como acontece, por exemplo, nas conversões de fitas ou Lps para a mídia digital.
Aqui também, como no caso do hardware, os custos variam de programa para programa, mas, ao contrário do segundo, o custo pode ser bem menor do que se imagina. Para quem prefere software de domínio público, a Voxengo oferece uma opção, chamada R8brain, gratuitamente. O R8brain é recomendado por vários estúdios que vendem download de fonogramas com alta qualidade de áudio. Isto porque ele permite fazer também o processo inverso: downsampling! Assim, quem compra áudio de alta qualidade pode reduzir a amostragem, para um valor aplicável a mídias com limitações de reprodução, por exemplo, de 94 kHz e 24 bits para 44.1 kHz e 16 bits, do CD.
Ainda na área de programas que a maioria de nós pode comprar, uma opção que me agrada muitíssimo é a suíte da Cirlinca, composta de três aplicativos, dois dos quais, o DVD-Audio Solo e o HD-Audio Remaster, podem ser adquiridos por fora, para atender a recursos específicos, ou então combinados na versão HD-Audio Solo Ultra, mais em conta, se adquirida no lugar dos outros dois.
Enquanto o DVD-Audio Solo permite processar áudio e depois queimar o resultado em DVD-Audio, DVD-Video ou num disco híbrido, ele não incorpora as virtudes do upsampling profissional oferecido pelo outro programa. Assim, na versão Ultra, estas limitações desaparecem, além do programa permitir um monte de outros recursos que não existem nas outras versões.
A empresa permite o uso do programa por trinta dias, sem limitações, e na verdade encarece o usuário de fazer testes antes de comprar. Nos testes que eu fiz em casa, a versão mais simples oferece um upsampling tão bom quanto o da versão Ultra, mas quando se trata de multicanal, esta última permite variar o processo para cada canal individualmente, e com isso se economiza um enorme espaço em disco, e sem perda de qualidade, quando o processo é feito com critério, tipo amostragem mais alta nos canais dianteiros e mais baixa nos de trás.
As limitações do uso de software
O usuário precisa ter em mente que freqüências de amostragem alta, especificamente 176.4 e 192 kHz, encontram espaço somente no DVD-Audio, para um máximo de dois canais, e assim é preciso primeiro saber se ele irá ter meios depois de reproduzir o produto da conversão. Existem toca-discos de carro e toca-discos de DVD ou Blu-Ray, com recursos para tocar DVD-Audio. Na ausência desses, é possível usar alguns programas de computador, com o uso de decodificadores, e tocar o arquivo obtido na conversão.
Programas não desenhados para uso profissional, como estes da Cirlinca, não aceitam arquivos MLP. Para tanto, é necessário investir muito mais, com programas como o DiscWelder versão Steel, da Minnetonka, e como uma coisa puxa a outra, ainda é preciso ter à mão o conversor PCM-MLP, elevando assim o custo do processo.
É preciso notar também que aumento de amostragem não faz milagre! Sinal de áudio sem qualidade dificilmente se beneficiará deste tipo de tratamento. Em alguns casos, o sinal até tem qualidade, mas o resultado da conversão acaba não acrescentando algum tipo de melhoria auditiva. Mas, de qualquer forma, o computador está aí exatamente para isso: se não der certo, muda-se ou abandona-se!
Análise auditiva
Uma aplicação das mais interessantes, que eu encontrei com o uso do programa da Cirlinca e que pode ser conseguida com qualquer programa semelhante, é o da transcrição literal da amostragem original da gravação de alta resolução, que não precisa de upsampling, mas que pode ser submetida a este tipo de tratamento, se desejado. E nisso eu incluo amostras em 48, 88.2, 96, 176.4 e 192 kHz, irrespectivo do número de bits.
Fazendo um upsampling experimental em uma gravação anteriormente transcrita de um Lp restaurado, de quase uma década atrás, foi possível observar uma mudança na clareza de sons na faixa de media para alta freqüência e um aumento da dinâmica geral do programa musical. Em alguns momentos, a transparência na reprodução de instrumentos de sopro me fizeram lembrar da excelência do som reproduzido por caixas eletrostáticas, coisa que nem sombra o meu atual equipamento consegue fazer.
Trabalhando com outras fontes de material, o resultado não foi tão dramático assim, o que é coerente com o fato de que essas fontes aparentam não ter conteúdo capaz de ser melhorado pelo aumento da amostragem.
Por outro lado, não creio que este tipo de aplicação será tão interessante ou útil para aqueles ouvintes cuja atenção não está focada na análise da reprodução ou se interessem por isso.
E algumas conclusões filosóficas
No meu modesto entendimento, toda essa conversa de “ouvidos de ouro”, que eu ouço desde que me envolvi com os ditos audiófilos, é e não passa de uma tremenda viagem. Primeiro, porque, com a devida orientação, paciência e treinamento, qualquer um pode aprender a ouvir áudio. Segundo, porque as limitações do ouvido humano excluem qualquer análise que não seja altamente subjetiva, além de prejudicar o indivíduo, em função da sua anatomia e da sua idade.
O importante na audiofilia e principalmente na apreciação da reprodução doméstica de música é saber se o que está tocando soa bem ou não, para os ouvidos de uma determinada pessoa! Se não for o caso, qualquer outra discussão sobre o assunto com terceiros cai totalmente no vazio, terminando algumas vezes em discussões ásperas e ressentimento!
Aqui, eu vou pedir licença aos leitores, e fazer um pequeno desabafo: eu me lembro de ter escrito um artigo sobre o melhoramento de reprodução de CDs, quando de repente eu vi o mesmo ser literalmente transcrito num desses fóruns de audiófilos nacionais, para logo depois desqualificado e desmerecido. E para não perderem a viagem, um dos usuários ainda me chamou de “preconceituoso”.
Quando as pessoas precisam recorrer ao background técnico, científico ou esotérico, para convencer os outros de que o que ele/ela ouve está certo e o ouvido dos outros não presta, então a audiofilia perdeu a sua razão de ser! Ela se torna excludente e esnobe. E eu já li, pela Internet a fora e ouvi de amigos, que as pessoas preferem não se reconheceram como audiófilos, para não serem confundidas com gente deste tipo.
Aos leitores que me acompanham, e que me premiam com a sua paciência, um conselho: a liberdade de pensamento e de julgamento é tudo na vida. No áudio, na música ou no cinema, se vê, se ouve, se gosta ou não. Ponto!
Aqui em casa, por exemplo, eu testei o R8brain, descrito acima e citado por vários sites, e não gostei. O resultado do tratamento deixou o áudio áspero e impreciso, pelo menos para os meus ouvidos. O Lplex, por outro lado, que é também gratuito, faz discos com 96/24, de resolução absolutamente impecável. O que muda entre o programa e outro é a maneira como seus algoritmos são desenhados. O R8 brain não deu certo para mim, mas pode dar certo para outros, e certamente dá, caso contrário não seria indicado por terceiros.
Certos equipamentos dotados de upsampling tem uma performance pobre, devido provavelmente à má construção do software interno dos seus processadores, ou então da construção da parte analógica com componentes de qualidade duvidosa, para baratear custos. Se alguém se basear num equipamento desses para julgar o upsampling, vai se precipitar num julgamento impreciso!
De longa data, eu percebo que algumas pessoas não notam nada de mais no áudio cujas fontes são notoriamente mais limpas, sob o ponto de vista da resolução dos instrumentos e das vozes. Mas, eu já estive perto de pessoas que, por outro lado, se impressionam com facilidade. E como eu sempre digo, tudo isso é pessoal e intransferível. Que cada um seja feliz com que acha que é melhor para si próprio. [Webinsider]
…………………………
Conheça os serviços de conteúdo da Rock Content..
Acompanhe o Webinsider no Twitter.
Paulo Roberto Elias
Paulo Roberto Elias é professor e pesquisador em ciências da saúde, Mestre em Ciência (M.Sc.) pelo Departamento de Bioquímica, do Instituto de Química da UFRJ, e Ph.D. em Bioquímica, pela Cardiff University, no Reino Unido.
5 respostas
sobre o upsampling reforço, ta cheio de audio porai, , registrado com ruídos em 44 na DAW e seus mentores achando quefzr UP vai sumir da gravação ou da reprodução, por isso que eu estou aqui, porque estou estudando muito ! parabéns de novo chapa! eu respeito que ouve e não ouve ! deus abençoe
concordo plenamente com vc chapa, meus amigos me abandonaram depois que eu investi num sistema de monitoração e captação 16 ch HD em 192. disseram que eu estava ficando pirado e maluco, piadinhas e testes maliciosos pra derrubar minha fisiologia auditiva! eu ouço, 18 khz, tenho 33 anos, meu studio e um silencio absoluto , e não uma resenha!
concordo plenamente com vc chapa, meus amigos me abandonaram depois que eu investi num sistema de monitoração e captação 16 ch HD em 192. disseram que eu estava ficando pirado e maluco, piadinhas e testes maliciosos pra derrubar minha fisiologia auditiva! eu ouço, 18 khz, tenho 33 anos, meu studio e um silencio absoluto , e não uma resenha! gato pelo seu post ,
Oi, Alex,
Obrigado pela leitura. Os processadores de áudio atuais estão realizando operações que passam completamente transparentes para os usuários, e assim é bem possível que no seu próximo equipamento você estará ouvindo áudio de melhor qualidade, sem saber por que. Entre estes melhoramentos, o upsampling, particularmente em cima de material comprimido, já é quase padrão.
Muito bom!
Com este texto leve e direto o senhor conseguiu sintetizar, para um leigo e quase analfabeto como eu, o significado e as aplicações do upsampling de áudio.
Coisa de Mestre…
Obrigado pelo anzol. Pretendo pescar muito! ;D