Hoje não faltam opções para quem gosta de música e podcasts. O mercado está repleto de serviços de streaming de áudio, tendo opções como Spotify, Deezer, Tidal, YouTube Music, Resso e Apple Music. Na hora de escolher, você deve estar atento não apenas ao tamanho da biblioteca disponibilizada, mas também a fatores como o Sample Rate, Bit rate e Bit depth.
Também conhecidos como Taxa de Amostragem (Sample Rate), Taxa de Bits (bit rate) e Profundidade de Bit (Bit Depth), esses três componentes interferem diretamente na qualidade do áudio que ouvimos
Se você pretende ouvir músicas com a máxima resolução, optando por formatos Hi-Fi e Hi-Res, entenda a seguir o que são, o que fazem cada um desses itens e quais as diferenças entre eles.
Antes de explicarmos termos como bit depth, bit rate e sample rate, é preciso entender um pouco mais sobre os sons em formato físico, analógico e digital. O som que ouvimos é resultado da movimentação do ar ao nosso redor. Nossos ouvidos percebem diferentes ondas de pressão e trabalham em conjunto com o cérebro para interpretá-las na forma sonora.
Em uma representação visual, o som pode ser traçado como ondas que oscilam em relação à amplitude e à frequência, conforme o gráfico abaixo:
Representação de uma frequência senoidal simples | Imagem: David MacDonald (YouTube)
A amplitude dessas ondas (marcada pela distância entre o ponto mais alto e o centro do gráfico) é o que dita a nossa percepção de volume e intensidade. Repare que a pressão ocorre nos dois sentidos, tanto entrando quanto saindo dos seus ouvidos.
Já a frequência de repetição dessa onda é o fator que dita o quão agudo ou grave um som é, o chamado tom. Imagine, por exemplo, o som de discagem que você ouve ao fazer uma ligação. Ele é uma onda senoidal pura oscilando a uma frequência de 425 Hertz (Hz). Isso significa que ela completa 425 ciclos a cada segundo.
Para capturar esses sons, utilizamos microfones, dispositivos que transformam a energia cinética (provocada pelas ondas de ar) em energia elétrica. Nessa etapa analógica, o áudio opera como um pulso contínuo, reproduzindo cada detalhe e transição fielmente.
É na hora da conversão do meio analógico para o digital (conversão AD) que entra em cena o processo de sampling, também conhecido como amostragem. O que ele faz é extrair milhares de amostras do sinal de áudio original, como se fossem “fotografias” da onda tiradas em momentos diferentes.
Isso é necessário porque o mundo digital não possui uma forma tão eficiente para representar mudanças graduais e contínuas como as vistas nas ondas sonoras.
Por meio desse processo conseguimos converter os pulsos elétricos em bits, a unidade de informação utilizada pelos nossos dispositivos eletrônicos, sejam eles computadores, smartphones ou players de áudio.
A frequência com que são feitas amostras da onda sonora é o que chamamos de Taxa de Amostragem, ou Sampling Rate. Ela também é medida em Hertz, ou ciclos por segundo. Para entender melhor, dê uma olhada na imagem abaixo:
Imagem: Zoom Brasil (YouTube)
Acima você pode ver uma onda sonora analógica (vermelho) e a sua representação digital (blocos cinza) em dois diferentes sampling rates: 44.1 kHz e 96 kHz. Note que quanto maior o número de amostras (eixo horizontal), mais fiel torna-se a “imagem” da onda e a sua representação. Por esse motivo, o Sampling Rate também é conhecido como Resolução sonora (Resolution).
Segundo o Teorema de Nyquist, a taxa de amostragem deve ser no mínimo o dobro da frequência a ser reproduzida. Para reproduzir corretamente um som de 5 kHz, por exemplo, você precisaria de um sampling rate de no mínimo 10 kHz. Isso é necessário para que todos os picos e vales da frequência sonora sejam capturados, de forma a reproduzir as ondas precisamente no mundo digital.
Diversos estudos apontam que os humanos ouvem frequências entre 20 Hz e 20 kHz. Algumas crianças até conseguem captar sons acima desse espectro, mas conforme envelhecemos nossos ouvidos se tornam cada vez menos sensíveis, com uma percepção auditiva que varia entre 15 e 17 kHz.
Com base nesses valores, o Teorema de Nyquist revela que seria necessária uma taxa de amostragem (sampling rate) de no mínimo 40 kHz para reproduzir de forma correta as ondas mais agudas que nós conseguimos ouvir.
Para acomodar essas frequências e outras questões técnicas, a indústria sonora adotou a taxa de amostragem de 44.1 kHz como o padrão para o formato de áudio digital em CDs e outras mídias. Mais recentemente, o valor de 48 kHz começou a ganhar popularidade por sua correlação direta com as taxas de frames mais utilizadas no cinema e na web (tais como 24, 25 e 30 fps).
E o que acontece se você utilizar uma taxa de amostragem menor do que 44.1 kHz? O resultado é uma perda cada vez mais pronunciada dos detalhes da música e das frequências agudas.
Confira a demonstração no vídeo abaixo:
Levando em consideração todos os fatores que citamos acima, chegamos à conclusão de que um sample rate de aproximadamente 40 kHz seria mais do que suficiente para reproduzir com fidelidade todas as frequências audíveis aos humanos, quando o assunto é a distribuição de música aos consumidores finais.
Contudo, aqui há um impasse muito grande.
De um lado, temos aqueles que encaram essa informação como absoluta, afirmando que o uso de sample rates mais altos é apenas um desperdício de banda de dados. Outro detalhe apontado é que a maioria dos alto-falantes não consegue sequer reproduzir ondas mais agudas do que isso (o que é verdade, já que muitos speakers e fones de ouvido trabalham apenas entre 20 Hz e 20 kHz).
Do outro lado, temos um grupo que afirma que, mesmo não sendo audíveis, essas frequências geram impactos sobre a nossa audição e o nosso corpo, alterando a percepção que temos do áudio e da sua qualidade.
Apesar do embate, a verdade é que as diferentes taxas de amostragem possuem seu lugar. Valores mais baixos como 44.1 kHz são úteis para consumidores finais, entregando arquivos com ótima fidelidade e tamanhos significativamente menores (além de exigirem menos processamento de CPU).
Já os profissionais que trabalham com a edição de áudio podem se beneficiar da resolução mais alta em gravações, principalmente quando precisam realizar operações de ajuste de tempo nos arquivos (como time stretching e mudanças no tom).
Onda senoidal com frequência de 10kHz e sample rate de 44.1kHz (Imagem: FabFilter)
Alguns fabricantes de plugins de áudio (como reverbs e modulações) têm produtos que se beneficiam de sampling rates mais elevados, produzindo resultados mais convincentes. Contudo, o uso de sampling rates acima de 44.1 kHz (como 48, 96 e 192 kHz) deve ser analisado caso a caso.
Vamos voltar um pouco à imagem que utilizamos para ilustrar o processo de amostragem? Agora, repare que ambos os samples foram realizados na taxa de 44.1 kHz. Contudo, um deles tem uma amplitude maior. Isso ocorre porque ele utiliza uma profundidade de bit (Bit Depth) mais elevada.
Imagem: Zoom Brasil (YouTube)
Essa amplitude é caracterizada como o alcance dinâmico de uma gravação digital, ou seja, a diferença entre o sinal com o maior volume possível antes que ele apresente distorções e o sinal com a menor intensidade perceptível acima do nível de ruído (noise floor).
Quanto maior for o número de bits utilizados por amostra de áudio, maior será o alcance dinâmico. Por isso o Bit Depth é representado como sendo o eixo vertical do gráfico. Confira alguns dos valores de bits e seus respectivos alcances, medidos em decibéis:
– 4 Bits – 24 dB de alcance dinâmico
– 8 Bits – 48 dB de alcance dinâmico
– 16 Bits (Qualidade de CD) – 94 dB de alcance dinâmico
– 24 Bits – 144 dB de alcance dinâmico
– 32 Bits – 1528 dB de alcance dinâmico
Os padrões de Bit Depth mais utilizados atualmente são 16 bits (qualidade de CD, padrão na maioria dos dispositivos) e 24 Bits (qualidade de estúdio). Ambos garantem um alcance mais do que suficiente para retratar as músicas distribuídas comercialmente, sendo o valor de 24 mais indicado para produção e edição.
Repetindo a pergunta… E o que acontece se utilizarmos valores de Bit Depth mais baixos?
Seu áudio apresentará cada vez menos qualidade, com notável perda dos graves, da dinâmica dos instrumentos e, principalmente, muito mais ruído, já que não haverá espaço suficiente para separá-los do conteúdo musical.
Com 8 bits por amostra ainda é possível discernir com facilidade as frequências mais agudas, vocal e outros instrumentos, mas tudo se torna menos nítido. Já em 4 bits o resultado é uma catástrofe, com os ruídos e distorções tomando conta da gravação. Confira a seguir mais uma demonstração da iZotope, desta vez sobre o Bit Depth:
Ao salvar um arquivo de áudio digital, podemos usar diversos codecs e formatos de arquivo. Aqui há uma diferença importante entre os formatos Lossless e os Lossy. Os arquivos lossless são aqueles que mantêm todas as informações sonoras, sem cortes ou perda de qualidade.
Como exemplos de formatos lossless, podemos citar o FLAC (Free Lossless Audio Codec) e o ALAC (Apple Lossless Audio Codec). O problema é que eles consomem bem mais espaço de armazenamento.
É nesse ponto que surgem os formatos lossy. Eles utilizam várias técnicas de compressão e sacrificam alguns aspectos sonoros (como frequências consideradas inaudíveis) para entregar um arquivo bom o suficiente para o consumidor final, mas sem tamanhos que impossibilitem o armazenamento em massa ou o streaming. Os dois principais exemplos de formato Lossy atualmente são o MP3 e o AAC.
Esses arquivos comprimidos com perdas utilizam o chamado bit rate, ou taxa de bits. Esse valor é essencial para a qualidade do som e dita quantos bits por segundo de informação um arquivo de áudio contém.
De um modo geral, quanto maior o bit rate (taxa de bits) de um arquivo de áudio, maior será a sua qualidade sonora.
Essa é a razão pela qual os serviços de streaming têm anunciado os chamados planos Hi-Fi, audiófilos ou Hi-Res. Eles utilizam arquivos com qualidade altíssima para reproduzir as suas músicas com todos os detalhes.
Alguns dos serviços que já embarcaram na onda da alta qualidade e grandes bit rates foram:
– Spotify
– Tidal (Tidal Masters)
– Apple Music
– Deezer
Para qualidade mais alta, o valor de bit rate recomendado é de 320 kbps ou superior. A maior parte dos planos de streaming oferece versões de 256 kbps. Valores abaixo desses, como 128 kbps, são utilizados quando a conexão de internet fica ruim. O resultado é a perda da nitidez, da separação dos canais e dos detalhes da gravação.
***
Agora que você sabe o que são bit depth, bit rate e sampling rate, experimente comparar os arquivos da sua biblioteca de áudio para ver se consegue perceber a diferença entre diferentes configurações. Você pode se surpreender com o resultado!