Intensidade é uma grandeza física definida  como o valor médio do fluxo de energia por unidade de área perpendicular  à direção de propagação, medida em watt por metro quadrado (W/m2).

Para  uma fonte produtora de ondas mecânicas harmônicas simples, a  intensidade está relacionada à densidade do meio fluido e ao  comprimento, frequência e amplitude da onda. As partículas de uma onda  longitudinal são deslocadas de suas posições de equilíbrio por uma  função que oscila no tempo e no espaço, criando um campo de pressão  variável.

Potência sonora é a energia sonora  produzida por uma fonte e não varia com a distância. É um valor teórico,  não mensurável, em watts. A potência sonora gera uma flutuação de  pressão sonora, cujo nivel depende da distância à fonte.

A pressão sonora é inversamente proporcional ao quadrado da distância à fonte
A pressão sonora é inversamente proporcional ao quadrado da distância à fonte

A intensidade sonora é uma grandeza de energia, a pressão sonora é uma grandeza de campo. A intensidade sonora é proporcional ao quadrado da pressão sonora.

A intensidade sonora nominal a uma distância r de uma fonte pontual e isotrópica de potência teórica W é obtida através da expressão:

intensidade_distancia_potencia

I intensidade sonora
r distância da fonte ao receptor
p pressão sonora no receptor
ρ densidade absoluta do ar (1,2 kg/m3)
c velocidade de propagação do som no ar (340 m/s)

O produto ρc é chamado impedância acústica específica e corresponde a 410 Rayls (Rayleighs) no ar.

No Sistema Internacional de Grandezas (ISQ) (ISO/IEC 80000), o Nível de uma grandeza, expresso em bel [B], é o logaritmo base 10 da razão  entre o valor dessa grandeza e um valor de referência da mesma grandeza.

A medição psicoacústica nível de pressão sonora (sound pressure level) (SPL), é uma medida da energia acústica na atmosfera, referenciada a 0 dB SPL.

O  nível máximo de pressão sonora no ar, em relação a 20 Pa, é de 194 dB,  calculado à pressão média ao nível do mar (1 ATM, 101.325 Pa) e 0 ºC.  Acima de 194 dB, a energia extra distorce a onda sonora, caracterizando  uma onda de choque.

Calcula-se que a explosão do asteroide de Tunguska (1908) atingiu 300 dB.

O nível de intensidade sonora (sound intensity level) (SIL), expressa em decibéis a intensidade do som no ar a 1 metro da fonte, referenciada ao limiar padrão de intensidade auditiva (I0 = 10-12 W/m2).

Na  prática, raramente é possível medir o nível da fonte na referência  padrão de 1 m, de modo que os níveis de fonte são geralmente estimados  medindo o SPL.

O nível de pressão sonora Lp e o nível de intensidade sonora LI tem exatamente o mesmo valor em decibéis.

Som é a sensação fisiológica produzida pelo sentido da audição quando  vibrações do meio externo, da gama específica de frequências e de  intensidades que definem o campo auditivo, pressionam a membrana  timpânica.

Quando a pressão sonora se transmite aos fluidos do  ouvido interno (labirinto) através do estribo, que funciona como um  êmbolo e aumenta a pressão ~24x, a onda de pressão vai deformar a  membrana basilar em local determinado que é dependente da frequência do  referido som. As frequências altas atuam sobre a membrana basilar da  base da  cóclea e as frequências baixas sobre a região apical.

Cóclea: frequências diferentes tratadas de forma diferente

Intensidade vs Sonoridade (Loudness)

A norma ISO 226,  revisada em 2003, especifica combinações para os níveis de pressão  sonora (dB) e tons (Hz)  percebidos com a mesma sonoridade (phons).

As  especificações são baseadas nas seguintes condições: a fonte sonora  fica diretamente na frente do ouvinte; o sinal sonoro são tons puros; o   nível de pressão sonora é medido na posição aonde o centro da cabeça do   ouvinte; os ouvintes são ontologicamente pessoas normais com idade  entre 18 e 25 anos.

Os valores do nível equal loudness são significamente maiores que os anteriores da ISO 226, particularmente abaixo de 1 kHz.

Uma pesquisa realizada pelo ISO (2003) redefiniu as curvas com um novo padrão ISO 226:2003, este não segue nem Fletcher-Munson nem Robinson-Dadson.

Fletcher-Munson (1933): Na  década de 1930, dois funcionários da Bell Labs, Harvey Fletcher e  Wilden Munson, pediram a um grupo de pessoas para julgar quando os tons  puros de duas freqüências diferentes estavam no mesmo volume. As curvas  do nível de igual sonoridade foram "descobertas" através de fones de  ouvido.
Robinson-Dadson (1956): As  curvas do nível de igual sonoridade (isofônicas) foram  "descobertas" com incidência sonora frontal usando tons puros com um  único falante central em uma sala anecoica por D.W. Robinson e R.S.  Dadson.
Curva de igual sonoridade revisada
Curva de igual sonoridade revisada

Para ilustrar a relação entre intensidade e loudness com base nas curvas de Fletcher-Munson, Joanne Bengert e Allen Upward,   criaram uma demonstração que reproduz várias frequências usando o  mesmo  nível de pressão sonora, mostrando que para uma mesma  intensidade, a percepção do "volume" dos tons varia:

Psicofísica e Psicoacústica

A  Psicofísica é o estudo da relação entre percepção sensorial  (psicologia) e variáveis físicas, por exemplo, como se relaciona  sonoridade (percepção) e o nível de pressão sonora (variável física)? O  termo "Psychophysics" foi cunhado por Gustav Fechner em seu livro  Elemente der Psychophysik (1860).

A Psicoacústica disseca a  experiência auditiva. Se preocupa com a quantificação das sensações  auditivas e estabelece relações matemáticas entre os estímulos acústicos   e as sensações auditivas. Desta forma, pode-se prever sensações   auditivas, como a sensação de sonoridade, a partir das características  físicas do estímulo sonoro.

No campo da psicoacústica, os termos  música, som, frequência e vibração são intercambiáveis, porque são  aproximações diferentes da mesma essência.

Loudness (Sonoridade)

A Anatel define Loudness como intensidade subjetiva do som

A  percepção auditiva de sonoridade de cada frequência está relacionada ao  nível de pressão sonora ao qual o ouvido está exposto. Contudo, vários  fatores, físicos e psicológicos, contribuem para o ouvinte perceber o  som como alto ou baixo.

A sonoridade, como um correlato  psicológico da amplitude, é afetada por outros parâmetros além da  pressão sonora, como frequência, largura de banda, composição espectral,  conteúdo informacional, estrutura temporal e duração da exposição do  sinal sonoro.

A mesma fonte não cria a mesma percepção sonora em todos os ouvintes.
  1. Todo ouvinte tem uma percepção ligeiramente diferente da sonoridade
  2. Lesões auditivas podem afetar essa percepção de várias maneiras.
  3. Nos casos mais graves, a sonoridade não acompanha de perto a intensidade.

Campo auditivo

Chamamos  de limiar auditivo ao nível  mínimo de pressão sonora eficaz necessária  para provocar uma sensação auditiva em ambiente silencioso.

A  curva representa o limiar da audição para as diversas frequências. Ou  seja, a intensidade mínima de um som, naquela frequência, para  conseguirmos ouvi-la.

A zona de maior sensibilidade do ouvido humano é a gama entre 500 Hz e 8000 Hz
A zona de maior sensibilidade do ouvido humano é a gama entre 500 Hz e 8000 Hz

O limiar varia para cada ouvinte e para cada frequência.

As  frequências que o ouvido humano melhor discrimina situam-se na gama  média, entre 1000 Hz  e 3000 Hz. É também nesta gama de frequências que o  campo dinâmico  auditivo é maior (0 a 120 dB).

O campo auditivo  humano está compreendido entre uma pressão acústica de 20 μPa e 20 Pa.  Estes valores aplicam-se apenas para frequências entre 500 Hz e  8000  Hz, onde a sensibilidade do ouvido é maior. Para frequências inferiores e  superiores é necessária uma pressão acústica muito superior para  atingir o limiar auditivo.

A gama entre limites vai do Limiar de Audibilidade (mínima intensidade audível) correspondente a 10-12 W/m2 até o Limite de Dor (nível máximo de intensidade audível sem danos fisiológicos ou dor) correspondente a 1 W/m2. Ou seja, uma razão de 1 para 1 trilhão.

A presença de ruídos reduz a sensibilidade do ouvido, provocando um deslocamento no contorno da curva de audibilidade.

Audição animal (faixas em Hz)
Audição animal (faixas em Hz)

Propriedades Psicoacústicas da Cóclea

Bandas Críticas

Em  meados do século XIX, os pesquisadores já supunham que o ouvido  separava os componentes de um som para um tratamento detalhado.

O sistema auditivo funciona como um banco de filtros de passagem de banda em paralelo.

As  propriedades gerais do processo de análise de frequência realizadas  pelo sistema auditivo são baseadas no conceito de banda crítica.

Bandas  críticas são usadas para quantificar a habilidade do ouvido humano de  distinguir tons. O ouvido humano pode ouvir de 20 a 20,000 Hertz, mas a  capacidade de distinguir tons individuais varia em função da frequência.

Em  baixas frequências, o ouvido humano pode distinguir mudanças na  frequência mais facilmente do que em altas frequências. Por exemplo, o  ouvido pode distinguir uma diferença de 20 Hertz entre 500 e 520 Hertz  mais prontamente do que os tons 5,000 e 5,020 Hertz.

A cóclea tem uma forma espiral logarítmica
A cóclea tem uma forma espiral logarítmica

Se a cóclea fosse desenrolada e a resposta de frequência mapeada  sobre ela, há menos espaço dedicado à faixa de audição de alta  frequência em comparação com a faixa de audição de baixa frequência.

Esta  alocação de espaço dá ao ouvido a capacidade de distinguir mudanças em  baixas frequências melhor do que as altas frequências. Diferentes partes  da membrana basilar, que faz parte da cóclea, são excitadas por  diferentes faixas de frequências.

Esses intervalos correspondem às bandas críticas.

Aparentemente,  cada banda crítica corresponderia a uma alocação fixa, ao longo da  membrana basilar, de aproximadamente 1,3 mm de comprimento, cobrindo  cerca de 150 células receptoras no órgão de Corti, de um total de 3600  células capilares.

As células ciliadas internas  transformam as vibrações sonoras nos  fluidos cocleares em sinais  elétricos que são então enviados ao encefalo.

A banda  crítica pode ser entendida como a faixa de frequências em torno de uma  determinada frequência que ativa a mesma área da membrana basilar.

Os  limites para a discriminação de pitch e a banda crítica dependem  fortemente da frequência central (a frequência média dos estímulos de  dois tons). Ambos são relativamente independentes da amplitude, mas  podem variar consideravelmente de indivíduo para indivíduo.

A  figura a seguir mostra a dependência da discriminação de pitch e da  banda crítica com a frequência central dos tons dos componentes.

dependência da discriminação de pitch e da  banda crítica com a frequência central dos tons dos componentes

A banda crítica está relacionada a vários fenômenos psicoacústicos. A  explicação fisiológica do mecanismo das bandas críticas, ainda incerta,  tem fundamento na capacidade de resolução da membrana basilar. São  muitas as semelhanças entre a seletividade de frequência medida na  membrana basilar e a psicofisicamente mensurada.

As larguras de  banda das bandas críticas são aproximadamente constantes (cerca de 100  Hz) para frequências abaixo de 500 Hz. Acima de 500 Hertz, as larguras  de banda aumentam aproximadamente por um valor percentual constante.

Existem vinte e quatro bandas críticas na faixa de audição humana. Cada banda é referida como "bark". As 24 bandas constituem a chamada bark scale.

Bark scale
Bark scale

As bandas críticas são usadas no cálculo de várias métricas psicoacústicas, incluindo Loudness e Sones, Roughness, Subjective Duration, Fluctuation Strength, Tone-to-Noise Ratio e Prominence Ratio.

Efeito de máscara (mascaramento)

A  audição humana pode perceber quatro situações diferentes de acordo com a  separação entre as frequências de dois tons puros produzidos ao mesmo  tempo.

1. (Fluctuation Strength) Quando a separação é menor que 15 Hz, ouvimos um único som que oscila como um batimento.

2. (Roughness) A  partir de aproximadamente 15 Hz, ouvimos um zumbido rugoso, sem sermos  capazes de distinguir duas alturas de pitch diferentes.

3.  (Roughness) Quando  a separação é próxima da largura da banda crítica correspondente à área  de frequência na qual os dois componentes são misturados, começamos a  distinguir dois sons, mas o som da mistura permanece rugoso.

4.  (Two Tons) À medida que a distância entre as frequências dos dois  componentes aumenta, a qualidade do som torna-se menos e menos rugosa  até que, uma vez que a largura de sua banda crítica é confortavelmente  ultrapassada, chega um momento em que percebemos claramente os dois  sons. Deve ser esclarecido que a largura de banda crítica não é a mesma  em todas as situações. Varia de acordo com a zona de frequência dos sons  sobrepostos, aumentando à medida que os sons são mais agudos.

Banda critica e o efeito de máscara (mascaramento)
Banda critica e o efeito de máscara (mascaramento)

Dependendo do número de modulações por segundo presentes no som, a métrica apropriada pode ser Fluctuation Strength ou Roughness:

What causes modulation of sound?

There are two main reasons why the level of sound may rise and fall over time:

  1. Amplitude  - The amplitude, or level, of the sound might rise and  fall over time,  as if someone was moving the volume knob on a radio up  and down. This  can happen even if the frequency content of the signal  remains  constant.
  2. Frequency - Multiple frequency tones present in the  sound  constructively and destructively interfere with each other  causing the  modulation.

Frequency based modulation occurs  when two tones of similar magnitude  and different frequency are played  simultaneously. Over time, the  difference in frequency causes the phase  between the two tones to vary  as shown in Figure 3.  Sometimes the tones are in phase, at other times they are out of phase.

Ouvidos simultaneamente, um tom de 100 Hertz e um tom de 120 Hertz interferirão de forma construtiva e destrutiva em cada um deles.
Ouvidos simultaneamente, um tom de 100 Hertz e um tom de 120 Hertz interferirão de forma construtiva e destrutiva em cada um deles.

For example, if a 100 Hertz tone and a 120 Hertz tone of the same   amplitude were played at the same time (i.e., summed), they would  create  a 20 Hz amplitude modulation as shown in Figure 4. The 100 Hertz tone has an amplitude of 2 Pascals of pressure, as does the 120 Hertz tone:

  • When the two tones are 180 degrees out of phase, the amplitude sum becomes zero
  • When the tones are in phase, the amplitude sum becomes 4 Pascal
  • At other times, the sum is between 0 and 4 Pascals

The  frequency difference (120 Hz minus 100 Hz in this case) between  the  two sinusoidal tones becomes the modulation frequency (20 Hertz in  this  case).

A taxa de modulação (20 por segundo) é a diferença dos dois tons (100 e 120 Hz)
A taxa de modulação (20 por segundo) é a diferença dos dois tons (100 e 120 Hz)

This modulation frequency is based on the difference in frequency, and not dependent on the actual frequencies involved:

  • For tones of 100 Hz and 120 Hz of equal magnitude, the modulation frequency is 20 Hz
  • For 1000 Hz and 1020 Hz tones, the modulation frequency is also 20 Hz

Modulation frequency versus actual frequencies are shown in Figure 5.

Freqüências diferentes podem criar a mesma taxa de modulação
Freqüências diferentes podem criar a mesma taxa de modulação

Any frequencies can create a modulation. Don’t confuse modulation rate (often expressed in Hertz) with the frequencies creating the modulation.

For  example, if hearing a 4 Hz modulation (i.e., four modulations per   second), it does not mean that there is a 4 Hz component in the sound. A   four Hertz modulation could be created by:

  • Two tones at 200 and 204 Hz
  • Two tones at 850 and 854 Hz
  • Two tones at 1000 and 1004 Hz, etc.

A four Hertz sound is outside the range of human hearing (20 Hz to 20,000 Hz)! However, a four Hertz modulation of audible sound is NOT outside of human hearing.

For two tones to create a modulation, they typically have to be within the frequency range of one critical band.

Fluctuation  Strength describes modulation frequencies below 20 Hz.  Because the  sound varies slowly over time (below 20 modulations per  second), a  listener can hear each individual rise and fall in the sound.

Human  hearing investigations show that a 4 Hz modulation frequency is  more  noticeable than other modulation frequencies.  This becomes more  and  more noticeable the closer the modulation frequency is to four times   per second, with all else being equal:

  1. 200 and 220 Hz tones (20 Hz difference) – Modulation noticeable
  2. 200 and 208 Hz tones (8 Hz difference) – Perceived modulation more than #1, less than #3
  3. 200 and 204 Hz tones (4 Hz difference) – Most noticeable modulation of 1, 2, 3, and 4
  4. 200 and 201 Hz tones (1 Hz difference) – Less noticeable than #3

In typical human speech, syllables occur about 4 times per second.

Escala de Munique
Escala de Munique
Escala de Munique vs Escala de Cambridge
Escala de Munique vs Escala de Cambridge

O modelo de Cambridge apresenta comportamento linear, o que sugere maior  equivalência geométrica com a membrana basilar. As bandas críticas do  modelo de Munique apresentam flutuação, além de serem mais largas.

O conceito de bandas críticas na audição humana foi proposto em 1933 pelo Dr. Harvey Fletcher, da AT&T Bell Labs.

A  escala de bark foi proposta em 1961 pelo professor Eberhard Zwicker, da Universidade Técnica de Munique. Zwicker nomeou a escala em homenagem  ao físico alemão Heinrich Barkhausen, que propôs a primeira medida subjetiva de intensidade (loudness, sonoridade).

Deslocamento de limiar para ruidos de 40, 60, 80 e 100 dB SPL
Deslocamento de limiar para ruidos de 40, 60, 80 e 100 dB SPL

O efeito do mascaramento aumenta com a intensidade e é mais  pronunciado nas  frequências agudas. As frequências graves mascaram   mais facilmente as altas frequências que o inverso.

Outros fatores que influenciam a sonoridade

O efeito da duração
A sonoridade aumenta até um valor crítico compreendido entre 50 e 400 ms e depois diminui ligeiramente.

A previsibilidade do sinal
Quando um ouvinte espera um som de forte intensidade, a sonoridade que este provoca é menor do que se não o esperasse.

Reflexo estapediano
Este reflexo atua essencialmente sobre  sons breves de frequências  médias e intensidades superiores a 80 dB.   Ele atua tornando mais  rígida a cadeia tímpano-ossicular, o que se  traduz numa diminuição da  vibração sonora e por consequência numa  diminuição da sonoridade. No  entanto, este reflexo é fatigável.

Fadiga auditiva
Depois da exposição do ouvido a um ruido  muito intenso, observa-se a  elevação dos limiares auditivos devido à  fadiga das fibras nervosas.  Podemos perceber este fenomeno quando saimos  de uma discoteca ou depois  de usar um player de MP3.

Material consultado

SIEMENS - Testing Knowledge Base

BAYEH, Rebeca. Estudo das propriedades acústicas e psicofísicas da cóclea.   2018. Dissertação (Mestrado em Física) - Instituto de Física,   Universidade de São Paulo, São Paulo, 2018.   doi:10.11606/D.43.2018.tde-03052018-195247

Psychoacoustics Facts and Models (ISSN 0720-678X) Hugo Fastl, Eberhard Zwicker

Loudness, Its Definition, Measurement and Calculation (08/1933) Harvey Fletcher, W.A. Munson, Bell Telephone Laboratories

Avaliação objetiva de qualidade de sinais de áudio e voz - Jayme Garcia Arnal Barbedo - Unicamp - 2004

Estudo de psicoacústica e suas aplicações - Luiz Fabiano Nogueira de Moura - UFRJ - 2006

Viagem ao mundo da audição (06/2018), , Nuno Trigueiros-Cunha,

The Physics Hypertextbook, Glenn Elert