Aplicações em Voz, Áudio e Acústica

Aluno: Marcelo Goulart Salinas Vega   |   RA: 11201921598

Aluno: Gustavo Hiromitsu Watari   |   RA: 11202020983

Aluno: Alexandre Keiti Fukamati   |   RA:11202021788

Experimento 1 - Medidas Acústicas da Resposta Impulsiva de Salas

1. Objetivos

  1. Obter a resposta impulsiva acústica de uma sala
  2. Comparar os procedimentos de obtenção da Resposta Impulsiva
  3. Obter o tempo de reverberação RT60 de várias “salas”
  4. Efetuar outras medidas acústicas, segundo a norma ISO 3382-1.

2. Material Necessário

  1. 02 Microfones Capacitivo Behringer Omnidirecional
  2. 04 pedestais de solo de microfone
  3. 02 Microfones Dinâmicos SM57
  4. 03 interfaces M-Audio Fast Track Ultra 8R
  5. 03 réguas/filtros de linha, 3 tomadas cada
  6. Fonte Omnidirecional dodecaédrica com 12 alto-falantes
  7. Cabo de áudio bipolar
  8. 01 Amplificador de Potência 600W estéreo
  9. 03 notebooks com entrada FireWire
  10. 01 Software Audacity instalado em cada notebook
  11. 01 Software REW (roomeqwizard.com) em cada notebook
  12. Extensão para cabo de força de 15 metros
  13. Cabos diversos

3. Metodologia

  1. Primeiramente, a cada Interface M-Audio Fast Track Ultra 8R foi conectado um jogo de microfones, uma interface sendo responsavel por controlar os microfones Dinamicos, e a outra responsavel pelos microfones Capacitivos.

    Estas interfaces foram conectadas aos Notebooks para gravacao com o software Audacity.

    Fonte Omnidirecional foi conectada ao notebook restante e posicionada no "palco" da sala.

    Preparadas Bexigas de diversos tamanhos, que quando estouradas representarao nosso impulso sonoro utilizado para medicoes.

    Microfones Dinamicos SM57 foram posicionados de forma cruzada entre si, representando os ouvidos de um ser humano com o objetivo de captar possiveis diferencas de percepcao entre ambos.

    Microfones Capacitivos foram posicionados a 1m e a 10m da fonte sonora (palco do auditorio) com o objetivo de captar diferencas de percepcao sonora em diferentes distancias dentro da mesma sala.

    A partir do palco do auditorio, foram estouradas bexigas de diferentes tamanhos, e o som produzido por esse evento foi captado pelos diferentes arranjos de microfones posicionados. Apos a captacao do impulso, foi utilizada a fonte Omnidirecional para realizar um Sweep em frequencias e tambem emitir Ruido Rosa, que tambem foram captados.

4. Medicoes e valores Teoricos

4.1 Imagens da Sala

Foto da Sala 1

Croqui - Sala de Auditorio

Foto da Sala 1

Vista da Sala de Auditorio

Foto da Sala 1

Palco da Sala de Auditorio

Foto da Sala 1

Montagem dos Microfones Dinamicos

Foto da Sala 1

Fonte Omnidirecional posicionada

4.2 Dimensoes da Sala

  1. Experimento foi relizado em uma sala do tipo Auditorio no bloco A da Universidade Federal do ABC, Santo Andre, Bloco A.

    Dimensoes estimadas: 19m x 12m x 6m

    Volume (V) = Comprimento × Largura × Altura = 19 m × 12 m × 6 m = 1368 m³

    Área do Piso = 19 m × 12 m = 228 m²

    Área do Teto = 19 m × 12 m = 228 m²

    Área da Parede 1 e 3 = 2 × (19 m × 6 m) = 2 × 114 m2 = 228 m²

    Área da Parede 2 e 4 = 2 × (12 m × 6 m) = 2 × 72 m2 = 144 m²

    Área Total (A) = Piso + Teto + Paredes = 228 + 228 + 228 + 144 = 828 m²

4.3 Propriedades da Sala

  1. T estimado: (RT60 Teorico)

    Pela fórmula de Sabine: Test = 0,163V/A

    Test. ​ = 0.163 × (1368/828) ≈ 0.163 × 1.652 ≈ 0.269 segundos

  2. distância mínima do microfone à fonte sonora:

    𝑑𝑚𝑖𝑛 = 2√ 𝑉/𝑐𝑇𝑒𝑠𝑡

    Usando V=1368 m3, c=340 m/s, e Test​≈0.269 s

    distância mínima = 7,73 metros

4.4 Medicoes Realizadas

  1. Bexiga Pequena:

  2. Bexiga Grande:

  3. Ruido Rosa:

  4. Sweep

  5. Sweep Decay:

4.5 Processando os dados

  1. Bexiga Pequena

    ir_bexiga_pequena

    Onde podemos ver as medidas obtidas atraves do REW:

    T10 = 0.679s

    T20 = 0.863s

    T60 = 3 x T20 = 3 x 0.863s = 2.589s

    TEDT (Tempo de Decaimento Adiantado) = 6 x T10 = 6 x 0.679s = 4.074s

    Claridade C50 = 4.66dB

    Claridade C80 = 7.27dB

    Definicao D50 = 74.5%

  2. Determinando Timbre Para Ruido Rosa

    Tr(125) Tr(250) Tr(500) Tr(1k) Tr(2k) Tr(4k)
    0.8 0.7 0.6 0.5 0.4 0.3

    𝐵𝑅 = (𝑇125𝐻𝑧+𝑇250𝐻𝑧)/T500Hz+T1000Hz = 1.36

    TR = (𝑇2000𝐻𝑧+𝑇4000𝐻𝑧)/T500Hz+T1000Hz = 0.64

6. Referências

  • ISO3382, Acoustics – Measurement of the Reverberation time rooms with reference to other acoustical parameters, 1997

    MULLER, S., Transfer-Function Measurement with Sweeps, JAES, 2001

  • Experimento 2 - Dispositivos Eletroacústicos

    1. Objetivos

    Conjunto 1 - Medições em Alto Falantes
    1. Efetuar medições de Resposta em Frequência em Alto-falantes diferentes:
    2. Woofer
    3. Midrange
    4. Tweeter
    Conjunto 2 - Testes Com Microfones
    1. Testes e gravações em microfones diferentes:
    2. Dinâmico de palco
    3. Capacitivo de Estúdio
    4. Capacitivo de Instrumentos

    2. Materiais

    Conjunto 1 - Medições em Alto Falantes
    1. Caixa Acustica TCL, 100W
    2. Caixa Acustica Sony (sub-woofer)
    3. Caixa Acustica Sony (Surround)
    4. 2 Bases para sustentacao
    5. 2 Microfones de Referencia Beringer ECM8000
    6. 2 Pedestais de Microfone
    7. 2 Cabos XLR de Microfone 3m
    8. 1 Interface M-Audio Fast Track Ultra 8 canais
    9. 1 Amplificador de potencia de audio Wattson 2200 de 600W
    10. 2 Cabos XLR-P10
    11. 1 Computador com Softwares REW, Audacity e entrada USB
    12. Cabos adicionais para interface e amplificador
    Conjunto 2 - Testes Com Microfones
    1. 1 Microfone capacitivo AKG C214
    2. 1 Microfone Dinamico Shure SM57
    3. 2 Microfones capacitivos AKG PGA81
    4. 4 Pedestais de microfones
    5. 1 Interface M-Audio Fast Track Ultra 8 canais
    6. 1 Computador com Softwares REW, Audacity e entrada USB
    7. 1 Fone de ouvido envolvente AKG
    8. 1 Caixa Bluetooth 5W

    4. Medicoes e Gravacoes

    Conjunto 1 - Medições em Alto Falantes

    Caixa Sony:
    Near-Field (Microfone na Abertura)

    Captacao da onda de audio em Campo Proximo (Near-Field)

    Woofer Near-Field Mic Recording

    Forma de Onda:

    Audio Captado:

    Espectro:

    Espectrograma:


    Near-Field (Microfone na Caixa)

    Captacao da onda de audio em Campo Proximo (Near-Field)

    Woofer Near-Field Mic Recording

    Forma de Onda:

    Audio Captado:

    Espectro:

    Espectrograma:


    Far-Field (50cm)

    Captacao da onda de audio em Far Field

    Woofer Near-Field Mic Recording

    Forma de Onda:

    Audio Captado:

    Espectro:

    Espectrograma:


    Tweeter:
    Near-Field (Microfone na Abertura)

    Captacao da onda de audio em Campo Proximo (Near-Field)

    Woofer Near-Field Mic Recording

    Forma de Onda:

    Audio Captado:

    Espectro:

    Espectrograma:


    Far-Field (27cm)

    Captacao da onda de audio em Far Field

    Woofer Near-Field Mic Recording

    Forma de Onda:

    Audio Captado:

    Espectro:

    Espectrograma:

    4. Análises

    1. Comparação entre o Alto-falante e o Tweeter da caixa TCL

      As principais imagens que podem ser utilizadas para observar a diferença entre o alto-falante e o tweeter são as imagens do espectro. Observando as componentes de frequência, é perceptível que o subwoofer tem componentes de frequências constantes tanto em near quanto em far field para as faixas entre 100 Hz e 1 kHz, sendo que a frequência apresenta um crescimento quase que linear antes dessas faixas de frequências. Entretanto, as componentes de frequência posteriores a 1 kHz se apresentam de forma decrescente, principalmente na faixa entre 10 kHz e 20 kHz.

      Em contrapartida, o tweeter possui o crescimento acontecendo até 1 kHz, sendo que as componentes de frequência se mostram constantes na faixa de 1 kHz a 10 kHz. Existe uma oscilação perceptível na faixa de 10 kHz a 20 kHz.

      De forma geral, temos que o tweeter desse conjunto se responsabiliza principalmente pela faixa de 1 kHz a 10 kHz, incorporando amostras agudas, enquanto o subwoofer reproduz principalmente entre 100 Hz e 1 kHz.

    2. Comparação entre Subwoofer e Surround Sony

      Utilizando o espectro como referência, temos que as diferenças nas faixas de frequências também são o principal ponto neste caso. Para o tweeter, é observado um crescimento oscilatório da amplitude nas faixas de frequência entre 1 e 10 Hz, seguido por um crescimento quase linear no intervalo entre 10 e 200 Hz. No intervalo entre 200 Hz e 4 kHz, foi obtido um comportamento quase linear, indicando que essa é a principal frequência fornecida por esse falante. No fim do espectro, temos um comportamento oscilatório entre 5 e 20 kHz.

      Diferente do tweeter, o subwoofer não apresenta um crescimento linear em nenhum ponto, mas a partir dos 3 Hz, começa a apresentar um crescimento acentuado em formato de curva, que se estende até cerca de 500 Hz. Com esse formato de curva, adquire um comportamento oscilatório até 8 kHz. Neste ponto, assume um comportamento completamente oscilatório, sem acompanhar a curva anterior.

      Neste caso, foi observado que o Surround Sony cobre uma faixa de frequências mais ampla e apresenta maior equilíbrio entre as regiões médias e altas, enquanto o subwoofer se mantém mais eficiente nas faixas graves, com desempenho decrescente e irregular em frequências médias e altas.

    3. Comparação entre os dois conjuntos (TCL e Sony)

      Ao comparar os dois conjuntos — caixa TCL (alto-falante + tweeter) e sistema Sony (subwoofer + surround) —, percebe-se que cada um foi projetado com propósitos distintos em termos de resposta em frequência.

      O conjunto da caixa TCL mostra uma divisão clara entre o alto-falante (atuando predominantemente entre 100 Hz e 1 kHz) e o tweeter (atuando com estabilidade entre 1 kHz e 10 kHz). Há um equilíbrio funcional, onde cada transdutor cobre eficientemente uma faixa específica do espectro, resultando em uma cobertura coerente e complementar das frequências audíveis.

      Já o conjunto Sony (subwoofer + surround) apresenta uma sobreposição maior nas faixas médias (especialmente entre 200 Hz e 4 kHz), com o surround sendo responsável pela maior extensão espectral. O subwoofer do conjunto Sony apresenta uma curva mais acentuada e restrita, focada nos graves até 500 Hz, com pouca contribuição nas faixas superiores.

      Dessa forma, conclui-se que o conjunto TCL apresenta uma segmentação mais tradicional entre os transdutores, favorecendo uma divisão mais clara entre graves e agudos, enquanto o conjunto Sony busca uma cobertura mais contínua e ampla, especialmente nas faixas médias, mas com maior sobreposição e irregularidade em altas frequências.

    5. Análise Subjetiva vs. Características Objetivas dos Microfones

    e) AKG C214

    Percepções Subjetivas:
    • Boa resposta dinâmica: O microfone captou bem as variações de intensidade sonora.
    • Mais claro e vibrante: O áudio soou nítido e com boa presença.
    • Mais sensível em comparação ao outro: Percebeu-se que o C214 captava detalhes com facilidade.
    • Áudio "estourava" provavelmente por estar mal configurado: Indicou-se uma possível sobrecarga do sinal.
    Características Objetivas (Fabricante):
    • Microfone condensador de diafragma grande, com alta fidelidade e detalhe.
    • Resposta de frequência ampla e linear, que contribui para um som claro e vibrante.
    • Alta sensibilidade inerente, explicando a maior captação de detalhes e possíveis problemas de clipping.
    • Boa resposta transitória, essencial para captar variações rápidas de intensidade sonora.
    • Possui pad de -20dB e filtro passa-altas (low-cut) para controlar SPL alto e ruídos de baixa frequência.

    Shure SM57

    Percepções Subjetivas:
    • Som "flat": O áudio não apresentou grande impacto ou coloração.
    • Pouco vibrante: A sonoridade pareceu menos "viva".
    • Baixa variação de intensidade: Dificuldade em captar as nuances dinâmicas.
    • Dificuldade de distinguir todos os elementos da música.
    • Enfoque maior nas frequências médias.
    Características Objetivas (Fabricante):
    • Microfone dinâmico cardióide, robusto e ideal para altos SPL.
    • Menor sensibilidade que condensadores, exigindo mais ganho.
    • Resposta de frequência otimizada para instrumentos e vocais, com realce nas médias-altas.
    • Boa rejeição de ruído fora do eixo (característica cardióide).
    • Ideal para ambientes barulhentos ou captação próxima.

    Comentários e Conclusões

    Depois de usar o AKG C214 e o Shure SM57, as diferenças entre eles ficaram bem claras, quase como se cada um tivesse sua própria "voz" ao captar o som. O que percebemos, nosso lado subjetivo, se encaixou perfeitamente com o que já sabemos sobre como eles foram construídos.

    O AKG C214 é como um microfone que busca cada detalhe. Ele capta nuances, vibrações. Nas gravações, notamos uma clareza e uma vitalidade no som, com uma dinâmica notável. No entanto, essa alta sensibilidade exige cuidado: se não ajustarmos bem o volume, o áudio pode "estourar". Para alcançar o pico de -10dB sem distorcer, foi preciso ajustar os controles com precisão.

    Já o Shure SM57 é mais direto. Ele é robusto e lida bem com volumes altos. Nas gravações, o som pareceu mais "reto" e menos "vibrante" que o C214. Ele focou mais nas frequências médias. Percebemos que era preciso aproximá-lo mais da fonte sonora – aqueles 8 cm – para que ele captasse o som com mais força, o que é esperado de um microfone dinâmico.

    Testar os microfones juntos, com um para a voz principal e outros para instrumentos, mostrou que não existe um microfone "universal". Cada um tem seu ponto forte. O C214, com sua sensibilidade e riqueza de detalhes, é ótimo para vozes e arranjos complexos. O SM57, por ser mais resistente e focado, é ideal para instrumentos mais intensos ou quando se precisa isolar bem o som.

    No fim, aprendemos que o importante não é ter o microfone mais caro, mas entender como cada um funciona e escolher o adequado para cada situação. E, fundamentalmente, ajustar os níveis de ganho com cuidado para extrair o melhor de cada um.

    Experimento 3 - Array de Alto-falantes

    Conjunto 1 - Array de Beamforming com Defasagem
    Objetivos:
    1. Testar um Line Phased Array de Alto Falantes, beamforming de delay
    Materiais:
    1. 01 celular com App Spectroid (Android)
    2. 01 interface M-Audio Fast Track ultra, 8 canais
    3. 01 computador com softwares REW, Reaper, Audacity e Tracks Live
    4. 02 amplificadores de áudio de 4 canais, 6W/canal
    5. 01 torre de Array de 8 alto-falantes
    6. 08 cabos com conector P10
    7. 01 fonte de alimentação com dois canais 0-30V, 3A
    8. Cabos diversos para interface M-Audio e amplificadores
    9. Apoio de 30 cm de altura para a torre de Array de 8 alto-falantes
    10. Gabarito transferidor -90° a 90° impresso
    11. Linha (barbante) de 6m, com marcações em 1,5m, 3,0m e 6,0m
    12. 01 haste de referência para altura das medições (1,10m aprox.)
    Conjunto 2 - Array de Bessel
    Objetivos:
    1. Testes e gravações em microfones diferentes:
    Materiais:
    1. 01 interface M-Audio Fast Track ultra, 8 canais
    2. 01 computador com softwares REW, Reaper, Audacity e Tracks Live
    3. 01 amplificador de potência de áudio Watson 2200 de 600W
    4. 05 caixas acústicas 8Ω, 50W passivas
    5. 01 base de madeira
    6. Gabarito transferidor -90°-0°-90° impresso
    7. 01 celular com Spectroid (Android)
    8. 01 metro (5m)
    Montagem conjunto 1: Array de Beamforming
    Calibracao e Medicoes:

    Com o array montado de acordo com a figura acima, foi iniciado o processo de calibracao de cada auto-falante.

    Este processo foi realizado com o auxilio do programa Reaper, onde foram silenciados todos os canais para que seja possivel calibra-los um a um.

    Foi utilizado o App Spectroid para medir a saida de cada um dos auto-falantes, e seu ganho foi ajustado para -14dBA, com um sinal de 250Hz.

    As medidas foram obtidas posicionando o microfone do aparelho celular a 0.75m do centro do Array, variando entre -75 e 75 graus, com intervalos de 15 graus.

    Foram utilizados sinais sonoros de 250Hz, 500Hz e 1kHz sem defasagem, e 1kHz e 2kHz com defasagem.

    Resultados podem ser visualizados na tabela 1 abaixo:

    Tabela 1. Array na Horizontal, Senóides sem defasagem, medição a d = 0,75 m de distância
    fteste
    Ângulo α
    250 Hz
    Calibração [dBA]
    500 Hz
    [dBA]
    1 kHz
    [dBA]
    -75º -18 -18 -19
    -60º -18 -19 -19
    -45º -20 -19 -19
    -30º -21 -20 -20
    -15º -20 -20 -20
    -21 -16 -21
    15º -21 -17 -21
    30º -23 -20 -19
    45º -22 -18 -18
    60º -24 -17 -18
    75º -22 -19 -17
    Tabela 2. Array na Horizontal, Senóides com defasagem 15 graus, medição a d = 0,75 m de distância
    fteste
    Ângulo α
    1 kHz, defasagem 15º
    [dBA]
    2 kHz, defasagem 15º
    [dBA]
    -75º -21 -28
    -60º -21 -23
    -45º -23 -31
    -30º -24 -29
    -15º -24 -30
    -25 -32
    15º -21 -30
    30º -20 -24
    45º -24 -25
    60º -20 -20
    75º -21 -20

    Comparação: Cartesiano vs Polar

    1 kHz – Frente (f)

    Cartesiano

    Cartesiano 1kHz Frente

    Polar

    Polar 1kHz Frente
    2 kHz – Horizontal (h)

    Cartesiano

    Cartesiano 2kHz Horizontal

    Polar

    Polar 2kHz Horizontal
    250 Hz – Frente (f)

    Cartesiano

    Cartesiano 250Hz Frente

    Polar

    Polar 250Hz Frente
    500 Hz – Frente (f)

    Cartesiano

    Cartesiano 500Hz Frente

    Polar

    Polar 500Hz Frente

    Introdução ao Ambisonics e Análise Cepstral

    Collab utilizado para processamentos

    Objetivos

    1. Utilizar uma DAW (Digital Audio Workstation) para verificar conceitos do Ambisonics
    2. Efetuar gravação com microfone FOA (Ambisonics de 1ª ordem)
    3. Efetuar o cálculo do cepstrum e determinar Formantes do Sinal de Voz

    Introdução

    Este experimento tem como objetivo apresentar os conceitos de Ambisonics e análise cepstral. Através da utilização de softwares de áudio, será possível explorar a espacialização sonora e a determinação de formantes de sinais de voz, com ênfase em técnicas de gravação e processamento.

    Material Necessário

    1. Notebook com DAW Reaper e Audacity
    2. Microfone Ambisonics FOA, com cabo USB
    3. Celular para tocar músicas
    4. Pedestal de microfone
    5. Fone de ouvido
    6. Notebook do Colab em Python, para cálculo do cepstrum e determinação de formantes

    Procedimento

    Parte A – Introdução ao Ambisonics com Reaper
    1. No Reaper, verificar a instalação dos plugins: Synth1, IEM e NX Waves
    2. Utilizar o fone de ouvido
    3. Abrir uma trilha e configurar Route da trilha para 64 canais
    4. Configurar o Master Mixer para 64 canais
    5. Utilizar o Virtual Keyboard (Alt+B)
    6. Configurar as entradas MIDI com algum instrumento do Synth1 (ex.: piano)
    7. Adicionar panning com plugin IEM Stereo Encoder
    8. Adicionar Decoder Ambisonics NX Quad/Stereo no Master
    9. Alterar posição no painel de Panning e verificar a mudança espacial do som
    Parte B – Gravação com microfone Ambisonics FOA
    1. Posicionar o microfone Ambisonics e o celular para música de fundo
    2. Realizar três leituras de textos com diferentes músicas de fundo e posições espaciais
    3. Transferir as gravações para o PC e analisar no Audacity
    4. Gerar espectrogramas em diferentes escalas: Logarítmica, Mel Cepstral e Bark
    Arquivos Gravados – Parte B

    Abaixo estão os arquivos gravados durante as leituras e músicas de fundo:

    1. Leitura 1 – O Burrinho Pedrês (com música 1)

      “O rio, que o rio já se fôra. Enche de chuva, de chuva que não para. De tudo que se arrasta, que se arranca, que se carrega. O rio, no rio, o rio, rio. Pois que o rio já se fôra. O rio em todo lugar, todo rio. Ó rio! Ó rio! O rio se leva, o rio se vai. O rio vai em toda a parte. E tudo se arrasta, tudo se leva.”

    2. Leitura 2 – Meu Destino (com música 2)

      “Nas palmas de tuas mãos
      leio as linhas da minha vida
      linhas cruzadas, sinuosas,
      interferindo no teu destino.
      Não te procurei, não me procurastes –
      íamos sozinhos por estradas diferentes."

    3. Leitura 3 – Amor (com música 3)

      “Ana olhou. O cego era um homem de cara limpa, e não parecia precisar de nada. Mas a mastigação era tão monótona, tão lenta e paciente. Como se ele estivesse comendo uma coisa gorda e sem sabor, sem que isso lhe incomodasse. E naquela mastigação, a boca se abria e fechava, se abria e fechava. Ana sentiu um súbito estranhamento, como se a cena não pertencesse ao mundo dela.”

    Análise do Panning no Reaper e sua Influência no Ambisonics

    Durante a configuração no Reaper, o uso do panning aliado aos plugins Ambisonics foi essencial para compreender como a manipulação espacial do som afeta a percepção auditiva no formato B-Format (1ª ordem).

    Ao inserir o plugin IEM Stereo Encoder nas trilhas e o NX Quad/Stereo Decoder no master, foi possível editar a cena sonora imersiva. A movimentação do controle de panning permitiu alterar a posição percebida do som de voz e da musica gravada.

    Esse ajuste não altera a intensidade do áudio, mas redistribui as componentes W, X, Y e Z do sinal Ambisonics.

    • Com panning central, os sons permanecem estáveis nos pontos de referência utilizados durante a gravacao.
    • Com panning deslocado para a direita ou esquerda, houve clara mudança na espacialidade, reforçando a sensação direcional.
    • Movimentos extremos (±90°) evidenciaram a capacidade do formato Ambisonics de preservar coerência espacial sem criar “buracos” na imagem sonora.

    Conclui-se que a manipulação de panning no Reaper, com suporte Ambisonics, oferece uma representação espacial realista, diferente da técnica estéreo convencional, pois envolve uma projeção tridimensional do som e não apenas variação de ganho entre canais.

    Parte C – Análise Cepstral
    1. Utilizar o Colab para determinar as formantes (F1 a F4) de vogais por integrante
    2. Utilizar análise cepstral para determinar pitch e validar com software Praat

    Formantes

    formantes do grupo

    Praat

    praat do grupo

    Conclusão

    O experimento demonstrou a versatilidade e a mutabilidade proporcionadas pelas gravações no formato Ambisonics. A possibilidade de manipular espacialmente o áudio após a gravação, utilizando ferramentas como o panning no Reaper aliado aos plugins Ambisonics, evidenciou como a tecnologia permite criar diferentes perspectivas sonoras sem necessidade de repetir a captação. Essa característica é especialmente relevante para aplicações imersivas, como realidade virtual e áudio 3D.

    Além disso, a etapa de análise cepstral aplicada às vogais gravadas permitiu uma compreensão detalhada das características acústicas da fala, com a determinação das formantes F1 a F4. Essa análise destacou como diferentes vogais pronunciadas por diferentes pessoas apresentam padrões espectrais específicos, reforçando a importância dessa técnica em áreas como reconhecimento de fala e síntese vocal.

    Em resumo, a combinação da espacialização Ambisonics com ferramentas de análise espectral mostrou-se poderosa, permitindo não apenas a criação de ambientes sonoros realistas, mas também a exploração científica das propriedades acústicas da voz humana.