Transformada de Fourier
29 pág.

Transformada de Fourier

Disciplina:Redes sem Fio510 materiais19.208 seguidores
Pré-visualização5 páginas
para este banco de filtros. São usados valores

para fi e C de 300 Hz e 200 Hz, resultando nas seguintes especificações para este banco de

filtros:

Filtro 1: f1 = 300 Hz b1 = 200 Hz

 Filtro 2: f2 = 600 Hz b2 = 400 Hz

 Filtro 3: f3 = 1200 Hz b3 = 800 Hz

 Filtro 4: f4 = 2400 Hz b4 = 1600 Hz

Figura 6.6: Especificação para um Banco de Filtro ideal de 4 canais de uma oitava

 58

6.4 IMPLEMENTAÇÃO DE UM BANCO DE FILTROS

Um banco de filtro pode ser implementado de diversos modos, dependendo do

método usado para projetar os filtros individuais. O projeto de filtros digitais divide-se em

duas classes:

- Resposta ao Impulso Infinita (IIR)

- Resposta ao Impulso Finita (FIR)

Os filtros IIR (também chamados na literatura de filtros recursivos), são os mais

diretos, e geralmente são de implementação mais eficiente, seja para realizar cada filtro

passa faixa individual como uma cascata ou uma estrutura paralela.

Para filtros FIR existem vários métodos possíveis de implementar os filtros passa

faixa em um banco de filtros. A mais simples implementação é a estrutura na forma direta.

Neste caso, se a resposta ao impulso para o iésimo canal é hi(n), onde 0 ≤ n ≤ L-1, então a
saída do iésimo canal xi(n), pode ser expressa como uma convolução discreta do sinal de

entrada s(n), com a resposta ao impulso, hi(n), isto é:

 xi(n) = s(n) * hi(n) [6.10]

6.5 CONSIDERAÇÕES SOBRE O USO DE BANCOS DE FILTROS EM SISTEMAS DE
RECONHECIMENTO DE VOZ

A primeira consideração para qualquer banco de filtro é o tipo de filtro digital

usado. As escolhas são IIR (recursivo) e FIR (não recursivo). O projeto de filtros IIR tem

a vantagem de ser implementável em estruturas simples e eficientes. A grande

desvantagem dos filtros IIR é que a resposta em fase é não linear. Além disso, este tipo de

filtro tem a possibilidade de ser tornar instável.

Os filtros FIR alcançam a fase linear sem comprometer a habilidade de aproximar-

se das características de magnitude ideais; porém, eles normalmente são de implementação

computacional muito cara.

Para aplicações de reconhecimento de voz, uma estrutura de FFT pode ser

aplicada freqüentemente para aliviar consideravelmente a ineficiência computacional de

 59

 60

bancos de filtro FIR; conseqüentemente, estruturas de banco de filtro digitais mais

práticas usam filtros FIR (normalmente em uma realização com FFT) [17].

A próxima consideração é o número de filtros a ser usado no banco de filtros. Para

bancos de filtros uniformes, o número de filtros, Q, não pode ser muito pequeno ou então a

habilidade do banco de filtros em filtrar o sinal da fala é grandemente prejudicada.

Assim, valores de Q menores que 8 geralmente são evitados. Igualmente, o valor de

Q não pode ser muito grande (a menos que haja uma considerável sobreposição de filtros),

porque as larguras de faixa dos filtros seriam muito estreitas.

Assim, sistemas práticos tendem a ter valores de Q < 32.

Embora bancos de filtros uniformemente espaçados sejam extensamente usados

para reconhecimento de voz, muitos sistemas práticos usam filtros de espaçamento não

uniformes, em um esforço de reduzir computação global e caracterizar o espectro de fala

de uma maneira mais consistente com a percepção humana.

Vale salientar que o banco de filtros é uma ferramenta importante para o

reconhecimento de voz quando o objetivo é encontrar frequências especificas de um sinal

de voz. Como exemplo pode-se citar a análise das formantes de frequência requeridas na

aproximação Acústico-fonética (Capitulo 2). Neste estudo, a aproximação utilizada é a de

Reconhecimento de Padrões onde a análise espectral do sinal é feita como um todo, deste

modo utilizamos apenas a FFT para obter o espectro de frequência do sinal.

AS “WAVELETS”

 Como será demonstrado no capitulo 10, a FFT é uma ferramenta eficiente para a

obtenção do espectro de freqüência de um sinal. No entanto, devido à característica

interdisciplinar do reconhecimento de voz, muitas são as variáveis que influenciam no

resultado final da FFT, isto é, as características do espectro de um sinal de voz mudam,

mesmo no caso deste sinal ser pronunciado pela mesma pessoa. Portanto, precisa-se de

uma ferramenta auxiliar para dar maior confiabilidade à resposta obtida pelo sistema. As

“Wavelets” cumprem este papel de auxiliar a FFT na definição do reconhecimento de voz.

 A Transformada “Wavelet”, é uma técnica relativamente pouco difundida, em

comparação com a FFT, daí a necessidade de comparar as duas ferramentas, e assim

demonstrar sua utilidade.

 Não é objetivo deste trabalho desenvolver um aprofundamento teórico referente às

“Wavelets”, mas somente demonstrar a sua utilidade como uma ferramenta auxiliar à FFT

no reconhecimento de voz. Pretende-se aqui mostrar uma pequena introdução conceitual e

exemplos práticos do uso das “Wavelets” no reconhecimento de sinais.

 A Transformada “Wavelet”, em alguns casos, propicia a obtenção de informações

não conseguidas com o uso da FFT. Dentre os tipos de aplicações que utilizam as

“Wavelets”, estão o reconhecimento de sinais e a compressão de imagens utilizadas pelo

FBI americano no reconhecimento de impressões digitais.

 A Transformada Discreta de Fourier foi concebida no século XIX pelo matemático

francês Jean Baptiste Fourier. Como visto no capitulo 5, esta técnica permite que, a partir

de um sinal no domínio do tempo, obtenha-se o sinal correspondente no domínio da

freqüência.

7.1 A TRANSFORMADA “WAVELET”

 A DFT (Transformada Discreta de Fourier) informa exatamente quais são as

freqüências presentes num sinal. Se for necessário analisar um sinal estacionário, ou seja,

um sinal com espectro invariante, a freqüência apontada como existente pela DFT está

presente em todo o sinal. Mas, se for necessário trabalhar com um sinal não estacionário

 61

(como sinal de voz), muito embora a DFT aponte as frequências presentes, ela não diz

nada sobre a localização dessas frequências, ou seja, em que instante de tempo

determinada frequência aparece. Quando essa informação é importante, deve-se lançar mão

de outra técnica. Uma delas é usar a decomposição baseada em “Wavelets”.

A tradução literal de “Wavelet”, é ondaleta, ou, pequena onda. As principais

aplicações práticas para o uso de Wavelets são:

- Detecção de características em sinais (imagens, sons e outros sinais).

- Tremores Sísmicos

- Imagens Médicas

- Compressão de imagens e sons.

- Filtragem do ruído em imagens e sons.

- Identificação de características em sinais.

 A Wavelet é uma forma de onda de duração limitada que tem um valor médio igual

a zero. A figura 7.1 mostra uma comparação entre um sinal senoidal (base da análise de

Fourier) sem limite de duração (estendida de menos a mais infinito) e um sinal Wavelet

com duração limitada, assimétrico e irregular.

Figura 7.1: Onda Senoidal e Wavelet tipo db10

 Matematicamente, o processo de análise de Fourier é representado pela

Transformada de Fourier (equação 7.1), que é a soma de todo o sinal f(t) multiplicado pela

exponencial complexa (que pode ser quebrado em componentes senoidais de parte real e

imaginária).

 ( ) ( ) dtetfF tjωω −+∞∞−∫= . [7.1]

 62

 A figura 7.2 mostra como a transformada de Fourier decompõe um sinal qualquer

em suas componentes senoidais.

Figura 7.2: Decomposição de um sinal qualquer em sinais senoidais

 (Transformada de Fourier)

 Similarmente a transformada Wavelet é definida como a soma de todo o sinal no

domínio do tempo, multiplicado pela função wavelet.

 C [7.2] ∫+∞∞−= dttposiçãoescalatfposiçãoescala ),,().(),( ψ

Figura 7.3: Decomposição de um sinal qualquer em sinais de diferentes escalas e posições (Transformada Wavelet)

 A equação 7.2 resulta em