Transformada de Fourier
29 pág.

Transformada de Fourier


DisciplinaRedes sem Fio594 materiais22.005 seguidores
Pré-visualização5 páginas
para este banco de filtros. São usados valores 
para fi e C de 300 Hz e 200 Hz, resultando nas seguintes especificações para este banco de 
filtros: 
 
Filtro 1: f1 = 300 Hz b1 = 200 Hz 
 Filtro 2: f2 = 600 Hz b2 = 400 Hz 
 Filtro 3: f3 = 1200 Hz b3 = 800 Hz 
 Filtro 4: f4 = 2400 Hz b4 = 1600 Hz 
 
 
 
 
 
 
 
 
Figura 6.6: Especificação para um Banco de Filtro ideal de 4 canais de uma oitava 
 58
 
 
6.4 IMPLEMENTAÇÃO DE UM BANCO DE FILTROS 
 
Um banco de filtro pode ser implementado de diversos modos, dependendo do 
método usado para projetar os filtros individuais. O projeto de filtros digitais divide-se em 
duas classes: 
- Resposta ao Impulso Infinita (IIR) 
- Resposta ao Impulso Finita (FIR) 
 
Os filtros IIR (também chamados na literatura de filtros recursivos), são os mais 
diretos, e geralmente são de implementação mais eficiente, seja para realizar cada filtro 
passa faixa individual como uma cascata ou uma estrutura paralela. 
Para filtros FIR existem vários métodos possíveis de implementar os filtros passa 
faixa em um banco de filtros. A mais simples implementação é a estrutura na forma direta. 
Neste caso, se a resposta ao impulso para o iésimo canal é hi(n), onde 0 \u2264 n \u2264 L-1, então a 
saída do iésimo canal xi(n), pode ser expressa como uma convolução discreta do sinal de 
entrada s(n), com a resposta ao impulso, hi(n), isto é: 
 
 xi(n) = s(n) * hi(n) [6.10] 
 
6.5 CONSIDERAÇÕES SOBRE O USO DE BANCOS DE FILTROS EM SISTEMAS DE 
RECONHECIMENTO DE VOZ 
 
A primeira consideração para qualquer banco de filtro é o tipo de filtro digital 
usado. As escolhas são IIR (recursivo) e FIR (não recursivo). O projeto de filtros IIR tem 
a vantagem de ser implementável em estruturas simples e eficientes. A grande 
desvantagem dos filtros IIR é que a resposta em fase é não linear. Além disso, este tipo de 
filtro tem a possibilidade de ser tornar instável. 
Os filtros FIR alcançam a fase linear sem comprometer a habilidade de aproximar-
se das características de magnitude ideais; porém, eles normalmente são de implementação 
computacional muito cara. 
 
Para aplicações de reconhecimento de voz, uma estrutura de FFT pode ser 
aplicada freqüentemente para aliviar consideravelmente a ineficiência computacional de 
 59
 
 
 60
 
 
bancos de filtro FIR; conseqüentemente, estruturas de banco de filtro digitais mais 
práticas usam filtros FIR (normalmente em uma realização com FFT) [17]. 
 
A próxima consideração é o número de filtros a ser usado no banco de filtros. Para 
bancos de filtros uniformes, o número de filtros, Q, não pode ser muito pequeno ou então a 
habilidade do banco de filtros em filtrar o sinal da fala é grandemente prejudicada. 
Assim, valores de Q menores que 8 geralmente são evitados. Igualmente, o valor de 
Q não pode ser muito grande (a menos que haja uma considerável sobreposição de filtros), 
porque as larguras de faixa dos filtros seriam muito estreitas. 
Assim, sistemas práticos tendem a ter valores de Q < 32. 
Embora bancos de filtros uniformemente espaçados sejam extensamente usados 
para reconhecimento de voz, muitos sistemas práticos usam filtros de espaçamento não 
uniformes, em um esforço de reduzir computação global e caracterizar o espectro de fala 
de uma maneira mais consistente com a percepção humana. 
 
Vale salientar que o banco de filtros é uma ferramenta importante para o 
reconhecimento de voz quando o objetivo é encontrar frequências especificas de um sinal 
de voz. Como exemplo pode-se citar a análise das formantes de frequência requeridas na 
aproximação Acústico-fonética (Capitulo 2). Neste estudo, a aproximação utilizada é a de 
Reconhecimento de Padrões onde a análise espectral do sinal é feita como um todo, deste 
modo utilizamos apenas a FFT para obter o espectro de frequência do sinal. 
AS \u201cWAVELETS\u201d 
 
 
 
 
 
 Como será demonstrado no capitulo 10, a FFT é uma ferramenta eficiente para a 
obtenção do espectro de freqüência de um sinal. No entanto, devido à característica 
interdisciplinar do reconhecimento de voz, muitas são as variáveis que influenciam no 
resultado final da FFT, isto é, as características do espectro de um sinal de voz mudam, 
mesmo no caso deste sinal ser pronunciado pela mesma pessoa. Portanto, precisa-se de 
uma ferramenta auxiliar para dar maior confiabilidade à resposta obtida pelo sistema. As 
\u201cWavelets\u201d cumprem este papel de auxiliar a FFT na definição do reconhecimento de voz. 
 A Transformada \u201cWavelet\u201d, é uma técnica relativamente pouco difundida, em 
comparação com a FFT, daí a necessidade de comparar as duas ferramentas, e assim 
demonstrar sua utilidade. 
 Não é objetivo deste trabalho desenvolver um aprofundamento teórico referente às 
\u201cWavelets\u201d, mas somente demonstrar a sua utilidade como uma ferramenta auxiliar à FFT 
no reconhecimento de voz. Pretende-se aqui mostrar uma pequena introdução conceitual e 
exemplos práticos do uso das \u201cWavelets\u201d no reconhecimento de sinais. 
 A Transformada \u201cWavelet\u201d, em alguns casos, propicia a obtenção de informações 
não conseguidas com o uso da FFT. Dentre os tipos de aplicações que utilizam as 
\u201cWavelets\u201d, estão o reconhecimento de sinais e a compressão de imagens utilizadas pelo 
FBI americano no reconhecimento de impressões digitais. 
 A Transformada Discreta de Fourier foi concebida no século XIX pelo matemático 
francês Jean Baptiste Fourier. Como visto no capitulo 5, esta técnica permite que, a partir 
de um sinal no domínio do tempo, obtenha-se o sinal correspondente no domínio da 
freqüência. 
 
7.1 A TRANSFORMADA \u201cWAVELET\u201d 
 
 A DFT (Transformada Discreta de Fourier) informa exatamente quais são as 
freqüências presentes num sinal. Se for necessário analisar um sinal estacionário, ou seja, 
um sinal com espectro invariante, a freqüência apontada como existente pela DFT está 
presente em todo o sinal. Mas, se for necessário trabalhar com um sinal não estacionário 
 61
 
 
(como sinal de voz), muito embora a DFT aponte as frequências presentes, ela não diz 
nada sobre a localização dessas frequências, ou seja, em que instante de tempo 
determinada frequência aparece. Quando essa informação é importante, deve-se lançar mão 
de outra técnica. Uma delas é usar a decomposição baseada em \u201cWavelets\u201d. 
A tradução literal de \u201cWavelet\u201d, é ondaleta, ou, pequena onda. As principais 
aplicações práticas para o uso de Wavelets são: 
- Detecção de características em sinais (imagens, sons e outros sinais). 
- Tremores Sísmicos 
- Imagens Médicas 
- Compressão de imagens e sons. 
- Filtragem do ruído em imagens e sons. 
- Identificação de características em sinais. 
 
 A Wavelet é uma forma de onda de duração limitada que tem um valor médio igual 
a zero. A figura 7.1 mostra uma comparação entre um sinal senoidal (base da análise de 
Fourier) sem limite de duração (estendida de menos a mais infinito) e um sinal Wavelet 
com duração limitada, assimétrico e irregular. 
 
 
Figura 7.1: Onda Senoidal e Wavelet tipo db10 
 
 Matematicamente, o processo de análise de Fourier é representado pela 
Transformada de Fourier (equação 7.1), que é a soma de todo o sinal f(t) multiplicado pela 
exponencial complexa (que pode ser quebrado em componentes senoidais de parte real e 
imaginária). 
 
 ( ) ( ) dtetfF tj\u3c9\u3c9 \u2212+\u221e\u221e\u2212\u222b= . [7.1] 
 62
 
 
 A figura 7.2 mostra como a transformada de Fourier decompõe um sinal qualquer 
em suas componentes senoidais. 
 
 
Figura 7.2: Decomposição de um sinal qualquer em sinais senoidais 
 (Transformada de Fourier) 
 
 Similarmente a transformada Wavelet é definida como a soma de todo o sinal no 
domínio do tempo, multiplicado pela função wavelet. 
 
 C [7.2] \u222b+\u221e\u221e\u2212= dttposiçãoescalatfposiçãoescala ),,().(),( \u3c8
 
 
 
Figura 7.3: Decomposição de um sinal qualquer em sinais de diferentes escalas e posições (Transformada Wavelet) 
 
 A equação 7.2 resulta em