Prévia do material em texto
INSTITUTO MILITAR DE ENGENHARIA LEONARDO AUGUSTO Z�O RECONHECIMENTO AUTOMÁTICO DE LOCUTORROBUSTO A RUÍDOS ACÚSTICOS AMBIENTAIS DEESPECTROS COLORIDOS Dissertação de Mestrado apresentada ao Curso deMestrado em Engenharia Elétri a do Instituto Militar deEngenharia, omo requisito par ial para obtenção do títulode Mestre em Ciên ias em Engenharia Elétri a.Orientador: Rosângela Fernandes Coelho - Do teur ENST Rio de Janeiro2010 2010INSTITUTO MILITAR DE ENGENHARIAPraça General Tibúr io, 80-Praia VermelhaRio de Janeiro-RJ CEP 22290-270Este exemplar é de propriedade do Instituto Militar de Engenharia, que poderá in luí-loem base de dados, armazenar em omputador, mi ro�lmar ou adotar qualquer forma dearquivamento.É permitida a menção, reprodução par ial ou integral e a transmissão entre bibliote asdeste trabalho, sem modi� ação de seu texto, em qualquer meio que esteja ou venha aser �xado, para pesquisa a adêmi a, omentários e itações, desde que sem �nalidade omer ial e que seja feita a referên ia bibliográ� a ompleta.Os on eitos expressos neste trabalho são de responsabilidade do(s) autor(es) e do(s)orientador(es). Z34r Zão, L.Re onhe imento Automáti o de Lo utor Robusto a RuídosA ústi os Ambientais de Espe tros Coloridos / Leonardo Au-gusto Zão. - Rio de Janeiro : Instituto Militar de Engenharia,2010.95 p.: il.Dissertação (mestrado) - Instituto Militar de Engenharia - Riode Janeiro, 2010.1. Engenharia elétri a - dissertações. 2. Pro essamento desinais. 3. Ruídos a ústi os 4. Re onhe imento automáti o delo utor I. Título II. Instituto Militar de Engenharia.CDD 621.3822 2 INSTITUTO MILITAR DE ENGENHARIALEONARDO AUGUSTO Z�ORECONHECIMENTO AUTOMÁTICO DE LOCUTOR ROBUSTO ARUÍDOS ACÚSTICOS AMBIENTAIS DE ESPECTROS COLORIDOS Dissertação de Mestrado apresentada ao Curso de Mestrado em Engenharia Elétri ado Instituto Militar de Engenharia, omo requisito par ial para obtenção do título deMestre em Ciên ias em Engenharia Elétri a.Orientador: Rosângela Fernandes Coelho - Do teur ENSTAprovada em 17 de Dezembro 2010 pela seguinte Ban a Examinadora: Rosângela Fernandes Coelho - Do teur ENST do IME - PresidenteRui Seara - Do teur da UFSCAbraham Al aim - Ph.D. da PUCPaulo Roberto Rosa Lopes Nunes - Ph.D. do IME Rio de Janeiro2010 3 A todos que em mim on�am. 4 AGRADECIMENTOSÀ Prof. Rosângela Coelho, minha orientadora e meu exemplo, por toda a sua atenção,amizade, respeito, in entivo e ompreensão que foram fundamentais para minha formaçãoe meu progresso.À minha esposa, Isabela, por me fortale er nos momentos difí eis, por ompartilharos momentos felizes e, prin ipalmente, por me apoiar in ondi ionalmente durante toda arealização do Mestrado,Aos meus pais Fran is o e Lourdes, a meus irmãos Vini ius e Marianna, e a todos osfamiliares que ompreenderam e apoiaram a minha dedi ação a este urso,Aos olegas Ri ardo e Dir eu, pela ajuda nos momentos de di� uldade e pela amizadeque tornou a aminhada menos desgastante e ainda mais prazerosa,À amiga Claudia Vieira, por ter in entivado a minha ini iação à pesquisa no LaRSO,Ao Instituto Militar de Engenharia, instituição da qual me orgulho de ter-me graduadoe que me propor ionou a realização deste urso de Mestrado,A todos os professores e fun ionários do Instituto Militar de Engenharia, por on-tribuirem direta e indiretamente para minha formação,A Deus, por estar presente na minha vida, na minha família e nos meus estudos, epor guiar sempre o meu aminho,E à Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), peloapoio �nan eiro. 5 SUMÁRIOLISTA DE ILUSTRAÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13LISTA DE SIGLAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 INTRODUÇ�O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201.2 Resultados Obtidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201.3 Organização da Dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 ESTUDO ESTATÍSTICO DE RUÍDOS ACÚSTICOS AMBIEN-TAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232.1 Densidade Espe tral de Potên ia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232.1.1 Estimação do parâmetro β . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242.2 Distribuição de Cauda Pesada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252.3 Distân ia Bhatta haryya . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252.4 Kurtosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.5 Resultados das Estatísti as dos Ruídos Ambientais . . . . . . . . . . . . . . . . . . . . 262.5.1 A Base de Ruídos NOISEX-92 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272.5.2 Resultados DEP e β . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272.5.3 Resultados HTD e K . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.5.4 Distân ia Bhatta haryya . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332.6 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343 REPRESENTAÇ�O E GERAÇ�O DE RUÍDOS ACÚSTICOSAMBIENTAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353.1 Proposta da Representação e Geração de Ruídos . . . . . . . . . . . . . . . . . . . . . . 353.1.1 Representação de ruídos om Distribuições Distintas . . . . . . . . . . . . . . . . . . . 363.1.2 Representação do Espe tro Colorido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363.1.3 Geração de Ruídos A ústi os de Espe tros Coloridos e DistribuiçõesDistintas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403.2 Estatísti as dos Ruídos Gerados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426 3.2.1 Não-Linearidade na Geração do Parâmetro β . . . . . . . . . . . . . . . . . . . . . . . . . 423.2.2 Resultados DEP e β . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433.2.3 Resultados de Distribuição e Kurtosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513.2.4 Distribuição de Cauda Pesada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 563.3 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594 IDENTIFICAÇ�O DE LOCUTOR ROBUSTA A RUÍDOS ACÚS-TICOS DE ESPECTRO COLORIDO . . . . . . . . . . . . . . . . . . . . . . . . . . 604.1 Atributos da Voz e Classi� ador para o RAL . . . . . . . . . . . . . . . . . . . . . . . . . . 614.1.1 MFCC (Mel-frequen y epstrum oe� ients) . . . . . . . . . . . . . . . . . . . . . . . . . . 614.1.1.1 Coe� ientes Dinâmi os . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 624.1.2 GMM (Gaussian Mixture Model) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 624.2 Modelo de Classi� ação Robusta om Ruídos em Partições e umClassi� ador: Proposta 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 634.2.1 Montagem dos Ruídos de Adição por Partições . . . . . . . . . . . . . . . . . . . . . . . . 644.2.2Adição do Ruído ao Sinal de Voz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644.3 Modelo de Classi� ação Robusta om Ruídos Isolados e MúltiplosClassi� adores: Proposta 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 654.3.1 Montagem dos Ruídos Isolados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 654.3.2 Adição ao Sinal de Voz dos Ruídos Isolados . . . . . . . . . . . . . . . . . . . . . . . . . . . 664.3.3 Modelo de Classi� ação om Múltiplos Modelos (n-GMM) . . . . . . . . . . . . . . 664.4 De isor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 674.5 Resultados de Identi� ação Robusta a Ruídos . . . . . . . . . . . . . . . . . . . . . . . . . 684.5.1 Ambiente de Testes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 684.5.2 Resultados de Identi� ação de Lo utor da Proposta de Modelos omRuídos por Partições - GMM-RP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 734.5.3 Resultados de Identi� ação de Lo utor da Proposta de Modelos omRuídos Isolados - n-GMM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 744.5.4 Resultados Comparativos de Identi� ação de Lo utor . . . . . . . . . . . . . . . . . . 784.6 Comentários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 864.6.1 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 875 CONCLUS�O E TRABALHOS FUTUROS . . . . . . . . . . . . . . . . . . . . 885.1 Sugestões para Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 897 5.2 Comentários Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 906 REFERÊNCIAS BIBLIOGRÁFICAS . . . . . . . . . . . . . . . . . . . . . . . . . . 91 8 LISTA DE ILUSTRAÇÕESFIG.2.1 Funções densidade espe tral de potên ia dos ruídos (a) Bran o Sin-téti o, (b) Rosa Sintéti o e ( ) Carro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24FIG.2.2 Curva DEP e parâmetro β̂ dos ruídos (a) Veí ulo Militar e (b)Balbúrdia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28FIG.2.3 Curva DEP e parâmetro β̂ dos ruídos (a) Fábri a 2 e (b) Tanque. . . . . . 28FIG.2.4 Curva DEP e parâmetro β̂ dos ruídos (a) Op Navio e (b) Avião 1. . . . . . 29FIG.2.5 Curva DEP e parâmetro β̂ dos ruídos (a) Avião 2 e (b) F16. . . . . . . . . . . 29FIG.2.6 Curva DEP e parâmetro β̂ dos ruídos (a) Fábri a 1 e (b) Maq Navio. . . 29FIG.2.7 Espe trogramas dos ruídos (a) Bran o Sintéti o, (b) Rosa Sintéti oe ( ) Carro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30FIG.2.8 Curvas de distribuição de auda pesada dos ruídos om K ≈ 3. . . . . . . . . 32FIG.2.9 Curvas de distribuição de auda pesada dos ruídos om K > 3. . . . . . . . . 32FIG.2.10 Ruídos a ústi os da base NOISEX-92 mapeados em função de K e β. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34FIG.3.1 Obtenção da sequên ia {Ym} de espe tro olorido a partir da �l-tragem de uma sequên ia {Xm} de espe tro bran o. . . . . . . . . . . . . . . . . 37FIG.3.2 Erro relativo per entual para β = 0, 8 (FERDI, 2008). . . . . . . . . . . . . . . . 38FIG.3.3 Esquema para a geração da sequên ia Ym om parâmetros KY e β. . . . . 41FIG.3.4 Relação entre os valores β utilizados na geração dos ruídos a ústi- os, e os resultados de estimação de β̂ orrespondentes. . . . . . . . . . . . . . . 43FIG.3.5 Resultados de DEP e β dos ruídos Bran o Sintéti o real e geradoarti� ialmente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44FIG.3.6 Resultados de DEP e β dos ruídos Rosa Sintéti o real e geradoarti� ialmente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44FIG.3.7 Resultados de DEP e β dos ruídos Carro real e gerado arti� ial-mente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45FIG.3.8 Resultados de DEP e β dos ruídos Avião 1 real e gerado arti� ial-mente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46FIG.3.9 Resultados de DEP e β dos ruídos Avião 2 real e gerado arti� ial-mente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469 FIG.3.10 Resultados de DEP e β dos ruídos Fábri a 2 real e gerado arti�- ialmente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47FIG.3.11 Resultados de DEP e β dos ruídos Tanque real e gerado arti� ial-mente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47FIG.3.12 Resultados de DEP e β dos ruídos Balbúrdia real e gerado arti�- ialmente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48FIG.3.13 Resultados de DEP e β dos ruídos Op Navio real e gerado arti�- ialmente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48FIG.3.14 Resultados de DEP e β dos ruídos Fábri a 1 real e gerado arti�- ialmente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49FIG.3.15 Resultados de DEP e β dos ruídos Veí ulo Militar real e geradoarti� ialmente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49FIG.3.16 Resultados de DEP e β dos ruídos Maq Navio real e gerado arti�- ialmente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50FIG.3.17 Resultados de DEP e β dos ruídos F16 real e gerado arti� ialmente. . . . 50FIG.3.18 Resultados de fdp e Kurtosis do ruído Bran o Sintéti o real e ge-rado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51FIG.3.19 Resultados de fdp e Kurtosis do ruído Rosa Sintéti o real e gerado. . . . . 52FIG.3.20 Resultados de fdp e Kurtosis do ruído Avião 1 real e gerado. . . . . . . . . . . 52FIG.3.21 Resultados de fdp e Kurtosis do ruído Maq Navio real e gerado. . . . . . . . 53FIG.3.22 Resultados de fdp e Kurtosis do ruído Op Navio real e gerado. . . . . . . . . 53FIG.3.23 Resultados de fdp e Kurtosis do ruído Tanque real e gerado. . . . . . . . . . . 53FIG.3.24 Resultados de fdp e Kurtosis do ruído Veí ulo Militar real e gerado. . . . . 54FIG.3.25 Resultados de fdp e Kurtosis do ruído Avião 2 real e gerado. . . . . . . . . . . 54FIG.3.26 Resultados de fdp e Kurtosis do ruído Balbúrdia real e gerado. . . . . . . . . 54FIG.3.27 Resultados de fdp e Kurtosis do ruído Carro real e gerado. . . . . . . . . . . . 55FIG.3.28 Resultados de fdp e Kurtosis do ruído F16 real e gerado. . . . . . . . . . . . . . 55FIG.3.29 Resultados de fdp e Kurtosis do ruído Fábri a 1 real e gerado. . . . . . . . . 55FIG.3.30 Resultados de fdp e Kurtosis do ruído Fábri a 2 real e gerado. . . . . . . . . 56FIG.3.31 Resultados de HTD dos ruídos (a) Bran o Sintéti o e (b) RosaSintéti o (reais e gerados). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56FIG.3.32 Resultados de HTD dos ruídos (a) Avião 1 e (b) Maq Navio (reaise gerados). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5710 FIG.3.33 Resultados de HTD dos ruídos (a) Op Navio e (b) Tanque (reais egerados). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57FIG.3.34 Resultadosde HTD dos ruídos Veí ulo Militar real e gerado. . . . . . . . . . . 58FIG.3.35 Resultados de HTD dos ruídos (a) Avião 2 e (b) Balbúrdia (reais egerados). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58FIG.3.36 Resultados de HTD dos ruídos (a) Carro e (b) F16 (reais e gerados). . . . 59FIG.3.37 Resultados de HTD dos ruídos (a) Fábri a 1 e (b) Fábri a 2 (reaise gerados). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59FIG.4.1 Extração dos oe� ientes MFCC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61FIG.4.2 Proposta do modelo GMM-RP, gerado a partir de múltiplas par-tições dos ruídos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65FIG.4.3 Exemplo do modelo n-GMM proposto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67FIG.4.4 Resultados dos experimentos preliminares om os modelos gerados om ruídos por partições, para testes de 5 segundos orrompidos om os ruídos (a) Avião 1, (b) Avião 2 e ( ) Fábri a 1. . . . . . . . . . . . . . . 74FIG.4.5 Resultados dos experimentos preliminares om os modelos n-GMM,para testes de 5 segundos orrompidos om os ruídos (a) Avião 2,(b) Carro e ( ) Rosa Sintéti o. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76FIG.4.6 Resultados de testes de identi� ação om lo uções de 5s orrompi-das pelo ruído Bran o Sintéti o e diferentes modelos. . . . . . . . . . . . . . . . . 78FIG.4.7 Resultados de testes de identi� ação om lo uções de 5s orrompi-das pelo ruído Avião 1 e diferentes modelos. . . . . . . . . . . . . . . . . . . . . . . . 79FIG.4.8 Resultados de testes de identi� ação om lo uções de 5s orrompi-das pelo ruído Avião 2 e diferentes modelos. . . . . . . . . . . . . . . . . . . . . . . . 79FIG.4.9 Resultados de testes de identi� ação om lo uções de 5s orrompi-das pelo ruído Fábri a 2 e diferentes modelos. . . . . . . . . . . . . . . . . . . . . . . 80FIG.4.10 Resultados de testes de identi� ação om lo uções de 5s orrompi-das pelo ruído Rosa Sintéti o e diferentes modelos. . . . . . . . . . . . . . . . . . 81FIG.4.11 Resultados de testes de identi� ação om lo uções de 5s orrompi-das pelo ruído Tanque e diferentes modelos. . . . . . . . . . . . . . . . . . . . . . . . 81FIG.4.12 Resultados de testes de identi� ação om lo uções de 5s orrompi-das pelo ruído Carro e diferentes modelos. . . . . . . . . . . . . . . . . . . . . . . . . . 8211 FIG.4.13 Resultados de testes de identi� ação om lo uções de 5s orrompi-das pelo ruído Maq Navio e diferentes modelos. . . . . . . . . . . . . . . . . . . . . 82FIG.4.14 Resultados de testes de identi� ação om lo uções de 5s orrompi-das pelo ruído Op Navio e diferentes modelos. . . . . . . . . . . . . . . . . . . . . . . 83FIG.4.15 Resultados de testes de identi� ação om lo uções de 5s orrompi-das pelo ruído F16 e diferentes modelos. . . . . . . . . . . . . . . . . . . . . . . . . . . . 84FIG.4.16 Resultados de testes de identi� ação om lo uções de 5s orrompi-das pelo ruído Fábri a 1 e diferentes modelos. . . . . . . . . . . . . . . . . . . . . . . 84FIG.4.17 Resultados de testes de identi� ação om lo uções de 5s orrompi-das pelo ruído Balbúrdia e diferentes modelos. . . . . . . . . . . . . . . . . . . . . . 85FIG.4.18 Resultados de testes de identi� ação om lo uções de 5s orrompi-das pelo ruído Veí ulo Militar e diferentes modelos. . . . . . . . . . . . . . . . . . 85 12 LISTA DE TABELASTAB.2.1 Des rição dos ruídos utilizados neste trabalho (base NOISEX-92). . . . . . 27TAB.2.2 Resultados de estimação do parâmetro β̂ e o erro ǫ da regressãolinear da DEP dos ruídos da base NOISEX-92. . . . . . . . . . . . . . . . . . . . . . 30TAB.2.3 Resultados de estimação do parâmetro K̂ dos ruídos da baseNOISEX-92. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31TAB.2.4 Resultados da distân ia Bhatta haryya (dB) entre os diversos ruí-dos a ústi os e o ruído Bran o Sintéti o. . . . . . . . . . . . . . . . . . . . . . . . . . . . 33TAB.3.1 Funções de transferên ia e DEP para os �ltros da forma retangular,trapezoidal e Al-Alaoui (FERDI, 2008). . . . . . . . . . . . . . . . . . . . . . . . . . . . 38TAB.4.1 Erros de pre isão da identi� ação de lo utor om a base KING paragrau de on�ança de 95%. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69TAB.4.2 Taxa de a ertos (%) da identi� ação de lo utor da base KING paratestes de 5 segundos, 20 oe� ientes MFCC e modelos GMM om32 gaussianas (resultados om a base limpa: 89,29%). . . . . . . . . . . . . . . . 70TAB.4.3 Taxa de a ertos (%) da identi� ação de lo utor da base KING paratestes de 1 segundo, 20 oe� ientes MFCC e modelos GMM om32 gaussianas (resultados om a base limpa: 68,32%). . . . . . . . . . . . . . . . 71TAB.4.4 Taxa de a ertos (%) da identi� ação de lo utor da base KING omtestes de 5 segundos, para 40 oe� ientes (MFCC + ∆) e modelosGMM om 32 gaussianas (resultados om a base limpa: 91,58%). . . . . . 72TAB.4.5 Taxa de a ertos (%) da identi� ação de lo utor da base KING omtestes de 1 segundo, para 40 oe� ientes (MFCC + ∆) e modelosGMM om 32 gaussianas (resultados om a base limpa: 69,80%). . . . . . 72TAB.4.6 Taxa de a ertos (%) da identi� ação de lo utor da base KING omtestes de 5 segundos, para 40 oe� ientes (MFCC + ∆) e modelosGMM-RP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75TAB.4.7 Taxa de a ertos (%) da identi� ação de lo utor da base KING omtestes de 1 segundo, para 40 oe� ientes (MFCC + ∆) e modelosGMM-RP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75TAB.4.8 Taxa de a ertos (%) da identi� ação de lo utor da base KING om13 testes de 5 segundos, para 40 oe� ientes (MFCC + ∆) e modelo n-GMM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77TAB.4.9 Taxa de a ertos (%) da identi� ação de lo utor da base KING omtestes de 1 segundo, para 40 oe� ientes (MFCC + ∆) e modelo n-GMM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 14 LISTA DE SIGLAS dB distân ia Bhatta haryyaAGFCC auditory gammatone frequen y epstral oe� ientsAMFCC auto orrelation mel-frequen y epstral oe� ientsCMS epstral mean subtra tionDCT dis rete osine transformDEP densidade espe tral de potên iaEM expe tation-maximizationFAC função auto orrelaçãofdp função densidade de probabilidadeFFT fast Fourier transformFIR �nite impulse responseGMM Gaussian Mixture ModelHTD heavy-tailed distributionLDA linear dis riminant analysisPCA prin ipal omponent analysisPCM Pulse Code ModulationRAL re onhe imento automáti o de lo utorSNR signal-to-noise ratioUBM universal ba kground model 15 RESUMOEsta Dissertação apresenta duas propostas para re onhe imento automáti o de lo u-tor robusto a ruídos a ústi os ambientais e situações de des asamento de ondições entretreinamento e teste. No desenvolvimento da pesquisa foram de�nidos tipos de ruídos quepodem orromper os sinais de voz. Este estudo propor ionou também a proposta de repre-sentação e geração de ruídos a ústi os om diferentes distribuições e espe tros oloridos.Esta geração foi adotada na montagem dos sinais de treinamento que foram utilizados nade�nição dos modelos de lo utor. No desenvolvimento do trabalho, foi também des ritoum novo método de estimação para o expoente da densidade espe tral de potên ia. Comeste expoente foi possível ompreender a or dos espe tros dos ruídos ambientais.Os resultados dos experimentos de identi� ação de lo utor, demonstraram que osmodelos propostos tiveram desempenho superior aos modelos de referên ia apresentadosna literatura. A identi� ação de lo utor obteve aumento de até 55% nas taxas de a er-tos em relação ao modeloGMM (gaussian mixture model) onven ional. Os diferentesexperimentos omprovaram a robustez propor ionada pelos métodos propostos. Assim,estes métodos de re onhe imento de lo utor robusto são bastante promissores para em-prego em sistemas sujeitos a ruídos a ústi os ambientais omo também em situações dedes asamento de ondições entre treinamento e teste. 16 ABSTRACTThis work presents two novel proposals to provide noise robust automati speakerre ognition. The resear h enables the lassi� ation of the a ousti noise sour es that maylead to spee h signal orruption. A noise sample generator was also proposed in this work.A new estimation method for the spe tral density exponent is also des ribed in this study.Several speaker identi� ation experiments were ondu ted onsidering di�erent noisesour es and signal-to-noise ratios. The results showed an improvement of 55% in theidenti� ation a ura y when ompared to the baseline GMM approa h. These resultsalso demonstrated that the proposed speaker re ognition methods are very promising andmay be used in noisy and mismat h onditions. 17 1 INTRODUÇ�O A res ente ne essidade de sistemas de segurança om requisitos ada vez mais rígidosvem impulsionando o uso da autenti ação biométri a. As soluções biométri as (JAIN,2004) baseiam-se no re onhe imento de padrões de ara terísti as humanas tais omo: aimpressão digital, a íris, a fa e e a voz.Por ser o sinal a ústi o resultante do sistema de produção da fala (OSHAUGHNESSY,1987), a voz é uma das prin ipais ara terísti as biométri as. As informações ontidas navoz in luem a identidade, o sexo, o idioma e as ondições físi o-emo ionais do lo utor. Osinal de voz é também de fá il aquisição e sua utilização em sistemas de re onhe imentoautomáti o de lo utor (RAL) (CAMPBELL, 1997) (DODDINGTON, 1985) têm amplaa eitação em diversas apli ações, tais omo: ontrole de a esso, segurança de dados einvestigações forenses.Os sistemas de RAL englobam as fases de treinamento e de teste (BIMBOT, 2004).Cada uma destas fases é geralmente omposta de três etapas: a aquisição e pré-pro essamento do sinal de voz, a extração de atributos ou ara terísti as da voz, e a lassi� ação do lo utor. Na etapa de lassi� ação, realizam-se as tarefas de identi� açãoe/ou veri� ação. Na identi� ação, o sistema de ide a qual dos lo utores adastrados per-ten e a lo ução de teste. Na veri� ação, o lo utor de lara sua identidade e o sistemade ide se a a eita, ou não, omo verdadeira.Os atributos MFCC (mel-frequen y epstral oe� ients) (FURUI, 1981) (IMAI, 1983)e o lassi� ador GMM (gaussian mixture model) (REYNOLDS, 1995a), são onsidera-dos na literatura omo referên ia de bom desempenho em sistemas de RAL. Apesar deapresentarem bons resultados para lo uções limpas (REYNOLDS, 1995a) (REYNOLDS,1995b), alguns métodos foram propostos para lidar om situações de des asamento de ondições entre as fases de treinamento e teste. As prin ipais té ni as geralmente atuamnos atributos da voz ou na lassi� ação do lo utor. Dentre as que operam nos atrib-utos da voz, pode-se ressaltar as de normalização omo, por exemplo, a subtraçãoda média dos oe� ientes epestrais (CMS - epstral mean subtra tion) (ATAL, 1974)(MAMMONE, 1996), a análise linear dis riminativa (LDA - linear dis riminant analysis)(JIN, 2000), a análise de omponentes prin ipais (PCA - prin ipal omponent analysis)18 (MAGRIN-CHAGNOLLEAU, 2002) (MAGRIN-CHAGNOLLEAU, 1999) e a alteração dadistribuição dos vetores de atributos (feature warping) (PELECANOS, 2001) (XIANG,2002) (XIE, 2006). Outras teorias propõem que os atributos da voz mais afetados pelodes asamento, sejam des artados (missing feature) pelo sistema de re onhe imento (DRY-GAJLO, 1998) (KWON, 2007). Há ainda sugestões de atributos mais robustos que osMFCC, dentre as quais pode-se itar os AMFCC (auto orrelation mel-frequen y epstral oe� ients) (SHANNON, 2004) onde os termos om orrelação ruzada são zerados ouignorados pelo modelo, e os AGFCC (auditory gammatone frequen y epstral oe� ients)(SHAO, 2008) (ZHANG, 2007), extraídos om �ltros gammatone, que aptam a faixa defrequên ia do aparelho auditivo humano ( ó lea).De forma a tornar a lassi� ação de lo utor robusta em (BOURLARD, 1996) foides rita a geração de modelos a partir de sub-bandas do sinal da voz. As sub-bandasmais afetadas pelo des asamento são des onsideradas ou atenuadas na geração do modelode lo utor. Desta forma, obtém-se o aprimoramento do re onhe imento.No entanto, atualmente, um dos mais importantes desa�os para prover um sistema deRAL robusto, refere-se o sinal de voz apturado em ambientes a usti amente ruidosos. Aprin ipal limitação é atribuída à variabilidade e ao des onhe imento das ara terísti asdas fontes de ruídos a ústi os presentes nas lo uções. Esta diversidade de fontes a ústi as,a arreta severa queda nas taxas de re onhe imento (MING, 2007) (SANTANA, 2010).Uma té ni a interessante, proposta ini ialmente para prover robustez diante de situ-ações de des asamento (LIPPMANN, 1987), foi adotada por (MING, 2007) e (PEARCE,2000). Ela atua na fase de treinamento e na etapa de lassi� ação. Nessa proposta, omodelo do lo utor é obtido através de treinamento em múltiplas ondições ou situações.Em (PEARCE, 2000), esta té ni a foi utilizada para re onhe imento de voz em que otreinamento de ada lo utor foi realizado om lo uções limpas e orrompidas por fontesde ruídos ambientais reais em diversas relações sinal-ruído (SNR - signal-to-noise ratio).Contudo, a grande limitação desta solução é onsiderar o onhe imento prévio da fontede ruído real que orromperá uma lo ução de teste. A té ni a de treinamento em múlti-plas ondições foi também desenvolvida para re onhe imento de lo utor (MING, 2007).No treinamento dos modelos, os autores utilizaram lo uções limpas e orrompidas omruído gaussiano bran o e diferentes valores de SNR. O ruído bran o foi adotado por nãohaver informações su� ientes sobre os ruídos presentes nas lo uções de testes e por seremdes onhe idas suas ara terísti as estatísti as.19 Assim, a prin ipal motivação desta Dissertação de Mestrado é atuar neste tema eprover um sistema de re onhe imento de lo utor robusto a ruídos a ústi os ambientais eem situações de des asamento entre treinamento e teste.1.1 OBJETIVOSDe forma a al ançar a robustez a ruídos de sistemas de re onhe imento automáti o delo utor, os prin ipais objetivos deste trabalho são: • De�nir os diversos tipos de fontes sonoras de ruídos ambientais, segundo suas a-ra terísti as de padrão e espe tro. Para isto, é realizado um estudo estatísti odetalhado de um onjunto de treze ruídos a ústi os da base de ruídos NOISEX-92(VARGA, 1993) oletados de diversas fontes ambientais reais. • Propor um método para representação e geração de ruídos a ústi os om padrõesdistintos e espe tros oloridos. Para validação da proposta são gerados treze ruídosarti� iais. Suas ara terísti as nos domínios do tempo e da frequên ia são ompara-das om as dos ruídos reais da base NOISEX-92. • Propor um sistema de re onhe imento de lo utor robusto a ruídos ambientais esituações de des asamento entre treinamento e teste. Dois modelos baseados emtreinamento em múltiplas ondições são apresentados e dis utidos neste trabalho.Estas propostas são omparadas om os referen iais: GMM e a proposta apresentadaem (MING, 2007).1.2 RESULTADOS OBTIDOSOs prin ipais resultados e ontribuições obtidos no desenvolvimento desta Dissertaçãosão: • De�nição estatísti a dos ruídos a ústi os da base NOISEX-92. Os resultados desteestudo mostraram que os ruídos a ústi os reais possuem espe tros oloridos e dis-tribuições distintas. Apenas o ruído arti� ial bran o apresentou realmente o espe -tro bran o. Os demais apresentaram espe tros de ores marrom e rosa. Quantoao padrão, vários ruídos apresentaram distribuição não-gaussiana. Segundo suas ara terísti as de padrão e espe tro, os treze ruídos foram de�nidos em in o tipos.20 • Método de estimação do expoente β da função densidade espe tral de potên ia(DEP).Os valores de β foram utilizados na de�nição das ores dos espe tros dosruídos ambientais. • Representação e geração de ruídos a ústi os ambientais om distintos espe tros ol-oridos e padrões. Os resultados demonstraram que as sequên ias de ruídos geradas onseguiram representar as ara terísti as de padrão e espe tro das fontes reais. • Duas soluções de re onhe imento de lo utor robusto a ruídos ambientais baseadosem treinamento em múltiplas ondições. A omposição dos modelos utilizou a re-presentação dos ruídos proposta neste trabalho. As validações das propostas foramrealizadas om experimentos de identi� ação de lo utor orrompidos pelos treze ruí-dos ambientais da base NOISEX-92 e seis diferentes valores de SNR. Os resultadosdemonstraram que os modelos propostos são bastante promissores quando ompara-dos aos referen iais de teste: o GMM onven ional e a té ni a de treinamento emmúltiplas ondições (MING, 2007). Em alguns asos, foi obtido um aprimoramentona taxa de re onhe imento de mais de 55% e 35% em relação aos referen iais deteste, respe tivamente.1.3 ORGANIZAÇ�O DA DISSERTAÇ�OO restante deste trabalho está organizado da seguinte forma: • Capítulo 2: Neste Capítulo é apresentado o estudo estatísti o de treze ruídosambientais da base NOISEX-92. Para a de�nição dos tipos de ruídos a ústi os, asseguintes medidas foram utilizadas: a densidade espe tral de potên ia, o parâmetroKurtosis, a distân ia Bhatta haryya e a distribuição de auda pesada (HTD - heavy-tailed distribution). Também é proposto neste Capítulo um método de estimaçãopara o expoente da função DEP (parâmetro β). • Capítulo 3: Uma proposta para representação e geração de ruídos a ústi os éapresentada neste Capítulo. Os ruídos gerados possuem espe tro olorido e padrãodeterminado pelo oe� iente Kurtosis. Treze ruídos foram obtidos para representaros ruídos ambientais da base NOISEX-92. Para validação dos resultados, foramutilizadas as seguintes estatísti as: a DEP, o expoente β, o parâmetro Kurtosis, afunção densidade de probabilidade (fdp) e a urva HTD.21 • Capítulo 4: Neste Capítulo, são apresentadas duas propostas de modelos para oRAL robusto a ruídos ambientais e situações de des asamento entre treinamento eteste. Ambas as propostas são baseadas em treinamento em múltiplas ondições.O estudo estatísti o dos ruídos da base NOISEX-92 (Capítulo 2) e a geração deruídos a ústi os (Capítulo 3) são utilizados na montagem dos modelos para proverrobustez ao re onhe imento de lo utor. Diversos experimentos de identi� ação sãoapresentados e dis utidos neste Capítulo. Para estes testes de validação, tambémforam utilizados os treze ruídos reais da base NOISEX-92 om seis distintas re-lações sinal-ruído. Os modelos propostos foram omparados om o modelo GMM onven ional e om a té ni a de treinamento em múltiplas ondições. • Capítulo 5: Finalmente, neste Capítulo, são expostas as prin ipais on lusõese ontribuições deste trabalho. Também são desta adas sugestões para trabalhosfuturos. 22 2 ESTUDO ESTATÍSTICO DE RUÍDOS ACÚSTICOS AMBIENTAIS A ara terização de fontes de ruídos ambientais é um grande desa�o para a pesquisa naárea de re onhe imento robusto de lo utor (MING, 2007) (MING, 2005) (WANG, 2010)(WU, 2009) (ZHANG, 2007). Neste Capítulo, é apresentado o resultado do estudo do omportamento de ruídos ambientais realizado om treze distintos tipos de fontes a ústi- as. Para a análise, foram utilizadas estatísti as nos domínios do tempo e da frequên ia.As prin ipais medidas onsideradas no estudo foram a densidade espe tral de potên ia(DEP), a distribuição de auda pesada (HTD - heavy-tailed distribution), a distân iaBhatta haryya (dB) e o parâmetro Kurtosis (K). Neste Capítulo, é também proposto ummétodo de estimação do expoente da densidade espe tral de potên ia.Para melhor entendimento da de�nição dos tipos de ruídos1 obtida neste estudo, ini- ialmente, são apresentados alguns on eitos importantes.2.1 DENSIDADE ESPECTRAL DE POTÊNCIAA presença de ruídos oloridos foi omprovada em estudos de diversas áreas da iên- ia (KESHNER, 1982) (KIKUCHI, 1985) (VOSS, 1978) (WEBSTER, 1994). A or dosespe tros é de�nida segundo o de aimento da densidade espe tral de potên ia S(f), dadapor, S(f) = c1 1 fβ (2.1)onde c1 é uma onstante positiva e β ∈ [0, 2].Assim, o ruído bran o, que possui potên ia onstante ao longo de todo o espe tro defrequên ias, apresenta β ≈ 0. Já os ruídos rosa e marrom, que apresentam funções DEP om de aimentos de 10 dB por dé ada (ou 3 dB por oitava) e 20 dB por dé ada (ou 6 dBpor oitava), têm β ≈ 1 e β ≈ 2, respe tivamente. Pela forma da DEP (EQ. 2.1) os ruídos oloridos também são designados na literatura por 1/fβ.Seja X(t) um pro esso esto ásti o esta ionário no sentido amplo, om função auto- orrelação (FAC) RX(τ), τ = t2 − t1. A densidade espe tral de potên ia é de�nida por1A expressão "de�nição de tipos de ruídos" foi adotada no lugar de " lassi� ação de ruídos" paraevitar onfusão om a expressão " lassi� ação de lo utor", utilizada no Capítulo 4.23 (PAPOULIS, 1991) omo, S(f) = ∫ ∞ −∞ RX(τ) e−j2πfτdτ . (2.2)Por de�nição, a DEP é obtida pela transformada de Fourier da função auto orrelação.Logo, S(f) = F [RX(τ)] . (2.3)2.1.1 ESTIMAÇ�O DO PARÂMETRO βPara a estimação do expoente β da densidade espe tral de potên ia, é proposta pri-meiramente, a linearização da EQ. 2.1 pela função logarítmi a. Desta forma, obtém-se aseguinte expressão: ln S(f) = ln c1 − β ln f . (2.4) 100 400 1000 4000 f [Hz] -70 -50 -30 -90 S( f) [ dB m /H z] 100 400 1000 4000 f [Hz] -70 -50 -30 -90 S( f) [ dB m /H z] (a) (b) 100 400 1000 4000 f [Hz] -70 -50 -30 -10 S( f) [ dB m /H z] ( )FIG. 2.1: Funções densidade espe tral de potên ia dos ruídos (a) Bran o Sintéti o, (b)Rosa Sintéti o e ( ) Carro. 24 O parâmetro β é então estimado pela in linação ( oe� iente angular) da reta obtida apartir da regressão linear da EQ. 2.4.A FIG. 2.1 ilustra as urvas DEP obtidas para três ruídos a ústi os onsiderados nestetrabalho. Também são mostradas as retas obtidas pelas regressões lineares apli adasà EQ. 2.4, e os orrespondentes resultados de estimação do expoente β̂. Nota-se pelode aimento destas funções, que os ruídos têm espe tro de or bran a (Bran o Sintéti o),rosa (Rosa Sintéti o) e marrom (Carro). Como pode-se observar, estas retas onseguemrepresentar o de aimento esperado para as funções DEP referentes a estes três ruídos.Ou seja, a potên ia é aproximadamente onstante para o ruído Bran o Sintéti o, e possuide aimentos de 10 dB por dé ada e de 20 dB por dé ada para os ruídos Rosa Sintéti o eCarro, respe tivamente.2.2 DISTRIBUIÇ�O DE CAUDA PESADAA distribuição de auda pesada de uma variável aleatória X é de�nida por, P [X > x] ≈ c2 1 xα , 0 ≤ α ≤ 2 (2.5)onde c2 é uma onstante positiva.A distribuição gaussiana apresenta auda, P (X > x) ≈ exp(−x2/2) x √ 2π , para x → ∞, om de aimento exponen ial e parâmetro α = 2 (FELLER, 1968). Curvas HTD2 om α < 2, são geralmente asso iadas às audas mais pesadas ou longas que a distribuiçãogaussiana.2.3 DISTÂNCIA BHATTACHARYYAA distân ia Bhatta haryya (dB) foi proposta em (KAILATH, 1967) omo ritério paraproblemas de seleção de sinais. Se X1 e X2 são duas variáveis aleatórias om funçõesdensidade de probabilidade p1(x) e p2(x), respe tivamente, então o oe� iente de Bhat-ta haryya (CB) é de�nido omo, CB = ∫ ∞ −∞ √ p1(x) p2(x) dx . (2.6)2A distribuição de Pareto, p(x) = α xαm xα+1 , é onsiderada a mais apropriada para a representação deamostras om distribuição de auda pesada (LÉVY, 1925).25 Logo, a distân ia Bhatta haryya entre as distribuições de X1 e X2 é dada por dB(X1, X2) = −ln CB = −ln ∫ ∞ −∞ √ p1(x) p2(x) dx . (2.7)A de�nição da EQ. 2.7 obede e às propriedades de simetria, positividade, e se anulaapenas para distribuições idênti as. Ou seja,a) dB(X1, X2) = dB(X2, X1);b) 0 ≤ dB(X1, X2) < ∞; ) dB(X1, X2) = 0 ⇔ p1(x) = p2(x), para todo x.Neste trabalho, a distân ia Bhatta haryya é utilizada para omparação das dis-tribuições das amostrasdos ruídos a ústi os om a distribuição gaussiana.2.4 KURTOSISO parâmetro ou oe� iente Kurtosis (ALLEN, 1978) pode ser de�nido omo a medidade deslo amento (skewness) ou dispersão entre os valores de uma variável aleatória omuma distribuição qualquer, e os valores de uma distribuição gaussiana. Se uma variávelaleatória X possui média mX e desvio padrão σX , o seu parâmetro K é de�nido pelarazão dos momentos entrais de quarta ordem. Ou seja, K = E[(X − mX)4] σ4X . (2.8)Por de�nição, o parâmetro Kurtosis assume o valor K = 3 para uma distribuiçãogaussiana. Neste trabalho, o parâmetro K é utilizado para de�nir os padrões das amostrasdos ruídos a ústi os omo gaussianos (K = 3) ou não-gaussianos (K 6= 3).O parâmetro Kurtosis também pode ser rela ionado om a urva HTD. Por exemplo,variáveis aleatórias om K = 3 (gaussianas) apresentam auda om de aimento exponen- ial (α = 2), enquanto pro essos om auda mais pesada (α < 2) possuem parâmetro K > 3.2.5 RESULTADOS DAS ESTATÍSTICAS DOS RUÍDOS AMBIENTAISNesta Seção, é proposta uma de�nição para os tipos de ruídos a ústi os ambientais,baseada na estimação das estatísti as DEP, β, HTD e K, des ritas anteriormente.26 TAB. 2.1: Des rição dos ruídos utilizados neste trabalho (base NOISEX-92).Ruído Des riçãoAvião 1 (Bu aneer 1) Co kpit de um jato Bu aneer a 190 nósAvião 2 (Bu aneer 2) Co kpit de um jato Bu aneer a 450 nósBalbúrdia (Babble) 100 pessoas onversando em uma salaBran o Sintéti o (White) Ruído gerado arti� ialmente om padrão gaussianoCarro (Volvo) Veí ulo Volvo 340, a 120 km/h, em ondições huvosasF16 (Co kpit) Co kpit de um aça F16 a 500 nósFábri a 1 (Fa tory 1) Ruído de uma fábri a de equipamentos elétri osFábri a 2 (Fa tory 2) Ruído de uma fábri a de automóveisMaq Navio (Dest Eng) Sala de máquinas de um navio DestroyerOp Navio (Dest Ops) Sala de operações de um navio DestroyerRosa Sintéti o (Pink) Ruído gerado arti� ialmente om padrão gaussianoTanque (M109 ) Tanque militar se movendo a 30 km/hVeí ulo Militar (Leopard) Veí ulo militar Leopard se movendo a 70 km/h2.5.1 A BASE DE RUÍDOS NOISEX-92Para o estudo, foi onsiderado o onjunto de treze fontes de ruídos ambientais reais ex-traídos da base NOISEX-92 (VARGA, 1993). Todos os ruídos desta base possuem duraçãode 235 segundos, amostrados a uma taxa de 19,98 kHz om odi� ação PCM (Pulse CodeModulation) de 16 bits. Dentre estes ruídos, dois foram gerados arti� ialmente (Bran oSintéti o e Rosa Sintéti o). Os demais foram oletados de diversas fontes sonoras reais.A des rição de ada uma destas fontes é apresentada na TAB. 2.1.Todos os resultados apresentados nesta Dissertação foram obtidos om os ruídos dabase NOISEX-92 re-amostrados a uma taxa de 8 kHz om duração de 40s. Esta adaptaçãoé ne essária devido aos experimentos de re onhe imento de lo utor, que utiliza uma basede voz om tais on�gurações.2.5.2 RESULTADOS DEP E βAs FIGs 2.2�2.6 exibem as urvas DEP e os resultados de estimação do parâmetro β̂para os ruídos a ústi os des ritos na TAB. 2.1. Estes resultados permitiram as de�niçõesdas ores dos espe tros de ada um dos ruídos da base NOISEX-92.Dentre os ruídos onsiderados, pode-se notar que os Veí ulo Militar (vide FIG. 2.2(a))e Balbúrdia (vide FIG. 2.2(b)), apresentaram DEP om os maiores de aimentos. Tambémpode ser observado que os valores de β obtidos para estes ruídos (β = 1, 97 e β = 1, 81)27 100 400 1000 4000 f [Hz] -70 -50 -30 -10 S( f) [ dB m /H z] 100 400 1000 4000 f [Hz] -70 -50 -30 -10 S( f) [ dB m /H z] (a) (b)FIG. 2.2: Curva DEP e parâmetro β̂ dos ruídos (a) Veí ulo Militar e (b) Balbúrdia.são próximos de 2. Ou seja, ambos têm espe tro de or marrom.Os ruídos Fábri a 2 (FIG. 2.3(a)), Tanque (FIG. 2.3(b)) e Op Navio (FIG. 2.4(a))também exibem de aimento próximo de 20 dB/dé ada em suas urvas DEP e, portanto,seus espe tros possuem or marrom. Este resultado é on�rmado pelos valor de β̂ (β ≈ 2). 100 400 1000 4000 f [Hz] -70 -50 -30 -10 S( f) [ dB m /H z] 100 400 1000 4000 f [Hz] -70 -50 -30 -10 S( f) [ dB m /H z] (a) (b)FIG. 2.3: Curva DEP e parâmetro β̂ dos ruídos (a) Fábri a 2 e (b) Tanque.As urvas DEP dos ruídos Avião 1 (FIG. 2.4(b)), Avião 2 (FIG. 2.5(a)), F16 (FIG.2.5(b)), Fábri a 1 (FIG. 2.6(a)) e Maq Navio (FIG. 2.6(b)) apresentam de aimentos deaproximadamente 10 dB/dé ada. Este resultado é on�rmado pelos valores de estimaçãode β̂ (β ≈ 1). Consequentemente, seus espe tros são onsiderados de or rosa.A FIG. 2.7 ilustra os espe trogramas dos ruídos Bran o Sintéti o, Rosa Sintéti o eCarro. Estes resultados on�rmam as ores dos espe tros identi� ados pelas urvas DEPapresentadas na FIG. 2.1. 28 100 400 1000 4000 f [Hz] -70 -50 -30 -10 S( f) [ dB m /H z] 100 400 1000 4000 f [Hz] -70 -50 -30 -10 S( f) [ dB m /H z] (a) (b)FIG. 2.4: Curva DEP e parâmetro β̂ dos ruídos (a) Op Navio e (b) Avião 1. 100 400 1000 4000 f [Hz] -70 -50 -30 -10 S( f) [ dB m /H z] 100 400 1000 4000 f [Hz] -70 -50 -30 -10 S( f) [ dB m /H z] (a) (b)FIG. 2.5: Curva DEP e parâmetro β̂ dos ruídos (a) Avião 2 e (b) F16. 100 400 1000 4000 f [Hz] -70 -50 -30 -10 S( f) [ dB m /H z] 100 400 1000 4000 f [Hz] -70 -50 -30 -10 S( f) [ dB m /H z] (a) (b)FIG. 2.6: Curva DEP e parâmetro β̂ dos ruídos (a) Fábri a 1 e (b) Maq Navio.Os resultados de estimação do expoente β̂ de todos os ruídos estão resumidos, emordem de res ente, na TAB. 2.2. Estes valores demonstram que, à ex eção do ruído Bran o29 −10 dB −60 dB −35 dB 5 s / div [k H z] 1.0 4.0 0.4 0.1 (a) (b) ( )FIG. 2.7: Espe trogramas dos ruídos (a) Bran o Sintéti o, (b) Rosa Sintéti o e ( ) Carro.Sintéti o, todos os demais ruídos apresentaram de aimento na função S(f), indi andoque este é o úni o ruído om espe tro bran o. Os demais ruídos foram divididos em duas lasses de or. Logo, aqueles uja DEP apresenta de aimento aproximado de 20 dB/dé ada(1, 5 < β < 2, 0) foram de�nidos omo de espe tro marrom. Finalmente, os que possuemde aimento de aproximadamente 10 dB/dé ada (0, 8 < β < 1, 5) foram de�nidos omo deTAB. 2.2: Resultados de estimação do parâmetro β̂ e o erro ǫ da regressão linear da DEPdos ruídos da base NOISEX-92. Ruído β̂ ǫMarromVeí ulo Militar 1,97 0,3585Balbúrdia 1,81 0,3153Carro 1,76 0,1649Op Navio 1,73 0,4173Tanque 1,72 0,3002Fábri a 2 1,64 0,1637RosaFábri a 1 1,43 0,5150F16 1,27 0,6541Rosa Sintéti o 1,22 0,1015Maq Navio 0,93 1,2456Avião 1 0,93 0,6230Avião 2 0,81 0,5374Bran oBran o Sintéti o 0,02 0,189730 espe tro rosa. Nota-se que das treze fontes a ústi as investigadas, apenas uma apresentouespe tro bran o. Das demais, 50 % foram onsideradas om espe tro de or marrom e 50% om espe tro de or rosa.A TAB. 2.2 exibe também o erro médio quadráti o (ǫ) entre os valores das urvasln S(f) e da regressão linear (EQ. 2.4) dos ruídos da base NOISEX-92. O úni o valordis repante foi obtido para o ruído Maq Navio devido à sua intensa variabilidade espe tral,que pode ser observada na FIG. 2.6(b).2.5.3 RESULTADOS HTD E KOs resultados das urvas HTD e dos parâmetros K foram utilizados na omparaçãoentre as distribuições das amostras dos ruídos ambientais. A partir destes resultados, ospadrões dos ruídos foram de�nidos omo gaussianos ou não-gaussianos. Como o ruídoBran o Sintéti o foi obtido por um gerador analógi o om padrão gaussiano, neste tra-balho ele é utilizado omo referên ia para os demais.Os resultados de estimação do parâmetro K de ada um dos ruídos, podem ser vistosna TAB. 2.3. Pelos resultados, per ebe-se que os ruídos Avião 2, Balbúrdia, Carro, F16,Fábri a 1 e Fábri a 2 possuem distribuições não-gaussianas (K > 3). Os demais ruídos(Avião 1, Bran o Sintéti o, Maq Navio, Op Navio, Rosa Sintéti o, Tanque e Veí uloTAB. 2.3: Resultados de estimação do parâmetro K̂ dos ruídos da base NOISEX-92.Ruído K̂GaussianosMaq Navio 2,89Op Navio 2,91Avião 1 2,93Veí ulo Militar 2,99Rosa Sintéti o 3,00Tanque 3,00Bran o Sintéti o 3,00Não-gaussianosF16 3,21Avião 2 3,22Carro 3,37Fábri a 1 3,42Fábri a 2 3,52Balbúrdia 3,7031 Militar)apresentaram padrões similares à distribuição gaussiana (K ≈ 3).A FIG. 2.8 ilustra as urvas HTD obtidas para os ruídos om K ≈ 3 (2,89 � 3,00).É possível notar que estes ruídos possuem audas om de aimentos similares ao ruídoBran o Sintéti o (α = 2). Já a FIG. 2.9 mostra as urvas HTD para os ruídos ompadrões não-gaussianos (K > 3). A urva relativa ao ruído Bran o Sintéti o também éexibida omo forma de omparação. Repare que as audas dos ruídos om K > 3 possuem 1 1,2 1,4 1,6 1,8 2 log x �3 �2 �1 0 lo g P [X > x ] Buccaneer 1 Dest Eng Dest Ops Leopard M109 Pink White FIG. 2.8: Curvas de distribuição de auda pesada dos ruídos om K ≈ 3. 1 1,2 1,4 1,6 1,8 2 log x �3 �2 �1 0 lo g P [X > x ] Babble Buccaneer 2 F16 Factory 1 Factory 2 Volvo White FIG. 2.9: Curvas de distribuição de auda pesada dos ruídos om K > 3.32 de aimento mais lento ( auda mais pesada, α < 2) que os ruídos de padrão gaussiano.2.5.4 DISTÂNCIA BHATTACHARYYAA distân ia Bhatta haryya (dB), des rita na Seção 2.3, foi utilizada para omparaçãoentre as distribuições das amostras dos ruídos ambientais. Conforme adotado no estudodas urvas HTD, o ruído Bran o Sintéti o foi utilizado omo referên ia para este estudo.Desta forma, foram avaliados os resultados da distân ia Bhatta haryya entre ada um dosruídos da TAB. 2.1 e o ruído Bran o Sintéti o.Os valores de dB são apresentados na TAB. 2.4. Todos os ruídos a ústi os omparâmetro K ≈ 3 apresentaram valores de dB na faixa entre 0,0025 e 0,0029. Já osruídos Avião 2 (K = 3, 22), Balbúrdia (K = 3, 70), Carro (K = 3, 37), F16 (K = 3, 21),Fábri a 1 (K = 3, 42) e Fábri a 2 (K = 3, 52) obtiveram valores da distân ia desta adosdos demais (dB ≥ 0, 0035). Ou seja, os ruídos om os maiores valores de K tambémforam identi� ados pela distân ia Bhatta haryya omo os mais distantes da distribuiçãogaussiana. Além disso, todos os ruídos om K ≈ 3 apresentaram valores similares de dB.TAB. 2.4: Resultados da distân ia Bhatta haryya (dB) entre os diversos ruídos a ústi ose o ruído Bran o Sintéti o. Ruído dBMaq Navio 0,0025Avião 1 0,0025Op Navio 0,0027Veí ulo Militar 0,0027Rosa Sintéti o 0,0027Tanque 0,0029F16 0,0035Avião 2 0,0035Carro 0,0042Fábri a 1 0,0042Fábri a 2 0,0045Balbúrdia 0,0054A FIG. 2.10 ilustra a de�nição �nal obtida para os treze ruídos a ústi os mapeadosem função dos valores de Kurtosis e do expoente β. As linhas tra ejadas horizontaisrepresentam as distinções obtidas de a ordo om os valores de β. Desta forma, quantoà or do espe tro, os ruídos a ústi os foram divididos em três tipos: um ruído bran o(1/f 0), seis ruídos rosas (1/f) e seis ruídos marrons (1/f 2). Já a linha tra ejada verti al33 3,5 0,0 1,0 2,0 2,7 3,0FIG. 2.10: Ruídos a ústi os da base NOISEX-92 mapeados em função de K e β.representa a divisão dos ruídos quanto ao valor de Kurtosis ou padrão. Assim, a basede ruídos estudada possui sete fontes de ruídos om padrão gaussiano e seis fontes ompadrão não-gaussiano. Considerando-se padrão e espe tro, obtém-se in o lasses distintasde ruídos (que estão representadas na FIG. 2.10). Estes resultados foram fundamentaispara a ara terização e geração de ruídos a ústi os proposta no Capítulo 3.2.6 RESUMOEste Capítulo apresentou o estudo estatísti o de treze ruídos ambientais de diversasfontes. Medidas nos domínios do tempo e da frequên ia foram utilizadas para de�nição dostipos de ruídos. Os resultados demonstraram que os ruídos a ústi os podem ter distintospadrões e espe tros oloridos. Segundo o expoente β da DEP, apenas um dos ruídospossui espe tro bran o. Os demais ruídos foram de�nidos om as ores rosa (50 %) emarrom (50 %). Quanto ao oe� iente Kurtosis, as amostras de sete dos ruídos a ústi osapresentaram padrão gaussiano. As amostras dos demais ruídos possuem distribuiçõesnão-gaussianas. Considerando as ara terísti as de padrão e espe tro, foram de�nidos in o tipos de ruídos a ústi os. 34 3 REPRESENTAÇ�O E GERAÇ�O DE RUÍDOS ACÚSTICOSAMBIENTAIS Na literatura de pro essamento de sinais os ruídos são geralmente onsiderados deespe tro bran o e padrão gaussiano. A razão disso se deve à tratabilidade da distribuiçãogaussiana e à teoria de distribuição fundamentada no teorema do limite entral. Noentanto, a presença de ruídos oloridos omo, por exemplo, o rosa, tem sido observada emdiversas áreas da iên ia (CALOYANNIDES, 1974) (KESHNER, 1982) (KIKUCHI, 1985)(MANDELBROT, 1968) (MOORE, 1974) (VOSS, 1978). Os ruídos a ústi os ambientais, onforme demonstrado no Capítulo 2, podem apresentar espe tros de ores distintas epadrões diversos. A representação e geração destas variadas fontes de ruídos ambientais éum grande desa�o para a área de re onhe imento robusto de lo utor (DRYGAJLO, 1998)(MING, 2005) (MING, 2007).Neste Capítulo, é apresentada uma proposta para representação e geração de ruídosa ústi os om qualquer or de espe tro e distintos padrões. As estatísti as nos domínios dotempo e da frequên ia são de�nidas pelo parâmetro Kurtosis e pelo expoente da densidadeespe tral de potên ia. Para validação da proposta, foram gerados treze ruídos arti� iaispara representação dos espe tros e distribuições dos ruídos ambientais da base NOISEX-92(VARGA, 1993).3.1 PROPOSTA DA REPRESENTAÇ�O E GERAÇ�O DE RUÍDOSA geração de ruídos a ústi os proposta nesta Dissertação, se realiza em duas eta-pas. Primeiramente, é gerada uma sequên ia amostral om padrão de�nido pelo valor doparâmetro Kurtosis. Para a obtenção desta sequên ia foi utilizada a proposta de geraçãodes rita na Seção 3.1.1. Na segunda etapa, a sequên ia amostral é �ltrada de forma quea densidade espe tral de potên ia resultante tenha de aimento 1/fβ (β ∈ [0, 2]). A Seção3.1.2 des reve a té ni a de �ltragem utilizada na representação do espe tro olorido. 35 3.1.1 REPRESENTAÇ�O DE RUÍDOS COM DISTRIBUIÇÕES DISTINTASEm (WEBSTER, 1994), é apresentada uma proposta de geração de números aleatóriospara representação de ruídos a ústi os de o eanos om espe tro bran o (β ≈ 0). Adistribuição das amostras é de�nida pelo parâmetro K e pode assumir formas gaussianase não-gaussianas.Seja {Tm} uma sequên ia de variáveis aleatórias independentes e uniformemente dis-tribuídas no intervalo 0 < Tm ≤ 1. A sequên ia de variáveis aleatórias {Xm} é entãodes rita por, Xm = [log 1 T2m−1 ]n sen(2πT2m) (3.1)onde n ≥ 0 é o parâmetro de forma da distribuição de {Xm}. Apesar de não ser possíveldeterminar analiti amente a fdp de {Xm}, são onhe idos alguns asos parti ulares. Para n = 0, por exemplo, a distribuição de {Xm} é dada por, p(x) = 1 π 1√ 1 − x2 . (3.2)Já para n = 1 2 , a sequên ia amostral gerada possui distribuição, p(x) = 1√ π e−π 2 . (3.3)Neste aso, {Xm} possui uma distribuição gaussiana om média mX = 0 e variân ia σ2X = 1/2.A relação entre o parâmetro Kurtosis e o parâmetro de forma n de {Xm} é de�nidapor, KX = 3 2 γ(4n + 1) [γ(2n + 1)]2 (3.4)onde γ(r) é a função gama (APOSTOL, 1967), γ(r) = ∫ ∞ 0 tr−1e−tdt . (3.5)Repare que, substituindo n = 1 2 na EQ. 3.4, obtém-se que KX = 3, que orrespondeao valor de Kurtosis para uma distribuição gaussiana. O valor de n é es olhido para obtera distribuição desejada para a sequên ia {Xm} de�nida pelo parâmetro K.3.1.2 REPRESENTAÇ�O DO ESPECTRO COLORIDOA FIG. 3.1 ilustra o esquema de obtenção de uma sequên ia {Ym} pela �ltragem deuma sequên ia {Xm} om determinado padrão e espe tro bran o. A densidade espe tral36 mYmX H(z)FIG. 3.1: Obtenção da sequên ia {Ym} de espe tro olorido a partir da �ltragem de umasequên ia {Xm} de espe tro bran o.de potên ia SY (f) é propor ional ao quadrado da resposta em frequên ia do �ltro H(z): SY (f) = σ 2 X |H(ej2πfT )|2 (3.6)onde T é o período de amostragem e σ2X é a variân ia de {Xm}.A maioria das propostas para obtenção de espe tros oloridos utiliza �ltros om res-posta em frequên ia propor ional a 1/fβ (CORSINI, 1988) (FERDI, 2008) (KASDIN,1995). A função de transferên ia lássi a retangular do �ltro H(z) é de�nida por, HR(z) = T (1 − z−1)β/2 . (3.7)A DEP da sequên ia Ym gerada por este �ltro pode ser esrita omo SY (f) = σ2XT β (2sen(πfT ))β . (3.8)Para valores de f abaixo da frequên ia de Nyquist (fN ), SY (f) pode ser aproximadapara, SY (f) ≈ σ2X (2πf)β , quando f → 0 . (3.9)Isto signi� a que a sequên ia {Ym} possui espe tro olorido. Ou seja, SY (f) ∝ 1 fβ . (3.10)Outras funções de transferên ia, que podem gerar sequên ias om espe tros 1/fβ, sãoa forma trapezoidal e a forma proposta em (AL-ALAOUI, 1993)3. A TAB. 3.1 apresentaas expressões destes �ltros, bem omo as orrespondentes funções SY (f) das sequên iasobtidas pela �ltragem.Para determinar qual das três formas possui de aimento da DEP mais próximo de 1/fβ, em (FERDI, 2008) é apresentado um estudo omparativo entre os �ltros om as3A forma de Al-Alaoui é uma ombinação linear das formas retangular e trapezoidal: HA(z) = 3 4 HR(z) + 1 4 HT (z). Os oe� ientes 3/4 e 1/4 foram obtidos de forma a obter a melhor aproximaçãoda função HA(z) para f = fN/2 (metade da frequên ia de Nyquist).37 TAB. 3.1: Funções de transferên ia e DEP para os �ltros da forma retangular, trapezoidale Al-Alaoui (FERDI, 2008).Função de Transferên ia SY (f)Retangular: HR(z) = T (1 − z−1)β/2 σ 2 X T β [2sen(πfT )]βTrapezoidal: HT (z) = [T 2 (1 + z−1) (1 − z−1) ]β/2 σ2X [ T 2 ]β [ os(πfT )sen(πfT )]βAl-Alaoui: HA(z) = [7T 8 (1 + z−1/7) (1 − z−1) ]β/2 σ2X [ 7T 8 ]β 50 49 + 2 7 os(πfT ) 2sen(πfT ) βfunções de transferên ia retangular, trapezoidal e Al-Alaoui. Para isto, foi de�nido o errorelativo ao de aimento 1/fβ para um dado �ltro H(z): erro% = (2πfT )β − |H(ej2πfT )|2 (2πfT )β × 100% . (3.11)A FIG. 3.2 apresenta as urvas dos erros relativos, em função da frequên ia normali-zada fT , para β = 0, 8. Pode-se veri� ar que o �ltro Al-Alaoui é aquele que apresenta er ro % f T 100 50 0 0 0,50,40,30,20,1 −50FIG. 3.2: Erro relativo per entual para β = 0, 8 (FERDI, 2008).38 valores de erro% mais próximos de 0. Resultados análogos o orrem para valores de β emtoda a faixa 0 ≤ β ≤ 2. Assim, a função HA(z) é onsiderada a que gera a sequên ia {Ym} om o espe tro mais próximo da forma 1/fβ orrespondente. Logo, este �ltro foies olhido para a proposta de geração de ruídos a ústi os desta Dissertação.De�nido o �ltro a ser utilizado e onsiderando as amostras da sequên ia {Xm} deespe tro bran o, a sequên ia {Ym} é obtida utilizando-se a expansão em série de potên iasda função de transferên ia HA(z) do �ltro Al-Alaoui. Tem-se que, HA(z) = [ 7 8 (1 + z−1/7) (1 − z−1) ]β/2 = h0 + h1z −1 + h2z −2 + . . . + hkz −k + . . . (3.12)onde hk são os oe� ientes da expansão em série. As amostras Ym são então obtidas pela onvolução (OPPENHEIM, 1998), Ym = Xm ∗ hm = ∞ ∑ k=0 hkXm−k . (3.13)Como o somatório da EQ. 3.13 possui in�nitas par elas, para a obtenção de Ym éne essário trun ar a EQ. 3.12 em um número �nito de oe� ientes. Considerando umaexpansão de até N oe� ientes, um �ltro de resposta �nita ao impulso (FIR - FiniteImpulse Response) é obtido pela expressão, H(z) = h0 + h1z −1 + h2z −2 + . . . + hN−1z −(N−1) . (3.14)Cada um dos oe� ientes hk (k = 0, 1, · · · , N−1) da expansão em série pode ser obtidopor, hk = [ 7 8 ]β/2 a(k) ∗ b(k) (3.15)onde as sequên ias a(k) e b(k), k = 0, 1, . . . , N 2 − 1, são de�nidas pelas re orrên ias4, b(0) = 1 b(k) = k + β/2 − 1 k b(k − 1) (3.16) a(0) = 1 a(k) = (−1/7)k k − β/2 − 1 k a(k − 1) (3.17)4a(k) e b(k) são, respe tivamente, os N/2 oe� ientes da expansão em série de potên ias do numerador (1 + z−1/7)β/2 e do denominador (1 + z−1)−β/2 do �ltro H(z).39 Assim, dada a sequên ia {Xm}, os oe� ientes do �ltro FIR de Al-Alaoui são al uladosutilizando as EQs 3.15, 3.16 e 3.17. As amostras da sequên ia {Ym} são, �nalmente,obtidas pelo somatório, Ym = N−1 ∑ k=0 hkXm−k . (3.18)A sequên ia {Ym} é então gerada om DEP na forma 1/fβ. Na Seção 3.1.3, é apre-sentada a proposta para agregar à sequên ia {Ym} as informações do padrão desejado dosruídos a ústi os.3.1.3 GERAÇ�O DE RUÍDOS ACÚSTICOS DE ESPECTROS COLORIDOS E DIS-TRIBUIÇÕES DISTINTASCom o objetivo prin ipal de obter uma sequên ia amostral om espe tro olorido edistribuições distintas, nesta Seção é des rito o pro edimento para a �ltragem (FIG. 3.1)da sequên ia {Xm} (EQ. 3.1) pelo �ltro de Al-Alaoui, apresentado na Seção 3.1.2. Em(WEBSTER, 1994) é de�nido que, se a �ltragem da sequên ia {Xm} é realizada por um�ltro FIR de oe� ientes hk, k = 0, 1, · · · , N−1 (EQ. 3.14), então a sequên ia {Ym} obtidapossui o valor de Kurtosis rela ionado por, KY = 3 + (KX − 3) N−1 ∑ k=0 h4k ( N−1 ∑ k=0 h2k )2 . (3.19)Pela desigualdade, N−1 ∑ k=0 h4k ≤ ( N−1 ∑ k=0 h2k )2 , (3.20)é possível notar que KY é mais próximo de 3 do que KX . Ou seja, uma sequên ia não-gaussiana, quando �ltrada, gera uma sequên ia om distribuição mais próxima do padrãogaussiano. Para superar tal limitação e para que a DEP da sequên ia {Ym} gerada possuade aimento 1/fβ, a função de transferên ia de Al-Alaoui é onsiderada, neste trabalho,para o �ltro.O pro edimento ompleto para obtenção de amostras om padrões distintos e espe tros oloridos é ilustrado na FIG. 3.3. O pro edimento proposto para obtenção das amostrasé omposto das seguintes fases: 40 mX mY yK kh β Calculo do Filtro Gerador de amostras H(z) FIG. 3.3: Esquema para a geração da sequên ia Ym om parâmetros KY e β.a) A partir do valor de β para a sequên ia desejada, al ulam-se os oe� ientes hk do�ltro FIR de Al-Alaoui de�nidos nas EQs 3.15, 3.16 e 3.17.b) A partir do parâmetro Kurtosis desejado (KY ) e dos oe� ientes hk obtidos na fase(a), determina-se o parâmetro Kurtosis (KX) da sequên ia {Xm} pela EQ. 3.19. ) Com o valor de KX , obtém-se o valor do parâmetro n (EQ. 3.4) a ser utilizado nageração da sequên ia {Xm}.d) Gera-se a sequên ia {Xm} pela EQ. 3.1 om parâmetro n obtido na fase ( ).e) Pela EQ. 3.18, obtém-se a sequên ia de saída {Ym} a partir da sequên ia {Xm} edos oe� ientes hk do �ltro FIR Al-Alaoui.f) Estima-se os parâmetros K̂Y e β̂ da sequên ia {Ym} gerada. Caso estas estimaçõesnão estejam em um intervalo a eitável para estes parâmetros, retorna-se à fase (d).A sequên ia {Ym} obtida, pode ainda ser normalizada em relação à média e ao desviopadrão, através de es olhas adequadas das onstantes c e d na seguinte transformação, Y ′m = c Ym + d . (3.21)As amostras da sequên ia {Y ′m} são utilizadas para formar o ruído a ústi o om as ara terísti as desejadas de padrão e espe tro. 41 3.2 ESTATÍSTICAS DOS RUÍDOS GERADOSPara validar a proposta de representação e geração de ruídos a ústi os apresentadaneste Capítulo, foram obtidos treze ruídos om as ara terísti as de padrão e espe tro dosruídos ambientais da base NOISEX-92. Para os experimentos, 320.000 amostras foramgeradas para os ruídos a ústi os arti� iais de forma a serem omparadas às amostras dosruídos reais. Assim, os ruídos a ústi os (gerados e reais) possuem duração de 40 s e taxade amostragem de 8000 amostras/s.Para omparação entre as urvas DEP dos ruídos reais (SR(f)) e gerados (SY (f)), afunção Erro(f) é de�nida por, Erro(f) = ln SR(f) − ln SY (f) . (3.22)O erro (ǫ) na geração das urvas DEP dos ruídos arti� iais é então al ulado pelo valormédio quadráti o da função Erro(f). Ou seja, ǫ = E [ Erro2(f) ] . (3.23)Em todos os ruídos gerados neste trabalho, foram utilizados N = 2000 oe� ien-tes para os �ltros FIR de Al-Alaoui. Experimentos foram realizados para represen-tação dos ruídos Rosa Sintéti o e Carro om variados números de oe� ientes: N ∈ {50, 100, 500, 1000, 2000, 5000, 10000}. Os resultados mostraram que, até N = 2000, oaumento no número de oe� ientes resulta em menores valores de ǫ. Contudo, para N > 2000 não per ebe-se diminuição nos valores do erro ǫ. Assim, o valor N = 2000 foiadotado para a quantidade de oe� ientes utilizados no �ltro FIR de Al-Alaoui para aobtenção dos ruídos a ústi os arti� iais.Os resultados das estatísti as dos ruídos gerados, bem omo suas omparações omos ruídos ambientais da base NOISEX-92, foram obtidos onsiderando-se as seguintesmedidas:a DEP, o expoente β, a fdp, o parâmetro Kurtosis e a urva HTD.3.2.1 N�O-LINEARIDADE NA GERAÇ�O DO PARÂMETRO βConforme apresentado na Seção 3.1.2, o �ltro de Al-Alaoui foi onsiderado na propostade geração de ruídos a ústi os. O �ltro utilizado foi obtido pela aproximação da sua funçãode transferên ia (TAB. 3.1) por um �ltro FIR (EQ. 3.14).No entanto, nos experimentos foi veri� ada a o orrên ia de uma não-linearidade entreo valor de β, utilizado para geração das sequên ias amostrais, e o resultado da estimação de42 β̂ destas sequên ias (FIG. 3.4). Pode-se veri� ar que a não-linearidade é mais a entuadano intervalo 1, 5 ≤ β ≤ 2. A FIG. 3.4 mostra ainda que o valor limite para o parâmetro β̂ estimado das sequên ias geradas pelo �ltro de Al-Alaoui, é aproximadamente 1,81. 0 0,5 1 1,5 2 0 0,5 1 1,5 2 FIG. 3.4: Relação entre os valores β utilizados na geração dos ruídos a ústi os, e osresultados de estimação de β̂ orrespondentes.A urva da FIG. 3.4 foi aproximada por um polin�mio de oitavo grau, que foi utilizadopara a obtenção das amostras. β̂ = 0, 0067377 + 0, 75016β + 2, 9637β2 − 9, 716β3+ +22, 067β4 − 26, 719β5 + 16, 714β6 − 5, 1998β7 + 0, 64048β8 (3.24)Desta forma, o valor do expoente β usado para geração dos ruídos a ústi os (EQs 3.15,3.16 e 3.17), deve ser adaptado pela solução desta equação polinomial.3.2.2 RESULTADOS DEP E βNesta Seção, são apresentados os resultados obtidos para as ara terísti as espe traisda proposta para representação e geração de ruídos a ústi os. As FIGs 3.5�3.17 ilustrama omparação entre as urvas DEP dos ruídos ambientais reais (base NOISEX-92) e asdos ruídos a ústi os gerados pela proposta desta Dissertação. Também são dis utidos osresultados de estimação dos parâmetros β e o valor do erro (ǫ) entre estas urvas.A FIG. 3.5 mostra as ara terísti as espe trais dos ruídos Bran o Sintéti o real egerado. Ambas as urvas DEP possuem espe tro plano (β ≈ 0) em toda a faixa de43 frequên ias. Estes resultados mostram que a proposta para geração de ruídos a ústi osfoi apaz de representar o espe tro de or bran a. 100 400 1000 4000 f [Hz] �70� 50�30 �10 S (f ) [d B m /H z] gerado real Bran o Sintéti oReal: β = 0, 02Gerado: β = 0, 00 FIG. 3.5: Resultados de DEP e β dos ruídos Bran o Sintéti o real e gerado arti� ialmente.Conforme observa-se na FIG. 3.6, os ruídos Rosa Sintéti o real e gerado apresentam urvas DEP semelhantes. Este resultado demonstra que espe tros de or rosa (≈ 10dB/dé ada) também podem ser representados pelo método de geração proposto. O mesmopode ser on luído a partir da análise da FIG. 3.7, que ilustra os espe tros de or marrom 100 400 1000 4000 f [Hz] �70� 50�30 �10 S (f ) [d B m /H z] gerado real Rosa Sintéti oReal: β = 1, 22Gerado: β = 1, 21 FIG. 3.6: Resultados de DEP e β dos ruídos Rosa Sintéti o real e gerado arti� ialmente.44 100 400 1000 4000 f [Hz] �70� 50�30 �10 S (f ) [d B m /H z] gerado real CarroReal: β = 1, 76Gerado: β = 1, 77 FIG. 3.7: Resultados de DEP e β dos ruídos Carro real e gerado arti� ialmente.(≈ 20 dB/dé ada) do ruído Carro, o real e o gerado. Além da semelhança entre as urvasDEP, os resultados das estimações de β on�rmam, numeri amente, que o de aimentode seus espe tros gerados arti� ialmente, são similares aos respe tivos ruídos ambientais.Além disso, os valores do erro ǫ são menores que aqueles obtidos para o ruído Bran oSintéti o, omprovando a proximidade entre as urvas DEP.Os resultados dos ruídos Rosa Sintéti o (FIG. 3.6) e Carro (FIG. 3.7), om expoentes β > 1, on�rmam ainda que o polin�mio proposto na EQ. 3.24 orrigiu a não-linearidadena geração das amostras (FIG. 3.4).As FIGs 3.8 e 3.9 mostram os resultados obtidos para os ruídos Avião 1 e Avião 2 (reale gerado), ambos de espe tro rosa (β ≈ 1). Repare que o ruído Avião 1 original apresentapi os de potên ia em valores de frequên ia próximos a 200 Hz e 3000 Hz. Apesar de oruído gerado não onseguir representar estes pi os, resultando em valores maiores de erro(ǫ), o de aimento do espe tro do ruído original foi a ompanhado pelo ruído arti� ial. Istopode ser omprovado pela proximidade das urvas DEP e pelos parâmetros β dos ruídosreal e gerado. Con lusões análogas podem ser apli adas ao ruído gerado orrespondentea Avião 2, que também possui alguns pi os de potên ia entre 200 Hz e 400 Hz.Como pode-se notar, apesar dos ruídos Fábri a 2 (FIG. 3.10) e Tanque (FIG. 3.11)possuirem espe tros de or marrom (β ≈ 2), as urvas DEP apresentam variações emalgumas faixas de frequên ia. O ruído Tanque, por exemplo, possui um vale e um pi o45 100 400 1000 4000 f [Hz] �70� 50�30 �10 S (f ) [d B m /H z] gerado real Avião 1Real: β = 0, 93Gerado: β = 0, 94 FIG. 3.8: Resultados de DEP e β dos ruídos Avião 1 real e gerado arti� ialmente. 100 400 1000 4000 f [Hz] �70� 50�30 �10 S (f ) [d B m /H z] gerado real Avião 2Real: β = 0, 81Gerado: β = 0, 82 FIG. 3.9: Resultados de DEP e β dos ruídos Avião 2 real e gerado arti� ialmente.entre as frequên ias 600 Hz e 700 Hz. Contudo, o de aimento de seus espe tros p�de serrepresentado orretamente pelo parâmetro β. Per eba ainda que a urva DEP dos ruídosgerados possui de aimento próximo aos orrespondentes ruídos originais. Este fato só nãoo orre naquelas faixas onde existem pi os e vales nos espe tros originais. Novamente, asemelhança no de aimento da DEP pode ser veri� ada pelos valores entre os expoentes βdos ruídos gerados e reais. 46 100 400 1000 4000 f [Hz] �70� 50�30 �10 S (f ) [d B m /H z] gerado real Fábri a 2Real: β = 1, 64Gerado: β = 1, 66 FIG. 3.10: Resultados de DEP e β dos ruídos Fábri a 2 real e gerado arti� ialmente. 100 400 1000 4000 f [Hz] �70� 50�30 �10 S (f ) [d B m /H z] gerado real TanqueReal: β = 1, 72Gerado: β = 1, 72 FIG. 3.11: Resultados de DEP e β dos ruídos Tanque real e gerado arti� ialmente.As FIGs 3.12 e 3.13 apresentam, respe tivamente, as urvas DEP obtidas para osruídos Balbúrdia e Op Navio (originais e gerados). Em ambos os asos, os espe trosdos ruídos gerados possuem de aimento similar às DEP dos ruídos originais no intervalo f > 400 Hz. O espe tro não onseguiu ser representado para f < 400 Hz, já que os ruídosoriginais apresentam os ilações de potên ia nesta faixa de frequên ias. Pode-se observarainda que a maior diferença entre o ruído Op Navio real e o respe tivo ruído gerado,47 100 400 1000 4000 f [Hz] �70� 50�30 �10 S (f ) [d B m /H z] gerado real BalbúrdiaReal: β = 1, 81Gerado: β = 1, 81 FIG. 3.12: Resultados de DEP e β dos ruídos Balbúrdia real e gerado arti� ialmente. 100 400 1000 4000 f [Hz] �70� 50�30 �10 S (f ) [d B m /H z] gerado real Op NavioReal: β = 1, 73Gerado: β = 1, 74 FIG. 3.13: Resultados de DEP e β dos ruídos Op Navio real e gerado arti� ialmente.resultou em um valor de erro (ǫ = 0, 9013) maior do que os demais ruídos.Os ruídos Fábri a 1 e Veí ulo Militar (reais e gerados) possuem seus espe tros apresen-tados nas FIGs 3.14 e 3.15, respe tivamente. Enquanto Fábri a 1 é um ruído de espe trorosa, o ruído Veí ulo Militar possui espe tro marrom. Pode-se per eber também uma par-ti ularidade destes dois ruídos. Ambos exibem uma des ontinuidade no de aimento daDEP em frequên ias abaixo de 400 Hz, devido à presença de um pi o de potên ia. Apesar48 100 400 1000 4000 f [Hz] �70� 50�30 �10 S (f ) [d B m /H z] gerado real Fábri a 1Real: β = 1, 43Gerado: β = 1, 44 FIG. 3.14: Resultados de DEP e β dos ruídos Fábri a 1 real e gerado arti� ialmente. 100 400 1000 4000 f [Hz] �50� 30�10 S (f ) [d B m /H z] gerado real Veí ulo MilitarReal: β = 1, 97Gerado: β = 1, 81 FIG. 3.15: Resultados de DEP e β dos ruídos Veí ulo Militar real e gerado arti� ialmente.disto, no restante do espe tro de frequên ias, o ruído Fábri a 1 gerado se aproxima doruído original. Para o ruído Veí ulo Militar, no entanto, não foi possível obter o valor β = 1, 97, já que o �ltro proposto possui a limitação de representação β ≤ 1, 81 (FIG.3.4). Note pela FIG. 3.15, que o de aimento da urva do ruído gerado é menos a entuadoqueo de aimento do ruído real. No entanto, o valor do erro ǫ = 0, 3450 mostra que as urvas DEP dos ruídos real e gerado são próximas, apesar de não ter sido representado o49 100 400 1000 4000 f [Hz] �50� 30�10 S (f ) [d B m /H z] gerado real Maq NavioReal: β = 0, 93Gerado: β = 0, 94 FIG. 3.16: Resultados de DEP e β dos ruídos Maq Navio real e gerado arti� ialmente. 100 400 1000 4000 f [Hz] �70� 50�30 �10 S (f ) [d B m /H z] gerado real F16Real: β = 1, 27Gerado: β = 1, 27 FIG. 3.17: Resultados de DEP e β dos ruídos F16 real e gerado arti� ialmente.expoente β da DEP.A análise das urvas dos ruídos originais Maq Navio (FIG. 3.16) e F16 (FIG. 3.17)indi am a existên ia de variações de potên ias em todo o espe tro de frequên ias. Estasparti ularidades são on�rmadas pelos valores elevados dos erros ǫ, prin ipalmente parao ruído Maq Navio em que ǫ = 1, 2821. Apesar disso, os ruídos gerados representaram ode aimento médio das urvas DEP dos ruídos originais (expoente β).50 Os resultados de DEP e β dos treze ruídos gerados (FIGs 3.5�3.17) mostraram que aproposta de representação e geração, apresentada nesta Dissertação, onseguiu reproduziras ara terísti as espe trais dos ruídos ambientais. Os ruídos a ústi os obtidos possuemespe tros de diferentes ores: bran o, rosa e marrom. Apesar de a DEP do ruído Veí uloMilitar não ter seu expoente β representado por limitações do �ltro, as urvas DEP e ovalor do erro ǫ mostram que a densidade espe tral de potên ia onseguiu ser representadapela proposta de geração.3.2.3 RESULTADOS DE DISTRIBUIÇ�O E KURTOSISA seguir, são apresentadas as urvas de distribuição (fdp) e os resultados da estimaçãodo parâmetro Kurtosis obtidos para os treze ruídos a ústi os gerados e reais. Todos osvalores de K dos ruídos gerados mostraram-se próximos aos valores obtidos para os ruídosreais. Além de K, a semelhança entre as fdp também atestam que as distribuições dosruídos gerados onseguiram representar os padrões das amostras dos ruídos reais.As FIGs 3.18 e 3.19 mostram os valores do parâmetro Kurtosis, bem omo as suas urvas de fdp, dos ruídos Bran o Sintéti o e Rosa Sintéti o originais e gerados. Como osruídos Bran o Sintéti o e Rosa Sintéti o da base NOISEX-92 foram oletados de geradoresanalógi os de padrão gaussiano, a análise das FIGs 3.18 e 3.19 omprova que a propostade geração apresentada nesta Dissertação é apaz de representar adequadamente ruídos om distribuições gaussianas (K ≈ 3). -0,1 0 0,1 x 0 5000 10000 15000 20000 25000 30000 p( x) real gerado Bran o Sintéti oReal: K = 3, 00Gerado: K = 3, 00 FIG. 3.18: Resultados de fdp e Kurtosis do ruído Bran o Sintéti o real e gerado. 51 -0,2 -0,1 0 0,1 0,2 x 0 5000 10000 15000 20000 25000 30000 p( x) real gerado Rosa Sintéti oReal: K = 3, 00Gerado: K = 2, 99 FIG. 3.19: Resultados de fdp e Kurtosis do ruído Rosa Sintéti o real e gerado.As FIGs 3.20�3.24 apresentam os resultados de fdp e Kurtosis para os ruídos Avião 1,Maq Navio, Op Navio, Tanque e Veí ulo Militar, respe tivamente. Apesar de os ruídosoriginais terem sido oletados de fontes a ústi as naturais, os valores de K mostramque estes possuem padrão gaussiano. As urvas de fdp mostram que os ruídos geradospossuem distribuições similares a dos ruídos reais. Assim, a proposta apresentada foi apaz de reproduzir os padrões gaussianos presentes em ruídos a ústi os oletados degeradores analógi os e também de fontes naturais.As FIGs 3.25�3.27 mostram os resultados de geração dos ruídos Avião 2, Balbúrdia,Carro, F16, Fábri a 1 e Fábri a 2. Pode-se per eber em todos estes asos, que as dis- -0,2 -0,1 0 0,1 0,2 x 0 5000 10000 15000 20000 25000 p( x) real gerado Avião 1Real: K = 2, 93Gerado: K = 2, 93 FIG. 3.20: Resultados de fdp e Kurtosis do ruído Avião 1 real e gerado.52 -0,2 -0,1 0 0,1 0,2 x 0 5000 10000 15000 20000 25000 p( x) real gerado Maq NavioReal: K = 2, 89Gerado: K = 2, 88 FIG. 3.21: Resultados de fdp e Kurtosis do ruído Maq Navio real e gerado. -0,2 -0,1 0 0,1 0,2 x 0 5000 10000 15000 20000 25000 p( x) real gerado Op NavioReal: K = 2, 91Gerado: K = 2, 91FIG. 3.22: Resultados de fdp e Kurtosis do ruído Op Navio real e gerado. -0,2 -0,1 0 0,1 0,2 x 0 5000 10000 15000 p( x) real gerado TanqueReal: K = 3, 00Gerado: K = 3, 00 FIG. 3.23: Resultados de fdp e Kurtosis do ruído Tanque real e gerado.tribuições são não-gaussianas (K 6= 3). Apesar de possuirem padrões distintos entre si(diferentes valores de K), as urvas de fdp dos ruídos arti� iais mostram que estes foram53 -0,2 -0,1 0 0,1 0,2 x 0 5000 10000 15000 p( x) real gerado Veí ulo MilitarReal: K = 2, 99Gerado: K = 2, 99 FIG. 3.24: Resultados de fdp e Kurtosis do ruído Veí ulo Militar real e gerado. -0,2 -0,1 0 0,1 0,2 x 0 5000 10000 15000 20000 25000 p( x) real gerado Avião 2Real: K = 3, 22Gerado: K = 3, 20 FIG. 3.25: Resultados de fdp e Kurtosis do ruído Avião 2 real e gerado. -0,2 -0,1 0 0,1 0,2 x 0 5000 10000 15000 20000 25000 p( x) real gerado BalbúrdiaReal: K = 3, 70Gerado: K = 3, 72FIG. 3.26: Resultados de fdp e Kurtosis do ruído Balbúrdia real e gerado.obtidos om padrões próximos aos dos ruídos ambientais reais. Esta proximidade é on-�rmada pelas semelhanças nos valores de Kurtosis dos ruídos reais e gerados. Ou seja,54 -0,2 -0,1 0 0,1 0,2 x 0 5000 10000 15000 20000 25000 p( x) real gerado CarroReal: K = 3, 37Gerado: K = 3, 36FIG. 3.27: Resultados de fdp e Kurtosis do ruído Carro real e gerado. -0,2 -0,1 0 0,1 0,2 x 0 5000 10000 15000 20000 25000 p( x) real gerado F16Real: K = 3, 21Gerado: K = 3, 21 FIG. 3.28: Resultados de fdp e Kurtosis do ruído F16 real e gerado. -0,2 -0,1 0 0,1 0,2 x 0 5000 10000 15000 20000 25000 p( x) real gerado Fábri a 1Real: K = 3, 42Gerado: K = 3, 40 FIG. 3.29: Resultados de fdp e Kurtosis do ruído Fábri a 1 real e gerado.a proposta de geração foi apaz de representar os ruídos om distribuições gaussianas enão-gaussianas. A representação dos ruídos foi on�rmada pelas urvas de fdp e pelos55 -0,2 -0,1 0 0,1 0,2 x 0 5000 10000 15000 20000 25000 p( x) real gerado Fábri a 2Real: K = 3, 52Gerado: K = 3, 51FIG. 3.30: Resultados de fdp e Kurtosis do ruído Fábri a 2 real e gerado.valores de K.3.2.4 DISTRIBUIÇ�O DE CAUDA PESADAAs urvas HTD apresentadas nesta Seção, representam uma outra forma de avaliaçãoda distribuição ou padrão dos ruídos reais e gerados. A FIG. 3.31 apresenta as urvasHTD dos ruídos Bran o Sintéti o e Rosa Sintéti o, tanto os reais quanto os gerados nestetrabalho. Como estes ruídos possuem distribuição gaussiana, a semelhança entre as urvasHTD são on�rmadas pelas distribuições ilustradas nas FIGs 3.18 e 3.19. 1 1,2 1,4 1,6 1,8 x 0,001 0,01 0,1 1 P [X > x ] gerado real 1 1,2 1,4 1,6 1,8 x 0,001 0,01 0,1 1 P [X > x ] gerado real (a) (b)FIG. 3.31: Resultados de HTD dos ruídos (a) Bran o Sintéti o e (b) Rosa Sintéti o (reaise gerados).As urvas HTD dos ruídos Avião 1, Maq Navio, Op Navio, Tanque e Veí ulo Militar(reais e gerados) são apresentadas nas FIGs 3.32, 3.33 e 3.34. Todos estes ruídos possuemvalor de Kurtosis K ≈ 3. Como pode-se per eber, as audas das distribuições destes56 1 1,2 1,4 1,6 1,8 x 0,001 0,01 0,1 1 P [X > x ] gerado real 1 1,2 1,4 1,6 1,8 x 0,001 0,01 0,1 1 P [X > x ] gerado real (a) (b)FIG. 3.32: Resultados de HTD dos ruídos (a) Avião 1 e (b) Maq Navio (reais e gerados). 1 1,2 1,4 1,6 1,8 x 0,001 0,01 0,1 1 P [X > x ] gerado real 1 1,2 1,4 1,6 1,8 x 0,001 0,01 0,1 1 P [X > x ] gerado real (a) (b)FIG. 3.33: Resultados de HTD dos ruídos (a) Op Navio e (b) Tanque (reais e gerados).ruídos possuem de aimento exponen ial (FELLER, 1968), assim omo os ruídos originais(α = 2). Isso se deve ao fato destes ruídos possuirem padrão gaussiano.Pela análise das audas dos ruídos Avião 2 (FIG. 3.35(a)), Balbúrdia (FIG. 3.35(b)),Carro (FIG. 3.36(a)) F16 (FIG. 3.36(b)), Fábri a 1 (FIG. 3.37(a)) e Fábri a 2 (FIG.3.37(b)), todos om distribuições não-gaussianas