Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
SISTEMA DE RECONHECIMENTO DE COMANDOS DE VOZ UTILIZANDO PDS E RNAs Aplicações reconhecimento automático de voz -Telefonia -Robótica -Automação -Interface para computador Processamento Digital de Sinais (PDS) e Redes Neurais Artificiais (RNA) Vantagens significativas: Liberar o uso das mãos Espaço em aparelhos controladores na forma de botões As técnicas mais utilizadas para o reconhecimento de voz são as redes neurais artificiais, o modelo oculto de Markov (HMM), o modelo híbrido e por audiovisual. Geravet: Gera características a partir do sinal de voz digitalizado. Sesame: Reconhecimento de padrões. Módulos principais do software A voz humana é percebida como variações da pressão sonora, e deve ser convertida em sinal elétrico por meio de um transdutor eletroacústico, como o microfone. O sinal é convertido de analógico para digital por um conversor A/D. Reconhecimento Automático de Voz Modelos de extração de características O LPC é um modelo de codificação por predição linear que fornece coeficientes lineares que predizem o comportamento futuro do sinal. A detecção de palavra, separa o sinal correspondente à voz, de ruídos de fundo e períodos de silêncio. Detecção da palavra (início/fim) Reconhecimento A forma mais simples de realizar reconhecimento de voz é transformar o padrão temporal da voz em espacial, através de um buffer. Colocando-se uma palavra inteira na entrada de uma rede de perceptrons multicamadas, pode-se efetuar diretamente o reconhecimento. Tebelskis (1995) testou redes neurais para RAV comparando o reconhecimento entre palavras inteiras e fonemas, constatando que as redes funcionam melhor na condição estática, ao reconhecer palavras inteiras. Pelos testes, verificou que o uso de função de transferência sigmoidal e de tangente hiperbólica é melhor e mais eficiente que função linear, acelerando o treinamento e a aprendizagem. Treinamento As redes neurais foram avaliadas por meio de simulações no ambiente do Matlab para os dois modos de pré-processamento, em situações com quantidades diferentes de amostras e neurônios. Foram utilizadas palavras denominadas “ruído”, que correspondem a palavras que não pertencem ao vocabulário. Cabe ressaltar que as seis palavras do vocabulário foram aprendidas mesmo utilizando se uma estrutura simples com apenas quatro neurônios em uma camada oculta, com mais seis neurônios de saída, com um neurônio para cada palavra. Amostras somente com palavras do vocabulário Acertos com palavras do vocabulário + “ruídos”. Artigo Fonte: SESAME: SISTEMA DE RECONHECIMENTO DE COMANDOS DE VOZ UTILIZANDO PDS E RNA SERGIO A. CARDOSO, JOSÉ E. C. CASTANHO, MARCELO N. FRANCHIN, IVO R. FONTES Faculdade de Engenharia de Bauru, UNESP - Univ. Estadual Paulista, Departamento de Engenharia Elétrica, Av Eng. Luiz Edmundo C. Coube, 14-01, C.P. 473, 17033-360 http://www.eletrica.ufpr.br/anais/cba/2010/Artigos/66176_1.pdf
Compartilhar