Buscar

SISTEMA DE RECONHECIMENTO DE COMANDOS

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

SISTEMA DE RECONHECIMENTO DE COMANDOS
DE VOZ UTILIZANDO PDS E RNAs
Aplicações reconhecimento automático de voz 
-Telefonia
-Robótica
-Automação
-Interface para computador
Processamento Digital de Sinais (PDS) e Redes Neurais Artificiais (RNA)
Vantagens significativas: 
Liberar o uso das mãos 
Espaço em aparelhos controladores na forma de botões
As técnicas mais utilizadas para o reconhecimento de voz são as redes neurais artificiais, o modelo oculto de Markov (HMM), o modelo híbrido e por audiovisual.
Geravet: Gera características a partir do sinal de voz digitalizado.
Sesame: Reconhecimento de padrões.
Módulos principais do software
A voz humana é percebida como variações da pressão sonora, e deve ser convertida em sinal elétrico por meio de um transdutor eletroacústico, como o microfone. O sinal é convertido de analógico para digital por um conversor A/D.
Reconhecimento Automático de Voz
Modelos de extração de características 
O LPC é um modelo de codificação por predição linear que fornece coeficientes lineares que predizem o comportamento futuro do sinal.
A detecção de palavra, separa o sinal correspondente à voz, de ruídos de fundo e períodos de silêncio. 
 Detecção da palavra (início/fim)
Reconhecimento 
A forma mais simples de realizar reconhecimento de voz é transformar o padrão temporal da voz em espacial, através de um buffer. Colocando-se uma palavra inteira na entrada de uma rede de perceptrons multicamadas, pode-se efetuar diretamente o reconhecimento.
Tebelskis (1995) testou redes neurais para RAV comparando o reconhecimento entre palavras inteiras e fonemas, constatando que as redes funcionam melhor na condição estática, ao reconhecer palavras inteiras. Pelos testes, verificou que o uso de função de transferência sigmoidal e de tangente hiperbólica é melhor e mais eficiente que função linear, acelerando o treinamento e a aprendizagem. 
 Treinamento 
As redes neurais foram avaliadas por meio de simulações no ambiente do Matlab para os dois modos de pré-processamento, em situações com quantidades diferentes de amostras e neurônios. Foram utilizadas palavras denominadas “ruído”, que correspondem a palavras que não pertencem ao vocabulário.
Cabe ressaltar que as seis palavras do vocabulário foram aprendidas mesmo utilizando se uma estrutura simples com apenas quatro neurônios em uma camada oculta, com mais seis neurônios de saída, com um neurônio para cada palavra. 
Amostras somente com palavras do vocabulário 
 Acertos com palavras do vocabulário + “ruídos”. 
Artigo Fonte:
SESAME: SISTEMA DE RECONHECIMENTO DE COMANDOS DE VOZ UTILIZANDO PDS E RNA
SERGIO A. CARDOSO, JOSÉ E. C. CASTANHO, MARCELO N. FRANCHIN, IVO R. FONTES 
Faculdade de Engenharia de Bauru, UNESP - Univ. Estadual Paulista, Departamento de Engenharia Elétrica, Av Eng. Luiz Edmundo C. Coube, 14-01, C.P. 473, 17033-360 
http://www.eletrica.ufpr.br/anais/cba/2010/Artigos/66176_1.pdf

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais