Buscar

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 82 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 82 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 82 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Continue navegando


Prévia do material em texto

5 Métodos sensoriais
Segundo Lawless e Claasen (1993), a escolha de um método de 
análise sensorial para desenvolvimento de produto está baseada na res-
posta a pelo menos uma de três questões fundamentais:
I. O produto é aceito pelos consumidores?
II. Existe diferença perceptível entre o produto em estudo e algum 
produto convencional similar? (Dois produtos podem ser diferen-
tes, mas igualmente aceitos)
III. Quais os principais pontos de diferença? (Que qualidades senso-
riais estão presentes? Quais as suas intensidades?)
As respostas a essas três questões gerais permitem classificar os 
métodos sensoriais em testes de aceitação, chamados testes subjetivos 
ou afetivos, para resolução da primeira pergunta; testes discriminativos 
(ou de diferença) para a segunda; e análises descritivas, para a terceira.
5.1 Classificação
A NBR 12994 de julho 1993 apresenta a seguinte classificação 
dos métodos de análise sensorial:
5
ANÁLISE SENSORIAL DE ALIMENTOS74
a)  Métodos discriminativos
Métodos que estabelecem diferenciação qualitativa e/ou quanti-
tativa entre as amostras.
Testes de diferença:
 - comparação pareada;
 - triangular;
 - duo-trio;
 - comparação múltipla;
 - ordenação;
 - A ou Não-A;
 - dois em cinco. 
Testes de sensibilidade:
 - limites;
 - estímulo constante;
 - diluição.
b)  Métodos descritivos
Métodos que descrevem qualitativa e quantitativamente as amostras:
 - avaliação de atributos - escalas;
 - perfil de sabor;
 - perfil de textura;
 - ADQ - análise descritiva quantitativa;
 - tempo-intensidade.
MéTODOS SENSORIAIS 75
c)  Métodos subjetivos
Métodos que expressam opinião pessoal do julgador:
 - comparação pareada;
 - ordenação;
 - escala hedônica;
 - escala de atitude.
6 Testes de diferença
Indicam se existe ou não diferença entre as amostras e podem ser 
classificados em testes de diferença e testes de similaridade.
Em um teste de diferença, a tarefa é encontrar a resposta se existe 
diferença sensorial significativa entre duas amostras. Em um teste de simi-
laridade, entretanto, a tarefa é demonstrar que não existe diferença signi-
ficativa entre duas amostras, que elas são “similares”. Este é um cenário 
com que a indústria se depara em diversas situações – por exemplo, quando 
um produto é reformulado com um novo ingrediente ou fornecedor, ou 
houve uma alteração no processo industrial e o fabricante quer se asse-
gurar de que o produto mantenha o mesmo padrão sensorial original.
Os testes/protocolos são os mesmos para um teste de diferença ou 
de similaridade, porém o delineamento (particularmente o número de 
julgadores envolvidos) e a análise estatística serão diferentes.
 Para entender as diferenças entre estas duas situações, os testes 
de diferença e testes de similaridade, nós precisamos entender o teste de 
hipótese e os riscos de erros do tipo I e do tipo II.
teste de hipótese
Todas as técnicas multivariadas, exceto análise de agrupamentos e 
escalonamento multidimensional, são baseadas na inferência estatística 
6
ANÁLISE SENSORIAL DE ALIMENTOS78
dos valores ou relações de uma população entre variáveis de uma amostra 
aleatória extraída daquela população. Se conduzimos um censo da popu-
lação inteira, então a inferência estatística é desnecessária, pois qualquer 
diferença ou relação, não importa quão pequena, é “verdadeira” e existe. 
Entretanto, raramente um censo é realizado; logo, o pesquisador é obri-
gado a fazer inferências a partir de uma amostra (HAIR et al., 2005).
Interpretar inferências estatísticas requer que o pesquisador espe-
cifique os níveis de erro estatístico aceitáveis. Conceituando:
Teste de hipótese é o procedimento diante de informações obti-
das de amostras que permite aceitar ou rejeitar hipóteses, demons-
trado no Gráfico 1. Frequentemente precisamos tomar decisões 
sobre populações, com base em informações de amostras das 
mesmas. Estas decisões envolvem riscos de erros do tipo I e II, 
conforme indicado no Quadro 2.
Hipótese nula H0 : µA = µB
Hipótese alternativa H1 : µA > µB hipótese monocaudal ou unilateral
µA < µB hipótese monocaudal ou unilateral
µA ≠ µB hipótese bicaudal ou bilateral
Distribuição F: função (nível de erro, grau de liberdade da amos-
tra, grau de liberdade do resíduo) (Gráfico 1).
O erro tipo I é a probabilidade de rejeitar a hipótese nula (a hipó-
tese de que não existe diferença entre as amostras) quando ela é verda-
deira. Isto significa que duas amostras similares são consideradas dife-
rentes quando elas, na realidade, não são. O risco de erro do tipo I é 
chamado de erro alfa e a maioria dos procedimentos estatísticos objetivam 
TESTES DE DIFERENçA 79
minimizá-lo. Este é o tipo de erro que nós queremos minimizar na si-
tuação do teste de diferença.
f (F)
0 Fc
RA Ho RR Ho
F
α = 5%
p < 0,05
Fo
gráfico 1 – Distribuição de F em função do nível de erro, grau de liberdade da 
amostra e grau de liberdade do resíduo
 - Região de Aceitação de H0 (RA);
 - Região de Rejeição de H0 (RR);
 - FC = fator F crítico ou limite;
 - F0 = fator F calculado;
 - Erro tipo I (a);
 - Erro tipo II (b).
“Realidade”
H0 verdadeiro H0 falso
Correto Erro II Aceitar H0
“Decisão”
Erro I Correto Rejeitar H0
quadro 2 – Probabilidade e tipos de erros
ANÁLISE SENSORIAL DE ALIMENTOS80
O erro tipo II é a probabilidade de não rejeitarmos a hipótese 
nula quando ela é falsa. Isto significa que duas amostras que são dife-
rentes são consideradas similares, quando elas não são similares. O erro 
do tipo II é chamado beta. Este é o tipo de erro que nós queremos 
minimizar na situação do teste de similaridade. O erro beta é o risco de 
não encontrarmos a diferença quando na realidade ela existe.
Portanto, nós iremos focar em minimizar alfa (α) ou beta(β), de-
pendendo da situação do teste, se este é de diferença ou de similaridade.
A potência (ou o poder) de um teste
A potência (também chamada de poder) de um teste é definido 
como P = 1 – β, ou seja, é a probabilidade de fazer a decisão correta 
quando duas amostras são perceptivelmente diferentes. A potência P 
é dependente da magnitude da diferença entre as duas amostras, do 
tamanho de alfa e do número de julgadores.
A relação das diferentes probabilidades de erro na situação hi-
potética de teste para a diferença entre duas médias, já apresentada no 
Quadro 2, é reapresentada no Quadro 3 para entendermos que os erros 
tipo I e II são inversamente relacionados e, à medida que o erro tipo I 
se torna mais restritivo (se aproxima de zero), o erro tipo II aumenta.
Realidade
H0: sem diferença H1: com diferença
Decisão 
estatística
H0: sem diferença 1 – α β (Erro tipo II)
H1: com diferença α (Erro tipo I) 1 – β (Potência do teste)
quadro 3 – Relação das diferentes probabilidades de erro
TESTES DE DIFERENçA 81
Assim o pesquisador deve jogar com o equilíbrio entre o nível alfa 
e a potência do teste.
O número de julgadores requeridos para um teste de diferença 
não é crítico como para um teste de similaridade. Vejamos por quê.
Se você quer demonstrar que uma nova formulação é mais macia 
que a velha, por exemplo, você pode usar um teste de diferença com o 
objetivo de minimizar alfa. O erro do tipo I é minimizado neste caso 
porque os analistas sensoriais querem ter a certeza de que a amostra 
nova é diferente da velha; portanto, o poder do teste não é crítico.
Quando o objetivo do teste é que a diferença não seja perceptí-
vel, nós queremos minimizar o erro beta. Este erro é o de decidirmos 
incorretamente que as amostras são similares, quando na realidade elas 
são diferentes. A potência (1 – β) é crítica e deve ser maximizada, o que 
significa que o número de julgadores deverá ser suficientemente grande 
para este fim.
Outra distinção entre os testes de diferençae similaridade é que 
nos testes de diferença, quando nós utilizamos estatística binomial para 
desenvolver as tabelas que determinam o número mínimo de respostas 
corretas para estabelecer diferença, nós testamos contra as chances de 
acerto ao acaso. Em testes de similaridade, nós iremos testar contra 
algum nível mais alto de proporção esperada de respostas corretas e ver 
se nós estamos significativamente abaixo desse, a fim de chegarmos à 
conclusão de que as duas amostras são similares. Nós chamamos isto 
de proporção de discriminação permitida. Como nós descobrimos qual 
é a proporção que deveria ser? Nós podemos optar por uma situação 
conservadora, na qual nós permitimos apenas 10% de julgadores dis-
criminadores, ou ter uma situação menos crítica e permitir 30% de 
julgadores discriminadores.
ANÁLISE SENSORIAL DE ALIMENTOS82
tipos gerais de testes de diferença
A tendência dominante dos testes de diferença são:
 - testes de diferença geral: quando a natureza da diferença é desco-
nhecida (não direcional);
 - testes de diferença de atributos: quando nós sabemos qual(is) 
atributo(s) deve(m) ser diferente(s) (direcional).
Os testes alternativos são:
 - o uso de detecção de sinal e a abordagem R-index;
 - ordenação e escalas.
6.1 testes de diferença geral (não direcional)
Para diferenças nos produtos resultantes de mudanças nos ingre-
dientes, processamento, embalagem ou estocagem. Quando não sabemos 
quais atributos específicos podem ser afetados.
6.1.1  Teste triangular (ASTM E1885 – 04)
Objetivo
Verificar se existe diferença significativa entre duas amostras que so-
freram tratamentos diferentes. Ex: verificar se mudanças de ingredientes, 
processamento, embalagem ou estocagem acarretaram alterações senso-
riais no produto. Serve para detectar pequenas diferenças e por esse motivo 
tem sido utilizado preliminarmente a outros testes, porque não avalia o 
grau da diferença, nem caracteriza os atributos responsáveis pela diferença.
TESTES DE DIFERENçA 83
Princípio do teste
Cada julgador recebe três amostras codificadas e é informado que 
duas amostras são iguais e uma é diferente. Em seguida, é solicitado ao 
julgador provar as amostras da esquerda para a direita e identificar a 
diferente. A probabilidade de acerto ao acaso é de 1/3, considerando-se 
a técnica de escolha forçada. As amostras devem ser servidas em todas as 
combinações possíveis: A A B/A B A/B A A/B B A/B A B/A B B.
Desta forma, a fonte de variação estatística dada pela influência 
que a ordem de apresentação das amostras exerce sobre o julgador é 
minimizada porque os julgadores recebem as amostras em posições di-
ferentes e a amostra diferente pode ser dada pelo tratamento “A” ou “B”.
O modelo da ficha é apresentado na Figura 12, observando-se 
que, por se tratar de um teste rápido, objetivo e de pouca fadiga, normal-
mente se aproveita a mesma sessão do julgador para aplicar-se dois ou 
três grupos de testes independentes.
Julgador:    Data: 
tEstE tRIANgUlAR
Em cada grupo de amostras apresentadas, duas são iguais e uma é diferente.
Deguste cuidadosamente cada uma das amostras, na ordem em que estão sendo 
apresentadas, e faça um círculo em volta da amostra diferente.
Grupo Código da amostra
I 928 479 110
II 171 036 245
III 352 563 684
Comentários: 
figura 12 – Modelo de ficha para aplicação do teste triangular
ANÁLISE SENSORIAL DE ALIMENTOS84
Equipe de julgadores
Os julgadores devem ser familiarizados com o formato e o procedi-
mento desta análise. Experiência e familiariedade com o produto podem 
aumentar a probabilidade de encontrar-se diferença significativa. Esco-
lha os julgadores de acordo com os objetivos do teste, por exemplo, para 
projetar resultados para uma população de consumidores, julgadores 
com sensibilidade desconhecida podem ser selecionados. Para análise 
da qualidade do produto, julgadores com acuidade sensorial devem 
ser selecionados. Nunca se deve misturar diferentes tipos de julgadores 
numa mesma análise.
A decisão de treinar ou não os julgadores deve ser discutida antes 
da realização do teste.
Número de julgadores
Escolha o número de julgadores de acordo com o nível de sensi-
bilidade requerida a fim de atingir os objetivos do teste. A sensibilidade 
de um teste é função de três valores: o risco α, o risco β e a proporção 
máxima permitida de discriminadores (Pd). Em linhas gerais:
 - Para o risco α – Um resultado com significância estatística:
10 a 5% (0,10 a 0,05) indica leve evidência de que as amostras 
diferem
5 a 1% (0,05 a 0,01) indica moderada evidência de que as amos-
tras diferem
1 a 0,1% (0,01 a 0,001) indica forte evidência de que as amostras 
diferem
Abaixo de 0,1% (< 0,001) indica uma evidência muito forte que 
as amostras diferem
TESTES DE DIFERENçA 85
 - Para o risco β – As forças das evidências para que a diferença entre 
as amostras não exista segue o mesmo critério do risco α
 - Para a proporção máxima permitida de discriminadores (Pd), te-
mos 3 faixas:
Pd < 25% representa um valor pequeno
25% < Pd < 35% representa um valor médio
Pd > 35% representa um valor grande
Após a definição da sensibilidade requerida para o teste, utiliza-se 
a Tabela 37, Anexo A para determinar o número de julgadores neces-
sários. O número de julgadores é maior quando o objetivo do teste é 
demonstrar que os produtos são similares.
Análise dos resultados
Os números de respostas corretas necessárias para estabelecer dife-
renças significativas são encontrados no Anexo B, Tabela 38. Se o número 
de respostas corretas é maior ou igual ao valor tabelado, conclui-se que 
existe diferença significativa entre as amostras. Se o número de respostas 
corretas é menor que o valor tabelado, conclui-se que as amostras são 
suficientemente similares. Estas conclusões estão baseadas nos riscos que 
foram aceitos quando a sensibilidade do teste foi pré-estabelecida.
Pode-se calcular o intervalo de confiança da proporção da popu-
lação que pode perceber a diferença entre as amostras. Este cálculo está 
demonstrado no exemplo 3.
 
Exemplo 1: Teste de diferença
O aditivo Esterlac® (estearoil 2 lactil lactato de sódio) foi aplicado 
ao macarrão espaguete com o objetivo de melhorar a textura al dente. 
ANÁLISE SENSORIAL DE ALIMENTOS86
Utilizou-se o teste triangular não direcional porque não é possível de-
finir a textura al dente por meio de um único atributo, pois se trata da 
combinação de atributos primários e secundários de textura. Portanto, 
avaliar a intensidade de apenas um atributo não seria recomendado, 
por desconhecerem-se as correlações. Considerou-se ainda o fato deste 
aditivo não alterar o sabor dos alimentos nas dosagens utilizadas, isto 
é, a diferença do produto estaria relacionada à textura, apesar de des-
conhecermos a relação dos atributos primários envolvidos. As amostras 
testadas foram:
 - amostra “A” = espaguete normal (padrão atual);
 - amostra “B” = espaguete com aditivo Esterlac®.
Obedecendo o delineamento sugerido para o teste triangular, 
utilizaram-se os códigos 397 e 240 para a amostra “A” e os códigos 561 
e 884 para a amostra “B”, sendo que os julgadores receberam as fichas 
na seguinte sequência:
Ficha n. 1: 397 - 561 - 240 (A B A)
Ficha n. 2: 561 - 397 - 884 (B A B)
Ficha n. 3: 397 - 240 - 884 (A A B)
Ficha n. 4: 561 - 884 - 240 (B B A)
Ficha n. 5: 884 - 240 - 397 (B A A)
FIcha n. 6: 240 - 561 - 884 (A B B)
Número de julgadores: a proposta é proteger-se de concluir fal-
samente que a diferença exista, por isso α = 0,05 foi escolhido. Também 
escolheu-se Pd = 40% e β = 0,20. Quer se ter 95% de certeza de que 
não mais do que 40% da população vai deixar de perceber que a dife-
rença existe. Consultando-se o Anexo A – Tabela 37 encontra-se que o 
mínimo de 23 julgadores é recomendado para o teste.
TESTES DE DIFERENçA 87Resultados: foram obtidas 16 respostas corretas. Consultando-se 
o Anexo B – Tabela 38, na linha correspondente a 23 julgadores e na 
coluna de α = 0,05 encontra-se que 12 respostas corretas é o suficiente 
para concluir-se que os dois espaguetes são diferentes, nas condições 
escolhidas para o teste (Pd = 40%, α = 0,05, β = 0,20). 
Desta forma, este estudo não termina aqui porque se este produto 
já tem um padrão de identidade no mercado, será imprescindível reali-
zar um teste de preferência com os consumidores. Este resultado indica 
que as amostras diferem significativamente e que esta diferença será 
percebida pelos consumidores, mas ainda é preciso certificar-se se esta 
melhoria será realmente preferida pelos consumidores deste produto.
Exemplo 2: Teste de diferença
Uma cervejaria desenvolveu um processo para reduzir o sabor in-
desejável do cereal cru que ocorre em uma cerveja não alcóolica. Foi 
necessário investir em um novo equipamento. Antes da realização de 
um teste de preferência com os consumidores, o pesquisador quer con-
firmar que a cerveja experimental é diferente da atual. 
Número de julgadores: a proposta é proteger-se de concluir fal-
samente que a diferença exista, por isso α = 0,05 foi escolhido. Também 
escolheu-se Pd = 50% e β = 0,20. Consultando-se o Anexo A – Tabela 37 
encontra-se que o mínimo de 16 julgadores é recomendado para o teste. 
Com o objetivo de utilizar uma ordem de apresentação balanceada, o 
analista decidiu utilizar 18 julgadores.
Resultados: foram obtidas 10 respostas corretas. Consultando-se 
o Anexo B – Tabela 38, na linha correspondente a 18 julgadores e na 
coluna de α = 0,05 encontra-se que 10 respostas corretas é o suficiente 
para concluir-se que as duas cervejas são diferentes, nas condições esco-
lhidas para o teste (Pd = 50%, α = 0,05, β = 0,20). Deve-se prosseguir 
com a análise de preferência com os consumidores.
ANÁLISE SENSORIAL DE ALIMENTOS88
Exemplo 3: Teste de similaridade
O teste triangular foi aplicado para avaliar as seguintes amostras, 
fabricadas no mesmo dia, sob as mesmas condições:
 - amostra “A” = macarrão talharim com 100% de farinha de trigo 
especial;
 - amostra “B” = macarrão talharim com 93% de farinha de trigo 
especial + 7% de creme de milho (fubá bem fino).
O objetivo desta análise era verificar se as amostras eram similares, 
pois não se deseja alterar o padrão de qualidade sensorial. Porém, deseja-
se a redução de custos do produto e a introdução dos benefícios nutri-
cionais e também social que as farinhas mistas trazem.
Número de julgadores: quer se ter 95% de certeza de que não 
mais do que 20% da população poderá detectar esta diferença. O que 
significa β = 0,05 e Pd = 20%. Também foi escolhido α = 0,20. Con-
sultando-se o Anexo A – Tabela 37 encontra-se que o mínimo de 86 
julgadores é recomendado para o teste. 
Resultados: foram obtidas 30 respostas corretas. Consultando-se 
o Anexo B – Tabela 38, é necessário interpolar entre os valores cor-
respondentes a 84 e 90 julgadores, conforme recomendações em nota 
na Tabela, encontrando-se que para 86 julgadores são necessárias 34 
respostas corretas para que as amostras sejam consideradas diferentes 
nas condições especificadas (Pd= 20%, α = 0,20, β = 0,05). Conclui-se 
que as amostras não diferem e, nas condições em que este talharim foi 
fabricado, é possível utilizar 7% de creme de milho sem alterar percep-
tivelmente a qualidade sensorial do produto.
Cálculo do intervalo de confiança:
Pc = proporção de respostas corretas
TESTES DE DIFERENçA 89
c = número de respostas corretas
n = número total de julgadores
Pd = proporção de discriminadores
Pc =
c
n 
(6.1)
Pc = 30 / 86 = 0,35
Pd = 1,5 Pc − 0,5 (6.2)
Pd = 1,5 Pc − 0,5 = 0,025
Sd (desvio padrão de Pd) = 1,5
Pc ( 1 − Pc )
n 
(6.3)
Limite superior de confiança = Pd + zβ ∙ Sd 
(6.4)
Limite inferior de confiança = Pd − zα ∙ Sd (6.5)
zα e zβ são valores críticos da distribuição normal padrão. 
Para um intervalo de confiança de 80%, z = 0,84;
para um intervalo de confiança de 90%, z = 1,28; 
para um intervalo de confiança de 95%, z = 1,64 e 
para um intervalo de confiança de 99%, z = 2,33
Substituindo-se:
ANÁLISE SENSORIAL DE ALIMENTOS90
Sd = 1,5 √ 0,35 (1 − 0,35) / 86 
Sd = 0,05
Limite superior de confiança = 0,025 + 1,64 ∙ (0,05) = 0,107
Limite inferior de confiança = 0,025 − 0,84 (0,05) = − 0,017
O analista pode ter 95% de certeza de que a proporção da po-
pulação que será capaz de perceber a diferença entre os espaguetes está 
entre - 1,7% e 10,7%, ainda sob condições de análise sensorial compa-
rativa, o que não ocorre nas condições de consumo normal. O limite in-
ferior não pode ser negativo, portanto o intervalo de 95% de confiança 
é de 0% a 10,7%. Este valor está bem abaixo da linha de corte utilizada 
no teste, que foi de 20%.
Exemplo 4: Balanceamento dos riscos dos erros de diferença 
e de similaridade
O teste triangular foi aplicado para avaliar a seguinte diferença 
entre as amostras armazenadas em temperatura ambiente (Curitiba, PR), 
as quais foram produzidas e embaladas no mesmo dia, sob as mesmas 
condições de processamento:
 - amostra “A” = coco ralado com antioxidante BHT;
 - amostra “B” = coco ralado sem antioxidante.
Deseja-se que as amostras não apresentem diferença significativa 
ao longo de 60 dias de prateleira, para não ser necessária a utilização do 
aditivo. Por outro lado, sabe-se que o coco ralado é uma amostra muito 
suscetível à oxidação e consequente rancificação. Sabe-se também que 
sua comercialização não se viabiliza com menos de 45 dias. Neste caso, 
é preciso balancear os riscos de diferença e similaridade. Em um pri-
meiro momento, desejou-se α = 0,05 e β = 0,05 para uma proporção 
TESTES DE DIFERENçA 91
máxima de 20% de discriminadores, porém, consultando-se o Anexo A – 
Tabela 37, o número de julgadores necessários é de 147 e o laborató-
rio contava com 50 julgadores selecionados. O analista sensorial infor-
mou à equipe de desenvolvimento que, para conseguir este número de 
julgadores, iria requerer mais tempo e dinheiro. A equipe se reuniu e 
discutiu os diversos aspectos, consideraram a experiência que tinham 
em relação à embalagem quanto à qualidade da barreira ao oxigênio. 
Consultando o Anexo A – Tabela 37, determinaram que Pd = 30%, α = 
0,10, β = 0,10 e n ≥ 43 forneceria sensibilidade suficiente, em função 
do número de julgadores disponível. O analista preparou para 48 julga-
dores para obter a ordem balanceada de apresentação.
I. A primeira análise ocorreu aos 30 dias de estocagem.
Participaram desta análise 48 julgadores e 18 acertaram a resposta. 
Consultando-se o Anexo B – Tabela 38, o número mínimo de 
respostas corretas para estabelecer diferença entre as amostras é 
de 21. As amostras não diferem nas condições estabelecidas para 
o teste. Conclui-se que, para 30 dias de vida de prateleira, o anti-
oxidante não é necessário.
II. A segunda análise ocorreu aos 45 dias.
Participaram desta análise 46 julgadores e 17 acertaram a resposta. 
Consultando-se o Anexo B – Tabela 38, o número mínimo de 
respostas corretas para estabelecer diferença entre as amostras é 
de 20. As amostras não diferem nas condições estabelecidas para 
o teste. Conclui-se que para 45 dias de vida de prateleira o antioxi-
dante não é necessário.
III. A terceira análise ocorreu aos 60 dias.
Participaram desta análise 48 julgadores e 29 acertaram a resposta. 
Consultando-se o Anexo B – Tabela 38, o número mínimo de res-
postas corretas para estabelecer diferença entre as amostras é de 21. 
As amostras diferem entre si nas condições estabelecidas para o 
teste. Conclui-se que para 60 dias o antioxidante é necessário. 
ANÁLISE SENSORIAL DE ALIMENTOS92
Deve-se caracterizar essa diferença por meio de um teste sensorial 
descritivo. Se a amostra com antioxidanteestiver com a qualidade sen-
sorial esperada, deve-se considerar os ganhos financeiros com 15 dias 
a mais de vida de prateleira com a utilização do antioxidante versus a 
possibilidade de não se utilizar o aditivo e determinar 45 dias de vida 
de prateleira ao produto.
Exercício 1:
Para determinar a diferença de sabor entre a composição de va-
riedades de café, aplicamos o teste triangular, utilizando as seguintes 
amostras:
 - amostra “A”: xícara de café com 96% de variedade arábica prove-
niente de São Paulo (lote n. 102) e 4% de robusta;
 - amostra “B”: xícara de café com 92% de variedade arábica pro-
veniente de São Paulo (lote n. 102) + 4% de variedade conilon e 
4% de robusta.
As condições de torração são idênticas e efetuadas no mesmo dia. 
O objetivo é o barateamento de custos, pois a variedade conilon é mais 
barata, porém com sabor característico bem mais suave.
Os critérios utilizados foram de probabilidade máxima de erro de 
5%, tolerando-se que até 30% da população possa detectar esta diferença. 
Para o erro de concluir que as amostras diferem quando na realidade 
elas não diferem estabeleceu-se 0,10. A análise foi desenvolvida por 60 
julgadores selecionados e treinados e o número total de julgamentos 
corretos obtidos foi igual a 24.
Pede-se: 
1) O número de julgadores está adequado para os critérios do teste?
TESTES DE DIFERENçA 93
2) Qual o resultado do teste e o que podemos concluir com este resultado?
3) Calcule o intervalo de confiança da proporção da população que pode 
perceber a diferença.
Exercício 2:
Um fabricante de confeitos quer se certificar de que a substituição 
para um novo material de embalagem nos doces não irá alterar signifi-
cativamente a qualidade sensorial do produto após três meses de estoca-
gem. O fabricante sabe que é impossível provar que dois produtos são 
idênticos, mas quer se assegurar que apenas uma pequena proporção da 
população consiga detectar que existe diferença. Por outro lado, o fabri-
cante não se preocupa com a conlusão falsa (erro) de que os produtos são 
diferentes quando na realidade eles não são, porque a embalagem atual é 
aceitável e a nova somente está sendo considerada com o propósito de 
oferecer maior flexibilidade à impressão gráfica da rotulagem.
Objetivo: determinar se os doces estocados por três meses com 
a nova embalagem são semelhantes aos doces estocados por três meses 
com a embalagem atual.
O fabricante quer ter 95% de certeza de que não mais do que 
30% da população consiga perceber a diferença entre as amostras. Por 
outro lado, por causa da aceitabilidade da embalagem atual, como já 
explicado, o fabricante aceita um risco α = 0,20.
Resultados: 14 dos 39 julgadores identificaram corretamente 
qual era a amostra diferente. 
Pede-se:
1) O número de julgadores está adequado para os critérios do teste?
2) Qual o resultado do teste e o que podemos concluir com este resultado?
3) Calcule o intervalo de confiança da proporção da população que pode 
perceber a diferença.
ANÁLISE SENSORIAL DE ALIMENTOS94
6.1.2  Teste duo-trio (ASTM E2610 – 08)
Objetivo
Como no teste triangular, verificar se existe diferença significativa 
entre duas amostras que receberam tratamentos diferentes.
Princípio do teste
Três amostras são apresentadas ao julgador. Uma padrão e duas 
codificadas. Uma das codificadas é igual ao padrão e a outra é diferente. 
Pede-se ao julgador para identificar a amostra igual ao padrão. A proba-
bilidade de acertar ao acaso é de 1/2, considerando-se técnica de escolha 
forçada. As amostras devem ser servidas em todas as posições possíveis:
P = A
A B B A A B B A
P = A P = B P = B
Equipe de julgadores
As recomendações para os julgadores são iguais às do teste triangular.
Número de julgadores
Escolha o número de julgadores de acordo com o nível de sensi-
bilidade requerida a fim de atingir os objetivos do teste. A sensibilidade 
TESTES DE DIFERENçA 95
de um teste é função de três valores: o risco α, o risco β e a proporção 
máxima permitida de discriminadores (Pd).
Seguem os mesmos critérios descritos para o teste triangular.
Após a definição da sensibilidade requerida para o teste, utiliza-se 
o Anexo C – Tabela 39 para determinar o número de julgadores neces-
sários. O número de julgadores é maior quando o objetivo do teste é 
demonstrar que os produtos são similares.
Análise dos resultados
Os números de respostas corretas necessárias para estabelecer di-
ferenças significativas são encontrados no Anexo D, Tabela 40. Se o 
número de respostas corretas é maior ou igual ao valor tabelado, con-
clui-se que existe diferença significativa entre as amostras. Se o número 
de respostas corretas é menor que o valor tabelado, conclui-se que 
as amostras são suficientemente similares. Estas conclusões estão ba-
seadas nos riscos que foram aceitos quando a sensibilidade do teste foi 
preestabelecida.
Pode-se calcular o intervalo de confiança da proporção da popula-
ção que pode perceber a diferença entre as amostras. Veja como calcular 
seguindo o exemplo 2.
Observações
 - o teste duo-trio é mais simples para o julgador, uma vez que é 
mais fácil procurar a amostra solicitada do que no teste triangular. 
Porém, o teste duo-trio é menos eficiente estatisticamente do que 
o triangular, porque a probabilidade de acertar ao acaso é de 1/2, 
em vez de 1/3, como no triangular;
ANÁLISE SENSORIAL DE ALIMENTOS96
 - tal qual o teste triangular, o teste duo-trio só verifica se as amos-
tras testadas são diferentes, não avaliando qual é a diferença ou se 
a diferença é grande ou pequena.
Exemplo 1:
Um fornecedor de equipamentos argumenta que seu novo equi-
pamento que aromatiza o interior da caixa do lenço umedecido facial é 
superior à tecnologia atual que aromatiza diretamente o lenço. O quí-
mico deseja confirmar este argumento antes de realizar um teste com o 
equipamento.
Objetivo do teste: determinar se os dois métodos de aromatiza-
ção produzem alguma diferença na percepção da fragrância dos lenços 
após eles terem sido estocados no período de três meses.
Número de julgadores: para proteger o químico de concluir 
falsamente que existe diferença quando esta diferença na realidade 
não existe, o analista sensorial propõe α = 0,05. Para manter o nú-
mero de julgadores num tamanho razoável, sugeriu-se Pd = 40%, com 
β = 0,20.
Consultando-se o Anexo C – Tabela 39 encontra-se que o mínimo 
de 37 julgadores é necessário para o teste. Com o objetivo de balan-
ceamento da ordem de apresentação das amostras, o analista decidiu 
utilizar 40 julgadores.
Procedimento do teste: suficientes quantidades de produtos são 
preparadas com ambas as tecnologias e os produtos são armazenados, 
sob as mesmas condições, por um período de três meses. Sessenta amos-
tras de lenço “A” com a fragrância aplicada diretamente sobre o lenço 
umedecido e 60 amostras de lenço “B” com a fragrância aplicada dentro 
das caixas dos lenços foram preparadas para o teste. Dez repetições das 
quatro possibilidades de ordem de apresentação das amostras são utili-
zadas: ArAB, ArBA, BrAB e BrBA.
TESTES DE DIFERENçA 97
O teste é conduzido com 40 julgadores que possuem experiência 
na avaliação de odores. Os lenços são pegos a partir do centro da caixa, 
cada lenço é colocado em uma jarra de vidro selada, uma hora antes 
da análise. Esse procedimento permite que a fragrância migre para o 
headspace e o uso dos recipientes fechados reduz a contaminação no 
ambiente das cabines. A Figura 13 mostra o modelo de ficha utilizado.
Análise dos resultados: somente 21 de 40 julgadores consegui-
ram acertar as respostas. De acordo com o Anexo D – Tabela 40, são 
necessárias 26 respostas corretas para o risco de 5% do erro alfa (tipo I). 
Portanto, não se atingiu o número de respostas corretas necessárias para 
estabelecer diferença.Isto indica que a qualidade ou a quantidade, ou 
ambas, das duas fragrâncias nos lenços faciais não diferem entre si, nas 
condições estudadas.
Julgador n.:    Nome:    Data: 
Tipo de amostra:   
Instruções:
1. Aspire cada amostra, iniciando pela amostra Referência. Remova a tampa por um período breve e 
inale através de aspirações curtas e sequenciais
2. Depois avalie as amostras codificadas da esquerda para a direita. Determine qual das duas amostras 
codificadas é igual à Referência.
3.  Indique a amostra colocando um X no quadrado correspondente.
Se você não perceber qual amostra é igual à Referência, deve escolher a amostra por adivinhação.
REFERÊNCIA Código:   Código:  
Comentários: 
figura 13 – Ficha utilizada no teste duo trio para o lenço facial
Lenço facial dentro de um jarro de vidro
ANÁLISE SENSORIAL DE ALIMENTOS98
Exemplo 2:
Um fabricante de cervejas deve decidir entre dois fornecedores 
de latas. Sendo “A” o fornecedor regular já há alguns anos e “B” o novo 
fornecedor, que argumenta algumas vantagens na manutenção da qua-
lidade sensorial durante a vida de prateleira. O fabricante de cervejas 
considera importante balancear entre o risco de introduzir uma mu-
dança não desejada em sua cerveja e o de não aproveitar a oportunidade 
oferecida de aumentar a vida de prateleira de seu produto.
Objetivo do teste: determinar se alguma diferença sensorial pode 
ser percebida entre duas cervejas após oito semanas de estocagem à tem-
peratura ambiente.
Número de julgadores: o fabricante tem observado pelo tempo 
de experiência que Pd = 30% é seguro para assumir que nenhuma 
diferença é perceptível. Ele está ligeiramente mais preocupado com a 
introdução de uma diferença não desejável do que perder a oportuni-
dade de aumentar a vida de prateleira do produto. Então ele decidiu 
fixar o risco de erro β = 0,05 e o risco de erro α = 0,10. Utilizando-se 
o Anexo C – Tabela 39, temos que 96 julgadores são requeridos para 
este teste.
Análise dos resultados: foram obtidas 57 respostas corretas de 
96 julgamentos totais. Extraindo-se do Anexo D – Tabela 40 que o nú-
mero de respostas corretas para estabelecer diferença significatica para 
α = 0,10 e 96 julgadores é 55. Portanto, a diferença é significativa e as 
amostras devem ser submetidas a um teste de preferência com consu-
midores e/ou uma análise descritiva.
Cálculo do intervalo de confiança:
Pc (proporção de respostas corretas) =
c (número de respostas corretas)
n (número de julgadores) 
(6.1)
TESTES DE DIFERENçA 99
Pd (proporção de discriminadores) = 2 Pc − 1
 
(6.6)
Sd (desvio padrão de Pd) = 2
Pc ( 1 − Pc )
n 
(6.7)
Limite superior de confiança = Pd + zβ ∙ Sd 
(6.4)
Limite inferior de confiança = Pd − zα ∙ Sd (6.5)
Para intervalos de confiança monocaudal de 90% z = 1,28
 95% z = 1,64
 99% z = 2,33
c = 57, n = 96, α = 0,10 e β = 0,05
Substituindo-se:
Pc = 57 / 96 = 0,59375
Pd = 2 (0,59375) − 1 = 0,1875
Sd = 2 √ 0,59375 (0,40625) / 96 = 0,10025
Limite superior de confiança = 0,1875 + 1,64 (0,10025) = 0,352
Limite inferior de confiança = 0,1875 − 1,28 (0,10025) = 0,059
Fazendo-se as considerações separadas, podemos dizer com 90% 
de confiança que pelo menos 5,9% dos julgadores podem distinguir a 
cerveja da nova lata em relação à cerveja da lata atual. Também pode-
mos dizer com 95% de confiança que a proporção de discriminadores 
pode chegar a 35,2%. Os dois limites suportam a conclusão de que 
existe diferença significativa entre as duas cervejas e o limite superior 
está acima do corte de 30% proposto. Portanto, precisa-se realizar um 
ANÁLISE SENSORIAL DE ALIMENTOS100
teste descritivo ou um teste de preferência com o consumidor para po-
dermos concluir se esta diferença é para melhor ou para pior.
6.1.3  Teste “A” ou “NÃO A” (NBR 13171/1994)
Objetivo
Deve ser aplicado para avaliar amostras que apresentem variações 
de aparência ou de gosto remanescente. Deve ser usado quando os testes 
duo-trio e triangular não são aplicáveis. Esse teste apresenta como vanta-
gem admitir pequenas diferenças no mesmo tipo de amostra e apresenta 
como desvantagem a fadiga sensorial.
Princípio do teste
Uma série de amostras provenientes de dois produtos (“A” ou 
“Não A”) é apresentada para identificação das amostras “A”.
Procedimento
Ao julgador deve ser apresentada a amostra referência “A”, várias vezes, 
antes do teste, até que ele possa reconhecê-la. Em seguida, amostras devem 
ser fornecidas aleatoriamente, podendo ser “A” ou “Não A”, para identi-
ficação das amostras “A”. O modelo da ficha é apresentado na Figura 14.
Equipe de julgadores
O mínimo recomendado deve ser de 20 julgadores selecionados.
TESTES DE DIFERENçA 101
Nome:    Data: 
tEstE “A” oU “Não A”
Após familiarizar-se com a amostra “A”, prove cuidadosamente da esquerda para a direita as amostras 
codificadas, a fim de avaliar, testar e identificar as amostras como sendo “A” ou  “Não A”.
n. da amostra “A” “Não A”
Comentários: 
figura 14 – Modelo de ficha para aplicação do teste “A” ou “Não A”
Análise dos resultados
Os resultados devem ser analisados utilizando a distribuição qui-
quadrada, conforme Tabela 41, Anexo E, observando-se o exemplo a seguir.
Exemplo:
Um profissional de desenvolvimento de produtos está pesquisando 
adoçantes alternativos para uma bebida que contém 5% de açúcar na 
sua formulação. Testes preliminares de gosto estabeleceram 0,1% do 
novo adoçante como o nível equivalente a 5% de sacarose, mas tam-
bém demonstrou que se mais de uma amostra é apresentada ao mesmo 
ANÁLISE SENSORIAL DE ALIMENTOS102
tempo, a discriminação é prejudicada por causa do efeito residual da 
doçura e outros gostos e fatores de sensação bucal. O profissional deseja 
saber se as duas bebidas se distinguem pelo sabor. Vinte julgadores rece-
bem aleatoriamente cinco amostras “A” (bebida com adoçante) e cinco 
amostras “Não A” (bebida com sacarose), sendo-lhes recomendado que 
determinem quais amostras são “A”. Os resultados obtidos são apresen-
tados a seguir (Tabela 2).
tabela 2 – Julgamentos obtidos no teste “A” ou “Não A” de bebidas
Respostas
Amostras
total
“A” “Não-A”
“A” 60 35 95
“Não-A” 40 65 105
Total 100 100 200
Fonte: NBR 13171/1994.
Aplicando-se a distribuição qui-quadrada, tem-se:
Frequência esperada para “A”:
= 47,5
100 × 95
200 
(6.8)
Frequência esperada para “Não A”:
= 52,5
105 × 100
200 
(6.9)
 
TESTES DE DIFERENçA 103
X² =
X² = 12,53
+
(60 − 47,5)²
47,5
(35 − 47,5)²
47,5
+
(40 − 52,5)²
52,5
+
(65 − 52,5)²
52,5
 
(6.10)
O valor obtido X² = 12,53 é maior do que o encontrado na 
Tabela 41 (Anexo E) para grau de liberdade 1 e nível de significância de 
5%, onde X² = 3,84. Assim, conclui-se que existe diferença significativa 
entre a bebida adoçada com sacarose e a adoçada com o novo adoçante.
6.1.4  Teste dois em cinco
Objetivo
Como nos testes já descritos, também é para verificar se existe 
diferença significativa entre duas amostras que receberam tratamentos 
diferentes.
Princípio do teste
Cinco amostras codificadas são apresentadas ao julgador, duas de 
um tipo e três de outro tipo. O julgador deverá identificar quais são as 
duas amostras que diferem das outras três remanescentes.
Quando o número de julgadores for menor que 20, as ordens de 
apresentação das amostras devem ser selecionadas ao acaso entre as 20 
combinações possíveis: AAABB, BBBAA, AABAB, BBABA, ABAAB, 
BABBA, BAAAB, ABBBA, AABBA, BBAAB, ABABA, BABAB, BAABA, 
ABBAB, ABBAA, BAABB, BABAA, ABABB, BBAAA e AABBB.
ANÁLISE SENSORIAL DE ALIMENTOS104
Análise dos resultados: a probabilidade de acerto ao acaso da 
primeira amostra de duas que são corretas é de 2/5. Então haverá quatro 
amostras restantes. A probabilidade de acerto ao acaso dasegunda amos-
tra correta é de 1/4. Como os dois eventos são dependentes entre si, 
nós multiplicamos as probabilidades associadas com cada evento para 
obter a probabilidade geral de acerto (resposta correta) ao acaso: 2/5 × 
1/4 = 1/10.
6.2 testes de diferença de atributos (Direcional)
6.2.1  Comparação Pareada ou Escolha Forçada entre duas alternativas  
(ASTM E2164 – 08)
Objetivo
Saber se uma amostra apresenta certo atributo sensorial em maior 
intensidade que a outra amostra. Por exemplo: verificar qual amostra é 
mais doce, ou mais ácida, ou mais aromática, etc. Observe que este teste 
é direcional porque chama a atenção do julgador para um determinado 
atributo sensorial (doçura, acidez, etc.), por isso a conclusão sobre a di-
ferença será apenas para aquele atributo específico que foi solicitado ao 
julgador; isto não implica que não exista algum outro tipo de diferença.
Princípio do teste
Consiste na apresentação de duas amostras e o julgador deve dizer 
qual das duas tem maior intensidade de uma característica bem definida. 
A probabilidade de acerto ao acaso é de ½. As amostras devem ser ser-
vidas nas duas ordens: AB / BA.
TESTES DE DIFERENçA 105
Equipe de julgadores
Deve-se garantir que os julgadores conheçam e detectem correta-
mente o atributo sensorial medido: doçura, acidez, aroma, firmeza, etc. 
É desejável julgadores com experiência e familiariedade com o produto, 
porém consumidores ou julgadores não selecionados podem realizar a 
análise, desde que, ao escolher-se a sensibilidade do teste, esse fato seja 
considerado para influenciar num número maior de julgadores e seja 
previsto um treinamento prévio. Não se recomenda misturar diferentes 
tipos de julgadores.
 
Sensibilidade do teste 
A escolha do número de julgadores dependerá da sensibilidade 
do teste, a qual será definida em função dos objetivos do teste. A sensi-
bilidade do teste é uma função de quatro fatores: risco alfa (α), risco beta 
(β), se o teste é de natureza uni ou bilateral e a proporção máxima per-
mitida de respostas corretas (teste unilateral) ou de respostas para amostra 
A ou B (teste bilateral) (Pmax).
Portanto, antes da realização do teste, deve-se decidir se este é uni 
ou bilateral e selecionar os valores de α, β e Pmax. As orientações gerais 
para esta tomada de decisão são as seguintes:
a) Teste unilateral (ou monocaudal) × Teste bilateral (ou bicaudal)
Se você sabe a priori qual amostra deveria apresentar maior inten-
sidade do atributo avaliado, use a tabela do teste pareado unilateral. 
Exemplo: se você está verificando se os julgadores conseguem di-
ferenciar doçura entre uma bebida láctea de morango com 1% 
de açúcar e outra bebida com 2% de açúcar. Você espera que, se 
houver diferença, a amostra com 2% será a mais doce.
ANÁLISE SENSORIAL DE ALIMENTOS106
Se você não sabe a priori qual amostra deveria apresentar maior 
intensidade do atributo avaliado, use a tabela do teste pareado bi-
lateral. Exemplo: você substituiu certa concentração de aspar tame 
numa gelatina, por certa concentração de ciclamato de sódio e de-
seja saber se as gelatinas diferem em doçura. Neste caso você não 
sabe qual amostra seria a mais doce, se elas diferirem em doçura.
b) Para um teste de diferença
Os valores normalmente utilizados são α = 0,05 e β = 0,20, com 
a possibilidade de aumentar o erro beta, mas mantendo sempre o 
erro alfa menor possível.
c) Para um teste de similaridade
Os valores normalmente utilizados são α = 0,20 e β = 0,05, com 
a possibilidade de aumentar o erro alfa, mas mantendo sempre o 
erro beta menor possível.
d) A proporção de respostas corretas (Pmax) fica entre três faixas:
Pmax < 55% representa um valor baixo
55% ≤ Pmax ≤ 65% representa um valor de tamanho médio
Pmax > 65% representa um valor grande
Número de julgadores: depois de definida a sensibilidade reque-
rida para o teste, utilize a Tabela 42 (Anexo F) para teste unilateral ou a 
Tabela 43 (Anexo G) para teste bilateral para determinar o número de 
julgadores necessários.
Análise dos resultados: soma-se o número de julgadores que 
acharam a amostra A com maior intensidade do atributo especificado 
e o número de julgadores que acharam a amostra B com maior intensi-
dade. Pegue o maior dos números e use a tabela apropriada, dependendo 
do número de julgadores:
 - se o número de julgadores é maior ou igual dos valores recomen-
dados nas Tabelas 42 e 43, então utilize a Tabela 44 (Anexo H) 
TESTES DE DIFERENçA 107
para analisar os dados obtidos de um teste unilateral e a Tabela 45 
(Anexo I) para analisar os dados obtidos de um teste bilateral. Se o 
número de respostas for maior ou igual ao número encontrado na 
Tabela, conclui-se que as amostras diferem no atributo analisado. 
Se o número de respostas for menor, conclui-se que as amostras 
são similares na intensidade do atributo analisado e que não mais 
do que a proporção Pmax da população perceberia a diferença em 
um nível de confiança igual a 1 − β. As conclusões se baseiam nos 
critérios definidos na sensibilidade do teste.
 - se o número de julgadores é menor do que os valores recomenda-
dos nas Tabelas 42 e 43 e o pesquisador está inicialmente interes-
sado em um teste de diferença, então utilize a Tabela 44 (unilateral) 
ou a Tabela 45 (bilateral). Se o número de respostas for maior ou 
igual ao número encontrado na Tabela, conclui-se que as amostras 
diferem no atributo analisado no nível α de significância.
 - Se o número de julgadores é menor do que os valores recomenda-
dos nas Tabelas 42 e 43 e o pesquisador está inicialmente interes-
sado em um teste de similaridade, então utiliza-se o cálculo do in-
tervalo de confiança para análise dos dados provenientes do teste:
Pc =
c
n 
(6.1)
Pc = Proporção de respostas corretas ou do maior número de respostas
c = número de respostas corretas ou da amostra que obteve maior 
número de respostas
n = número de julgadores
Sc (Erro padrão de Pc) =
Pc ( 1 − Pc )
n
 (6.11)
ANÁLISE SENSORIAL DE ALIMENTOS108
Para um teste unilateral:
Limite de confiança = Pc + zβ ∙ Sc 
(6.12)
Onde zβ é o valor crítico unilateral da distribuição normal e os 
valores para cada risco beta são:
Risco Beta zβ
0,50 0,000
0,40 0,253
0,30 0,524
0,20 0,842
0,10 1,282
0,05 1,645
0,01 2,326
0,001 3,090
Para um teste bilateral:
Limite superior de confiança = Pc + z ∙ Sc
 
(6.13)
Limite inferior de confiança = Pc − z ∙ Sc
 
(6.14)
Para 80% confiança z = 1,280
Para 90% confiança z = 1,645
Para 95% confiança z = 1,960
Para 99% confiança z = 2,576
Se o limite de confiança for menor do que Pmax, então conclui-se 
que as amostras são similares na intensidade do atributo.
TESTES DE DIFERENçA 109
Se o limite de confiança for maior que Pmax, então a similaridade 
não poderá ser demonstrada.
Exemplo 1: Teste de diferença unilateral
A equipe de P&D (pesquisa e desenvolvimento) direcionou seus 
esforços para desenvolver um cereal mais crocante no leite. Antes de reali-
zar um teste de preferência com consumidores, a equipe quer confirmar 
se o cereal desenvolvido é realmente percebido como mais crocante do 
que o cereal de referência atual.
Objetivo do teste: confirmar que o cereal reformulado é mais cro-
cante que o atual para justificar o teste com os consumidores. A equipe 
de desenvolvimento concorda que só há interesse em que o produto teste 
seja mais crocante que o atual, por isso será conduzido o teste unilateral.
Número de julgadores: para proteger-se de uma falsa conclusão 
de que existe diferença significativa de crocância, o analista sensorial 
propôs α = 0,05 e um Pmáx de 60% com β = 0,50. Consultando a Tabela 
42, encontrou-se a recomendação de 72 julgadores.
Análise dos resultados: 48 julgadores selecionaram a amostra “B” 
(cereal reformulado) como mais crocante que o cereal “A”. NaTabela 
44, na linha correspondente a 72 julgadores e na coluna para α = 0,05, 
encontra-se que 44 respostas corretas são suficientes para concluir que 
o cereal reformulado é mais crocante que o cereal atual.
Conclusão: o cereal reformulado é mais crocante que o cereal atual 
ao nível de 5% de significância, considerando-se Pmax = 60% e β = 0,50.
Exemplo 2: Teste de similaridade unilateral
Um fabricante de adoçante em pacotinho quer garantir que a 
quantidade adequada do adoçante esteja sendo envasada dentro de cada 
pacotinho para que não haja variação de doçura ao consumidor. Por 
causa da variabilidade na embaladora, o fabricante precisa estabelecer 
ANÁLISE SENSORIAL DE ALIMENTOS110
o limite mínimo que apenas uma pequena proporção da população 
detecte o gosto menos doce que o padrão médio.
Objetivo do teste: determinar o limite mínimo de concentração 
de adoçante permitido dentro de um pacotinho que forneça o mesmo 
gosto doce que a concentração padrão almejada. Como o teor de doçura 
será manipulado em direção à menor concentração possível que não 
altere o padrão atual de doçura, trata-se de um teste unilateral.
Número de julgadores: o fabricante busca garantir a concen-
tração e intensidade de doçura especificada na rotulagem. Neste caso 
objetiva-se um erro beta mínimo de 0,05. Selecionou-se α = 0,20 e um 
Pmax = 65%. Neste caso como somente o limite mínimo do gosto doce 
está sendo testado, utilizamos a Tabela 42 onde encontramos que um 
mínimo de 68 julgadores é recomendado.
Procedimento do teste: de acordo com experimentos prévios, a 
concentração do limite inferior (X) foi selecionada para ser avaliada 
versus a concentração alvo Padrão (P). A água filtrada foi utilizada como 
diluente. Este meio de diluição foi o que demonstrou permitir a melhor 
sensibilidade para diferenças entre gostos doces, pela experiência prévia 
dos julgadores.
As soluções nas concentrações X e P foram preparadas e porciona-
das em copos codificados com números com três dígitos aleatórios. Foram 
servidos nas ordens XP e PX de forma balanceada para 68 julgadores.
Análise dos resultados: 36 julgadores identificaram corretamente 
a amostra P como a mais doce, dentre 68 julgamentos totais. Consul-
tando-se a Tabela 44 para α = 0,20 encontra-se que o mínimo de res-
postas corretas necessárias para estabelecer a diferença entre as amostras 
é de 38 respostas. Portanto, com 36 respostas podemos concluir que as 
amostras são similares em doçura.
Conclusão: o analista sensorial pode emitir resultado de análise 
sensorial concluindo que a concentração X do adoçante é suficientemente 
similar ao alvo Padrão para ser utilizado como especificação de controle 
de qualidade de limite inferior permitido.
TESTES DE DIFERENçA 111
Exemplo 3: Teste de diferença bilateral
Um fabricante de sopas deseja determinar quais dos dois siste-
mas dosadores de sal proporciona melhor percepção do sabor salgado. 
O sistema dosador que proporcionar o gosto salgado mais intenso será 
selecionado para uma nova linha de produção de sopas. Desta forma, 
será possível diminuir a quantidade de sal e reduzir custos. Se nenhuma 
diferença for encontrada entre os dois sistemas, outros sistemas precisa-
rão ser pesquisados.
Objetivo do teste: determinar qual dos dois sistemas dosadores 
entrega melhor percepção do gosto salgado (mais intenso). Como não 
sabemos qual dos dois pode ser mais efetivo para este objetivo, trata-se 
de um teste pareado bilateral.
Número de julgadores: a seleção de um sistema dosador de sal 
mais efetivo é crítica nesta etapa do projeto, pois irá definir todas as for-
mulações futuras. O analista sensorial deseja ter apenas 5% de risco de 
erro alfa, isto é, selecionar um sistema dosador que na realidade não 
tenha diferença significativa. Entretanto, o analista também sabe que se 
ele concluir falsamente que não há diferença entre os dois sistemas, inves-
timentos adicionais serão necessários para continuar pesquisando outro 
sistema mais efetivo de aplicação de sal na sopa. Desta forma, ele decide 
por aceitar somente 10% do risco beta, em que 75% ou mais dos julga-
dores possa perceber a diferença de gosto salgado entre as duas amostras. 
Consultando-se a Tabela 43 na seção correspondente ao Pmax = 0,75 e na 
coluna correspondente a β = 0,10 encontrando-se com a linha de α = 0,05, 
resulta na recomendação de no mínimo 42 julgadores para este teste.
Análise dos resultados: 48 julgadores foram recrutados e partici-
param do teste, sendo que 32 julgadores indicaram a amostra do sistema A 
como a mais salgada e 16 selecionaram a amostra do sistema B como a 
mais salgada. Na Tabela 45 o analista encontra que para 48 julgamentos 
totais, no nível de significância de 0,05 para alfa, o mínimo de respostas 
para estabelecer a diferença é 32.
ANÁLISE SENSORIAL DE ALIMENTOS112
Conclusão: a amostra A é significativamente mais salgada que a 
amostra B e o sistema dosador de sal A foi selecionado para compra e 
continuação dos estudos da dosagem ideal de sal na formulação.
Intervalo de Confiança:
Pc =
c
n 
(6.1)
Pc = 32/48 = 0,67
Sc (Erro padrão de Pc) =
Pc ( 1 − Pc )
n 
(6.11)
Sc = √ 0,67 (1 – 0,67)/48 = 0,07
Conforme valores já informados em análise dos resultados para 
teste pareado bilateral, com 95% de confiança o valor de z = 1,96
Limite superior de confiança = 0,67 + 1,96 (0,07) = 0,80
Limite inferior de confiança = 0,67 − 1,96 (0,07) = 0,53
O analista pode concluir com 95% de certeza que entre 53% e 
80% dos julgadores conseguem reconhecer e selecionar a amostra A como 
a amostra mais salgada.
Exemplo 4: Teste de diferença bilateral – Balanceamento entre 
diferença e similaridade
Para o desenvolvimento de uma bebida tipo licor, observou-se 
que a adição de um espessante ao produto, além de dar mais “corpo” à 
bebida, também acentuava seu sabor característico de amêndoa. A fim 
TESTES DE DIFERENçA 113
de conhecer a influência da concentração do espessante na intensidade 
de percepção do sabor, o teste pareado foi aplicado apresentando-se as 
seguintes amostras:
 - amostra “A” = licor de amêndoas com 0,2% de carboximetilcelulose;
 - amostra “B” = licor de amêndoas com 0,4% de carboximetilcelulose.
Na ficha, a pergunta formulada ao julgador: qual é a amostra que 
apresenta sabor característico de amêndoa mais intenso?
Objetivo do teste: conhecer a influência do corpo da bebida (con-
centração do espessante) no realce ou supressão do sabor de amêndoa. 
Se não sabemos, a priori, qual amostra deveria apresentar maior 
intensidade do atributo avaliado, pois conhecemos a influência que o 
espessante exerce diretamente no corpo da bebida e não conhecemos 
o tipo de influência no sabor, devemos usar a tabela do teste pareado 
bilateral.
Número de julgadores: a expectativa é de encontrar a diferença 
de textura influenciando diretamente no sabor, pois o licor mais encor-
pado deverá permanecer mais tempo na boca e realçar o desprendimento 
de voláteis a serem percebidos via retronasal, por isso queremos ter 95% 
de certeza na diferença (erro alfa). Porém, o intervalo das concentra-
ções do espessante é desconhecido e por esse motivo precisamos ter, 
pelo menos, 90% de certeza na similaridade (erro beta). A proporção 
máxima de discriminadores poderá ser de 70%, considerando-se que a 
diferença no sabor é desejável. Com esses critérios, encontramos uma 
recomendação de 66 julgadores na Tabela 43.
Análise dos resultados: 16 julgadores escolheram a amostra A 
com sabor mais intenso e 50 julgadores indicaram a amostra B. Consul-
tando-se a Tabela 45, verificamos que precisaremos calcular o número 
mínimo de respostas para estabelecer diferença. É o número inteiro 
mais próximo de x = (n/2) + z √ n/4 para α = 0,05 o valor de z é 1,96, 
resultando em 40,96 ≈ 41.
ANÁLISE SENSORIAL DE ALIMENTOS114
Conclusão:conclui-se que existe diferença significativa na intensi-
dade percebida do “sabor característico” entre as amostras de licor com 
0,2% e 0,4% de carboximetilcelulose, com 5% de erro. Isto é, a diferença 
de 0,2% na concentração do espessante é a responsável pelo realce no 
sabor característico de amêndoas.
Exemplo 5: Teste de similaridade bilateral
Por razões econômicas, uma fábrica de laticínios deseja passar a 
produzir o requeijão cremoso com 65% de umidade; sendo que o seu 
padrão atual é de 60% de umidade e o percentual permitido pela legis-
lação é de até 65%. Porém, pretende-se que esta alteração no padrão 
de umidade final do produto não altere a firmeza do requeijão, ou seja, 
a diretoria desta empresa pretende que essa alteração mantenha para 
o consumidor o mesmo padrão de firmeza no produto. Desta forma, 
realizou-se um teste com aplicação de 0,01% de goma carragena no re-
queijão com 65% de umidade e comparou-se com o padrão atual (60% 
umidade). O teste pareado foi aplicado com a pergunta: “qual amostra 
é mais firme?”. Por causa da adição de 0,01% de goma carragena para 
compensar a possível perda de firmeza com o aumento de 5% no per-
centual de umidade, não sabemos a priori qual amostra seria a resposta 
correta, portanto trata-se de um teste pareado bilateral.
Objetivo do teste: aumentar 5% de umidade sem alterar o padrão 
de qualidade de firmeza do requeijão. Para esse fim está sendo utilizado 
um aditivo espessante.
Número de julgadores: queremos ter 95% de certeza na similari-
dade (β = 0,05) e por esse motivo também queremos evitar maior percen-
tual de discriminadores. Decidiu-se utilizar Pmax = 65% (para este teste é 
considerado um valor médio). O erro alfa não é tão preocupante neste 
caso e podemos assumir α = 0,20. A Tabela 43 recomenda 96 julgadores.
Análise dos resultados: não foi possível recrutar 96 julgadores. 
Com o resultado de análise de 80 julgadores decidiu-se realizar o cálculo 
TESTES DE DIFERENçA 115
do intervalo de confiança para saber se a similaridade já poderia ser 
demonstrada ou era necessário continuar o teste. Na Tabela 45 encon-
tramos que são necessárias 47 respostas para estabelecer diferença signi-
ficativa. Para 80 julgadores, 36 escolheram a amostra A (60% umidade) 
como mais firme e 44 escolheram a amostra B (65% umidade e adição 
de 0,01% de goma carragena) como o requeijão mais firme. Quarenta 
e quatro respostas são um valor menor que o tabelado para estabelecer 
diferença significativa (47), mas para demonstrar similaridade com nú-
mero de julgadores menor que 96, precisamos calcular o intervalo de 
confiança para teste bilateral.
Pc =
c
n 
(6.1)
Pc = 44/80 = 0,55
Sc (Erro padrão de Pc) =
Pc ( 1 − Pc )
n 
(6.11)
Sc = √ 0,55 (1 − 0,55)/n = 0,0556
Limite superior de confiança = Pc + z ∙ Sc
 
(6.13)
Limite superior de confiança = 0,55 + 1,28 ∙ 0,0556 = 0,6212
Limite inferior de confiança = Pc − z ∙ Sc
 
(6.14)
Limite inferior de confiança = 0,55 − 1,28 ∙ 0,0556 = 0,4788
O intervalo de confiança está entre 48 e 62% de discriminadores. 
O limite de confiança de 62% é menor que Pmax = 65%, então podemos 
ANÁLISE SENSORIAL DE ALIMENTOS116
finalizar os testes e concluir que as amostras de requeijão cremoso tes-
tadas são similares na textura e será possível realizar a redução de custos 
sem mudar o padrão de firmeza do requeijão.
6.2.2  Teste triangular direcional (Teste de escolha forçada entre três alternativas)
No teste triangular direcional utiliza-se sempre a amostra de maior 
intensidade como a amostra diferente entre as outras duas amostras mais 
fracas que são apresentadas codificadas aos julgadores.
Por exemplo, nós aumentamos a concentração de açúcar da nossa 
formulação e gostaríamos de saber se a nova formulação é significativa-
mente mais doce que a antiga. Nós apresentamos duas amostras da antiga 
formulação e uma da nova formulação para os julgadores. Nós pedimos 
aos julgadores para eles escolherem qual é a formulação mais doce.
A probabilidade de acerto ao acaso é de 1/3 e utilizamos a mesma 
tabela do teste triangular não direcional.
6.3 Utilização de detecção de sinal e abordagem R-Index
O principal propósito dos testes de diferença ou discriminativos é 
saber se é possível a discriminação entre dois estímulos muito similares. 
Os estímulos são suficientemente próximos, de maneira que as carac-
terísticas sensoriais podem ser confundidas. Duas amostras podem ser 
quimicamente diferentes, mas esta diferença pode não ser perceptível 
sensorialmente pela maioria dos seres humanos.
É importante descrever o processo em que um julgador é envol-
vido ao escolher entre duas amostras facilmente confundíveis. A correta 
determinação se existe ou não uma diferença sensorial significativa 
entre dois ou mais estímulos é uma questão de suma importância na se-
leção de ingredientes, redução de custos, estabilidade ou para propósitos 
TESTES DE DIFERENçA 117
de controle de qualidade. Entender a teoria básica que está por trás 
destes testes permite melhores decisões quanto à escolha do teste e do 
delineamento experimental. A teoria “Thurstoniana” (procedimento “d”, 
R-Index e Detecção do Sinal) pode nem sempre ser o método preferido, 
mas permite o entendimento dos fatores que contribuem na sensibili-
dade, confiabilidade e validade dos testes de diferença.
Os testes discriminativos podem ser divididos em: testes direcio-
nais, aqueles em que a diferença é identificada; e testes não direcionais, 
em que a diferença não é identificada.
testes direcionais
Estes testes já foram descritos no item 6.2. 
O primeiro exemplo é o teste de comparação pareada, também 
chamado teste de escolha forçada entre duas alternativas. Existem duas 
amostras A e B. O objetivo é determinar qual destas duas amostras tem 
maior intensidade de uma característica definida. Outro exemplo é o teste 
triangular de escolha forçada entre três alternativas. São apresentadas 
três amostras codificadas, por exemplo: uma mais doce e duas menos 
doce. Pergunta-se ao julgador: qual amostra é mais doce?
testes não direcionais
Quando a diferença entre as amostras não é previamente conhe-
cida ou identificada.
Estes testes foram descritos no item 6.1.
Schutz e Bleibaum (2005) apresentam, de forma didática, a in-
fluência dos fatores que contribuem para a sensibilidade, confiabilidade e 
validade dos testes de diferença. Sintetizamos esta apresentação a seguir:
ANÁLISE SENSORIAL DE ALIMENTOS118
Na Figura 15, o eixo da doçura vai da esquerda para a direita. Do 
lado esquerdo temos um biscoito não adoçado (N) e do lado direito 
temos um biscoito doce (S). Estes dois biscoitos são facilmente distin-
guíveis. Ao adicionar um pouco de açúcar ao biscoito chamado X, per-
gunta-se: este biscoito é mais doce do que N? A resposta é “talvez” ou 
“não tenho certeza” ou “eu acho que posso dizer que esta amostra é mais 
doce”. No dia seguinte esta pessoa avalia exatamente as mesmas amos-
tras, mas a resposta é que X não é mais doce que N. Esta é a região de 
incerteza e a linha pode ser desenhada em qualquer lugar.
Dizer que o biscoito é mais doce nem sempre depende dos bo-
tões gustativos, pois também é uma questão cognitiva. E isto não tem 
relação com a sua sensibilidade, mas com a sua confiança naquele dia. 
Onde você desenha a linha? A linha é chamada de critério, o seu critério 
de doçura. Se você alcança este nível de doçura, você está preparado para 
identificar todas as concentrações de doçura acima desta linha. Algumas 
vezes nós temos um critério com folga quando nós estamos desejando 
dizer que a amostra é doce. Outras vezes nós temos um critério estrito. 
O critério pode ser diferente entre as pessoas ou para a mesma pessoa ao 
longo do tempo. Nós precisamos estabilizar o critério. Neste exemplo, 
está em algum lugar entre N e X.
D Primo (d’) emodelagem thurstoniana
Por que em alguns testes as diferenças parecem ser melhor perce-
bidas do que em outros? De acordo com Schutz e Bleibaum (2005), 
existem duas questões que respondem estas variações:
1) Quão claramente a informação está alcançando o cérebro?
A adaptação pode influenciar a escolha. Quando um estímulo é 
colocado na boca e engolido, o residual fica na boca e interfere na 
próxima degustação. O sinal para o cérebro é distorcido.
TESTES DE DIFERENçA 119
Critério mais estrito
Aumento da doçura
Sem
açúcar
β β β β
Suavemente
doce
Doce
Região de incerteza
n x s
figura 15 – Região de incerteza das diferenças de doçura entre amostras
Fonte: SCHUTZ; BLEIBAUM, 2005.
2) Como o cérebro processa a informação?
O processamento no cérebro pode funcionar de maneira diferente 
para os diferentes testes. Cada vez que o sinal é enviado ao local 
de processamento da informação no cérebro, pode processar de 
maneira diferente, e para um teste pode ser melhor do que em 
relação a outro teste.
Introduzindo o conceito D Primo (d’)
a)  Para um alimento
Ao comermos o mesmo alimento várias vezes, a resposta poderia 
ser medida pelo número de impulsos por segundo do sistema nervoso 
que alcançam o centro de processamento no cérebro. Quando degus-
tamos um alimento, a resposta atual irá variar ligeiramente da próxima 
ANÁLISE SENSORIAL DE ALIMENTOS120
em que o alimento será degustado, podendo acontecer o efeito de adap-
tação ou alguns ruídos nas sinapses do sistema nervoso – pois todos os 
sinais dos estímulos que alcançam o cérebro podem ser acompanhados 
de ruídos.
Estas variações das intensidades percebidas dos sinais podem ser 
representadas como na Figura 16; esta curva é chamada distribuição 
das frequências. A maioria das vezes o sinal do estímulo irá ocorrer 
num nível médio, mas algumas vezes o sinal será percebido mais forte 
e outras vezes mais fraco.
Resposta
Resposta
figura 16 – Intensidades de resposta do estímulo para várias degustações de 
um alimento
b)  Para dois alimentos
Ao avaliarmos dois alimentos completamente diferentes, represen-
tados na Figura 17, nós podemos ver que a frequência dos sinais das 
respostas apresenta uma distribuição normal, representada pela primeira 
curva para o alimento “A” e a segunda curva para o alimento “B”. Estes 
TESTES DE DIFERENçA 121
dois alimentos não são confundíveis, e o alimento “B” sempre apresenta 
um sinal de estímulo mais intenso que o alimento “A”. Não existe sobre-
posição entre as distribuições das frequências das respostas.
Resposta
Resposta
A B
d’
figura 17 – Intensidades de resposta do estímulo para várias degustações do 
alimento “A” e do alimento “B”, não confundíveis
c)  Para testes de diferença
Em um teste de diferença existe o confundimento. O estímulo 
pode ser simples como dulçor ou complexo como o sabor de chocolate; 
pode também ser uma diferença na textura. Se dois estímulos são confun-
díveis eles se sobrepoem, como está demonstrado na Figura 18. Com-
parando-se com a Figura 17, onde as duas médias são distantes e os estí-
mulos claramente distinguíveis, na Figura 18 as médias estão próximas 
quando os estímulos são confundíveis. Portanto, a distância entre estas 
duas distribuições dá uma medida de quão diferentes estes produtos 
foram percebidos para um julgador em particular. 
ANÁLISE SENSORIAL DE ALIMENTOS122
Resposta
Resposta
figura 18 – Intensidades de resposta do estímulo para várias degustações do 
alimento “A” e do alimento “B”, quando as amostras são similares
O d’ é o número de desvios padrões pelos quais as duas distribui-
ções são separadas.
Assume-se que ambos os produtos têm o mesmo desvio padrão. 
Como o estímulo avaliado é o mesmo, assume-se que as distribuições 
serão similares.
Quando d’ é menor do que 1, significa que os dois estímulos 
podem ser confundíveis, e quando d’ é maior do que 1 será mais fácil 
distinguir os dois estímulos. O d’ = 2 apresentará uma probabilidade 
de 92% de resposta correta. O d’ = 3 dará uma probabilidade de 98% 
de resposta correta.
Quanto à variância, observamos na Figura 19 que se a distribui-
ção tiver variância maior, o d’ será menor, ou seja, suas distribuições de 
frequência terão mais sobreposição. Podemos dizer que as curvas de dis-
tribuição que estão acima (SD = 1) são de um julgador mais consistente, 
com menor variação, indicado por um d’ maior.
TESTES DE DIFERENçA 123
d’ = 2 SD = 1
d’ = 1 SD = 2
figura 19 – Quanto maior a variância, maior será a sobreposição e menor d’ 
Modelagem Thurstoniana
O modelo thurstoniano é similar ao d primo. Quando um pro-
duto é apresentado ao julgador repetidamente, o sinal ao cérebro pode 
ser medido como uma distribuição de frequência. Na maioria das vezes 
é percebido com uma intensidade média, porém algumas vezes este sinal 
pode ser percebido com intensidade mais fraca ou mais forte. Cada 
produto tem a sua distribuição de frequência.
A Figura 20 mostra as distribuições de frequências para um teste 
pareado. As curvas da esquerda demonstram o eixo da resposta e os dois 
estímulos, onde o estímulo mais fraco é analisado quando o sistema 
nervoso não está tão ativado e a resposta instantânea se encontra no 
final inferior da distribuição, identificado como amostra A. Para a dis-
tribuição da solução mais forte (amostra B) o nível instantâneo de res-
posta está no final superior da distribuição, indicando que o estímulo 
mais forte é percebido de forma evidente em relação ao estímulo mais 
ANÁLISE SENSORIAL DE ALIMENTOS124
fraco. Nas curvas da direita, a resposta da amostra A (estímulo mais 
fraco) se encontra no final superior da distribuição, num momento em 
que o sistema nervoso esteja mais reativo, e o contrário acontece para a 
amostra B (mais forte) e a resposta será errada.
A B B A
figura 20 – Diferentes  respostas  ao  estímulo  mais  fraco  (A)  e  ao  estímulo 
mais forte (B) em um teste pareado
Tabelas que medem as proporções de respostas corretas necessá-
rias para diferentes d’s foram feitas a partir de simulações com centenas 
de milhares de testes de diferença. Estas tabelas fornecem a você as 
proporções de testes corretos para um diferente d’, ou converte para um 
dado número de testes corretos os diferentes valores de d’.
Teoria da discriminação e os métodos de diferença
Vamos avaliar a situação em que nós tenhamos duas amostras com 
estímulo mais fraco (N) e uma mais forte (F). Poderia ser um teste trian-
gular não direcional (qual amostra é diferente das outras) ou um teste 
triangular direcional (qual é mais intensa – doçura, maciez, etc. – entre 
três amostras). Existe um dado d primo entre a distribuição de estímulos 
para N (mais fraca ou normal) e a distribuição de estímulos para F (mais 
TESTES DE DIFERENçA 125
forte). Quando os dois estímulos mais fracos são testados, o sistema tem 
uma atividade média. Quando o estímulo mais forte é testado, o sistema 
nervoso tem uma reatividade média um pouco acima do normal (N).
Qual é a diferença entre um teste triangular direcional e um não direcional?
Conforme representado na Figura 21, chamado de Caso (a), para 
o teste triangular não direcional (qual destas é a amostra estranha), é 
óbvio que é a proveniente da solução mais forte, mais distante das outras. 
Para o teste direcional haverá uma mais doce e duas menos doces, ou 
qualquer outro atributo. A mais forte será escolhida e a resposta estará 
correta também, neste caso.
(a) N d’ F
Não direcional ✓
Direcional ✓
figura 21 – Caso (a)
Agora vamos supor o caso (b) quando a amostra mais forte (F) foi 
avaliada, o sistema nervoso não foi muito reativo e a resposta ficou na 
parte inicial da distribuição. E quando se avaliou as duas soluções mais 
fracas, uma foi avaliada quando o sistema nervoso não foi muito reativoe ficou na parte inicial da distribuição de N e a outra amostra fraca foi 
analisada quando o sistema nervoso foi reativo e a resposta ficou na 
parte final da distribuição de N.
ANÁLISE SENSORIAL DE ALIMENTOS126
Conforme representado na Figura 22, neste caso (b), para o teste 
triangular não direcional: qual destas é a amostra estranha, nós olha-
mos para as distâncias e escolhemos a da esquerda como a estranha 
porque é a mais distante, mas é uma das amostras mais fracas e a res-
posta está errada. Para o teste direcional “qual amostra é a mais forte?”, 
a amostra que está mais à direita será a escolhida, e a resposta também 
estará errada.
(b) N NF
Não direcional
Direcional
figura 22 – Caso (b)
Supondo um terceiro caso (c), baseado na Figura 23, para o teste 
triangular não direcional “Qual é a amostra estranha ou diferente?”, a 
amostra que está na extrema esquerda será escolhida porque é a mais 
distante das outras e a resposta estará errada. No entanto, no teste dire-
cional para a pergunta “qual amostra é mais forte?”, a resposta para a 
amostra mais forte estará correta. Para exatamente os mesmos estímulos 
e as mesmas sensações, nós obtivemos diferentes respostas.
E nós temos ainda o caso reverso do (c), que é o caso (d), repre-
sentado na Figura 24. Para o teste não direcional, irá parecer que a 
amostra mais forte está mais distante que as outras duas, e a resposta 
estará correta. Para o teste direcional, nós vamos escolher a que estará 
mais à direita no eixo de intensidade, a qual é uma das fracas, e a resposta 
estará errada.
TESTES DE DIFERENçA 127
(c) N FN
Não direcional
Direcional ✓
figura 23 – Caso (c)
(d) NF N
Não direcional
Direcional
✓
figura 24 – Caso (d)
As situações apresentadas nos quatro casos irão aparecer em pro-
porções iguais ao longo das repetições. Realizando-se as simulações dos 
testes no computador 100.000 vezes com um valor d’ = 1, a situação do 
caso (a) em que ambas as respostas estarão corretas ocorrerá 37% das 
vezes e as respostas referentes ao caso (d) não ocorrerão mais do que 5% 
das vezes, comparando-se estes quatro casos.
Também encontramos tabelas que fornecem a proporção de res-
postas corretas em função de d’, comparando-se o teste triangular direcio-
nal com o não direcional (Tabela 3). A proporção de respostas corretas 
utilizando-se teste direcional é maior do que o teste não direcional.
A Tabela 4 apresenta os valores de d’ em função da proporção de 
respostas corretas. Se você alcança 33% de respostas corretas, você está 
ANÁLISE SENSORIAL DE ALIMENTOS128
trabalhando com acertos ao acaso e o valor de d’ é zero para ambos os 
testes. Se você alcança 70% de respostas corretas, o d’ será 1,24 para o 
teste triangular direcional. Nós conseguimos analisar melhor em um 
teste direcional, pois para o teste não direcional precisaremos que d’ seja 
2,50 para alcançar os mesmos 70% de respostas corretas.
tabela 3 – Proporção de respostas corretas para o teste triangular não 
direcional e direcional
Proporção de respostas corretas triangular
d primo Não direcional Direcional
0,00 33,3% 33,3%
0,43 35% 46%
0,88 40% 60%
1,00 42% 64%
1,52 51% 77%
2,03 61% 87%
tabela 4 – Valores de d’ para o teste triangular não direcional e direcional
Proporção respostas 
corretas
d primo
Não direcional Direcional
33% 0,00 0,00
40% 0,88 0,23
50% 1,47 0,56
60% 1,98 0,89
70% 2,50 1,24
80% 3,13 1,65
90% 4,03 2,23
TESTES DE DIFERENçA 129
6.4 teste de ordenação (Iso 8587: 2006)
Objetivo
Comparar diferenças entre diversas amostras com relação à inten-
sidade de um atributo específico. Este teste é utilizado para verificar se 
as amostras diferem entre si, mas não determina o grau de diferença que 
existe entre elas. É um método recomendado para:
a) Avaliação do desempenho dos julgadores;
b) Avaliação do produto:
 - pré-seleção de amostras: em critério discriminativo (diferença 
na intensidade de um atributo) ou em preferência hedônica;
 - determinação da influência dos níveis de intensidade de um pa-
râmetro (exemplo: ordem de diluição, influência das matérias-
primas, especificações de produção, embalagem ou estocagem), 
em critério discriminativo (diferença na intensidade de um 
atributo), ou determinação da influência dos níveis de intensi-
dade de um parâmetro em preferência hedônica;
 - determinação da ordem de preferência em um teste hedônico 
global.
Princípio do teste
Três ou mais amostras são apresentadas ao julgador, solicitando 
que as ordene em ordem crescente ou decrescente ao atributo sensorial 
avaliado. Ex: ordenar em ordem crescente de doçura, quatro sucos de 
maracujá com diferentes teores de açúcar. Como nos demais testes de 
diferença, a posição das amostras deve ser casualizada com relação aos 
ANÁLISE SENSORIAL DE ALIMENTOS130
julgadores. Recomenda-se que o julgador faça uma primeira análise e 
ordenação das amostras e, em seguida, teste-as novamente para verificar 
se a ordem escolhida na primeira degustação está realmente correta.
Todos os julgadores devem realizar o teste no mesmo ambiente e 
sob as mesmas condições de análise.
Amostras de referência podem ser incluídas, mas elas não serão 
identificadas dentro da série de amostras.
Um único atributo deve ser avaliado por teste.
Deve-se instruir os julgadores a evitar ordens idênticas ou em-
patadas e deve-se somente utilizá-las quando for realmente necessá-
rio. Quando o julgador não conseguir diferenciar duas ordens, deve-se 
instruí-lo a colocar uma ordem e na parte dos comentários fazer a obser-
vação sobre o empate das ordens. A norma ISO 8587: 2006 orienta 
desta maneira para que os julgadores utilizem o empate somente quando 
não se sentirem capazes de diferenciar entre as amostras. Na análise 
dos resultados deve-se considerar o empate quando este foi incluído 
nos comentários.
Equipe sensorial
O número de julgadores depende do objetivo do teste. Para aná-
lise de diferença no atributo do produto recomenda-se um mínimo de 
12 a 15 julgadores pré-selecionados e treinados. Para testes de preferên-
cia recomenda-se no mínimo 60 julgadores por segmento, isto é, grupo 
de consumidor tipificado ou público-alvo definido.
Análise dos resultados
A Tabela 5 ilustra como as ordens dos julgadores são tabuladas 
após a realização do teste. Se houver ordens empatadas, registre a média 
TESTES DE DIFERENçA 131
das ordens das amostras. Na Tabela 5 o julgador 2 colocou a mesma 
ordem para as amostras B e C. E o julgador 3 colocou a mesma ordem 
para as amostras B, C e D. Todas as linhas devem resultar na mesma 
soma total. A soma das ordens é obtida para cada amostra colocando-se 
as ordens em cada coluna.
tabela 5 – Tabulação dos resultados obtidos em teste de ordenação
julgadores
Amostras
soma das 
ordensA B C D
1 1 2 3 4 10
2 4 1,5 1,5 3 10
3 1 3 3 3 10
4 1 3 4 2 10
5 3 1 2 4 10
6 2 1 3 4 10
7 2 1 4 3 10
soma 14 12,5 20,5 23 70
Quando há empates, são necessárias correções para os testes 
não paramétricos empregados. Elas são expostas detalhadamente por 
Campos (1984).
O teste estatístico a ser escolhido depende do objetivo do teste:
 
I. determinação do desempenho individual do candidato;
II. teste de ordenação unilateral (monocaudal). Para o caso de uma 
ordem predeterminada;
III. teste de ordenação bilateral (bicaudal). Pode ser de critério discri-
minativo ou teste de preferência. Para o caso em que não exista 
uma ordem predeterminada.
ANÁLISE SENSORIAL DE ALIMENTOS132
I. Determinação do desempenho individual do candidato
Para estudar a concordância entre duas ordens, aquela realizada 
pelo candidato e a prevista pela concentração das amostras, utiliza-se o 
coeficiente de correlação de Spearman:
ρ = 1 −
6 ∑ D ²
N ( N ² − 1) 
(6.15)
onde ρ (rho) é uma medida