Prévia do material em texto
5 Métodos sensoriais Segundo Lawless e Claasen (1993), a escolha de um método de análise sensorial para desenvolvimento de produto está baseada na res- posta a pelo menos uma de três questões fundamentais: I. O produto é aceito pelos consumidores? II. Existe diferença perceptível entre o produto em estudo e algum produto convencional similar? (Dois produtos podem ser diferen- tes, mas igualmente aceitos) III. Quais os principais pontos de diferença? (Que qualidades senso- riais estão presentes? Quais as suas intensidades?) As respostas a essas três questões gerais permitem classificar os métodos sensoriais em testes de aceitação, chamados testes subjetivos ou afetivos, para resolução da primeira pergunta; testes discriminativos (ou de diferença) para a segunda; e análises descritivas, para a terceira. 5.1 Classificação A NBR 12994 de julho 1993 apresenta a seguinte classificação dos métodos de análise sensorial: 5 ANÁLISE SENSORIAL DE ALIMENTOS74 a) Métodos discriminativos Métodos que estabelecem diferenciação qualitativa e/ou quanti- tativa entre as amostras. Testes de diferença: - comparação pareada; - triangular; - duo-trio; - comparação múltipla; - ordenação; - A ou Não-A; - dois em cinco. Testes de sensibilidade: - limites; - estímulo constante; - diluição. b) Métodos descritivos Métodos que descrevem qualitativa e quantitativamente as amostras: - avaliação de atributos - escalas; - perfil de sabor; - perfil de textura; - ADQ - análise descritiva quantitativa; - tempo-intensidade. MéTODOS SENSORIAIS 75 c) Métodos subjetivos Métodos que expressam opinião pessoal do julgador: - comparação pareada; - ordenação; - escala hedônica; - escala de atitude. 6 Testes de diferença Indicam se existe ou não diferença entre as amostras e podem ser classificados em testes de diferença e testes de similaridade. Em um teste de diferença, a tarefa é encontrar a resposta se existe diferença sensorial significativa entre duas amostras. Em um teste de simi- laridade, entretanto, a tarefa é demonstrar que não existe diferença signi- ficativa entre duas amostras, que elas são “similares”. Este é um cenário com que a indústria se depara em diversas situações – por exemplo, quando um produto é reformulado com um novo ingrediente ou fornecedor, ou houve uma alteração no processo industrial e o fabricante quer se asse- gurar de que o produto mantenha o mesmo padrão sensorial original. Os testes/protocolos são os mesmos para um teste de diferença ou de similaridade, porém o delineamento (particularmente o número de julgadores envolvidos) e a análise estatística serão diferentes. Para entender as diferenças entre estas duas situações, os testes de diferença e testes de similaridade, nós precisamos entender o teste de hipótese e os riscos de erros do tipo I e do tipo II. teste de hipótese Todas as técnicas multivariadas, exceto análise de agrupamentos e escalonamento multidimensional, são baseadas na inferência estatística 6 ANÁLISE SENSORIAL DE ALIMENTOS78 dos valores ou relações de uma população entre variáveis de uma amostra aleatória extraída daquela população. Se conduzimos um censo da popu- lação inteira, então a inferência estatística é desnecessária, pois qualquer diferença ou relação, não importa quão pequena, é “verdadeira” e existe. Entretanto, raramente um censo é realizado; logo, o pesquisador é obri- gado a fazer inferências a partir de uma amostra (HAIR et al., 2005). Interpretar inferências estatísticas requer que o pesquisador espe- cifique os níveis de erro estatístico aceitáveis. Conceituando: Teste de hipótese é o procedimento diante de informações obti- das de amostras que permite aceitar ou rejeitar hipóteses, demons- trado no Gráfico 1. Frequentemente precisamos tomar decisões sobre populações, com base em informações de amostras das mesmas. Estas decisões envolvem riscos de erros do tipo I e II, conforme indicado no Quadro 2. Hipótese nula H0 : µA = µB Hipótese alternativa H1 : µA > µB hipótese monocaudal ou unilateral µA < µB hipótese monocaudal ou unilateral µA ≠ µB hipótese bicaudal ou bilateral Distribuição F: função (nível de erro, grau de liberdade da amos- tra, grau de liberdade do resíduo) (Gráfico 1). O erro tipo I é a probabilidade de rejeitar a hipótese nula (a hipó- tese de que não existe diferença entre as amostras) quando ela é verda- deira. Isto significa que duas amostras similares são consideradas dife- rentes quando elas, na realidade, não são. O risco de erro do tipo I é chamado de erro alfa e a maioria dos procedimentos estatísticos objetivam TESTES DE DIFERENçA 79 minimizá-lo. Este é o tipo de erro que nós queremos minimizar na si- tuação do teste de diferença. f (F) 0 Fc RA Ho RR Ho F α = 5% p < 0,05 Fo gráfico 1 – Distribuição de F em função do nível de erro, grau de liberdade da amostra e grau de liberdade do resíduo - Região de Aceitação de H0 (RA); - Região de Rejeição de H0 (RR); - FC = fator F crítico ou limite; - F0 = fator F calculado; - Erro tipo I (a); - Erro tipo II (b). “Realidade” H0 verdadeiro H0 falso Correto Erro II Aceitar H0 “Decisão” Erro I Correto Rejeitar H0 quadro 2 – Probabilidade e tipos de erros ANÁLISE SENSORIAL DE ALIMENTOS80 O erro tipo II é a probabilidade de não rejeitarmos a hipótese nula quando ela é falsa. Isto significa que duas amostras que são dife- rentes são consideradas similares, quando elas não são similares. O erro do tipo II é chamado beta. Este é o tipo de erro que nós queremos minimizar na situação do teste de similaridade. O erro beta é o risco de não encontrarmos a diferença quando na realidade ela existe. Portanto, nós iremos focar em minimizar alfa (α) ou beta(β), de- pendendo da situação do teste, se este é de diferença ou de similaridade. A potência (ou o poder) de um teste A potência (também chamada de poder) de um teste é definido como P = 1 – β, ou seja, é a probabilidade de fazer a decisão correta quando duas amostras são perceptivelmente diferentes. A potência P é dependente da magnitude da diferença entre as duas amostras, do tamanho de alfa e do número de julgadores. A relação das diferentes probabilidades de erro na situação hi- potética de teste para a diferença entre duas médias, já apresentada no Quadro 2, é reapresentada no Quadro 3 para entendermos que os erros tipo I e II são inversamente relacionados e, à medida que o erro tipo I se torna mais restritivo (se aproxima de zero), o erro tipo II aumenta. Realidade H0: sem diferença H1: com diferença Decisão estatística H0: sem diferença 1 – α β (Erro tipo II) H1: com diferença α (Erro tipo I) 1 – β (Potência do teste) quadro 3 – Relação das diferentes probabilidades de erro TESTES DE DIFERENçA 81 Assim o pesquisador deve jogar com o equilíbrio entre o nível alfa e a potência do teste. O número de julgadores requeridos para um teste de diferença não é crítico como para um teste de similaridade. Vejamos por quê. Se você quer demonstrar que uma nova formulação é mais macia que a velha, por exemplo, você pode usar um teste de diferença com o objetivo de minimizar alfa. O erro do tipo I é minimizado neste caso porque os analistas sensoriais querem ter a certeza de que a amostra nova é diferente da velha; portanto, o poder do teste não é crítico. Quando o objetivo do teste é que a diferença não seja perceptí- vel, nós queremos minimizar o erro beta. Este erro é o de decidirmos incorretamente que as amostras são similares, quando na realidade elas são diferentes. A potência (1 – β) é crítica e deve ser maximizada, o que significa que o número de julgadores deverá ser suficientemente grande para este fim. Outra distinção entre os testes de diferençae similaridade é que nos testes de diferença, quando nós utilizamos estatística binomial para desenvolver as tabelas que determinam o número mínimo de respostas corretas para estabelecer diferença, nós testamos contra as chances de acerto ao acaso. Em testes de similaridade, nós iremos testar contra algum nível mais alto de proporção esperada de respostas corretas e ver se nós estamos significativamente abaixo desse, a fim de chegarmos à conclusão de que as duas amostras são similares. Nós chamamos isto de proporção de discriminação permitida. Como nós descobrimos qual é a proporção que deveria ser? Nós podemos optar por uma situação conservadora, na qual nós permitimos apenas 10% de julgadores dis- criminadores, ou ter uma situação menos crítica e permitir 30% de julgadores discriminadores. ANÁLISE SENSORIAL DE ALIMENTOS82 tipos gerais de testes de diferença A tendência dominante dos testes de diferença são: - testes de diferença geral: quando a natureza da diferença é desco- nhecida (não direcional); - testes de diferença de atributos: quando nós sabemos qual(is) atributo(s) deve(m) ser diferente(s) (direcional). Os testes alternativos são: - o uso de detecção de sinal e a abordagem R-index; - ordenação e escalas. 6.1 testes de diferença geral (não direcional) Para diferenças nos produtos resultantes de mudanças nos ingre- dientes, processamento, embalagem ou estocagem. Quando não sabemos quais atributos específicos podem ser afetados. 6.1.1 Teste triangular (ASTM E1885 – 04) Objetivo Verificar se existe diferença significativa entre duas amostras que so- freram tratamentos diferentes. Ex: verificar se mudanças de ingredientes, processamento, embalagem ou estocagem acarretaram alterações senso- riais no produto. Serve para detectar pequenas diferenças e por esse motivo tem sido utilizado preliminarmente a outros testes, porque não avalia o grau da diferença, nem caracteriza os atributos responsáveis pela diferença. TESTES DE DIFERENçA 83 Princípio do teste Cada julgador recebe três amostras codificadas e é informado que duas amostras são iguais e uma é diferente. Em seguida, é solicitado ao julgador provar as amostras da esquerda para a direita e identificar a diferente. A probabilidade de acerto ao acaso é de 1/3, considerando-se a técnica de escolha forçada. As amostras devem ser servidas em todas as combinações possíveis: A A B/A B A/B A A/B B A/B A B/A B B. Desta forma, a fonte de variação estatística dada pela influência que a ordem de apresentação das amostras exerce sobre o julgador é minimizada porque os julgadores recebem as amostras em posições di- ferentes e a amostra diferente pode ser dada pelo tratamento “A” ou “B”. O modelo da ficha é apresentado na Figura 12, observando-se que, por se tratar de um teste rápido, objetivo e de pouca fadiga, normal- mente se aproveita a mesma sessão do julgador para aplicar-se dois ou três grupos de testes independentes. Julgador: Data: tEstE tRIANgUlAR Em cada grupo de amostras apresentadas, duas são iguais e uma é diferente. Deguste cuidadosamente cada uma das amostras, na ordem em que estão sendo apresentadas, e faça um círculo em volta da amostra diferente. Grupo Código da amostra I 928 479 110 II 171 036 245 III 352 563 684 Comentários: figura 12 – Modelo de ficha para aplicação do teste triangular ANÁLISE SENSORIAL DE ALIMENTOS84 Equipe de julgadores Os julgadores devem ser familiarizados com o formato e o procedi- mento desta análise. Experiência e familiariedade com o produto podem aumentar a probabilidade de encontrar-se diferença significativa. Esco- lha os julgadores de acordo com os objetivos do teste, por exemplo, para projetar resultados para uma população de consumidores, julgadores com sensibilidade desconhecida podem ser selecionados. Para análise da qualidade do produto, julgadores com acuidade sensorial devem ser selecionados. Nunca se deve misturar diferentes tipos de julgadores numa mesma análise. A decisão de treinar ou não os julgadores deve ser discutida antes da realização do teste. Número de julgadores Escolha o número de julgadores de acordo com o nível de sensi- bilidade requerida a fim de atingir os objetivos do teste. A sensibilidade de um teste é função de três valores: o risco α, o risco β e a proporção máxima permitida de discriminadores (Pd). Em linhas gerais: - Para o risco α – Um resultado com significância estatística: 10 a 5% (0,10 a 0,05) indica leve evidência de que as amostras diferem 5 a 1% (0,05 a 0,01) indica moderada evidência de que as amos- tras diferem 1 a 0,1% (0,01 a 0,001) indica forte evidência de que as amostras diferem Abaixo de 0,1% (< 0,001) indica uma evidência muito forte que as amostras diferem TESTES DE DIFERENçA 85 - Para o risco β – As forças das evidências para que a diferença entre as amostras não exista segue o mesmo critério do risco α - Para a proporção máxima permitida de discriminadores (Pd), te- mos 3 faixas: Pd < 25% representa um valor pequeno 25% < Pd < 35% representa um valor médio Pd > 35% representa um valor grande Após a definição da sensibilidade requerida para o teste, utiliza-se a Tabela 37, Anexo A para determinar o número de julgadores neces- sários. O número de julgadores é maior quando o objetivo do teste é demonstrar que os produtos são similares. Análise dos resultados Os números de respostas corretas necessárias para estabelecer dife- renças significativas são encontrados no Anexo B, Tabela 38. Se o número de respostas corretas é maior ou igual ao valor tabelado, conclui-se que existe diferença significativa entre as amostras. Se o número de respostas corretas é menor que o valor tabelado, conclui-se que as amostras são suficientemente similares. Estas conclusões estão baseadas nos riscos que foram aceitos quando a sensibilidade do teste foi pré-estabelecida. Pode-se calcular o intervalo de confiança da proporção da popu- lação que pode perceber a diferença entre as amostras. Este cálculo está demonstrado no exemplo 3. Exemplo 1: Teste de diferença O aditivo Esterlac® (estearoil 2 lactil lactato de sódio) foi aplicado ao macarrão espaguete com o objetivo de melhorar a textura al dente. ANÁLISE SENSORIAL DE ALIMENTOS86 Utilizou-se o teste triangular não direcional porque não é possível de- finir a textura al dente por meio de um único atributo, pois se trata da combinação de atributos primários e secundários de textura. Portanto, avaliar a intensidade de apenas um atributo não seria recomendado, por desconhecerem-se as correlações. Considerou-se ainda o fato deste aditivo não alterar o sabor dos alimentos nas dosagens utilizadas, isto é, a diferença do produto estaria relacionada à textura, apesar de des- conhecermos a relação dos atributos primários envolvidos. As amostras testadas foram: - amostra “A” = espaguete normal (padrão atual); - amostra “B” = espaguete com aditivo Esterlac®. Obedecendo o delineamento sugerido para o teste triangular, utilizaram-se os códigos 397 e 240 para a amostra “A” e os códigos 561 e 884 para a amostra “B”, sendo que os julgadores receberam as fichas na seguinte sequência: Ficha n. 1: 397 - 561 - 240 (A B A) Ficha n. 2: 561 - 397 - 884 (B A B) Ficha n. 3: 397 - 240 - 884 (A A B) Ficha n. 4: 561 - 884 - 240 (B B A) Ficha n. 5: 884 - 240 - 397 (B A A) FIcha n. 6: 240 - 561 - 884 (A B B) Número de julgadores: a proposta é proteger-se de concluir fal- samente que a diferença exista, por isso α = 0,05 foi escolhido. Também escolheu-se Pd = 40% e β = 0,20. Quer se ter 95% de certeza de que não mais do que 40% da população vai deixar de perceber que a dife- rença existe. Consultando-se o Anexo A – Tabela 37 encontra-se que o mínimo de 23 julgadores é recomendado para o teste. TESTES DE DIFERENçA 87Resultados: foram obtidas 16 respostas corretas. Consultando-se o Anexo B – Tabela 38, na linha correspondente a 23 julgadores e na coluna de α = 0,05 encontra-se que 12 respostas corretas é o suficiente para concluir-se que os dois espaguetes são diferentes, nas condições escolhidas para o teste (Pd = 40%, α = 0,05, β = 0,20). Desta forma, este estudo não termina aqui porque se este produto já tem um padrão de identidade no mercado, será imprescindível reali- zar um teste de preferência com os consumidores. Este resultado indica que as amostras diferem significativamente e que esta diferença será percebida pelos consumidores, mas ainda é preciso certificar-se se esta melhoria será realmente preferida pelos consumidores deste produto. Exemplo 2: Teste de diferença Uma cervejaria desenvolveu um processo para reduzir o sabor in- desejável do cereal cru que ocorre em uma cerveja não alcóolica. Foi necessário investir em um novo equipamento. Antes da realização de um teste de preferência com os consumidores, o pesquisador quer con- firmar que a cerveja experimental é diferente da atual. Número de julgadores: a proposta é proteger-se de concluir fal- samente que a diferença exista, por isso α = 0,05 foi escolhido. Também escolheu-se Pd = 50% e β = 0,20. Consultando-se o Anexo A – Tabela 37 encontra-se que o mínimo de 16 julgadores é recomendado para o teste. Com o objetivo de utilizar uma ordem de apresentação balanceada, o analista decidiu utilizar 18 julgadores. Resultados: foram obtidas 10 respostas corretas. Consultando-se o Anexo B – Tabela 38, na linha correspondente a 18 julgadores e na coluna de α = 0,05 encontra-se que 10 respostas corretas é o suficiente para concluir-se que as duas cervejas são diferentes, nas condições esco- lhidas para o teste (Pd = 50%, α = 0,05, β = 0,20). Deve-se prosseguir com a análise de preferência com os consumidores. ANÁLISE SENSORIAL DE ALIMENTOS88 Exemplo 3: Teste de similaridade O teste triangular foi aplicado para avaliar as seguintes amostras, fabricadas no mesmo dia, sob as mesmas condições: - amostra “A” = macarrão talharim com 100% de farinha de trigo especial; - amostra “B” = macarrão talharim com 93% de farinha de trigo especial + 7% de creme de milho (fubá bem fino). O objetivo desta análise era verificar se as amostras eram similares, pois não se deseja alterar o padrão de qualidade sensorial. Porém, deseja- se a redução de custos do produto e a introdução dos benefícios nutri- cionais e também social que as farinhas mistas trazem. Número de julgadores: quer se ter 95% de certeza de que não mais do que 20% da população poderá detectar esta diferença. O que significa β = 0,05 e Pd = 20%. Também foi escolhido α = 0,20. Con- sultando-se o Anexo A – Tabela 37 encontra-se que o mínimo de 86 julgadores é recomendado para o teste. Resultados: foram obtidas 30 respostas corretas. Consultando-se o Anexo B – Tabela 38, é necessário interpolar entre os valores cor- respondentes a 84 e 90 julgadores, conforme recomendações em nota na Tabela, encontrando-se que para 86 julgadores são necessárias 34 respostas corretas para que as amostras sejam consideradas diferentes nas condições especificadas (Pd= 20%, α = 0,20, β = 0,05). Conclui-se que as amostras não diferem e, nas condições em que este talharim foi fabricado, é possível utilizar 7% de creme de milho sem alterar percep- tivelmente a qualidade sensorial do produto. Cálculo do intervalo de confiança: Pc = proporção de respostas corretas TESTES DE DIFERENçA 89 c = número de respostas corretas n = número total de julgadores Pd = proporção de discriminadores Pc = c n (6.1) Pc = 30 / 86 = 0,35 Pd = 1,5 Pc − 0,5 (6.2) Pd = 1,5 Pc − 0,5 = 0,025 Sd (desvio padrão de Pd) = 1,5 Pc ( 1 − Pc ) n (6.3) Limite superior de confiança = Pd + zβ ∙ Sd (6.4) Limite inferior de confiança = Pd − zα ∙ Sd (6.5) zα e zβ são valores críticos da distribuição normal padrão. Para um intervalo de confiança de 80%, z = 0,84; para um intervalo de confiança de 90%, z = 1,28; para um intervalo de confiança de 95%, z = 1,64 e para um intervalo de confiança de 99%, z = 2,33 Substituindo-se: ANÁLISE SENSORIAL DE ALIMENTOS90 Sd = 1,5 √ 0,35 (1 − 0,35) / 86 Sd = 0,05 Limite superior de confiança = 0,025 + 1,64 ∙ (0,05) = 0,107 Limite inferior de confiança = 0,025 − 0,84 (0,05) = − 0,017 O analista pode ter 95% de certeza de que a proporção da po- pulação que será capaz de perceber a diferença entre os espaguetes está entre - 1,7% e 10,7%, ainda sob condições de análise sensorial compa- rativa, o que não ocorre nas condições de consumo normal. O limite in- ferior não pode ser negativo, portanto o intervalo de 95% de confiança é de 0% a 10,7%. Este valor está bem abaixo da linha de corte utilizada no teste, que foi de 20%. Exemplo 4: Balanceamento dos riscos dos erros de diferença e de similaridade O teste triangular foi aplicado para avaliar a seguinte diferença entre as amostras armazenadas em temperatura ambiente (Curitiba, PR), as quais foram produzidas e embaladas no mesmo dia, sob as mesmas condições de processamento: - amostra “A” = coco ralado com antioxidante BHT; - amostra “B” = coco ralado sem antioxidante. Deseja-se que as amostras não apresentem diferença significativa ao longo de 60 dias de prateleira, para não ser necessária a utilização do aditivo. Por outro lado, sabe-se que o coco ralado é uma amostra muito suscetível à oxidação e consequente rancificação. Sabe-se também que sua comercialização não se viabiliza com menos de 45 dias. Neste caso, é preciso balancear os riscos de diferença e similaridade. Em um pri- meiro momento, desejou-se α = 0,05 e β = 0,05 para uma proporção TESTES DE DIFERENçA 91 máxima de 20% de discriminadores, porém, consultando-se o Anexo A – Tabela 37, o número de julgadores necessários é de 147 e o laborató- rio contava com 50 julgadores selecionados. O analista sensorial infor- mou à equipe de desenvolvimento que, para conseguir este número de julgadores, iria requerer mais tempo e dinheiro. A equipe se reuniu e discutiu os diversos aspectos, consideraram a experiência que tinham em relação à embalagem quanto à qualidade da barreira ao oxigênio. Consultando o Anexo A – Tabela 37, determinaram que Pd = 30%, α = 0,10, β = 0,10 e n ≥ 43 forneceria sensibilidade suficiente, em função do número de julgadores disponível. O analista preparou para 48 julga- dores para obter a ordem balanceada de apresentação. I. A primeira análise ocorreu aos 30 dias de estocagem. Participaram desta análise 48 julgadores e 18 acertaram a resposta. Consultando-se o Anexo B – Tabela 38, o número mínimo de respostas corretas para estabelecer diferença entre as amostras é de 21. As amostras não diferem nas condições estabelecidas para o teste. Conclui-se que, para 30 dias de vida de prateleira, o anti- oxidante não é necessário. II. A segunda análise ocorreu aos 45 dias. Participaram desta análise 46 julgadores e 17 acertaram a resposta. Consultando-se o Anexo B – Tabela 38, o número mínimo de respostas corretas para estabelecer diferença entre as amostras é de 20. As amostras não diferem nas condições estabelecidas para o teste. Conclui-se que para 45 dias de vida de prateleira o antioxi- dante não é necessário. III. A terceira análise ocorreu aos 60 dias. Participaram desta análise 48 julgadores e 29 acertaram a resposta. Consultando-se o Anexo B – Tabela 38, o número mínimo de res- postas corretas para estabelecer diferença entre as amostras é de 21. As amostras diferem entre si nas condições estabelecidas para o teste. Conclui-se que para 60 dias o antioxidante é necessário. ANÁLISE SENSORIAL DE ALIMENTOS92 Deve-se caracterizar essa diferença por meio de um teste sensorial descritivo. Se a amostra com antioxidanteestiver com a qualidade sen- sorial esperada, deve-se considerar os ganhos financeiros com 15 dias a mais de vida de prateleira com a utilização do antioxidante versus a possibilidade de não se utilizar o aditivo e determinar 45 dias de vida de prateleira ao produto. Exercício 1: Para determinar a diferença de sabor entre a composição de va- riedades de café, aplicamos o teste triangular, utilizando as seguintes amostras: - amostra “A”: xícara de café com 96% de variedade arábica prove- niente de São Paulo (lote n. 102) e 4% de robusta; - amostra “B”: xícara de café com 92% de variedade arábica pro- veniente de São Paulo (lote n. 102) + 4% de variedade conilon e 4% de robusta. As condições de torração são idênticas e efetuadas no mesmo dia. O objetivo é o barateamento de custos, pois a variedade conilon é mais barata, porém com sabor característico bem mais suave. Os critérios utilizados foram de probabilidade máxima de erro de 5%, tolerando-se que até 30% da população possa detectar esta diferença. Para o erro de concluir que as amostras diferem quando na realidade elas não diferem estabeleceu-se 0,10. A análise foi desenvolvida por 60 julgadores selecionados e treinados e o número total de julgamentos corretos obtidos foi igual a 24. Pede-se: 1) O número de julgadores está adequado para os critérios do teste? TESTES DE DIFERENçA 93 2) Qual o resultado do teste e o que podemos concluir com este resultado? 3) Calcule o intervalo de confiança da proporção da população que pode perceber a diferença. Exercício 2: Um fabricante de confeitos quer se certificar de que a substituição para um novo material de embalagem nos doces não irá alterar signifi- cativamente a qualidade sensorial do produto após três meses de estoca- gem. O fabricante sabe que é impossível provar que dois produtos são idênticos, mas quer se assegurar que apenas uma pequena proporção da população consiga detectar que existe diferença. Por outro lado, o fabri- cante não se preocupa com a conlusão falsa (erro) de que os produtos são diferentes quando na realidade eles não são, porque a embalagem atual é aceitável e a nova somente está sendo considerada com o propósito de oferecer maior flexibilidade à impressão gráfica da rotulagem. Objetivo: determinar se os doces estocados por três meses com a nova embalagem são semelhantes aos doces estocados por três meses com a embalagem atual. O fabricante quer ter 95% de certeza de que não mais do que 30% da população consiga perceber a diferença entre as amostras. Por outro lado, por causa da aceitabilidade da embalagem atual, como já explicado, o fabricante aceita um risco α = 0,20. Resultados: 14 dos 39 julgadores identificaram corretamente qual era a amostra diferente. Pede-se: 1) O número de julgadores está adequado para os critérios do teste? 2) Qual o resultado do teste e o que podemos concluir com este resultado? 3) Calcule o intervalo de confiança da proporção da população que pode perceber a diferença. ANÁLISE SENSORIAL DE ALIMENTOS94 6.1.2 Teste duo-trio (ASTM E2610 – 08) Objetivo Como no teste triangular, verificar se existe diferença significativa entre duas amostras que receberam tratamentos diferentes. Princípio do teste Três amostras são apresentadas ao julgador. Uma padrão e duas codificadas. Uma das codificadas é igual ao padrão e a outra é diferente. Pede-se ao julgador para identificar a amostra igual ao padrão. A proba- bilidade de acertar ao acaso é de 1/2, considerando-se técnica de escolha forçada. As amostras devem ser servidas em todas as posições possíveis: P = A A B B A A B B A P = A P = B P = B Equipe de julgadores As recomendações para os julgadores são iguais às do teste triangular. Número de julgadores Escolha o número de julgadores de acordo com o nível de sensi- bilidade requerida a fim de atingir os objetivos do teste. A sensibilidade TESTES DE DIFERENçA 95 de um teste é função de três valores: o risco α, o risco β e a proporção máxima permitida de discriminadores (Pd). Seguem os mesmos critérios descritos para o teste triangular. Após a definição da sensibilidade requerida para o teste, utiliza-se o Anexo C – Tabela 39 para determinar o número de julgadores neces- sários. O número de julgadores é maior quando o objetivo do teste é demonstrar que os produtos são similares. Análise dos resultados Os números de respostas corretas necessárias para estabelecer di- ferenças significativas são encontrados no Anexo D, Tabela 40. Se o número de respostas corretas é maior ou igual ao valor tabelado, con- clui-se que existe diferença significativa entre as amostras. Se o número de respostas corretas é menor que o valor tabelado, conclui-se que as amostras são suficientemente similares. Estas conclusões estão ba- seadas nos riscos que foram aceitos quando a sensibilidade do teste foi preestabelecida. Pode-se calcular o intervalo de confiança da proporção da popula- ção que pode perceber a diferença entre as amostras. Veja como calcular seguindo o exemplo 2. Observações - o teste duo-trio é mais simples para o julgador, uma vez que é mais fácil procurar a amostra solicitada do que no teste triangular. Porém, o teste duo-trio é menos eficiente estatisticamente do que o triangular, porque a probabilidade de acertar ao acaso é de 1/2, em vez de 1/3, como no triangular; ANÁLISE SENSORIAL DE ALIMENTOS96 - tal qual o teste triangular, o teste duo-trio só verifica se as amos- tras testadas são diferentes, não avaliando qual é a diferença ou se a diferença é grande ou pequena. Exemplo 1: Um fornecedor de equipamentos argumenta que seu novo equi- pamento que aromatiza o interior da caixa do lenço umedecido facial é superior à tecnologia atual que aromatiza diretamente o lenço. O quí- mico deseja confirmar este argumento antes de realizar um teste com o equipamento. Objetivo do teste: determinar se os dois métodos de aromatiza- ção produzem alguma diferença na percepção da fragrância dos lenços após eles terem sido estocados no período de três meses. Número de julgadores: para proteger o químico de concluir falsamente que existe diferença quando esta diferença na realidade não existe, o analista sensorial propõe α = 0,05. Para manter o nú- mero de julgadores num tamanho razoável, sugeriu-se Pd = 40%, com β = 0,20. Consultando-se o Anexo C – Tabela 39 encontra-se que o mínimo de 37 julgadores é necessário para o teste. Com o objetivo de balan- ceamento da ordem de apresentação das amostras, o analista decidiu utilizar 40 julgadores. Procedimento do teste: suficientes quantidades de produtos são preparadas com ambas as tecnologias e os produtos são armazenados, sob as mesmas condições, por um período de três meses. Sessenta amos- tras de lenço “A” com a fragrância aplicada diretamente sobre o lenço umedecido e 60 amostras de lenço “B” com a fragrância aplicada dentro das caixas dos lenços foram preparadas para o teste. Dez repetições das quatro possibilidades de ordem de apresentação das amostras são utili- zadas: ArAB, ArBA, BrAB e BrBA. TESTES DE DIFERENçA 97 O teste é conduzido com 40 julgadores que possuem experiência na avaliação de odores. Os lenços são pegos a partir do centro da caixa, cada lenço é colocado em uma jarra de vidro selada, uma hora antes da análise. Esse procedimento permite que a fragrância migre para o headspace e o uso dos recipientes fechados reduz a contaminação no ambiente das cabines. A Figura 13 mostra o modelo de ficha utilizado. Análise dos resultados: somente 21 de 40 julgadores consegui- ram acertar as respostas. De acordo com o Anexo D – Tabela 40, são necessárias 26 respostas corretas para o risco de 5% do erro alfa (tipo I). Portanto, não se atingiu o número de respostas corretas necessárias para estabelecer diferença.Isto indica que a qualidade ou a quantidade, ou ambas, das duas fragrâncias nos lenços faciais não diferem entre si, nas condições estudadas. Julgador n.: Nome: Data: Tipo de amostra: Instruções: 1. Aspire cada amostra, iniciando pela amostra Referência. Remova a tampa por um período breve e inale através de aspirações curtas e sequenciais 2. Depois avalie as amostras codificadas da esquerda para a direita. Determine qual das duas amostras codificadas é igual à Referência. 3. Indique a amostra colocando um X no quadrado correspondente. Se você não perceber qual amostra é igual à Referência, deve escolher a amostra por adivinhação. REFERÊNCIA Código: Código: Comentários: figura 13 – Ficha utilizada no teste duo trio para o lenço facial Lenço facial dentro de um jarro de vidro ANÁLISE SENSORIAL DE ALIMENTOS98 Exemplo 2: Um fabricante de cervejas deve decidir entre dois fornecedores de latas. Sendo “A” o fornecedor regular já há alguns anos e “B” o novo fornecedor, que argumenta algumas vantagens na manutenção da qua- lidade sensorial durante a vida de prateleira. O fabricante de cervejas considera importante balancear entre o risco de introduzir uma mu- dança não desejada em sua cerveja e o de não aproveitar a oportunidade oferecida de aumentar a vida de prateleira de seu produto. Objetivo do teste: determinar se alguma diferença sensorial pode ser percebida entre duas cervejas após oito semanas de estocagem à tem- peratura ambiente. Número de julgadores: o fabricante tem observado pelo tempo de experiência que Pd = 30% é seguro para assumir que nenhuma diferença é perceptível. Ele está ligeiramente mais preocupado com a introdução de uma diferença não desejável do que perder a oportuni- dade de aumentar a vida de prateleira do produto. Então ele decidiu fixar o risco de erro β = 0,05 e o risco de erro α = 0,10. Utilizando-se o Anexo C – Tabela 39, temos que 96 julgadores são requeridos para este teste. Análise dos resultados: foram obtidas 57 respostas corretas de 96 julgamentos totais. Extraindo-se do Anexo D – Tabela 40 que o nú- mero de respostas corretas para estabelecer diferença significatica para α = 0,10 e 96 julgadores é 55. Portanto, a diferença é significativa e as amostras devem ser submetidas a um teste de preferência com consu- midores e/ou uma análise descritiva. Cálculo do intervalo de confiança: Pc (proporção de respostas corretas) = c (número de respostas corretas) n (número de julgadores) (6.1) TESTES DE DIFERENçA 99 Pd (proporção de discriminadores) = 2 Pc − 1 (6.6) Sd (desvio padrão de Pd) = 2 Pc ( 1 − Pc ) n (6.7) Limite superior de confiança = Pd + zβ ∙ Sd (6.4) Limite inferior de confiança = Pd − zα ∙ Sd (6.5) Para intervalos de confiança monocaudal de 90% z = 1,28 95% z = 1,64 99% z = 2,33 c = 57, n = 96, α = 0,10 e β = 0,05 Substituindo-se: Pc = 57 / 96 = 0,59375 Pd = 2 (0,59375) − 1 = 0,1875 Sd = 2 √ 0,59375 (0,40625) / 96 = 0,10025 Limite superior de confiança = 0,1875 + 1,64 (0,10025) = 0,352 Limite inferior de confiança = 0,1875 − 1,28 (0,10025) = 0,059 Fazendo-se as considerações separadas, podemos dizer com 90% de confiança que pelo menos 5,9% dos julgadores podem distinguir a cerveja da nova lata em relação à cerveja da lata atual. Também pode- mos dizer com 95% de confiança que a proporção de discriminadores pode chegar a 35,2%. Os dois limites suportam a conclusão de que existe diferença significativa entre as duas cervejas e o limite superior está acima do corte de 30% proposto. Portanto, precisa-se realizar um ANÁLISE SENSORIAL DE ALIMENTOS100 teste descritivo ou um teste de preferência com o consumidor para po- dermos concluir se esta diferença é para melhor ou para pior. 6.1.3 Teste “A” ou “NÃO A” (NBR 13171/1994) Objetivo Deve ser aplicado para avaliar amostras que apresentem variações de aparência ou de gosto remanescente. Deve ser usado quando os testes duo-trio e triangular não são aplicáveis. Esse teste apresenta como vanta- gem admitir pequenas diferenças no mesmo tipo de amostra e apresenta como desvantagem a fadiga sensorial. Princípio do teste Uma série de amostras provenientes de dois produtos (“A” ou “Não A”) é apresentada para identificação das amostras “A”. Procedimento Ao julgador deve ser apresentada a amostra referência “A”, várias vezes, antes do teste, até que ele possa reconhecê-la. Em seguida, amostras devem ser fornecidas aleatoriamente, podendo ser “A” ou “Não A”, para identi- ficação das amostras “A”. O modelo da ficha é apresentado na Figura 14. Equipe de julgadores O mínimo recomendado deve ser de 20 julgadores selecionados. TESTES DE DIFERENçA 101 Nome: Data: tEstE “A” oU “Não A” Após familiarizar-se com a amostra “A”, prove cuidadosamente da esquerda para a direita as amostras codificadas, a fim de avaliar, testar e identificar as amostras como sendo “A” ou “Não A”. n. da amostra “A” “Não A” Comentários: figura 14 – Modelo de ficha para aplicação do teste “A” ou “Não A” Análise dos resultados Os resultados devem ser analisados utilizando a distribuição qui- quadrada, conforme Tabela 41, Anexo E, observando-se o exemplo a seguir. Exemplo: Um profissional de desenvolvimento de produtos está pesquisando adoçantes alternativos para uma bebida que contém 5% de açúcar na sua formulação. Testes preliminares de gosto estabeleceram 0,1% do novo adoçante como o nível equivalente a 5% de sacarose, mas tam- bém demonstrou que se mais de uma amostra é apresentada ao mesmo ANÁLISE SENSORIAL DE ALIMENTOS102 tempo, a discriminação é prejudicada por causa do efeito residual da doçura e outros gostos e fatores de sensação bucal. O profissional deseja saber se as duas bebidas se distinguem pelo sabor. Vinte julgadores rece- bem aleatoriamente cinco amostras “A” (bebida com adoçante) e cinco amostras “Não A” (bebida com sacarose), sendo-lhes recomendado que determinem quais amostras são “A”. Os resultados obtidos são apresen- tados a seguir (Tabela 2). tabela 2 – Julgamentos obtidos no teste “A” ou “Não A” de bebidas Respostas Amostras total “A” “Não-A” “A” 60 35 95 “Não-A” 40 65 105 Total 100 100 200 Fonte: NBR 13171/1994. Aplicando-se a distribuição qui-quadrada, tem-se: Frequência esperada para “A”: = 47,5 100 × 95 200 (6.8) Frequência esperada para “Não A”: = 52,5 105 × 100 200 (6.9) TESTES DE DIFERENçA 103 X² = X² = 12,53 + (60 − 47,5)² 47,5 (35 − 47,5)² 47,5 + (40 − 52,5)² 52,5 + (65 − 52,5)² 52,5 (6.10) O valor obtido X² = 12,53 é maior do que o encontrado na Tabela 41 (Anexo E) para grau de liberdade 1 e nível de significância de 5%, onde X² = 3,84. Assim, conclui-se que existe diferença significativa entre a bebida adoçada com sacarose e a adoçada com o novo adoçante. 6.1.4 Teste dois em cinco Objetivo Como nos testes já descritos, também é para verificar se existe diferença significativa entre duas amostras que receberam tratamentos diferentes. Princípio do teste Cinco amostras codificadas são apresentadas ao julgador, duas de um tipo e três de outro tipo. O julgador deverá identificar quais são as duas amostras que diferem das outras três remanescentes. Quando o número de julgadores for menor que 20, as ordens de apresentação das amostras devem ser selecionadas ao acaso entre as 20 combinações possíveis: AAABB, BBBAA, AABAB, BBABA, ABAAB, BABBA, BAAAB, ABBBA, AABBA, BBAAB, ABABA, BABAB, BAABA, ABBAB, ABBAA, BAABB, BABAA, ABABB, BBAAA e AABBB. ANÁLISE SENSORIAL DE ALIMENTOS104 Análise dos resultados: a probabilidade de acerto ao acaso da primeira amostra de duas que são corretas é de 2/5. Então haverá quatro amostras restantes. A probabilidade de acerto ao acaso dasegunda amos- tra correta é de 1/4. Como os dois eventos são dependentes entre si, nós multiplicamos as probabilidades associadas com cada evento para obter a probabilidade geral de acerto (resposta correta) ao acaso: 2/5 × 1/4 = 1/10. 6.2 testes de diferença de atributos (Direcional) 6.2.1 Comparação Pareada ou Escolha Forçada entre duas alternativas (ASTM E2164 – 08) Objetivo Saber se uma amostra apresenta certo atributo sensorial em maior intensidade que a outra amostra. Por exemplo: verificar qual amostra é mais doce, ou mais ácida, ou mais aromática, etc. Observe que este teste é direcional porque chama a atenção do julgador para um determinado atributo sensorial (doçura, acidez, etc.), por isso a conclusão sobre a di- ferença será apenas para aquele atributo específico que foi solicitado ao julgador; isto não implica que não exista algum outro tipo de diferença. Princípio do teste Consiste na apresentação de duas amostras e o julgador deve dizer qual das duas tem maior intensidade de uma característica bem definida. A probabilidade de acerto ao acaso é de ½. As amostras devem ser ser- vidas nas duas ordens: AB / BA. TESTES DE DIFERENçA 105 Equipe de julgadores Deve-se garantir que os julgadores conheçam e detectem correta- mente o atributo sensorial medido: doçura, acidez, aroma, firmeza, etc. É desejável julgadores com experiência e familiariedade com o produto, porém consumidores ou julgadores não selecionados podem realizar a análise, desde que, ao escolher-se a sensibilidade do teste, esse fato seja considerado para influenciar num número maior de julgadores e seja previsto um treinamento prévio. Não se recomenda misturar diferentes tipos de julgadores. Sensibilidade do teste A escolha do número de julgadores dependerá da sensibilidade do teste, a qual será definida em função dos objetivos do teste. A sensi- bilidade do teste é uma função de quatro fatores: risco alfa (α), risco beta (β), se o teste é de natureza uni ou bilateral e a proporção máxima per- mitida de respostas corretas (teste unilateral) ou de respostas para amostra A ou B (teste bilateral) (Pmax). Portanto, antes da realização do teste, deve-se decidir se este é uni ou bilateral e selecionar os valores de α, β e Pmax. As orientações gerais para esta tomada de decisão são as seguintes: a) Teste unilateral (ou monocaudal) × Teste bilateral (ou bicaudal) Se você sabe a priori qual amostra deveria apresentar maior inten- sidade do atributo avaliado, use a tabela do teste pareado unilateral. Exemplo: se você está verificando se os julgadores conseguem di- ferenciar doçura entre uma bebida láctea de morango com 1% de açúcar e outra bebida com 2% de açúcar. Você espera que, se houver diferença, a amostra com 2% será a mais doce. ANÁLISE SENSORIAL DE ALIMENTOS106 Se você não sabe a priori qual amostra deveria apresentar maior intensidade do atributo avaliado, use a tabela do teste pareado bi- lateral. Exemplo: você substituiu certa concentração de aspar tame numa gelatina, por certa concentração de ciclamato de sódio e de- seja saber se as gelatinas diferem em doçura. Neste caso você não sabe qual amostra seria a mais doce, se elas diferirem em doçura. b) Para um teste de diferença Os valores normalmente utilizados são α = 0,05 e β = 0,20, com a possibilidade de aumentar o erro beta, mas mantendo sempre o erro alfa menor possível. c) Para um teste de similaridade Os valores normalmente utilizados são α = 0,20 e β = 0,05, com a possibilidade de aumentar o erro alfa, mas mantendo sempre o erro beta menor possível. d) A proporção de respostas corretas (Pmax) fica entre três faixas: Pmax < 55% representa um valor baixo 55% ≤ Pmax ≤ 65% representa um valor de tamanho médio Pmax > 65% representa um valor grande Número de julgadores: depois de definida a sensibilidade reque- rida para o teste, utilize a Tabela 42 (Anexo F) para teste unilateral ou a Tabela 43 (Anexo G) para teste bilateral para determinar o número de julgadores necessários. Análise dos resultados: soma-se o número de julgadores que acharam a amostra A com maior intensidade do atributo especificado e o número de julgadores que acharam a amostra B com maior intensi- dade. Pegue o maior dos números e use a tabela apropriada, dependendo do número de julgadores: - se o número de julgadores é maior ou igual dos valores recomen- dados nas Tabelas 42 e 43, então utilize a Tabela 44 (Anexo H) TESTES DE DIFERENçA 107 para analisar os dados obtidos de um teste unilateral e a Tabela 45 (Anexo I) para analisar os dados obtidos de um teste bilateral. Se o número de respostas for maior ou igual ao número encontrado na Tabela, conclui-se que as amostras diferem no atributo analisado. Se o número de respostas for menor, conclui-se que as amostras são similares na intensidade do atributo analisado e que não mais do que a proporção Pmax da população perceberia a diferença em um nível de confiança igual a 1 − β. As conclusões se baseiam nos critérios definidos na sensibilidade do teste. - se o número de julgadores é menor do que os valores recomenda- dos nas Tabelas 42 e 43 e o pesquisador está inicialmente interes- sado em um teste de diferença, então utilize a Tabela 44 (unilateral) ou a Tabela 45 (bilateral). Se o número de respostas for maior ou igual ao número encontrado na Tabela, conclui-se que as amostras diferem no atributo analisado no nível α de significância. - Se o número de julgadores é menor do que os valores recomenda- dos nas Tabelas 42 e 43 e o pesquisador está inicialmente interes- sado em um teste de similaridade, então utiliza-se o cálculo do in- tervalo de confiança para análise dos dados provenientes do teste: Pc = c n (6.1) Pc = Proporção de respostas corretas ou do maior número de respostas c = número de respostas corretas ou da amostra que obteve maior número de respostas n = número de julgadores Sc (Erro padrão de Pc) = Pc ( 1 − Pc ) n (6.11) ANÁLISE SENSORIAL DE ALIMENTOS108 Para um teste unilateral: Limite de confiança = Pc + zβ ∙ Sc (6.12) Onde zβ é o valor crítico unilateral da distribuição normal e os valores para cada risco beta são: Risco Beta zβ 0,50 0,000 0,40 0,253 0,30 0,524 0,20 0,842 0,10 1,282 0,05 1,645 0,01 2,326 0,001 3,090 Para um teste bilateral: Limite superior de confiança = Pc + z ∙ Sc (6.13) Limite inferior de confiança = Pc − z ∙ Sc (6.14) Para 80% confiança z = 1,280 Para 90% confiança z = 1,645 Para 95% confiança z = 1,960 Para 99% confiança z = 2,576 Se o limite de confiança for menor do que Pmax, então conclui-se que as amostras são similares na intensidade do atributo. TESTES DE DIFERENçA 109 Se o limite de confiança for maior que Pmax, então a similaridade não poderá ser demonstrada. Exemplo 1: Teste de diferença unilateral A equipe de P&D (pesquisa e desenvolvimento) direcionou seus esforços para desenvolver um cereal mais crocante no leite. Antes de reali- zar um teste de preferência com consumidores, a equipe quer confirmar se o cereal desenvolvido é realmente percebido como mais crocante do que o cereal de referência atual. Objetivo do teste: confirmar que o cereal reformulado é mais cro- cante que o atual para justificar o teste com os consumidores. A equipe de desenvolvimento concorda que só há interesse em que o produto teste seja mais crocante que o atual, por isso será conduzido o teste unilateral. Número de julgadores: para proteger-se de uma falsa conclusão de que existe diferença significativa de crocância, o analista sensorial propôs α = 0,05 e um Pmáx de 60% com β = 0,50. Consultando a Tabela 42, encontrou-se a recomendação de 72 julgadores. Análise dos resultados: 48 julgadores selecionaram a amostra “B” (cereal reformulado) como mais crocante que o cereal “A”. NaTabela 44, na linha correspondente a 72 julgadores e na coluna para α = 0,05, encontra-se que 44 respostas corretas são suficientes para concluir que o cereal reformulado é mais crocante que o cereal atual. Conclusão: o cereal reformulado é mais crocante que o cereal atual ao nível de 5% de significância, considerando-se Pmax = 60% e β = 0,50. Exemplo 2: Teste de similaridade unilateral Um fabricante de adoçante em pacotinho quer garantir que a quantidade adequada do adoçante esteja sendo envasada dentro de cada pacotinho para que não haja variação de doçura ao consumidor. Por causa da variabilidade na embaladora, o fabricante precisa estabelecer ANÁLISE SENSORIAL DE ALIMENTOS110 o limite mínimo que apenas uma pequena proporção da população detecte o gosto menos doce que o padrão médio. Objetivo do teste: determinar o limite mínimo de concentração de adoçante permitido dentro de um pacotinho que forneça o mesmo gosto doce que a concentração padrão almejada. Como o teor de doçura será manipulado em direção à menor concentração possível que não altere o padrão atual de doçura, trata-se de um teste unilateral. Número de julgadores: o fabricante busca garantir a concen- tração e intensidade de doçura especificada na rotulagem. Neste caso objetiva-se um erro beta mínimo de 0,05. Selecionou-se α = 0,20 e um Pmax = 65%. Neste caso como somente o limite mínimo do gosto doce está sendo testado, utilizamos a Tabela 42 onde encontramos que um mínimo de 68 julgadores é recomendado. Procedimento do teste: de acordo com experimentos prévios, a concentração do limite inferior (X) foi selecionada para ser avaliada versus a concentração alvo Padrão (P). A água filtrada foi utilizada como diluente. Este meio de diluição foi o que demonstrou permitir a melhor sensibilidade para diferenças entre gostos doces, pela experiência prévia dos julgadores. As soluções nas concentrações X e P foram preparadas e porciona- das em copos codificados com números com três dígitos aleatórios. Foram servidos nas ordens XP e PX de forma balanceada para 68 julgadores. Análise dos resultados: 36 julgadores identificaram corretamente a amostra P como a mais doce, dentre 68 julgamentos totais. Consul- tando-se a Tabela 44 para α = 0,20 encontra-se que o mínimo de res- postas corretas necessárias para estabelecer a diferença entre as amostras é de 38 respostas. Portanto, com 36 respostas podemos concluir que as amostras são similares em doçura. Conclusão: o analista sensorial pode emitir resultado de análise sensorial concluindo que a concentração X do adoçante é suficientemente similar ao alvo Padrão para ser utilizado como especificação de controle de qualidade de limite inferior permitido. TESTES DE DIFERENçA 111 Exemplo 3: Teste de diferença bilateral Um fabricante de sopas deseja determinar quais dos dois siste- mas dosadores de sal proporciona melhor percepção do sabor salgado. O sistema dosador que proporcionar o gosto salgado mais intenso será selecionado para uma nova linha de produção de sopas. Desta forma, será possível diminuir a quantidade de sal e reduzir custos. Se nenhuma diferença for encontrada entre os dois sistemas, outros sistemas precisa- rão ser pesquisados. Objetivo do teste: determinar qual dos dois sistemas dosadores entrega melhor percepção do gosto salgado (mais intenso). Como não sabemos qual dos dois pode ser mais efetivo para este objetivo, trata-se de um teste pareado bilateral. Número de julgadores: a seleção de um sistema dosador de sal mais efetivo é crítica nesta etapa do projeto, pois irá definir todas as for- mulações futuras. O analista sensorial deseja ter apenas 5% de risco de erro alfa, isto é, selecionar um sistema dosador que na realidade não tenha diferença significativa. Entretanto, o analista também sabe que se ele concluir falsamente que não há diferença entre os dois sistemas, inves- timentos adicionais serão necessários para continuar pesquisando outro sistema mais efetivo de aplicação de sal na sopa. Desta forma, ele decide por aceitar somente 10% do risco beta, em que 75% ou mais dos julga- dores possa perceber a diferença de gosto salgado entre as duas amostras. Consultando-se a Tabela 43 na seção correspondente ao Pmax = 0,75 e na coluna correspondente a β = 0,10 encontrando-se com a linha de α = 0,05, resulta na recomendação de no mínimo 42 julgadores para este teste. Análise dos resultados: 48 julgadores foram recrutados e partici- param do teste, sendo que 32 julgadores indicaram a amostra do sistema A como a mais salgada e 16 selecionaram a amostra do sistema B como a mais salgada. Na Tabela 45 o analista encontra que para 48 julgamentos totais, no nível de significância de 0,05 para alfa, o mínimo de respostas para estabelecer a diferença é 32. ANÁLISE SENSORIAL DE ALIMENTOS112 Conclusão: a amostra A é significativamente mais salgada que a amostra B e o sistema dosador de sal A foi selecionado para compra e continuação dos estudos da dosagem ideal de sal na formulação. Intervalo de Confiança: Pc = c n (6.1) Pc = 32/48 = 0,67 Sc (Erro padrão de Pc) = Pc ( 1 − Pc ) n (6.11) Sc = √ 0,67 (1 – 0,67)/48 = 0,07 Conforme valores já informados em análise dos resultados para teste pareado bilateral, com 95% de confiança o valor de z = 1,96 Limite superior de confiança = 0,67 + 1,96 (0,07) = 0,80 Limite inferior de confiança = 0,67 − 1,96 (0,07) = 0,53 O analista pode concluir com 95% de certeza que entre 53% e 80% dos julgadores conseguem reconhecer e selecionar a amostra A como a amostra mais salgada. Exemplo 4: Teste de diferença bilateral – Balanceamento entre diferença e similaridade Para o desenvolvimento de uma bebida tipo licor, observou-se que a adição de um espessante ao produto, além de dar mais “corpo” à bebida, também acentuava seu sabor característico de amêndoa. A fim TESTES DE DIFERENçA 113 de conhecer a influência da concentração do espessante na intensidade de percepção do sabor, o teste pareado foi aplicado apresentando-se as seguintes amostras: - amostra “A” = licor de amêndoas com 0,2% de carboximetilcelulose; - amostra “B” = licor de amêndoas com 0,4% de carboximetilcelulose. Na ficha, a pergunta formulada ao julgador: qual é a amostra que apresenta sabor característico de amêndoa mais intenso? Objetivo do teste: conhecer a influência do corpo da bebida (con- centração do espessante) no realce ou supressão do sabor de amêndoa. Se não sabemos, a priori, qual amostra deveria apresentar maior intensidade do atributo avaliado, pois conhecemos a influência que o espessante exerce diretamente no corpo da bebida e não conhecemos o tipo de influência no sabor, devemos usar a tabela do teste pareado bilateral. Número de julgadores: a expectativa é de encontrar a diferença de textura influenciando diretamente no sabor, pois o licor mais encor- pado deverá permanecer mais tempo na boca e realçar o desprendimento de voláteis a serem percebidos via retronasal, por isso queremos ter 95% de certeza na diferença (erro alfa). Porém, o intervalo das concentra- ções do espessante é desconhecido e por esse motivo precisamos ter, pelo menos, 90% de certeza na similaridade (erro beta). A proporção máxima de discriminadores poderá ser de 70%, considerando-se que a diferença no sabor é desejável. Com esses critérios, encontramos uma recomendação de 66 julgadores na Tabela 43. Análise dos resultados: 16 julgadores escolheram a amostra A com sabor mais intenso e 50 julgadores indicaram a amostra B. Consul- tando-se a Tabela 45, verificamos que precisaremos calcular o número mínimo de respostas para estabelecer diferença. É o número inteiro mais próximo de x = (n/2) + z √ n/4 para α = 0,05 o valor de z é 1,96, resultando em 40,96 ≈ 41. ANÁLISE SENSORIAL DE ALIMENTOS114 Conclusão:conclui-se que existe diferença significativa na intensi- dade percebida do “sabor característico” entre as amostras de licor com 0,2% e 0,4% de carboximetilcelulose, com 5% de erro. Isto é, a diferença de 0,2% na concentração do espessante é a responsável pelo realce no sabor característico de amêndoas. Exemplo 5: Teste de similaridade bilateral Por razões econômicas, uma fábrica de laticínios deseja passar a produzir o requeijão cremoso com 65% de umidade; sendo que o seu padrão atual é de 60% de umidade e o percentual permitido pela legis- lação é de até 65%. Porém, pretende-se que esta alteração no padrão de umidade final do produto não altere a firmeza do requeijão, ou seja, a diretoria desta empresa pretende que essa alteração mantenha para o consumidor o mesmo padrão de firmeza no produto. Desta forma, realizou-se um teste com aplicação de 0,01% de goma carragena no re- queijão com 65% de umidade e comparou-se com o padrão atual (60% umidade). O teste pareado foi aplicado com a pergunta: “qual amostra é mais firme?”. Por causa da adição de 0,01% de goma carragena para compensar a possível perda de firmeza com o aumento de 5% no per- centual de umidade, não sabemos a priori qual amostra seria a resposta correta, portanto trata-se de um teste pareado bilateral. Objetivo do teste: aumentar 5% de umidade sem alterar o padrão de qualidade de firmeza do requeijão. Para esse fim está sendo utilizado um aditivo espessante. Número de julgadores: queremos ter 95% de certeza na similari- dade (β = 0,05) e por esse motivo também queremos evitar maior percen- tual de discriminadores. Decidiu-se utilizar Pmax = 65% (para este teste é considerado um valor médio). O erro alfa não é tão preocupante neste caso e podemos assumir α = 0,20. A Tabela 43 recomenda 96 julgadores. Análise dos resultados: não foi possível recrutar 96 julgadores. Com o resultado de análise de 80 julgadores decidiu-se realizar o cálculo TESTES DE DIFERENçA 115 do intervalo de confiança para saber se a similaridade já poderia ser demonstrada ou era necessário continuar o teste. Na Tabela 45 encon- tramos que são necessárias 47 respostas para estabelecer diferença signi- ficativa. Para 80 julgadores, 36 escolheram a amostra A (60% umidade) como mais firme e 44 escolheram a amostra B (65% umidade e adição de 0,01% de goma carragena) como o requeijão mais firme. Quarenta e quatro respostas são um valor menor que o tabelado para estabelecer diferença significativa (47), mas para demonstrar similaridade com nú- mero de julgadores menor que 96, precisamos calcular o intervalo de confiança para teste bilateral. Pc = c n (6.1) Pc = 44/80 = 0,55 Sc (Erro padrão de Pc) = Pc ( 1 − Pc ) n (6.11) Sc = √ 0,55 (1 − 0,55)/n = 0,0556 Limite superior de confiança = Pc + z ∙ Sc (6.13) Limite superior de confiança = 0,55 + 1,28 ∙ 0,0556 = 0,6212 Limite inferior de confiança = Pc − z ∙ Sc (6.14) Limite inferior de confiança = 0,55 − 1,28 ∙ 0,0556 = 0,4788 O intervalo de confiança está entre 48 e 62% de discriminadores. O limite de confiança de 62% é menor que Pmax = 65%, então podemos ANÁLISE SENSORIAL DE ALIMENTOS116 finalizar os testes e concluir que as amostras de requeijão cremoso tes- tadas são similares na textura e será possível realizar a redução de custos sem mudar o padrão de firmeza do requeijão. 6.2.2 Teste triangular direcional (Teste de escolha forçada entre três alternativas) No teste triangular direcional utiliza-se sempre a amostra de maior intensidade como a amostra diferente entre as outras duas amostras mais fracas que são apresentadas codificadas aos julgadores. Por exemplo, nós aumentamos a concentração de açúcar da nossa formulação e gostaríamos de saber se a nova formulação é significativa- mente mais doce que a antiga. Nós apresentamos duas amostras da antiga formulação e uma da nova formulação para os julgadores. Nós pedimos aos julgadores para eles escolherem qual é a formulação mais doce. A probabilidade de acerto ao acaso é de 1/3 e utilizamos a mesma tabela do teste triangular não direcional. 6.3 Utilização de detecção de sinal e abordagem R-Index O principal propósito dos testes de diferença ou discriminativos é saber se é possível a discriminação entre dois estímulos muito similares. Os estímulos são suficientemente próximos, de maneira que as carac- terísticas sensoriais podem ser confundidas. Duas amostras podem ser quimicamente diferentes, mas esta diferença pode não ser perceptível sensorialmente pela maioria dos seres humanos. É importante descrever o processo em que um julgador é envol- vido ao escolher entre duas amostras facilmente confundíveis. A correta determinação se existe ou não uma diferença sensorial significativa entre dois ou mais estímulos é uma questão de suma importância na se- leção de ingredientes, redução de custos, estabilidade ou para propósitos TESTES DE DIFERENçA 117 de controle de qualidade. Entender a teoria básica que está por trás destes testes permite melhores decisões quanto à escolha do teste e do delineamento experimental. A teoria “Thurstoniana” (procedimento “d”, R-Index e Detecção do Sinal) pode nem sempre ser o método preferido, mas permite o entendimento dos fatores que contribuem na sensibili- dade, confiabilidade e validade dos testes de diferença. Os testes discriminativos podem ser divididos em: testes direcio- nais, aqueles em que a diferença é identificada; e testes não direcionais, em que a diferença não é identificada. testes direcionais Estes testes já foram descritos no item 6.2. O primeiro exemplo é o teste de comparação pareada, também chamado teste de escolha forçada entre duas alternativas. Existem duas amostras A e B. O objetivo é determinar qual destas duas amostras tem maior intensidade de uma característica definida. Outro exemplo é o teste triangular de escolha forçada entre três alternativas. São apresentadas três amostras codificadas, por exemplo: uma mais doce e duas menos doce. Pergunta-se ao julgador: qual amostra é mais doce? testes não direcionais Quando a diferença entre as amostras não é previamente conhe- cida ou identificada. Estes testes foram descritos no item 6.1. Schutz e Bleibaum (2005) apresentam, de forma didática, a in- fluência dos fatores que contribuem para a sensibilidade, confiabilidade e validade dos testes de diferença. Sintetizamos esta apresentação a seguir: ANÁLISE SENSORIAL DE ALIMENTOS118 Na Figura 15, o eixo da doçura vai da esquerda para a direita. Do lado esquerdo temos um biscoito não adoçado (N) e do lado direito temos um biscoito doce (S). Estes dois biscoitos são facilmente distin- guíveis. Ao adicionar um pouco de açúcar ao biscoito chamado X, per- gunta-se: este biscoito é mais doce do que N? A resposta é “talvez” ou “não tenho certeza” ou “eu acho que posso dizer que esta amostra é mais doce”. No dia seguinte esta pessoa avalia exatamente as mesmas amos- tras, mas a resposta é que X não é mais doce que N. Esta é a região de incerteza e a linha pode ser desenhada em qualquer lugar. Dizer que o biscoito é mais doce nem sempre depende dos bo- tões gustativos, pois também é uma questão cognitiva. E isto não tem relação com a sua sensibilidade, mas com a sua confiança naquele dia. Onde você desenha a linha? A linha é chamada de critério, o seu critério de doçura. Se você alcança este nível de doçura, você está preparado para identificar todas as concentrações de doçura acima desta linha. Algumas vezes nós temos um critério com folga quando nós estamos desejando dizer que a amostra é doce. Outras vezes nós temos um critério estrito. O critério pode ser diferente entre as pessoas ou para a mesma pessoa ao longo do tempo. Nós precisamos estabilizar o critério. Neste exemplo, está em algum lugar entre N e X. D Primo (d’) emodelagem thurstoniana Por que em alguns testes as diferenças parecem ser melhor perce- bidas do que em outros? De acordo com Schutz e Bleibaum (2005), existem duas questões que respondem estas variações: 1) Quão claramente a informação está alcançando o cérebro? A adaptação pode influenciar a escolha. Quando um estímulo é colocado na boca e engolido, o residual fica na boca e interfere na próxima degustação. O sinal para o cérebro é distorcido. TESTES DE DIFERENçA 119 Critério mais estrito Aumento da doçura Sem açúcar β β β β Suavemente doce Doce Região de incerteza n x s figura 15 – Região de incerteza das diferenças de doçura entre amostras Fonte: SCHUTZ; BLEIBAUM, 2005. 2) Como o cérebro processa a informação? O processamento no cérebro pode funcionar de maneira diferente para os diferentes testes. Cada vez que o sinal é enviado ao local de processamento da informação no cérebro, pode processar de maneira diferente, e para um teste pode ser melhor do que em relação a outro teste. Introduzindo o conceito D Primo (d’) a) Para um alimento Ao comermos o mesmo alimento várias vezes, a resposta poderia ser medida pelo número de impulsos por segundo do sistema nervoso que alcançam o centro de processamento no cérebro. Quando degus- tamos um alimento, a resposta atual irá variar ligeiramente da próxima ANÁLISE SENSORIAL DE ALIMENTOS120 em que o alimento será degustado, podendo acontecer o efeito de adap- tação ou alguns ruídos nas sinapses do sistema nervoso – pois todos os sinais dos estímulos que alcançam o cérebro podem ser acompanhados de ruídos. Estas variações das intensidades percebidas dos sinais podem ser representadas como na Figura 16; esta curva é chamada distribuição das frequências. A maioria das vezes o sinal do estímulo irá ocorrer num nível médio, mas algumas vezes o sinal será percebido mais forte e outras vezes mais fraco. Resposta Resposta figura 16 – Intensidades de resposta do estímulo para várias degustações de um alimento b) Para dois alimentos Ao avaliarmos dois alimentos completamente diferentes, represen- tados na Figura 17, nós podemos ver que a frequência dos sinais das respostas apresenta uma distribuição normal, representada pela primeira curva para o alimento “A” e a segunda curva para o alimento “B”. Estes TESTES DE DIFERENçA 121 dois alimentos não são confundíveis, e o alimento “B” sempre apresenta um sinal de estímulo mais intenso que o alimento “A”. Não existe sobre- posição entre as distribuições das frequências das respostas. Resposta Resposta A B d’ figura 17 – Intensidades de resposta do estímulo para várias degustações do alimento “A” e do alimento “B”, não confundíveis c) Para testes de diferença Em um teste de diferença existe o confundimento. O estímulo pode ser simples como dulçor ou complexo como o sabor de chocolate; pode também ser uma diferença na textura. Se dois estímulos são confun- díveis eles se sobrepoem, como está demonstrado na Figura 18. Com- parando-se com a Figura 17, onde as duas médias são distantes e os estí- mulos claramente distinguíveis, na Figura 18 as médias estão próximas quando os estímulos são confundíveis. Portanto, a distância entre estas duas distribuições dá uma medida de quão diferentes estes produtos foram percebidos para um julgador em particular. ANÁLISE SENSORIAL DE ALIMENTOS122 Resposta Resposta figura 18 – Intensidades de resposta do estímulo para várias degustações do alimento “A” e do alimento “B”, quando as amostras são similares O d’ é o número de desvios padrões pelos quais as duas distribui- ções são separadas. Assume-se que ambos os produtos têm o mesmo desvio padrão. Como o estímulo avaliado é o mesmo, assume-se que as distribuições serão similares. Quando d’ é menor do que 1, significa que os dois estímulos podem ser confundíveis, e quando d’ é maior do que 1 será mais fácil distinguir os dois estímulos. O d’ = 2 apresentará uma probabilidade de 92% de resposta correta. O d’ = 3 dará uma probabilidade de 98% de resposta correta. Quanto à variância, observamos na Figura 19 que se a distribui- ção tiver variância maior, o d’ será menor, ou seja, suas distribuições de frequência terão mais sobreposição. Podemos dizer que as curvas de dis- tribuição que estão acima (SD = 1) são de um julgador mais consistente, com menor variação, indicado por um d’ maior. TESTES DE DIFERENçA 123 d’ = 2 SD = 1 d’ = 1 SD = 2 figura 19 – Quanto maior a variância, maior será a sobreposição e menor d’ Modelagem Thurstoniana O modelo thurstoniano é similar ao d primo. Quando um pro- duto é apresentado ao julgador repetidamente, o sinal ao cérebro pode ser medido como uma distribuição de frequência. Na maioria das vezes é percebido com uma intensidade média, porém algumas vezes este sinal pode ser percebido com intensidade mais fraca ou mais forte. Cada produto tem a sua distribuição de frequência. A Figura 20 mostra as distribuições de frequências para um teste pareado. As curvas da esquerda demonstram o eixo da resposta e os dois estímulos, onde o estímulo mais fraco é analisado quando o sistema nervoso não está tão ativado e a resposta instantânea se encontra no final inferior da distribuição, identificado como amostra A. Para a dis- tribuição da solução mais forte (amostra B) o nível instantâneo de res- posta está no final superior da distribuição, indicando que o estímulo mais forte é percebido de forma evidente em relação ao estímulo mais ANÁLISE SENSORIAL DE ALIMENTOS124 fraco. Nas curvas da direita, a resposta da amostra A (estímulo mais fraco) se encontra no final superior da distribuição, num momento em que o sistema nervoso esteja mais reativo, e o contrário acontece para a amostra B (mais forte) e a resposta será errada. A B B A figura 20 – Diferentes respostas ao estímulo mais fraco (A) e ao estímulo mais forte (B) em um teste pareado Tabelas que medem as proporções de respostas corretas necessá- rias para diferentes d’s foram feitas a partir de simulações com centenas de milhares de testes de diferença. Estas tabelas fornecem a você as proporções de testes corretos para um diferente d’, ou converte para um dado número de testes corretos os diferentes valores de d’. Teoria da discriminação e os métodos de diferença Vamos avaliar a situação em que nós tenhamos duas amostras com estímulo mais fraco (N) e uma mais forte (F). Poderia ser um teste trian- gular não direcional (qual amostra é diferente das outras) ou um teste triangular direcional (qual é mais intensa – doçura, maciez, etc. – entre três amostras). Existe um dado d primo entre a distribuição de estímulos para N (mais fraca ou normal) e a distribuição de estímulos para F (mais TESTES DE DIFERENçA 125 forte). Quando os dois estímulos mais fracos são testados, o sistema tem uma atividade média. Quando o estímulo mais forte é testado, o sistema nervoso tem uma reatividade média um pouco acima do normal (N). Qual é a diferença entre um teste triangular direcional e um não direcional? Conforme representado na Figura 21, chamado de Caso (a), para o teste triangular não direcional (qual destas é a amostra estranha), é óbvio que é a proveniente da solução mais forte, mais distante das outras. Para o teste direcional haverá uma mais doce e duas menos doces, ou qualquer outro atributo. A mais forte será escolhida e a resposta estará correta também, neste caso. (a) N d’ F Não direcional ✓ Direcional ✓ figura 21 – Caso (a) Agora vamos supor o caso (b) quando a amostra mais forte (F) foi avaliada, o sistema nervoso não foi muito reativo e a resposta ficou na parte inicial da distribuição. E quando se avaliou as duas soluções mais fracas, uma foi avaliada quando o sistema nervoso não foi muito reativoe ficou na parte inicial da distribuição de N e a outra amostra fraca foi analisada quando o sistema nervoso foi reativo e a resposta ficou na parte final da distribuição de N. ANÁLISE SENSORIAL DE ALIMENTOS126 Conforme representado na Figura 22, neste caso (b), para o teste triangular não direcional: qual destas é a amostra estranha, nós olha- mos para as distâncias e escolhemos a da esquerda como a estranha porque é a mais distante, mas é uma das amostras mais fracas e a res- posta está errada. Para o teste direcional “qual amostra é a mais forte?”, a amostra que está mais à direita será a escolhida, e a resposta também estará errada. (b) N NF Não direcional Direcional figura 22 – Caso (b) Supondo um terceiro caso (c), baseado na Figura 23, para o teste triangular não direcional “Qual é a amostra estranha ou diferente?”, a amostra que está na extrema esquerda será escolhida porque é a mais distante das outras e a resposta estará errada. No entanto, no teste dire- cional para a pergunta “qual amostra é mais forte?”, a resposta para a amostra mais forte estará correta. Para exatamente os mesmos estímulos e as mesmas sensações, nós obtivemos diferentes respostas. E nós temos ainda o caso reverso do (c), que é o caso (d), repre- sentado na Figura 24. Para o teste não direcional, irá parecer que a amostra mais forte está mais distante que as outras duas, e a resposta estará correta. Para o teste direcional, nós vamos escolher a que estará mais à direita no eixo de intensidade, a qual é uma das fracas, e a resposta estará errada. TESTES DE DIFERENçA 127 (c) N FN Não direcional Direcional ✓ figura 23 – Caso (c) (d) NF N Não direcional Direcional ✓ figura 24 – Caso (d) As situações apresentadas nos quatro casos irão aparecer em pro- porções iguais ao longo das repetições. Realizando-se as simulações dos testes no computador 100.000 vezes com um valor d’ = 1, a situação do caso (a) em que ambas as respostas estarão corretas ocorrerá 37% das vezes e as respostas referentes ao caso (d) não ocorrerão mais do que 5% das vezes, comparando-se estes quatro casos. Também encontramos tabelas que fornecem a proporção de res- postas corretas em função de d’, comparando-se o teste triangular direcio- nal com o não direcional (Tabela 3). A proporção de respostas corretas utilizando-se teste direcional é maior do que o teste não direcional. A Tabela 4 apresenta os valores de d’ em função da proporção de respostas corretas. Se você alcança 33% de respostas corretas, você está ANÁLISE SENSORIAL DE ALIMENTOS128 trabalhando com acertos ao acaso e o valor de d’ é zero para ambos os testes. Se você alcança 70% de respostas corretas, o d’ será 1,24 para o teste triangular direcional. Nós conseguimos analisar melhor em um teste direcional, pois para o teste não direcional precisaremos que d’ seja 2,50 para alcançar os mesmos 70% de respostas corretas. tabela 3 – Proporção de respostas corretas para o teste triangular não direcional e direcional Proporção de respostas corretas triangular d primo Não direcional Direcional 0,00 33,3% 33,3% 0,43 35% 46% 0,88 40% 60% 1,00 42% 64% 1,52 51% 77% 2,03 61% 87% tabela 4 – Valores de d’ para o teste triangular não direcional e direcional Proporção respostas corretas d primo Não direcional Direcional 33% 0,00 0,00 40% 0,88 0,23 50% 1,47 0,56 60% 1,98 0,89 70% 2,50 1,24 80% 3,13 1,65 90% 4,03 2,23 TESTES DE DIFERENçA 129 6.4 teste de ordenação (Iso 8587: 2006) Objetivo Comparar diferenças entre diversas amostras com relação à inten- sidade de um atributo específico. Este teste é utilizado para verificar se as amostras diferem entre si, mas não determina o grau de diferença que existe entre elas. É um método recomendado para: a) Avaliação do desempenho dos julgadores; b) Avaliação do produto: - pré-seleção de amostras: em critério discriminativo (diferença na intensidade de um atributo) ou em preferência hedônica; - determinação da influência dos níveis de intensidade de um pa- râmetro (exemplo: ordem de diluição, influência das matérias- primas, especificações de produção, embalagem ou estocagem), em critério discriminativo (diferença na intensidade de um atributo), ou determinação da influência dos níveis de intensi- dade de um parâmetro em preferência hedônica; - determinação da ordem de preferência em um teste hedônico global. Princípio do teste Três ou mais amostras são apresentadas ao julgador, solicitando que as ordene em ordem crescente ou decrescente ao atributo sensorial avaliado. Ex: ordenar em ordem crescente de doçura, quatro sucos de maracujá com diferentes teores de açúcar. Como nos demais testes de diferença, a posição das amostras deve ser casualizada com relação aos ANÁLISE SENSORIAL DE ALIMENTOS130 julgadores. Recomenda-se que o julgador faça uma primeira análise e ordenação das amostras e, em seguida, teste-as novamente para verificar se a ordem escolhida na primeira degustação está realmente correta. Todos os julgadores devem realizar o teste no mesmo ambiente e sob as mesmas condições de análise. Amostras de referência podem ser incluídas, mas elas não serão identificadas dentro da série de amostras. Um único atributo deve ser avaliado por teste. Deve-se instruir os julgadores a evitar ordens idênticas ou em- patadas e deve-se somente utilizá-las quando for realmente necessá- rio. Quando o julgador não conseguir diferenciar duas ordens, deve-se instruí-lo a colocar uma ordem e na parte dos comentários fazer a obser- vação sobre o empate das ordens. A norma ISO 8587: 2006 orienta desta maneira para que os julgadores utilizem o empate somente quando não se sentirem capazes de diferenciar entre as amostras. Na análise dos resultados deve-se considerar o empate quando este foi incluído nos comentários. Equipe sensorial O número de julgadores depende do objetivo do teste. Para aná- lise de diferença no atributo do produto recomenda-se um mínimo de 12 a 15 julgadores pré-selecionados e treinados. Para testes de preferên- cia recomenda-se no mínimo 60 julgadores por segmento, isto é, grupo de consumidor tipificado ou público-alvo definido. Análise dos resultados A Tabela 5 ilustra como as ordens dos julgadores são tabuladas após a realização do teste. Se houver ordens empatadas, registre a média TESTES DE DIFERENçA 131 das ordens das amostras. Na Tabela 5 o julgador 2 colocou a mesma ordem para as amostras B e C. E o julgador 3 colocou a mesma ordem para as amostras B, C e D. Todas as linhas devem resultar na mesma soma total. A soma das ordens é obtida para cada amostra colocando-se as ordens em cada coluna. tabela 5 – Tabulação dos resultados obtidos em teste de ordenação julgadores Amostras soma das ordensA B C D 1 1 2 3 4 10 2 4 1,5 1,5 3 10 3 1 3 3 3 10 4 1 3 4 2 10 5 3 1 2 4 10 6 2 1 3 4 10 7 2 1 4 3 10 soma 14 12,5 20,5 23 70 Quando há empates, são necessárias correções para os testes não paramétricos empregados. Elas são expostas detalhadamente por Campos (1984). O teste estatístico a ser escolhido depende do objetivo do teste: I. determinação do desempenho individual do candidato; II. teste de ordenação unilateral (monocaudal). Para o caso de uma ordem predeterminada; III. teste de ordenação bilateral (bicaudal). Pode ser de critério discri- minativo ou teste de preferência. Para o caso em que não exista uma ordem predeterminada. ANÁLISE SENSORIAL DE ALIMENTOS132 I. Determinação do desempenho individual do candidato Para estudar a concordância entre duas ordens, aquela realizada pelo candidato e a prevista pela concentração das amostras, utiliza-se o coeficiente de correlação de Spearman: ρ = 1 − 6 ∑ D ² N ( N ² − 1) (6.15) onde ρ (rho) é uma medida