Baixe o app para aproveitar ainda mais
Prévia do material em texto
Bioestatística Técnico em Biotecnologia - BIO309 1 Técnico em Biotecnologia – IFRS Profª Dra. Vera L. M. Martins Análise Descritiva - Medida de variabilidade (MV) Um aspecto fundamental da natureza é o fato de que os fenômenos não se repetem com precisão, pelo contrário estes são caracterizados por certa diferença entre os elementos. O que precisamos identificar é o quanto os elementos estão dispersos. É desejável então, uma medida que indique o grau de aleatoriedade de um conjunto de dados, identificando o comportamento de dispersão (medidas de variabilidade), buscando, deste modo, uma representação numérica que indique além da localização destes (MTC). Vamos tentar responder à pergunta da abertura deste material.... Há uma especificação indicando que a temperatura deve ser de 51°C para um determinado processo. Após 5 observações, a temperatura média de funcionamento do Equipamento A foi estimada em 50°C e do B em 51°C. Aparentemente, o Equipamento B oferece as melhores condições de temperatura. Vejamos os dados: Tabela 1. Temperatura dos Equipamentos A e B Equipamento Observações Média Equipamento A: 50, 51, 49, 50, 50 50oC Equipamento B: 40, 60, 50, 42, 63 51oC No entanto, se formos um pouco cuidadosos e fizermos a verificação das observações, percebemos que a temperatura de “A” varia de 49 a 51oC, ao passo que a de B varia de 40 a 63 oC, o que indica que o desempenho de A é bem mais uniforme do que de B. Por isto é importante sempre avaliar uma medida de variabilidade, junto a uma MTC. Vamos pensar em um processo que possui especificação de temperatura em 51°C. Ao observar em 5 momentos distintos a temperatura dos equipamentos A e B, estimou-se temperatura média de funcionamento do Equipamento A em 50°C e do B em 51°C. Neste caso, é razoável inferir que o desempenho de B é melhor do que de A, já que B mantém, em média, a temperatura especificada. Mas será que é isso mesmo? ..... Bioestatística Técnico em Biotecnologia - BIO309 2 Técnico em Biotecnologia – IFRS Profª Dra. Vera L. M. Martins Variância e Desvio-padrão: A média dos quadrados da distância de cada observação em relação à média do conjunto de dados corresponde à medida que chamamos de variância. Ela leva em consideração todas as informações do conjunto em análise, fazendo uso da soma de quadrados dos desvios em torno da média. Denotada pelo símbolo σ2 (na população) e por s2 (na amostra). O cálculo da variância é apresentado pelas Equações: A variância é uma boa medida de dispersão, mas possui uma desvantagem: é difícil interpretar o seu valor numérico, por causa da unidade de medida que é sempre elevada ao quadrado no resultado. Para resolver o problema da unidade de medida utiliza-se outra medida estatística, o desvio-padrão, que consiste em extrair a raiz quadrada da variância. Denotado pelo símbolo σ (na população) e s(na amostra). O cálculo do desvio-padrão é apresentado pelas Equações: Geralmente, para investigações na área de Bioestatística utilizamos amostras, o que nos direciona para a utilização de “s” nos cálculos de desvio-padrão. Algebricamente, a fórmula de “s” resultará em um valor numérico maior que “”, então, caso não saiba se está trabalhando com uma amostra ou população opte sempre pela fórmula da amostra. Exemplo (o mesmo do material anterior): Em um determinado bioma, observou-se o tempo, em minutos, entre as refeições de uma das espécies presentes. Após 10 observações, registraram-se os seguintes tempos: Interpretação (sugestão): Em média o tempo entre as refeições para indivíduos de uma das espécies presentes no bioma é 90min, com variância de 435,56 min² e desvio-padrão de 20,87 min. Sendo que os tempos observados com maior frequência foram de 67 e 112 minutos. Observou-se ainda que metade dos indivíduos possui intervalo de tempo superior a 91min entre as refeições. 𝜎2 = ∑ (𝑋𝑖 − 𝜇) 2𝑁 𝑖=1 𝑁 𝒔 𝟐 = ∑ (𝒙𝒊 − 𝒙) 𝟐𝒏 𝒊=𝟏 𝒏 − 𝟏 Bioestatística Técnico em Biotecnologia - BIO309 3 Técnico em Biotecnologia – IFRS Profª Dra. Vera L. M. Martins Mais uma vez, note que para cada análise é fundamental que haja uma interpretação, tornando claro para o leitor qual a variável de estudo, o que se está medindo e qual foi o resultado. Vamos observar com um detalhamento maior como obter tais resultados.... O desvio-padrão de uma amostra pode ser calculado considerando as seguintes etapas: 1ª) Calcular a média (𝑥) 2ª) Subtrair a média de cada valor observado (𝑥𝑖 − 𝑥) 3ª) Elevar ao quadrado os resultados da etapa 2 (𝑥𝑖 − 𝑥)² 4ª) Somar os quadrados obtidos na etapa 3 5ª) Dividir esta soma por (n-1) 6ª) Tirar a raiz quadrada 𝑠 = √ ∑ (𝑥𝑖 − 𝑥) 2𝑛 𝑖 𝑛 − 1 1ª etapa: Calcular a média: Para aplicar a fórmula e calcular a média, podemos proceder da seguinte forma: Somar os valores observados Dividir pelo tamanho da amostra Assim, termos 𝒙= 900/10= 90min 2ª) Subtrair a média de cada valor observado (𝑥𝑖 − 𝑥) 3ª) Elevar ao quadrado os resultados da etapa 2 (𝑥𝑖 − 𝑥)² 4ª) Somar os quadrados obtidos na etapa 3 xi 𝑥𝑖 − 𝑥 (𝑥𝑖 − 𝑥)² 112 112 - 90 = 22 222= 484 108 108 - 90 = 18 182= 324 57 57 - 90 = -33 -332= 1089 84 84 - 90 = -6 -62= 36 112 112 - 90 = 22 222= 484 67 67 - 90 = -23 -232= 529 90 90 - 90 = 0 02= 0 67 67 - 90 = -23 -232= 529 111 111 - 90 = 21 212= 441 92 92 - 90 = 2 22= 4 Soma = 3920 5ª) Dividir esta soma por (n-1) = 3920/9= 435,56min² (note que este é o valor da variância) 6ª) Tirar a raiz quadrada= √435,56min² = 20,87min Assim temos min Bioestatística Técnico em Biotecnologia - BIO309 4 Técnico em Biotecnologia – IFRS Profª Dra. Vera L. M. Martins Coeficiente de variação (CV): Uma forma de relacionar a média com o desvio-padrão é pela utilização do coeficiente de variação (CV). O CV é uma medida relativa de concentração dos dados em torno da média, em geral é utilizado para a comparação de grupos distintos com médias diferentes ou unidades diferentes. Quanto menor o coeficiente de variação, mais homogêneo será o grupo de dados. A obtenção desta medida e apresentada, abaixo, pela Equação para dados amostrais. %100 X s CV Aplicando este conceito aos dados do nosso exemplo temos: Assim, o CV do tempo do tempo entre as refeições de uma das espécies de um determinado bioma é de aproximadamente 23,19%. Agora é a sua vez!!!! Tente obter os resultados para o exemplo acima em uma planilha do Excel!!! Utilize as fórmulas: Desvio-padrão: =desvpad.a(argumento de valores) Variância: =var.a(argumento de valores) Dicas de observação: Note que há várias fórmulas para média e desvio, fique atento para utilizar a fórmula relativa à amostra. O valor obtido com a fórmula da variância deve ser igual ao valor do desvio elevado ao quadrado. E nunca se esqueça de fornecer uma interpretação para os resultados obtidos. Bons estudos!!!!!
Compartilhar