Prévia do material em texto
BIOESTATÍSTICA WEBCONFERÊNCIA IV Temas: Unidade IV Modalidade: EAD Professora: Marcela Pinto Moura Medidas descritivas Medidas de dispersão • Indicam se os valores estão relativamente próximos uns dos outros, ou se estão separados. • O valor zero indica ausência de dispersão; a dispersão aumenta à proporção que aumenta o valor da medida. • As principais medidas de dispersão são: • Amplitude • Variância • Desvio padrão • Coeficiente de variação • Todas elas, exceto, a amplitude, têm na média o ponto de referência. 2 Medidas de dispersão Amplitude total (AT) • Expressa a variação máxima encontrada no conjunto de dados, sendo obtida pela diferença entre o maior e o menor valor. 3 Medidas de dispersão Amplitude total (AT) 4 Distribuição de frequência c/ intervalos de classe Medidas de dispersão Amplitude total (AT) – Desvantagens: • A amplitude total depende somente dos valores extremos, que são, geralmente, os menos frequentes e os menos significativos de uma distribuição. • Outro inconveniente é que a amplitude não leva em consideração as frequências das observações 5 Medidas de dispersão Variância • É a soma dos quadrados dos desvios em relação à média. • Com ela se estabelece uma medida de variabilidade para um conjunto de dados. • É denotada por S2 no caso amostral ou σ2 no caso populacional. 6 Medidas de dispersão Variância • É a soma dos quadrados dos desvios em relação à média. • Com ela se estabelece uma medida de variabilidade para um conjunto de dados. • É denotada por S2 no caso amostral ou σ2 no caso populacional. 7 Medidas de dispersão 8 Medidas de dispersão Variância – sem intervalos de classe 9 Medidas de dispersão 10 Medidas de dispersão 11 Medidas de dispersão Desvio padrão • É a raiz quadrada positiva da variância. • É representado por S ou DP no caso amostral ou σ no caso da população. 12 Medidas de dispersão Desvio padrão • Um desvio padrão igual a zero indica que todos os valores são iguais à média. 13 Medidas de dispersão 14 Medidas de dispersão Observações - Desvio padrão e Variância I. A variância apresenta unidade quadrática. II. Quanto mais afastado o valor se encontrar em relação à média, maior será sua contribuição para o valor da variância (desvio padrão). III. Ambas as medidas (variância e desvio padrão) indicam a variação absoluta. 15 Medidas de dispersão Coeficiente de variação • Trata-se de uma medida de dispersão relativa e expressa a razão entre o desvio padrão e a média. • Pode ser apresentado na forma de proporção ou porcentagem. 16 Medidas de dispersão 17 Medidas de dispersão 18 Medidas de dispersão 19 Medidas de dispersão Observações sobre o coeficiente de variação I. Quanto menor o coeficiente de variação, mais homogêneo o conjunto de valores. II. Trata-se de uma medida de variação relativa e adimensional. • O CV é utilizado quando: 1) Dois grupos apresentam mesmo desvio padrão e médias diferentes; 2) Para se comparar duas ou mais séries de valores, quanto a sua dispersão ou variabilidade, quando expressas em unidades diferentes; 3) Duas médias forem muito distantes. 20 Probabilidade A teoria de probabilidade consiste em utilizar a intuição humana para estudar diversos fenômenos. Em experimentos aleatórios, os acontecimentos apresentam resultados que a priori não podem ser previstos. Principais elementos: EVENTOS (A) ESPAÇO AMOSTRAL (E) 21 Probabilidade Espaço amostral Consiste no conjunto de todos os resultados possíveis do experimento. Exemplo: Se o experimento é lançar um dado de seis faces, o ESPAÇO AMOSTRAL é S = {1, 2, 3, 4, 5, 6}. Eventos São todas as perguntas (ou conjecturas) formuladas a respeito do experimento. Exemplo: Ao lançar um dado, podemos ter os seguintes EVENTOS: A = {sair número par} → {2,4,6} B = {sair número ímpar} → {1,3,5} C = {sair número maior do que 3} → {4,5,6} 22 Probabilidade 23 OU E Ac OU Probabilidade Probabilidade da união P (A U B) = P(A) + P(B) – P(AՈB) Exemplo: Escolhendo-se aleatoriamente um número natural de 1 a 20, qual é a probabilidade desse número ser múltiplo de 2 ou 3? A: Múltiplo de 2 B: Múltiplo de 3 A U B: múltiplo de 2 ou 3 → A = {2, 4, 6, 8, 10, 12, 14, 16, 18, 20} B = {3, 6, 9, 12, 15, 18} A Ո B: múltiplo de 2 e 3 → {6, 12, 18} Temos então: P (A U B) = P(A) + P(B) – P(AՈB) → 10/20 + 6/20 – 3/20 → 13/20 24 Probabilidade Evento complementar Se Ac for complementar de A, então P(Ac) = 1 – P(A) Exemplo: A probabilidade de um equipamento sair de fábrica com defeito é de 0,5%. Qual é a probabilidade do equipamento sair funcionando corretamente? A: Sair com defeito Ac: não sair com defeito (sair funcionando corretamente) P(A): 0,5% → P(A): 0,005 Temos então: P(Ac) = 1 – P(A) → 1 – 0,005 → 0,995 → 99,5% 25 Probabilidade Eventos mutuamente exclusivos P (A U B) = P(A) + P(B) Exemplo: Uma urna contém 20 bolas idênticas numeradas de 1 a 20. Extraindo-se uma bola ao acaso dessa urna, qual a probabilidade de o número da bola sorteada ser múltiplo de 5 ou 7? S (espaço amostral) = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20} A: múltiplo de 5 → A = {5, 10, 15, 20} B: múltiplo de 7 → B = {7, 14} Temos então: P (A U B) = P(A) + P(B) → 4/20 + 2/20 → 6/20 → 0,3 → 30% 26 Probabilidade Eventos independentes P (A Ո B) = P(A) x P(B) Exemplo: Uma experiência consiste em lançar, simultaneamente, um dado e uma moeda. Qual é a probabilidade de obter a face quatro no dado e uma cara? S (espaço amostral) = {(1,K); (2,K); (3,K); (4,K); (5,K); (6,K)} A: Dado → A = {4} B: Moeda → B = {K} Temos então: P (A Ո B) = P(A) x P(B) → 1/6 x 1/2 → 1/12 → 0,083 → 8,3 % 27 Probabilidade Interseção de eventos P (A Ո B) Exemplo: Em um grupo de 500 estudantes, 80 estudam Fisioterapia, 150 estudam Biomedicina, 10 estudam Fisioterapia e Biomedicina. Se um aluno é escolhido ao acaso, qual é a probabilidade de que ele estude Fisioterapia e Biomedicina? A: Estudam Fisioterapia → A = {80} B: Estudam Biomedicina → B = {150} A Ո B → 10 Estudam Fisioterapia e Biomedicina Temos então: P (A Ո B) = 10/500 → 0,02 → 2% 28 Distribuição normal • Ao representarmos de forma gráfica um conjunto de dados quantitativos de uma distribuição simétrica, chamada Normal ou Gaussiana, a maioria dos dados: • Se encontra próximo de um determinado valor central (média, moda ou mediana); • Os demais dados se distribuem igualmente afastando-se dos valores centrais. 29 30 Distribuição normal 31 Distribuição normal Distribuição normal • Características gerais da curva Gaussiana: O gráfico da distribuição normal é uma curva em forma de sino A área total da curva vale 1 ou 100% Valores maiores e menores do que a média têm a mesma probabilidade de ocorrer A configuração da curva é dada por dois parâmetros: a média, μ, e o desvio padrão É uma curva unimodal (Mo = Md = M) A curva normal aproxima-se mais do eixo x à medida que se afasta da média em ambos os lados, mas nunca toca o eixo 32 Distribuição normal • Valores padronizados na curva de Gauss Todas as curvas normais de distribuições de frequências podem ser transformadas em uma curva normal padrão (valores padronizados z). A Distribuição Normal Padrão é caracterizada por média igual a zero (μ = 0) e desvio padrão igual a 1 (σ = 1). 33 Distribuição normal • Cálculo da distribuição normal: • Qualquerconjunto de valores (x), normalmente distribuídos, pode ser convertido em valores normais padronizados (z) pelo uso da fórmula: 34 μ= média (x-) σ= desvio padrão (s) Distribuição normal reduzida 35 • Exemplo • O peso de 600 estudantes são normalmente distribuídos com média 65,3 kg e desvio padrão de 5,5 kg. Determine o número de estudantes que pesam: a) Entre 70 e 80 kg b) Mais que 63,2 kg c) Mais que 72 kg a) P(70 <X<80) = P (70 - 65,3 < Z < 80 – 65,3) = P (0,85 < Z < 2,67) 5,5 5,5 P = 0,4962 – 0,3023 = 0,1939 ou 19,39% 19,39% de 600 → 0,1939 x 600 = 116,34 (116 estudantes) Dados: X: peso; μ: 65,3; σ: 5,5 Distribuição normal reduzida 36 • Exemplo (cont.) • O peso de 600 estudantes são normalmente distribuídos com média 65,3 kg e desvio padrão de 5,5 kg. Determine o número de estudantes que pesam: a) Entre 70 e 80 kg b) Mais que 63,2 kg c) Mais que 72 kg b) P(X > 63,2) = P (Z > 63,2 – 65,3) = P (Z >-0,38) 5,5 P = 0,5 + 0,1480 = 0,6480 ou 64,80% 64,80% de 600 → 0,6480 x 600 = 388,8 (389 estudantes) Dados: X: peso; μ: 65,3; σ: 5,5 Distribuição normal reduzida 37 • Exemplo (cont.) • O peso de 600 estudantes são normalmente distribuídos com média 65,3 kg e desvio padrão de 5,5 kg. Determine o número de estudantes que pesam: a) Entre 70 e 80 kg b) Mais que 63,2 kg c) Mais que 72 kg c) P(X > 72) = P (Z > 72 – 65,3) = P (Z > 1,22) 5,5 P = 0,5 - 0,3888 = 0,1112 ou 11,12% 11,12% de 600 → 0,1112 x 600 = 66,72 (67 estudantes) Dados: X: peso; μ: 65,3; σ: 5,5 Teste de hipótese • O teste de hipótese é uma técnica que nos permite aceitar ou rejeitar a hipótese estatística, a partir dos dados da amostra dessa população. • O objetivo do teste de hipótese é confirma ou não o valor do parâmetro populacional informado, com base em dados amostrais. • Tipos de hipóteses: • Hipótese nula • Hipótese alternativa 38 Teste de hipótese • Hipótese nula • É a hipótese a ser testada. • Usamos a notação H0 para indicar a hipótese nula. • Ausência de diferença entre os parâmetros (hipótese de não efeito). • É uma hipótese estatística que contém uma afirmação verdadeira de igualdade, tal como ≤, = ou ≥. 39 Teste de hipótese • Hipótese alternativa • É a hipótese a ser considerada como uma alternativa à hipótese nula. • Usamos a notação Ha para indicar a hipótese alternativa. • Hipótese contrária à hipótese nula. Geralmente é o que o pesquisador quer confirmar. • É geralmente o complemento da hipótese nula. Contém uma afirmação de desigualdade estrita, tal como <, ≠ ou >. 40 Teste de hipótese 41 Teste de hipótese • Erros Tipo 1 e Tipo 2: • Ao fazer um teste de hipótese, corre-se o risco de: 1) Rejeitar uma hipótese que era verdadeira ou 2) Aceitá-la quando era falsa. • Temos, portanto, dois tipos possíveis de erro: 42 Teste de hipótese • Um erro do tipo 1 é, mais importante que um erro do tipo 2. • Por exemplo, suponhamos a decisão de aprovar ou reprovar um aluno na prova final. • Ou seja, o objetivo principal é não cometer o erro tipo 1, o qual só é possível de ocorrer, quando se rejeita H0. 43 Teste de hipótese • Nível de Significância: • É a probabilidade de se cometer um erro do tipo 1. • Dizemos, por exemplo, que nosso teste de hipótese está planejado ao nível de significância igual a 5% ou 1% que são os níveis mais utilizados. • Vamos chamá-lo de α (no caso, α = 5%). Ou seja, existe uma chance de 5% de cometermos o erro tipo 1. 44 Teste de hipótese • Etapas: 1) Escreva a hipótese nula (H0), usando os símbolos ≤, = ou ≥, e a hipótese alternativa (Ha), usando os símbolos <, ≠ ou >; 2) Calcule o valor observado (Zobs , tobs, ...) através da fórmula correspondente ao caso que está sendo analisado; 3) Faça um gráfico da distribuição amostral. De acordo com a hipótese alternativa marque a região crítica (RC) do teste; 45 Teste de hipótese • Etapas: 4) Obtenha o valor crítico do teste (Zobs , tobs, ...) de acordo com o nível de significância do teste (ɑ) e com a região crítica (RC), utilizando a tabela de distribuição correspondente (Normal, t de student,...). Marque esse valor no gráfico; 5) Marque o valor observado (Zobs , tobs, ...) no gráfico; 6) Conclua o teste; - Se o valor observado Ε RC, então rejeite H0 (aceite Ha); - Se o valor observado Ɇ RC, então aceite H0 (rejeite Ha); 7) Interprete, em palavras, a conclusão feita. 46 Teste de hipótese • Exemplo: • Uma fábrica anuncia que o índice de nicotina dos cigarros da marca X apresenta-se abaixo de 26 mg por cigarro. Um laboratório realiza 10 análises do índice, obtendo: 26, 24, 23, 22, 28, 25, 27, 26, 28 e 24. Sabe-se que índice de nicotina da marca X distribui-se normalmente com variância de 5,36 mg2. Pode-se aceitar a afirmação do fabricante, ao nível de significância 5%? • Resolução: • n = 10 Zobs = 25,3 – 26 = - 0,959 • x = 253 = 25,3 0,73 10 • σx = Ѵ5,36/10 = Ѵ0,536 = 0,73 Zɑ = Z5% = 1,64 • Conclusão: Ao nível de 5%, não se rejeita H0 , ou seja, a afirmação do fabricante é falsa. 47 48