Baixe o app para aproveitar ainda mais
Prévia do material em texto
Profa. Ana Carolina Bueno UNIDADE II Estatística Como podemos descrever estes dados? Como podemos resumir estes dados? Média. Mediana. Moda. Medidas de tendência central 0 2 4 6 8 10 12 148. 152. 156. 160. 164. 168. 172. 176. Nú me ro d e a lun os Estatura Estatura de 40 alunos Estatura Xi Fi 150 154 152 4 154 158 156 9 158 162 160 11 162 166 164 8 166 170 168 5 170 174 172 3 Total 40 Fonte: autoria própria É a soma dos valores de todas as observações dividida pelo número de observações envolvidas. Vantagem: leva em conta todos os valores no seu cálculo. Média aritmética para distribuição de frequência sem classe A tabela mostra uma pesquisa sobre o número de filhos por funcionário de uma certa empresa. Como calcular: Número de filhos: média aritmética Nº de filhos fi 0 4 1 5 2 7 3 3 4 0 5 1 Total 20 Divide uma série ordenada de dados em duas partes iguais. Ocupa a posição central. Não é afetada por valores extremos. A amostra pode ter número ímpar de elementos ou número par de elementos. Calcular a posição da mediana com a fórmula a seguir: Posição mediana Eme = (N + 1)/2 Mediana (Md) para distribuição de frequência sem classe Um conjunto de dados indica o salário de funcionários de uma empresa xi = {6, 9, 3, 5, 2, 9, 5, 5, 8, 7, 1, 7, 2}, em que n = 13. Rol - {1, 2, 2, 3, 5, 5, 5, 6, 7, 7, 8, 9, 9} Posição mediana = (N + 1)/2 Posição mediana = (13 + 1)/2 = 7 (indica a posição) Então: Md = 5 funcionários Mediana: nº ímpar de elementos Exemplo: número de filhos Posição mediana = (20 + 1) / 2 = 10,5 Então: Md = (2 + 2)/2 = 2 filhos Mediana: nº par de elementos 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 Mediana para tabela de frequência sem intervalo. Primeiro determinar a classe de referência. Me = 2 filhos Número de filhos: mediana Nº de filhos fi Fa 0 4 4 1 5 9 2 7 16 3 3 19 4 0 19 5 1 20 Total 2 0 20 Um conjunto de dados ao dado que ocorre com maior frequência. A moda não é afetada por valores extremos. É utilizada para fins descritivos apenas, uma vez que é, dentre as medidas de tendência, a mais variável de amostra para amostra. Uma moda: unimodal Duas modas: bimodal Mais de duas modas: multimodal Nenhuma moda: amodal Moda (Mo) para distribuição de frequência sem classe Classe de referência é a classe com o maior valor de fi. Mo = 2 filhos (unimodal) Número de filhos: moda 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 Nº de filhos fi 0 4 1 5 2 7 3 3 4 0 5 1 Total 20 Medidas que mostram a dispersão dos dados em torno da tendência central. A variação se refere a quanto os valores podem diferir entre si e pode ser medida por números específicos. Os números relativamente próximos uns dos outros têm baixas medidas de variação, enquanto os valores mais dispersos têm maior medida de variação. Medidas de dispersão 0 2 4 6 8 10 12 148. 152. 156. 160. 164. 168. 172. 176. Nú me ro de alu no s Estatura Estatura de 40 alunos Fonte: autoria própria Amplitude Xmaior – Xmenor Variância Desvio-padrão Coeficiente de variação Medidas de dispersão Amplitude Total = Valor máximo – Valor mínimo Amplitude Total = 5 – 0 = 5 Amplitude total: número de filhos Nº de filhos fi 0 4 1 5 2 7 3 3 4 0 5 1 Total 20 Número de filhos: variância (s²) para distribuição de frequência sem classe Número de filhos: desvio-padrão (s) para distribuição de frequência sem classe Em um levantamento realizado, em maio, com os 134 funcionários da empresa XK, em relação à variável expressa em unidades monetárias (u.m.), obteve-se a tabela abaixo. Determine a média aproximada de salário. a) 4 salários. b) 5 salários. c) 6 salários. d) 7 salários. e) 8 salários. Interatividade Salário Nº de funcionários 3 32 5 34 7 40 9 28 Total 134 A estatura média para a amostra de alunos é de 161 cm. Estatura: média aritmética para distr. de frequência com classe Estatura xi fi xifi 150 154 152 4 152 x 4 = 608 154 158 156 9 156 x 9 = 1404 158 162 160 11 160 x 11 = 1760 162 166 164 8 164 x 8 = 1312 166 170 168 5 168 x 5 = 840 170 174 172 3 172 x 3 = 516 Total 40 xifi = 6440 Mediana para distribuição de frequência com classe Em que: Me = Mediana. lime = Limite inferior da classe que contém o elemento mediano (classe mediana). Eme = Elemento mediano. fac ant = Frequência acumulada crescente até a classe anterior à classe mediana. fme = Frequência da classe mediana. h = Amplitude da classe mediana. Eme = (fi/2) = 40/2 = 20 (referência) Lime = limite inferior da classe mediana (158) fac ant = frequência acumulada anterior à classe mediana (13) fme = freq. simples da classe mediana (11) h = amplitude de classe (4) Estatura: mediana para distribuição de frequência com classe Md = 160,55 cm Estatura Xi Fi fa 150 154 152 4 4 154 158 156 9 13 158 162 160 11 24 162 166 164 8 32 166 170 168 5 37 170 174 172 3 40 Total 40 Moda para distribuição de frequência com classe Moda de Czuber Em que: Mo = Moda. Limo = Limite inferior da classe modal. fmo = Frequência da classe modal. fant = Frequência da classe imediatamente anterior à classe modal. fpost = Frequência da classe imediatamente posterior à classe modal. h = Amplitude da classe modal. f = frequência simples da classe modal Li = limite inferior da classe modal (158) d1 = fmo – fant (11 – 9 = 2) d2 = fmo – fpost (11 – 8 = 3) A = amplitude de classe (4) Estatura: moda para distribuição de frequência com classe Estatura xi fi 150 154 152 4 154 158 156 9 158 162 160 11 162 166 164 8 166 170 168 5 170 174 172 3 Total 40 Amplitude Xmaior – Xmenor = 172 – 152 = 20 Estatura: amplitude para distribuição de frequência com classe Estatura xi fi 150 154 152 4 154 158 156 9 158 162 160 11 162 166 164 8 166 170 168 5 170 174 172 3 Total 40 Estatura: variância para distribuição de frequência com classe Estatura: desvio-padrão para distribuição de frequência com classe Idade Estatura Coeficiente de variação Dada a tabela do número de erros de impressão da primeira página de um jornal durante 50 dias, assinale a alternativa correta. a) Os pontos médios são 11, 14, 14 e 9. b) A média é igual a 10,5 erros. c) O desvio-padrão é igual a 17,3 erros. d) O desvio-padrão é igual a 4,2 erros. e) A variância é igual a 4 erros². Interatividade Erros xi fi xi fi (xi – x)² * fi 5 9 7 11 7 x 11 = 77 (7 – 12,7)² x 11 = 357,4 9 13 11 14 11 x 14 = 154 (11 – 12,7)² x 14 = 40,5 13 17 15 14 15 x 14 = 210 (15 – 12,7)² x 14 = 74,1 17 21 19 9 19 x 9 =171 (19 – 12.7)² x 9 = 357,2 Total 48 = 612 = 829,2 Para fazer inferência estatística usam-se técnicas que exigem o conhecimento de probabilidade. A teoria das probabilidades busca estimar as chances de ocorrer um determinado acontecimento. Antes de ativar uma usina nuclear, devemos analisar a probabilidade de uma detonação acidental. Antes de aumentar o limite de velocidade em nossas rodovias, devemos procurar estimar a probabilidade do aumento em acidentes fatais. Probabilidade Experimentos: resultado no lançamento de um dado; hábito de fumarde um estudante sorteado em sala de aula; tipo sanguíneo de um habitante escolhido ao acaso. Espaço amostral: lançamento de um dado: = {1, 2, 3, 4, 5, 6}; exame de sangue (tipo sanguíneo): = {A, B, AB, O}; hábito de fumar: = {fumante, não fumante}; tempo de duração de uma lâmpada: = {t: t 0}. Eventos: alguns eventos de um dado: A: sair face par A = {2, 4, 6} B: sair face maior que 3 B = {4, 5, 6} Experimentos, espaço amostral e eventos Medida da incerteza associada aos resultados do experimento aleatório. Em um vestibular, uma questão típica de múltipla escolha tem 5 respostas possíveis. Respondendo à questão aleatoriamente, qual é a probabilidade de sua resposta estar errada? Probabilidade: exemplo Imagine que um dado foi jogado. Qual é a probabilidade de ter ocorrido 5? No lançamento de um dado perfeito, qual é a probabilidade de sair número maior do que 4? Probabilidade: mais dois exemplos Determine a probabilidade de que um casal com três filhos tenha exatamente 2 meninos. Probabilidade: outro exemplo 1º 2º 3º H H H H M M M M H H M M H H M M H M H M H M H M Árvore de decisão H M H H M M H H H H M M M M O nº de caminhos é dado pelo nº de combinações. n = nº total de repetições do experimento (n = 3). x = nº de resultados desejados (x varia de 0 a 3). Análise combinatória Números de H Números de M Caminhos Quantidade de caminhos 3 meninos 0 menina 1 1 2 meninos 1 menina 2, 3, 5 3 1 menino 2 meninas 4, 6, 7 3 0 menino 3 meninas 8 1 Então, a probabilidade de ocorrer dois meninos será: Análise combinatória Qual é a probabilidade de ocorrer, pelo menos, dois meninos? P(obter, pelo menos, dois meninos) = 3/8 + 1/8 = 4/8 = 0,5 Análise combinatória Vinte moedas são jogadas simultaneamente, qual é a probabilidade de que se obtenham exatamente oito caras? Total de combinações = 220 = 1.048.576 de resultados O número total de resultados que nos interessa: A probabilidade de ocorrer 8 caras é: Exemplo A MasterCard International efetuou um estudo de fraudes em cartões de crédito; os resultados estão na tabela. Selecionado aleatoriamente um caso de fraude nos casos resumidos na tabela, qual a probabilidade de a fraude resultar de um cartão falsificado? a) P(cartão falsificado) = 1,85%. b) P(cartão falsificado) = 57,04%. c) P(cartão falsificado) = 19,95%. d) P(cartão falsificado) = 12,21%. e) P(cartão falsificado) = 10,80%. Interatividade Tipo de fraude Número Cartão roubado Cartão falsificado Pedido por correio / telefone Outros 243 85 52 46 Selecione um aluno ao acaso e defina os eventos: a) O aluno selecionado é do sexo masculino, dado que cursa Computação: P(HC) = 15/19 = 0,7895 ou 78,95%. b) A disciplina selecionada é Estatística, dado que é homem: P(EH) = 16/41 = 0,3902 Probabilidade condicional: exemplo Homens (H) Mulheres (M) Total Computação (C) 15 4 19 Estatística (E) 16 15 31 Física (F) 6 0 6 Outros (O) 4 2 6 Total 41 21 62 Imagine que um dado e uma moeda são jogados ao mesmo tempo. Qual a probabilidade de ocorrer cara na moeda, sabendo que ocorreu face 6 no dado? P(sair cara na moeda, sabendo que ocorreu 6 no dado) = ½ = 0,5. Eventos independentes: exemplo Dado Moeda Cara Coroa 1 Cara; 1 Coroa; 1 2 Cara; 2 Coroa; 2 3 Cara; 3 Coroa; 3 4 Cara; 4 Coroa; 4 5 Cara; 5 Coroa; 5 6 Cara; 6 Coroa; 6 P(A ou B) = P(A B) = P(A) + P(B) Palavra-chave: OU Suponha que uma urna contém duas bolas brancas, uma azul e uma vermelha. Retira-se uma bola da urna ao acaso. Qual a probabilidade de ter saído bola colorida, isto é, azul ou vermelha? A probabilidade de sair bola azul é ¼ = 0,25 ou 25%. A probabilidade de sair bola vermelha é ¼ = 0,25 ou 25%. Então, a probabilidade de sair bola colorida é ¼ + ¼ = 2/4 = ½ = 0,5 ou 50%. Regra da adição: exemplo com eventos mutuamente excludentes P(A ou B) = P(A B) = P(A) + P(B) – P(A B) Imagine uma carta ser retirada ao acaso de um baralho. Qual é a probabilidade de sair uma carta de espadas ou um ás? Um baralho tem 52 cartas 13 são de espadas e 4 são ases P(sair uma carta de espadas ou um ás) é: 13/52 + 4/52 – 1/52 = 16/52 = 4/13 = 0,3077 ou 30,77% Regra da adição: eventos não excludentes P(A e B) = P(A B) = P(A) . P(B) Palavra-chave: E Uma moeda será jogada duas vezes. Qual é a probabilidade de ocorrer cara nas duas jogadas? Probabilidade de ocorrer cara na primeira jogada é ½ = 0,5 ou 50%. Probabilidade de ocorrer cara na segunda jogada é: ½ = 0,5 ou 50%. Para obter a probabilidade de ocorrer cara nas duas jogadas, faz-se o produto: ½ . ½ = ¼ = 0,25 ou 25%. Regra da multiplicação: eventos independentes Se os eventos A e B são dependentes, temos que: P(A e B) = P(A B) = P(A) . P(B/A) Uma urna contém duas bolas brancas e uma vermelha. Retiram-se duas bolas da urna ao acaso, uma em seguida da outra e sem que a primeira tenha sido recolocada. Qual é a probabilidade de as duas serem brancas? Regra da multiplicação: eventos dependentes A probabilidade da primeira bola ser branca é: 2/3 = 0,6667 ou 66,67%. A probabilidade da segunda bola ser branca: ½ = 0,5 ou 50%. Para obter a probabilidade das duas bolas retiradas serem brancas, faz-se o produto: P(2 bolas brancas) = 2/3 * 1/2 = 2/6 = 1/3 = 0,3333 ou 33,33%. Regra da multiplicação: eventos dependentes Com referência à tabela, admita que todas as escolhas envolvam 2000 indivíduos. Se uma pessoa é selecionada aleatoriamente, qual é a probabilidade de ela ter sido vítima de um estranho, dado que foi escolhida uma vítima de furto? a) P(estranho / furto) = 0,75. b) P(estranho / furto) = 0,559. c) P(estranho / furto) = 0,2525. d) P(estranho / furto) = 0,5087. e) P(estranho / furto) = 0,1739. Interatividade Homicídio Furto Assalto Total Estranho Conhecido ou parente Ignorado 12 39 18 379 106 20 727 642 57 1118 787 95 Totais 69 505 1429 2000 ATÉ A PRÓXIMA!
Compartilhar