Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Estudo Dirigido de ESTATÍSTICA APLICADA Olá pessoal, estamos no final desta fase e para auxiliá-los, nós preparamos um material que certamente irá ser muito útil para as provas objetivas e discursivas. Ao longo das 6 aulas estudamos que é extremamente difícil definir estatística, mas, segundo descrito por Castanheira e Aurélio é uma metodologia desenvolvida para coleta, classificação, a apresentação, a análise e a interpretação de dados quantitativos e a utilização desses dados para tomada de decisões. Alguns destes termos são População e Amostra que são definidos como: População – é o conjunto de elementos que desejamos observar para obtermos determinados dados. 1. População finita: é quando sabemos exatamente o tamanho dela, por exemplo, vamos pesquisar a altura dos alunos de uma sala de aula com 50 alunos ou vamos pesquisar a variação de idade dos sócios do clube X etc. 2. População infinita: é quando a população tem um número infinito de elementos ou é difícil de ser quantificada, por exemplo, a quantidade de rosas amarelas que florescem no outono no Brasil, ou a quantidade peixes X no oceano Atlântico etc. Amostra – é o subconjunto de elementos retirados da população que estamos observando para obtermos determinados dados. Estatística Descritiva ou dedutiva, é o tipo de estatística que tem por objetivo descrever e analisar determinada população sem, com isso, pretender tirar conclusões de caráter mais genérico. É a parte da estatística referente à coleta e à tabulação dos dados. Estatística Indutiva ou Inferência Estatística é admitirmos que os resultados obtidos na análise dos dados de uma amostra são válidos para toda a população da qual aquela amostra foi retirada. Consiste em obtermos e generalizarmos conclusões. Um estudo estatístico completo compreende oito fases distintas para que se chegue ao resultado final. 1. Definição do problema; 2. Delimitação do problema; 3. Planejamento para obtenção dos dados; 2 4. Coletar os dados; 5. Apuração dos dados; 6. Apresentação dos dados; 7. Análise dos dados; 8. Interpretação dos dados. Uma vez concluída a coleta de dados e também a ordenação dos mesmos, devemos apresentá-las de tal forma que o leitor consiga identificar, rapidamente, uma série de informações. Para tal processo, a estatística costuma utilizar-se de duas ferramentas: tabelas e gráficos. Em relação às tabelas, a sua estrutura é constituída de 3 partes: Cabeçalho, corpo e rodapé. Quando o número de resultados obtidos em uma pesquisa é demasiadamente grande, sendo necessário agruparmos esses resultados em faixas de valores, denominados classes ou intervalos. Dentro da Estatística, encontramos o termo “Séries Estatísticas”, denominação dada a uma tabela na qual existe um critério distinto que a especifica e a diferencia. Existem cinco tipos de tabelas de Séries Estatísticas, cada uma tem particularidades que as definem e as diferenciam das outras. São elas: Temporais Geográficas Específicas: Esse tipo de série é caracterizada pela variação do fato (variação do fenômeno), enquanto local e o tempo são constantes. Conjugadas: Esse tipo de série, também conhecida como série mista, é caracterizada pela existência da combinação entre as séries temporais, geográficas e específicas. De distribuição de frequência. Uma tabela de Série Estatística Temporal (cronológica, evolutiva ou histórica) tem como característica a variação do tempo (época), enquanto o local (fator geográfico) e o fato (fenômeno) permanecem fixos, como podemos ver na tabela 1. ANO EXPORTAÇÕES (em US$ 1.000.000,00) 2008 344 2009 434 2010 667 2011 892 2012 1.465 Fonte: dados fictícios elaborados pelo autor. 3 Nossa Instituição obteve certa quantidade de candidatos ao vestibular de verão/2013, a distribuição desses candidatos por curso pode ser verificada na tabela 2. Observamos que se trata de uma Séries Estatísticas específicas – sua característica é a variação do fato (variação do fenômeno), enquanto local e o tempo são constantes. Cursos ofertados Número de candidatos Logística 5.980 Recursos humanos 3.120 Gestão ambiental 2.331 Saúde ocupacional 1.567 Gestão da produção 6.025 Fonte: dados fictícios elaborados pelo autor Observando a tabela a seguir que demonstra uma Série Estatísticas geográficas – sua característica é a variação do local de ocorrência (fator geográfico), enquanto tempo (a época) e o fato (o fenômeno) permanecem fixos. Região Quantidade de microempresas Norte 8.879 Sul 23.986 Sudeste 45.901 Centro oeste 7.987 Nordeste 16.439 Fonte: dados fictícios elaborados pelo autor Observamos em uma pesquisa que podem existir diferentes valores, isso denominamos de variável. As variáreis são classificadas em qualitativas e quantitativas. A variável quantitativa é expressa por meio de valores numéricos e pode relacionar todos os possíveis valores que ela pode assumir. Exemplo: número de peças defeituosas, quantidade de máquinas disponíveis, volume de água em reservatórios, altura dos empregados, temperatura ambiente etc. A variável qualitativa é a que descreve qualidades, categorias ou atributos que normalmente não podem ser expressos em valores numéricos. 1. Variável qualitativa nominal – permite somente a classificação dos dados. Ex.: sexo, cor da pele, origem, ramo de atividade de uma empresa etc. 4 2. Variável qualitativa ordinal – permite que se estabeleça uma ordem nos seus resultados. Ex.: grau de instrução, status social, classificação em um concurso, classe social, ordem de chegada etc. A mediana (Md) de um conjunto de dados é o valor que ocupa a posição central desses dados, desde que estejam colocados em ordem crescente ou decrescente, ou seja, em um rol. Caso a quantidade de dados seja par, o valor da mediana será a média aritmética dos dois valores que estão no centro da série. Agora para calcularmos a mediana do conjunto de valores abaixo necessitamos seguir alguns passos, veja: 10 - 7 - 12 - 6 - 10 - 9 1º. Passo colocar em ordem crescente: 6 – 7 – 9 – 10 – 10 - 12 2º. Passo é verificar se a quantidade de dados é par ou impar, nesse caso é par então a mediana é a média aritmética dos dois valores centrais da série, ou seja: Md= (9+ 10)/2 Md = 9,5 Outro exemplo: Dados o conjunto de números inteiros, determine a mediana desses valores. 9 - 6 - 5 - 4 - 8 - 9 - 10 - 4 - 7 - 8 - 5 - 6 - 10 1º. Passo colocar em ordem crescente: 4 - 4 – 5 – 5 - 6 – 6 - 7 – 8 - 8 – 9 - 9 – 10 – 10 2º. Passo é verificar se a quantidade de dados é par ou impar, nesse caso é impar então a mediana é o valor central da série, ou seja: Md= 7 5 Caso tenhamos uma relação com dados oriundos de uma pesquisa, pede-se o valor da Mediana deles. Descreva a seguir o passo a passo para determinar a Mediana (Md) dos valores do exemplo de dados a seguir. “4, 7, 3, 9, 6, 15, 4, 7, 8, 10, 5, 3, 1” 1º. Passo colocar em ordem crescente: 1, 3, 3, 4, 4, 5, 6, 7, 7, 8, 9, 10, 15 2º. Passo é verificar se a quantidade de dados é par ou impar, nesse caso é impar então a mediana é o valor central da série, ou seja: Md= 6 Analisando os resultados de uma pesquisa feita em uma sala de aula, em relação à altura dos alunos, obtivemos os dados agrupados na tabela 1. Calcule a altura Mediana (Md) desses alunos. ALTURA DOS ALUNOS FREQUÊNCIA 163 cm 3 165 cm 4 167 cm 8 169 cm 5 171 cm 5 173 cm 7 175 cm 5 177 cm 3Fonte: o autor. 1º Verificar a quantidade de dados (n = ?). Para isso, fazer a frequência acumulada e verá que é 40, portanto, n = 40 “par”. 2º Como é par, a Mediana (Md) será a média dos dois elementos centrais. 3º Os elementos centrais são: os 20º e 21º , em que o 20º tem 169 cm e o 21º 171 cm. 4º Calcular a média entre eles: (169 + 171) / 2 = 170 cm, essa é a Md. Um valor muito usado nos cálculos estatísticos é a Moda (Mo) de uma amostra ou população. A Moda (Mo) é o valor dos resultados de uma pesquisa que acontecem com a maior frequência. 6 Observando a distribuição sem agrupamento na tabela 1, descreva qual o valor modal desta e como foi encontrado. ALTURA DOS PILOTOS FREQUÊNCIA 168 cm 12 169 cm 15 170 cm 13 171 cm 19 172 cm 7 Fonte: dados fictícios elaborados pelo autor. O valor modal (Mo) é 171 cm, pois, para se determinar o valor modal de uma distribuição sem agrupamento, deve-se observar qual variável tem a maior frequência. Dado o conjunto de números inteiros, determine o desvio médio desses valores em relação à média. 8, 4, 6, 9, 10, 5 Dm = [∑|X - média aritmética|x f]/n X= (8 + 4 + 6 + 9 + 10 + 5)/6 X = 42/6 X = 7 Xi Xi - X I Xi – X I 4 4 – 7 = - 3 3 5 5 – 7 = -2 2 6 6 – 7 = - 1 1 8 8 – 7 = 1 1 9 9 – 7 = 2 2 10 10 – 7 = 3 3 ∑ 0 12 Dm = 12/6 Dm = 2 7 Variância é a média aritmética dos quadrados dos desvios Ou seja: Dado o conjunto de números inteiros, determine a variância do conjunto, supondo que esses valores correspondam a uma amostra. 8, 4, 6, 9, 10, 5 S2 = [∑(X - média aritmética)2 x f]/(n – 1) X= (8 + 4 + 6 + 9 + 10 + 5)/6 X = 42/6 X = 7 S2 = [(7)2 x f]/(n – 1) Xi Xi - X S 2 4 4 – 7 = - 3 9 5 5 – 7 = -2 4 6 6 – 7 = - 1 1 8 8 – 7 = 1 1 9 9 – 7 = 2 4 10 10 – 7 = 3 9 ∑ 0 28 S2 = 28/6-1 = 28/5 S2 = 5,6 Dado o conjunto de números inteiros, determine o desvio padrão do conjunto, supondo que esses valores correspondam a uma amostra. 8, 4, 6, 9, 10, 5 S = desvio padrão “é igual a raiz quadrada da variância”. 8 S2 = [∑(X - média aritmética)2 x f]/(n – 1) X= (8 + 4 + 6 + 9 + 10 + 5)/6 X = 42/6 X = 7 S2 = [(7)2 x f]/(n – 1) Xi Xi - X S 2 4 4 – 7 = - 3 9 5 5 – 7 = -2 4 6 6 – 7 = - 1 1 8 8 – 7 = 1 1 9 9 – 7 = 2 4 10 10 – 7 = 3 9 ∑ 0 28 S2 = 28/6-1 = 28/5 S2 = 5,6 S = desvio padrão “é igual a raiz quadrada da variância”. S = √ S2 S = 2,36 Em uma distribuição de frequências, verificou-se que a mediana é igual a 15,40, a média é igual a 16,00 e o desvio padrão é igual a 6,00. Determine o segundo coeficiente de assimetria de Pearson, com duas casas depois da vírgula. As = 3 x (Média aritmética – Md) / S, ou seja, As= 3 . (média – mediana)/desvio padrão As = 3 (16 – 15,4) / 6 9 As = 3 (0,6) / 6 As = 1,8 / 6 As = 0,30 Em uma distribuição de frequências, verificou-se que a mediana é igual a 15,40, a média é igual a 16,00 e o desvio padrão é igual a 6,00. Determine o segundo coeficiente de assimetria de Pearson, com duas casas depois da vírgula. As = 3 x (Média aritmética – Md) / S, ou seja, As= 3 . (média – mediana)/desvio padrão As = 3 (16 – 15,4) / 6 As = 3 (0,6) / 6 As = 1,8 / 6 As = 0,30 Uma bola é retirada ao acaso de uma urna que contém 6 bolas vermelhas, 8 bolas pretas e 4 bolas verdes. Analise a demonstração do cálculo da probabilidade dela não ser preta. A bola retirada não pode ser preta; logo, poderá ser vermelha ou verde. Então: P (Vermelha ou Verde) = P (Vermelha) + P (Verde) P (Vermelha ou Verde) = 6/18 + 4/18 P (Vermelha ou Verde) = 10/18 Dados brutos: são as relações dos resultados obtidos em uma pesquisa e que foram transcritos aleatoriamente, ou seja, fora de qualquer ordem. Rol: é a relação dos resultados obtidos em uma pesquisa e que foram colocados em ordem numérica, crescente ou decrescente. 10 Frequência: é o número de vezes que um mesmo resultado acontece durante uma pesquisa. Calcule a média das idades representadas na distribuição de frequências da tabela abaixo. Idade Frequência 4 4 5 6 6 6 7 4 Média = 4 .4 + 5 . 6 + 6 . 6 + 7 . 4 / 20 Média = 16 + 30 + 36 + 28 / 20 Média = 110 / 20 = 5,5 Calcule o desvio médio do seguinte conjunto de números: 4, 6, 8, 9, 10 e 11. Inicialmente devemos calcular a média aritmética dos valores dados: Média = 4 + 6 + 8 + 9 + 10 + 11 / 6 Média = 8 Em seguida: 4 4 – 8 = - 4 4 6 6 – 8 = - 2 2 8 8 – 8 = 0 0 9 9 – 8 = 1 1 10 10 – 8 = 2 2 11 11 – 8 = 3 3 ∑ 0 12 Desvio médio = 12 / 6 = 2 11 Qual a probabilidade de obtermos o total de seis (6) pontos na jogada de dois (2) dados honestos? S = {36 resultados possíveis} A = {a soma dos dois dados é igual a 6} A = {(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)} P(A) = 5/36 Hipótese nula (H0) é a hipótese que será testada, ou seja, é a informação a respeito do valor do parâmetro que desejamos avaliar. Hipótese alternativa (H1) é a hipótese que afirma que a hipótese nula é falsa, ou seja, é a afirmação a respeito do valor do parâmetro que aceitaremos como verdadeiro, caso a hipótese nula seja rejeitada. Em 100 lances de uma moeda honesta, qual a média esperada de caras obtidas e qual o desvio padrão do experimento? Média = 100 (1/2) = 50 S2 = 100 (1/2) . (1/2) = 25 S = 5 O termo probabilidade é usado de modo amplo na conversação diária para sugerir certo grau de incerteza sobre o que ocorreu no passado, o que ocorrerá no futuro e o que está ocorrendo no presente. Uma empresa importadora tem 25% de chance de vender com sucesso um produto A e tem 40% de chance de vender com sucesso um produto B. Se essa empresa importar os dois produtos A e B, qual a probabilidade dela ter sucesso na venda ou do produto A ou do produto B? P (A ou B) = P ( A ) + P ( B ) – P ( A ∩ B) P (A ou B) = 25/100 + 40/100 – 25/100 . 40/100 12 P (A ou B) = 65/100 – 10/100 P (A ou B) = 55/100 Uma urna I contém 4 bolas vermelhas, 3 bolas pretas e 3 bolas verdes. Uma urna II contém 2 bolas vermelhas, 5 bolas pretas e 8 bolas verdes. Uma urna III contém 10 bolas vermelhas, 4 bolas pretas e 6 bolas verdes. Calcule a probabilidade de, retirando-se uma bola de cada urna, serem todas de mesma cor. Calculando-se a probabilidade de todas as bolas serem vermelhas: P (Verm, Verm, Verm) = 4/10 . 2/15 . 10/20 P (Verm, Verm, Verm) = 80/3000 Calculando-se a probabilidade de todas as bolas serem pretas: P (Preta, Preta, Preta) = 3/10 . 4/15 . 5/20 P (Preta, Preta, Preta) = 60/3000 Calculando-se a probabilidade de todas as bolas serem verdes: P (Verde, Verde, Verde) = 3/10 . 8/15. 6/20 P (Verde, Verde, Verde) = 144/3000 Calculando a soma das três probabilidades: P (ser da mesma cor) = 80/3000 + 60/3000 + 144/3000 P (ser da mesma cor) = 284/3000. Caros alunos chegamos ao final do nosso estudo dirigido, desejo a todos muito sucesso! Prof. Emerson Seixas
Compartilhar