Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
* * * * * * * * * Estatística Descritiva é usada para: organizar; resumir ; descrever os aspectos importantes de um conjunto de características observadas; comparar tais características entre dois ou mais conjuntos identificar anomalias * * * Ferramentas descritivas: gráficos; tabelas; porcentagens; índices; médias. * * * Dados obtidos a partir das notas das tarefas dos alunos de Estatística: * * * Variável é a característica de interesse que é medida em cada elemento da amostra ou população * * * Variáveis Quantitativas: são as características que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos. Ex: número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia, peso, altura, tempo, pressão arterial, idade. * * * Variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. Variáveis contínuas, características mensuráveis que assumem valores em uma escala contínua (na reta real), para as quais valores fracionais fazem sentido. Dois tipos de Variáveis Quantitativas * * * * * * Variáveis Qualitativas (ou categóricas): são as características que não possuem valores quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma classificação dos indivíduos. Podem ser nominais ou ordinais. * * * Variáveis nominais: não existe ordenação dentre as categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio. Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (1o, 2o, 3o graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro,..., dezembro). * * * Situação: Um agente comunitário do programa de saúde da família deseja escrever um pequeno texto alertando os jovens de sua comunidade sobre o problema da gravidez indesejada. Com este propósito, ele decide investigar quais os métodos que os jovens estão usando. Após pesquisa realizada com 50 jovens (14 – 19 anos), escolhidos aleatoriamente, obteve-se os dados ao lado. Tabela Tabela Tabela Pílula Tabela Preserv. Outros Tabela Outros Preserv. Pílula Tabela Preserv. Tabela Tabela Outros Preserv. Pílula Preserv. Tabela Tabela Preserv. Tabela Tabela Tabela Preserv. Preserv. Preserv. Tabela Tabela Tabela Pílula Pílula Tabela Tabela Tabela Preserv. Outros Preserv. Tabela Preserv. Preserv. Preserv. Outros Preserv. Pílula Pílula Pílula Tabela Preserv. Análise Descritiva & Dados Qualitativos * * * Conclusão: 74% dos jovens se utilizam de tabela e preservativo, logo, o texto deve explicar em detalhe como utilizar corretamente estes métodos e alertar para a sua fragilidade enquanto método contraceptivo. Plan1 Método Freq. Absoluta Freq. Relativa Freq. Acumulada Tabela 21 42% 42% Preservativo 16 32% 74% Pílula 8 16% 90% Outros 5 10% 100% Total 50 100% Plan2 Plan3 Gráf2 21 16 8 5 Freq. Absoluta Métodos Anticoncepcionais Plan1 Método Freq. Absoluta Freq. Relativa Freq. Acumulada Tabela 21 42% 42% Preservativo 16 32% 74% Pílula 8 16% 90% Outros 5 10% 100% Total 50 100% Plan1 21 16 8 5 Freq. Absoluta Refrigerantes consumidos Plan2 Plan3 * * * Normas para representação tabular: Local, época e fenômeno Entidade responsável pelo levantamento dos dados * * * * * * * * * * * * * * * IMPORTANTE: Tabelas devem ser precedidas ou seguidas de uma análise, ou seja, não devem aparecer soltas em um trabalho científico. * * * Mais detalhes: http://www.sei.ba.gov.br/images/releases_mensais/pdf/ipc/norma_tabular/normas_apresentacao_tabular.pdf * * * Distribuição de Freqüências de uma Variável Variáveis Quantitativas Discretas * * * Exemplo: A lista do número de irmãos dos alunos de uma determinada turma é a seguinte: Construa a tabela de freqüências. Construa o diagrama de barras. * * * Quando trabalhamos com uma variável discreta que pode assumir um grande número de valores distintos como, por exemplo, o número de ovos que um inseto põe durante sua vida, a construção da tabela de freqüências e de gráficos considerando cada valor como uma categoria fica inviável. A solução é agrupar os valores em classes. * * * * * * Gráf3 1.6 12 38.8 30.8 13.2 2.8 0.8 FreqüênciaRelativa (%) Número de ovos Freqüência Relativa % Ovopostura de 250 insetos Plan1 Número de ovos FreqüênciaRelativa (%) 10 a 14 1.6 15 a 19 12 20 a 24 38.8 25 a 29 30.8 30 a 34 13.2 35 a 39 2.8 40 a 44 0.8 Plan1 35 62 Freqüência da variável sexo dos ursos Plan2 FreqüênciaRelativa (%) Número de ovos Freqüência Relativa % Ovopostura de 250 insetos Plan3 * * * Distribuição de Freqüências de uma Variável Variáveis Quantitativas Contínuas * * * * * * Exemplo: As alturas, em cm dos alunos de uma turma. Construa uma tabela de freqüências, agrupando os dados em classe. Represente graficamente os dados. Faça uma leitura preliminar dos resultados. * * * Quadro 1. 1 Dados sobre as alturas dos alunos numa amostra de 28 colaboradores – Local, ano. * * * Figura 1. 1 Distribuição de freqüências das alturas dos alunos numa amostra de 28 colaboradores - Local, ano. Gráf3 4 4 8 8 4 150 155 160 165 170 175 Alturas Fi Alturas dos alunos Plan1 Distribuição das alturas dos alunos Alturas xi Fi fi % Fiac fiac % 150 |--- 155 152.5 4 14.29 4 14.29 155 |--- 160 157.5 4 14.29 8 28.57 160 |--- 165 162.5 8 28.57 16 57.14 165 |--- 170 167.5 8 28.57 24 85.71 170 |--- 175 172.5 4 14.29 28 100.00 Total 28 100.00 Plan1 150 155 160 165 170 175 Alturas Fi Alturas dos alunos Plan2 150 169 174 155 165 170 172 152 158 163 158 166 158 166 170 171 162 171 161 154 168 161 164 166 164 162 156 167 Plan3 * * * Símbolo do somatório Valor final do índice Valor inicial do índice Variável Índice * * * * * * * * * Exemplos: * * * Medidas de Localização Média Moda Mediana O conjunto de dados ou observações que constituem a amostra será representado por x1, x2, ..., xn * * * * * * Há três espécies de mentiras: mentiras, mentiras do caraças e Estatística. Mark Twain * * * É freqüente, em televisão, solicitar aos espectadores que telefonem a dar a sua opinião relativamente a um determinado assunto. Num programa colocaram as seguintes questões: 1. Deve haver pagamento de propinas no ensino superior público? 2. Os hipermercados devem fechar aos domingos? 3. Deveríamos voltar a ter uma monarquia? * * * Resultados: 1. 50%-Sim, 50%-Não 2. 50%-Sim, 50%-Não 3. 93%-Sim, 7%-Não. A apresentadora afirmou que 50% dos telespectadores achavam que deveria haver pagamento de propinas no ensino superior público. Estará esta afirmação correta? * * * Frases publicitárias do gênero "8 em cada 10 pessoas prefere o detergente X“ ... ... podem muito bem ser baseadas em amostras de 10 pessoas cuidadosamente selecionadas para dar aquele resultado. * * * Frases como: “houve uma melhoria de 100% nos nossos serviços!” procuram transmitir a idéia de qualidade... ... quando melhorar 100% sobre um serviço de péssima qualidade não é lá grande coisa. * * * Média = média x1, x2, ..., xn representam os elementos da amostra n número de elementos da amostra * * * Exemplo: Os dados a seguir referem-se ao número de dias de chuva por mês numa cidade, durante 12 meses: 10 9 8 5 5 3 5 5 6 7 9 11 Calcule a média desses dados. * * * Média para dados agrupados = média k é o número de classes do agrupamento ni é a frequência absoluta da classe i yi é o ponto médio da classe i, o qual é considerado como elemento representativo da classe. * * * Os professores universitários estão, dentro da mesma categoria, classificados em 4 escalões A, B, C e D. Suponha que num determinado departamento com 15 professores auxiliares, se registrou para cada um deles a categoria, o estado civil e a idade: 1- B, casado, 35 6- D, viúvo, 50 11- A, solteiro, 32 2- A, solteiro, 28 7- B, solteiro,35 12- B, divorciado, 30 3- B, casado, 38 8- A, solteiro,32 13- C, casado, 36 4- A, solteiro, 34 9- A, casado, 30 14- D, casado 40 5- C, casado, 40 10- A, solteiro, 28 15- B, casado, 35 * * * Relativamente à característica "categoria", poderá calcular a média, mediana e moda ? b) A mesma questão anterior, relativamente ao estado civil. c) A mesma questão relativamente à idade. * * * Resposta item a * * * Resposta item b * * * Resposta item c * * * A média será sempre uma medida representativa dos dados ? Ex : 12.4 13.5 13.6 11.2 15.1 10.6 12.4 14.3 113.5 = 24.1 Se calcularmos os desvios de todas as observações relativamente à média e somarmos esses desvios o resultado obtido é igual a zero. * * * Com dados de tipo qualitativo não tem sentido calcular a média, mesmo que os dados sejam números. Se, por exemplo, temos um conjunto de 1's e 2's, se se referirem à variável sexo, em que se utilizou o 1 para representar o sexo masculino e o 2 para o sexo feminino. * * * Suponha que numa região começaram a aparecer pessoas com uma virose desconhecida. Os médicos do Centro de Saúde dessa região procuraram recolher alguma informação sobre as pessoas atacadas por essa doença. Foi recolhida uma amostra de 34 desses doentes a quem se perguntou, entre outras características, a idade. Depois de analisados os dados os médicos foram informados que a idade média dos doentes era de 32 anos. Um dos médicos, mais curioso que os outros pediu que lhe mostrassem a distribuição dos dados, tendo-lhe sido apresentada a seguinte distribuição. * * * Conclusão? * * * Moda * * * Mediana É a medida de localização, tal que 50% dos elementos da amostra são menores ou iguais a M, e os outros 50% são maiores ou iguais a M. Se n é ímpar, a mediana é o elemento médio. Se n é par, a mediana é a semi-soma dos dois elementos médios. * * * Média ou Mediana? * * * Um aluno do obteve as seguintes notas: 10, 10, 10, 11, 11, 11, 11, 12 A média e a mediana da amostra anterior são respectivamente = 10.75 e M = 11 * * * Uma das notas de 10 foi substituída por uma de 18. Neste caso a mediana continuaria a ser igual a 11, enquanto que a média subiria para 11.75 ! * * * Os salários dos 160 empregados de uma determinada empresa, distribuem-se de acordo com a seguinte tabela de frequências: Calcular a média e a mediana e comentar os resultados obtidos. * * * Resolução: = (75*23+100*58+...+400*7+1700*2)/160 = $ 156,10 m = semi-soma dos elementos de ordem 80 e 81 = $ 100. Numa perspectiva social, a mediana é uma característica mais importante do que a média. Na realidade 50% dos trabalhadores têm salário menor ou igual a $100 , embora a média de $156,10 não transmita essa idéia ! * * * Não é conveniente o uso a média como medida de localização para amostra com distribuição muito assimétrica. * * * A média é influenciada quer por valores muito grandes, quer por valores muito pequenos. * * * * * * * * * Medidas de Dispersão Variância Desvio Padrão Os dados abaixo referem-se ao consumo de água, em litros, em 7 casas. Calcule a média, a variância e o desvio padrão desses dados. 1020 1300 2300 1500 900 3500 800 * * * * * * Define-se a variância, e representa-se por s2, como sendo a medida que se obtém somando os quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra menos um. * * * Desvio Padrão o desvio padrão é sempre não negativo e será tanto maior, quanto mais variabilidade houver entre os dados. se s = 0, então não existe variabilidade, isto é, os dados são todos iguais. * * * * * * Cálculo da Média: http://www.webcalc.com.br/frame.asp?pag=http://www.webcalc.com.br/matematica/estatistica.html * * * * * * * * * O tempo médio de realização da tarefa foi de aproximadamente 17 minutos com uma variabilidade medida pelo desvio padrão de aproximadamente 3.5 minutos média = 16.9. s2 = 112.9 = 12.54 9 s = 3.54 * * * Tabela: Notas finais de 3 turmas de estudantes e a média de cada turma * * * Outro modo de calcular o desvio Padrão: * * * Com valores repetidos: * * * Medidas descritivas das notas finais dos alunos de 3 turmas * * * Coeficiente de variação (cv) : Para compararmos duas distribuições nem sempre é conveniente uma comparação direta. Exemplo: Os dados a seguir mostram os preços de uma geladeira (a) e de um liquidificador (b), pesquisado em 7 lojas distintas: 750 800 790 810 820 760 780 50 45 55 43 52 45 54 Qual dos dois preços possui menor dispersão em relação à média? * * * Média(a) = Média (b) = S(a) = S(b) = * * * Média(a) = 787,14 Média (b) = 49,11 S(a) = 25,63 S(b) = 4,81 A diferença de preços é grande e uma comparação direta pode mascarar os resultados. Para uma avaliação correta usa-se o coeficiente de variação (cv). * * * = 0,033 = 3,3% = 0,098 = 9,8% * * * Conclusão: Os preços da geladeira têm menor variabilidade em relação aos preços do liquidificador. * * * Observação: Quanto maior for a dispersão no conjunto de observações, maior será o valor do CV. Até 10% - ótimo; 11% a 20% - bom; 21% - 30 % - regular. * * * Erro padrão da média: É comum média da amostra apresentar um desvio em relação à média da população. Calculamos o erro padrão da média para um ajuste posterior nos resultados obtidos. S = desvio padrão N – tamanho da amostra * * * Exemplo: Em uma amostra com cem observações em que o desvio padrão é igual a 5, o erro padrão da média será? * * * Aproximadamente 68% dos dados estão no intervalo , numa distribuição aproximadamente normal * * * * * * * * * Aproximadamente 100% dos dados estão no intervalo * * * Quartis e extremos Extremo inferior (Ei) – o menor valor do conjunto de valores. Extremo superior (Es) – o maior valor do conjunto de valores. Primeiro quartil ou quartil inferior ( Qi) – valor que delimita os 25% menores valores. Terceiro quartil ou quartil superior (Qs) – valor que separa os 25% maiores valores. Segundo quartil ou quartil do meio – É a própria mediana. * * * Exemplo Dados: 2, 0, 5, 7, 9, 1, 3, 4, 6, 8 Qi = ?, Qs = ?, Md = ? Dados: 2, 3, 4, 4, 5, 5, 5, 7, 8, 9, 10 Qi = ?, Qs = ?, Md = ? * * * Esquema dos cinco números: Dados: n = 34 Md 22,5 Q 18 29 E 9 62
Compartilhar