Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 EstatísticaEstatística 2 Por quê é Por quê é importante importante estudar estudar estatística?estatística? Torna o profissional mais crítico na análise de informações e menos sujeito a afirmações enganosas Perguntas tendenciosas => Ex1: o presidente deve ter o poder de vetar decisões do congresso? (97% sim) o presidente deve ter ou não o poder de vetar decisões do congresso? (57% sim) 2 3 • Pressão do pesquisador: –Quem lava as mãos após usar um banheiro? –Perguntas feitas a indivíduos pesquisados, estes normalmente dão respostas favoráveis à sua auto-imagem. –Pesquisa telefônica 94% dos entrevistados responderam que lavam suas mãos após usar um banheiro, –Observação em lugares públicos confirmaram apenas em 68% dos indivíduos. 4 Objetivos da Estatística obter conclusões sobre as populações a partir de informações da amostra. Sem Métodos Estatísticos, uma pesquisa não tem validade científica! POPULAÇÃO : Conjunto de elementos com pelo menos uma característica em comum observável. Pode ser finita ou infinita AMOSTRA: Parte da população. 3 5 Tipos de pesquisa estatística • DE LEVANTAMENTO Características de interesse de uma população são levantadas (observadas ou medidas), mas sem manipulação.As informações já existem • EXPERIMENTAL Grupos de indivíduos (ou animais, ou objetos) são manipulados para se avaliar o efeito de diferentes tratamentos. . As informações são produzidas pelo experimento 6 Censo x Amostragem População Censo: Todos são avaliados Análise Exploratória dos Dados Amostra: Uma Parte Análise Exploratória dos Dados + Inferência Estatística X1 X2 Xn... X1 X2 XN... 4 7 Quando usar Amostragem? Economia Rapidez de processamento Confiabilidade Testes destrutivos 8 Quando NÃO usar Amostragem? População pequena Característica de fácil mensuração Necessidades políticas Necessidade de alta precisão 5 9 Fases do Método Estatístico 1. DEFINIÇÃO DO PROBLEMA 2. PLANEJAMENTO 3. COLETA DE DADOS 4. APURAÇÃO DOS DADOS 5. APRESENTAÇÃO DOS DADOS 6. ANÁLISE E INTERPRETAÇÃO DOS DADOS 10 Fases do Método Estatístico 1. DEFINIÇÃO DO PROBLEMA: Saber exatamente aquilo que se pretende pesquisar é o mesmo que definir corretamente o problema. 6 11 Fases do Método Estatístico 2. PLANEJAMENTO: Como levantar informações? Que dados deverão ser obtidos? Qual levantamento a ser utilizado? Censo ou amostragem? Cronograma de atividades, Os custos envolvidos? Etc. 12 Fases do Método Estatístico 3. COLETA DE DADOS : Fase operacional. É o registro sistemático de dados, com um objetivo determinado. 7 13 Fases do Método Estatístico 4. APURAÇÃO DOS DADOS : Resumo dos dados através de sua contagem e agrupamento. É a condensação e tabulação de dados. 14 Fases do Método Estatístico 5. APRESENTAÇÃO DOS DADOS : Há duas formas de apresentação, que não se excluem mutuamente: – A apresentação tabular: apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado segundo regras práticas fixadas pelo Conselho Nacional de Estatística. – A apresentação gráfica: os dados numéricos constituem uma apresentação geométrica permitindo uma visão rápida e clara do fenômeno. 8 15 Fases do Método Estatístico 6. ANÁLISE E INTERPRETAÇÃO DOS DADOS: Cálculo de medidas e coeficientes, cuja finalidade principal é descrever o fenômeno (estatística descritiva). Descrição e apresentação de dados Estatística Descritiva: Coleta → Organização → Análise Estatística inferencial ou Inferência Estatística: Generalizações, conclusões (Amostra → População) Características Importantes: • A natureza ou forma da distribuição dos dados, como forma de sino, uniforme ou assimétrica; • Um valor representativo, como uma média; • Uma medida de dispersão ou variação. 9 Conceitos básicos: • População (ou universo): conjunto total de elementos com pelo menos uma característica comum. • Amostra: subconjunto finito da população (com as mesmas características). •Amostragem: é o processo de obtenção (ou coleta) de amostras de uma população. • Variável: a característica de interesse na população (entre outras possíveis) é chamada de variável. Classificação das variáveis Variáveis Qualitativas • qualitativa ordinal → possível ordenação (Exemplo: grau de instrução) •qualitativa nominal → não há possibilidade de ordenação (exemplo cor, estado civil) Variáveis Quantitativas • quantitativa discreta: contagem (números naturais). Exemplo: número de alunos • quantitativa contínua: mensuração (números reais) Exemplo: peso, altura, volume. 10 • Dados Brutos (Variável qualitativa nominal) Tabela 1 – Marcas de carros populares predominantes em 25 cidade do triângulo. Pálio Corsa Uno Gol Corsa Uno Gol Uno Pálio Uno Pálio Uno Gol Corsa Gol Ka Gol Uno Uno Gol Gol Corsa Gol Uno Uno Coleta, organização e apresentação dos dados Exemplo 2: Determine o tipo de variável dos dados a seguir. Coleta, organização e apresentação dos dados Tabela 2 – Marcas de carros populares predominantes em 25 cidade do triângulo. Uno Uno Gol Gol Corsa Uno Uno Gol Gol Pálio Uno Uno Gol Corsa Pálio Uno Uno Gol Corsa Pálio Uno Gol Gol Corsa Ka • Dados Elaborados - Rol 11 Coleta, organização e apresentação dos dados Distribuição de FrequênciaDistribuição de Frequência -Frequência absoluta (fi): número de vezes que o valor da variável ocorreu na amostra. -Frequência relativa (fr): frequência absoluta dividida pelo número total de observações. -Frequência percentual (fp): freqüência relativa multiplicada por cem. - Frequência acumulada (da classe) (Fa): soma das freqüências absolutas até a classe em questão. Distribuição de Frequência variável qualitativaDistribuição de Frequência variável qualitativa Tabela 3 – Distribuição de frequência das marcas de carros populares em 25 cidades do triângulo. Marca Frequência - fi fr fp(%) Corsa 4 4/25 = 0,16 16 Gol 8 8/25 = 0,32 32 Ka 1 1/25 = 0,04 4 Pálio 3 3/25 = 0,12 12 Uno 9 9/25 =0,36 36 Σ 25 1,00 100 Coleta, organização e apresentação dos dados Exemplo 5: Construir a distribuição de freqüências para os dados dos modelos de carros. 12 Distribuição de FrequênciaDistribuição de Frequência Distribuição de frequências da idade, em classes Idade Frequências (fi) 21 |– 24 7 24 |– 27 8 27 |– 30 1 30 |– 33 5 33 |– 36 9 TOTAL 30 Distribuição de frequências ( não aconselhável) Idade (Xi) fi 21 3 22 2 23 2 24 1 25 4 26 3 28 1 30 1 31 3 32 1 33 3 34 3 35 2 36 1 TOTAL 30 Exemplo: Idade dos alunos do curso de medicina veterinária de1993. 24 - 23 - 22 - 28 - 35 - 21 - 23 - 33 - 34 - 24 - 21 - 25 - 36 - 26 - 22 - 30 - 32 - 25 - 26 - 33 - 34 - 21 - 31 - 25 - 31 - 26 - 25 - 35 - 33 - 31 Dados em rol 21 - 21 - 21 - 22 - 22 - 23 - 23 - 24 - 25 - 25 - 25 - 25 - 26 - 26 - 26 - 28 - 30 - 31 - 31 - 31 - 32 - 33 - 33 - 33 - 34 - 34 - 34 - 35 - 35 - 36 Distribuição de FrequenciaDistribuição de Frequencia para dados contínuos ou para dados contínuos ou discretosdiscretos Elementos de uma distribuição de freqüência i. Organizar (ordenar): dados brutos → dados elaborados ii. Cálculo da amplitude total (A): iii. Cálculo do número de classes: Adotar um critério iv. Cálculo de amplitude de classe (C): v. Cálculo do limite inferior da primeira classe: vi. Calcular as classes. ( ) (1) nA X X 1C A k 1ª (1) 2 CLI X 13 Determinando o número de classes Determinando o número de classes -- kk Critérios: i) Critério de Oliveira (1994): , 100 5.log( ), 100 k n n k n n Exercícios 1- Na Tabela 9, temos as anotações das estaturas de 40 alunos do sexo masculino. Tabela 9 - Estaturas de alunos universitários do sexo masculino (m), em ordem crescente. 1,58 1,68 1,70 1,71 1,74 1,75 1,79 1,80 1,83 1,86 1,62 1,69 1,70 1,71 1,74 1,76 1,80 1,81 1,83 1,87 1,64 1,69 1,70 1,72 1,75 1,77 1,80 1,81 1,84 1,94 1,68 1,70 1,71 1,73 1,75 1,77 1,80 1,83 1,85 1,94 Construa uma tabela com a distribuição de frequencia absoluta, relativa e percentual referente às estaturas de alunos universitários do sexo masculino. Utilizar o critério de Oliveira. 14 Representação GráficaRepresentação Gráfica Gráfico para variáveis qualitativas: Gráfico em barras horizontais ou verticais; Gráfico em setores (“pizza”). Gráfico para variáveis quantitativas: Histograma; Polígono de Frequencia. Ilustração gráficaIlustração gráfica Grau de instrução fi fr fp.(%) Fundamental 12 0,3333 33,33 Médio 18 0,5000 50,00 Superior 6 0,1667 16,67 Total 36 1,00 100,00 Exemplo: Nível de instrução no setor de orçamento de uma companhia. 0 6 12 18 24 Fundamental Médio Superior Grau de Instrução Fr eq ue nc ia Figura 1 - Gráfico em barras verticais para a variável grau de instrução. 15 Ilustração gráficaIlustração gráfica Grau de instrução fi fr fp.(%) Fundamental 12 0,3333 33,33 Médio 18 0,5000 50,00 Superior 6 0,1667 16,67 Total 36 1,00 100,00 Exemplo: Nível de instrução no setor de orçamento de uma companhia. Figura 2 - Gráfico em setores para a variável grau de instrução. 12; 33,3% 18; 50,0% 6; 16,7% Fundamental Médio Superior Ilustração gráficaIlustração gráfica Gráfico de "Pizza" 4 16% 8 32%1 4% 3 12% 9 36% Corsa Gol Ka Pálio Uno Figura 4 – Gráfico de pizza para a variável marca de carros populares predominantes em 25 cidade do triângulo. Marca Frequencia Corsa 4 Gol 8 Ka 1 Pálio 3 Uno 9 Σ 25 16 Marca Frequencia Corsa 4 Gol 8 Ka 1 Pálio 3 Uno 9 Σ 25 Ilustração gráficaIlustração gráfica 0 1 2 3 4 5 6 7 8 9 Fr eq ue nc ia Corsa Gol Ka Pálio Uno Marcas ou modelos predominantes Gráfico de Barras Figura 5 – Gráfico de barras para a variável marca de carros populares predominantes em 25 cidade do triângulo. Marca Frequencia Corsa 4 Gol 8 Ka 1 Pálio 3 Uno 9 Σ 25 Ilustração gráficaIlustração gráfica Gráfico de Barras 4 8 1 3 9 Corsa Gol Ka Pálio Uno Marcas de carros Figura 6 – Gráfico de barras para a variável marca de carros populares predominantes em 25 cidade do triângulo. 17 Ilustração gráficaIlustração gráfica Figura 7 – Histograma para a variável coeficiente de atrito cinético de uma amostra de 40 pneus. Histograma 0 2 4 6 8 10 12 14 16 0,25 0,45 0,65 0,85 Coeficiente de atrito cinético Fr eq ue nc ia s Classes de Coeficiente de Atrito Cinético if iX 0,15 ├ 0,35 5 0,25 0,35 ├ 0,55 10 0,45 0,55 ├ 0,75 8 0,65 0,75 ├ 0,95 17 0,85 40 - Ilustração gráficaIlustração gráfica Figura 8 – Histograma para a variável coeficiente de atrito cinético de uma amostra de 40 pneus. Classes de Coeficiente de Atrito Cinético if iX 0,15 ├ 0,35 5 0,25 0,35 ├ 0,55 10 0,45 0,55 ├ 0,75 8 0,65 0,75 ├ 0,95 17 0,85 40 - Histograma 5 10 8 17 0,25 0,45 0,65 0,85 Coeficiente de atrito cinético medio da classei ix x ponto 18 Medidas de Posição Medidas de Posição –– Medidas de Tendência CentralMedidas de Tendência Central •• MédiaMédia – Média populacional → μ (mi) – Média amostral → (X barra) •• MedianaMediana – Mediana populacional → μd – Mediana amostral → Md •• ModaModa – Moda populacional → μo – Moda amostral → Mo X Média para dados Média para dados não agrupadosnão agrupados – Média amostral: Exemplo: Sabendo-se que o número de peças defeituosas observados em amostras retiradas diariamente da linha de produção, durante uma semana foi de 10, 14, 13, 15, 16, 18 e 12 peças, têm, para número médio de peças defeituosas da semana: 1 1 2 n i i n X X X XX n n 7 1 1 1 2 7 10 14 13 15 16 18 12 7 7 7 98 14 peças/dia 7 n i i i i X X X X XX n X 19 Média para dados Média para dados agrupadosagrupados – Média amostral: Exemplo: Número de gols por partida (variável discreta). 1 1 ou k k i i i i i i X X f n X X f n Nº. de gols por partida iX if 0 7 1 12 2 16 3 12 4 9 5 2 6 2 60 i iX f 0 12 32 36 36 10 12 138 , 7 1 1 1 2 2 7 7 60 60 0 12 12 60 138 2 3 gols por partida 60 i i i X f X f X f X fX X X Média para dados Média para dados agrupadosagrupados Exemplo: Coeficiente de atrito cinético (variável contínua) Classes de Coeficiente de Atrito Cinético if iX i iX f 0,15 ├ 0,35 5 0,25 1,25 0,35 ├ 0,55 10 0,45 4,50 0,55 ├ 0,75 8 0,65 5,20 0,75 ├ 0,95 17 0,85 14,45 40 - 25,40 * , * , * , * , , , . i i i f X X X 4 1 5 0 25 10 0 45 8 0 65 17 0 85 40 40 25 40 0 635 40 medio da classei ix x ponto 20 Mediana para dados Mediana para dados não agrupadosnão agrupados Se n é par, a mediana é média dos dois elementos centrais Se n é ímpar a mediana é o elemento central Exemplo: Considere a seguinte amostra de dados: 9, 9, 8, 11, 12, 13, 13, 14. , X X Md 4 5 1 12 2 1 11 5 2 Exemplo: Considere a seguinte amostra de dados: 9, 9, 8, 11, 12, 13, 13. Md X 4 11 Mediana para dados Mediana para dados agrupadosagrupados • Se a variável é discreta: Se a variável é discreta: o procedimento é o mesmo. Exemplo para variável discreta: Número de gols por partida. nº. de gols por partida iX if iF 0 7 7 1 12 19 2 16 35 3 12 47 4 9 56 5 2 58 6 2 60 60 - n n X posicao n X X Md Md X 30 31 2 2 2 2 60 2 2 2 2 2 4 2 gols por par 2 30 tida 2 • Se a variável é contínua: Se a variável é contínua: o procedimento (estimador) muda. ( )anterior Md i Md n F Md LI C f 2 21 Mediana para dados Mediana para dados agrupadosagrupados Exemplo para variável contínua: Coeficiente de atrito cinético. Classes de Coeficiente de Atrito Cinético if iF 0,15 ├ 0,35 5 5 0,35 ├ 0,55 10 15 0,55 ├ 0,75 8 23 0,75 ├ 0,95 17 40 40 - ( ) , , , , , , , , anterior Md iMd E n n F C Md LI f Md 2 40 2 40 15 0 20 2 20 55 8 5 0 20 10 55 0 55 0 55 0 125 0 675. 8 8 20 Moda para dados Moda para dados não agrupadosnão agrupados Exemplo: Considere a seguinte amostra: 8, 9, 9, 11, 13, 13, 13, 14. O valor que mais se repete é o 13, que aparece três vezes, portanto a moda é Mo = 13 (unimodal). Observação: Pode haver mais de uma moda em uma série. Exemplo: A série: 8, 9, 9, 11, 12, 13, 13, 14 então, os valores 9 e 13 ocorrem com maior frequencia que os demais. Esta série apresenta duas modas, sendo dita bimodal. É possível encontrar séries de dados nas quais nenhum valor apareça mais do que os outros. Exemplo: A série 8, 9, 10, 11, 13, 14 então, esta série é dita amodal. 22 Moda para dados Moda para dados agrupadosagrupados • SeSe aa variávelvariável éé discretadiscreta:: observa a maior frequencia (muito simples). Exemplo: Número de circuitos defeituosos por sistema, observados em uma amostra de 19sistemas. nº. de circuitos defeituosos iX if 1 10 2 7 3 1 4 1 19 A maior freqüência foi a da primeira “classe”, cujo valor é 1 circuito defeituoso por sistema , por isso a moda da distribuição é Mo = 1 circuito defeituoso/sistema. • SeSe aa variávelvariável éé contínuacontínua:: o estimador muda. MoMo LI C 1 1 2 Moda para dados Moda para dados agrupadosagrupados Exemplo para variável contínua: Coeficiente de atrito cinético. Classes de Coeficiente de Atrito Cinético if 0,15 ├ 0,35 5 0,35 ├ 0,55 10 0,55 ├ 0,75 8 0,75 ├ 0,95 17 40 ( ), , ( ) ( ) ( ) ,, , , , , ( ) ( ) , , , MoMo LI C Mo Mo 1 1 2 17 80 75 0 20 17 8 17 0 9 9 1 80 75 0 20 0 75 0 20 0 75 9 17 26 26 0 75 0 0692 0 8192 23 ASSIMETRIA Assimetria: significa desvio ou afastamento da simetria, (grau de deformação de uma curva). # Simétrica, se a média e a moda coincidem. # Assimétrica à esquerda ou negativa, se a média é menor que a moda. # Assimétrica à direita ou positiva, se a média é maior que a moda. Natureza da distribuição dos dados Média Mediana Moda freq Moda Mediana Média freq. Moda = Média = Mediana freq. Assimétrica à esquerda ou negativa Assimétrica à direita ou positiva Simétrica 24 Medidas de DispersãoMedidas de Dispersão Exemplo: Três grupos de alunos submeteram-se a um teste, obtendo as seguintes notas: Grupo A: 3, 4, 5, 6, 7 Grupo B: 1, 3, 5, 7, 9 Grupo C: 5, 5, 5, 5, 5 5A B Cx x x As médias das notas dos grupos são iguais, mas a variabilidade, que é bem distinta nos 3 grupos, não pode ser identificada apenas com a medida de posição. Nesse caso, seria necessário uma medida de dispersão. Medidas de DispersãoMedidas de Dispersão • Amplitude → A • Variância – Variância populacional → σ2 – Variância amostral → S2 • Desvio Padrão – Desvio Padrão Populacional → σ – Desvio Padrão Amostral → S • Coeficiente de Variação → CV • Erro Padrão da Média – Erro Padrão da Média Populacional → – Erro Padrão da Média Amostral → X XS 25 Amplitude para dados agrupados e não agrupadosAmplitude para dados agrupados e não agrupados A = maior valor - menor valor = X(n) – X(1) = Exemplo 1: Dados da amostra de tempo de vida de pneus: 40.000; 40.500; 35.600; 39.300; 37.200; 39.700; 35.000; 32.300 km. Logo, o tempo de vida do pneu apresenta uma amplitude A = 40.500 – 32.300 = 8.200 km, ou seja, o tempo de vida do pneu varia entre 32.300 e 40.500. Exemplo 2: Amplitude do coeficiente de atrito cinético 1kX X Classes de Coeficiente de Atrito Cinético if iX 0,15 ├ 0,35 5 0,25 0,35 ├ 0,55 10 0,45 0,55 ├ 0,75 8 0,65 0,75 ├ 0,95 17 0,85 40 - Logo, o coeficiente de atrito cinético apresenta uma amplitude A = 0,85 – 0,25 = 0,60 . Isto é, o coeficiente de atrito cinético varia entre 0,25 e 0,85. Variância para dados não agrupadosVariância para dados não agrupados Variância Amostral 2 2 12 2 21 1 1 1 ou , em que 1 1 nn n ii in ii i i i XX X X S S X X n n n n 2 2 121 1 1 1 ou , em que 1 1 nn n ii in ii i i i XX X X S S X X n n n n Desvio Padrão Amostral 26 Variância e Desvio Padrão para dados não agrupadosVariância e Desvio Padrão para dados não agrupados Exemplo: Considere os dados referentes ao tempo de vida de uma marca de pneu: 40.000; 40.500; 35.600; 39.300; 37.200; 39.700; 35.000; 32.300 km. Determine a variância e o desvio padrão. Situação 1: Estimador não simplificado 2 2 1 1, em que 1 n n i i i i X X X S X n n 2 . . . . km . . . . . . . . . . , km . . , = . , km n i i i i X X n X X S n S S 1 8 2 2 2 2 2 1 2 40 000 40 500 32 300 37 450 8 40 000 37 450 40 500 37 450 32 300 37 450 1 8 1 60 300 000 8 614 285 714 7 8 614 285 714 2 935 0103 Variância e Desvio Padrão para dados não agrupadosVariância e Desvio Padrão para dados não agrupados Exemplo: Considere os dados referentes ao tempo de vida de uma marca de pneu: 40.000; 40.500; 35.600; 39.300; 37.200; 39.700; 35.000; 32.300 km. Determine a variância e o desvio padrão. Situação 2: Estimador simplificado 2 12 2 1 1 1 n in i i i X S X n n . . . . . . . , * , * , * . . . . , . . , . , S S S S 2 2 2 2 2 2 2 10 10 10 2 2 40 000 40 500 32 3001 40 000 40 500 32 300 8 1 8 299 6001 11128032 10 1128032 10 1122002 10 7 8 7 1 60 300 000 8 614 285 714 km 7 8 614 285 714 = 2 935 0103 km 27 Variância e Desvio Padrão para dados agrupadosVariância e Desvio Padrão para dados agrupados Exemplo: Coeficiente de atrito cinético (variável contínua) Classes de Coeficiente de Atrito Cinético if iX 0,15 ├ 0,35 5 0,25 0,35 ├ 0,55 10 0,45 0,55 ├ 0,75 8 0,65 0,75 ├ 0,95 17 0,85 40 - , , * , , * , , , k ï i i S X X f n S S S 22 1 2 22 2 1 1 1 0 25 0 635 5 0 85 0 635 17 40 1 0 0480 0 0480 0 2190 medio da classei ix x ponto 0,635x Variância e Desvio padrão para dados agrupadosVariância e Desvio padrão para dados agrupados Exercício: Número de ovos danificados (variável discreta) Número de ovos quebrados iX fi 0 13 1 9 2 3 3 3 4 1 5 1 30 , , , S S 22 2 1 8172 ovos danificados 1 8172 1 3480 ovos danificados 28 Coeficiente de VariaçãoCoeficiente de Variação Coeficiente de Variação Populacional 100%CV Coeficiente de Variação Amostral 100%SCV X Erro Padrão da MédiaErro Padrão da Média Erro Padrão da Média Populacional Erro Padrão da Média Amostral 2 X nn 2 X S SS nn Coeficiente de VariaçãoCoeficiente de Variação • Conjunto de dados com diferentes unidades de medidas; • Mesma unidade de medida mas, com médias de magnitudes distintas. Exemplo: Qual das lâmpadas possui maior uniformidade de tempo de vida? , , , ,A A B BX S X S 4 0 meses, 0 8 meses, 8 0 meses e 1 2 meses , % , A A A SCV X 0 8x100 x100 20 4 0 , % , B B B SCV X 1 2x100 x100 15 8 0 A lâmpada B é a mais uniforme, pois possui um menor CV que a lâmpada A .
Compartilhar