Prévia do material em texto
�PAGE � �PAGE �57� ANÁLISE ESTATÍSTICA APRESENTAÇÃO E OBJETIVOS. BIBLIOGRAFIA ( Estatística Básica. Geraldo L. Toledo e Ivo I. Ovalle. ( Estatística para Economia. José da Costa Gomes. ( Estatística Aplicada à Administração. W. J. Stevenson. ( Estatística Aplicada com Excel. Ricardo Braule. ( Estatística Aplicada à Gestão Empresarial. Adriano Leal Bruni. RELACIONAMENTO COM DISCIPLINAS AFINS ( Física ( Agricultura ( Biologia ( Engenharia ( Monografia ( Medicina ( Economia ( Meio Ambiente ( Administração de Empresas IMPORTÂNCIA DA DISCIPLINA NA FORMAÇÃO PROFISSIONAL USO DO EXCEL Funções ( média, mediana, desvio-padrão, quartis, probabilidade etc. Ferramentas ( histograma, distribuição de freqüência, análise da variância, regressão, correlação, amostragem etc. APLICAÇÕES NOS EXERCÍCIOS ( inflação, balança comercial, produção industrial ( emprego, salário, distribuição de renda ( educação AVALIAÇÃO ( AV-1 (8,0) + LISTA1 (2,0) ( AV-2 (8,0) + LISTA 2,3, 4 (2,0) CONCEITOS INTRODUTÓRIOS O QUE É A ESTATÍSTICA? É UMA METODOLOGIA USADA PARA TRATAMENTO QUANTITATIVO DE FENÔMENOS DE MASSA. REPRESENTA O CONJUNTO DE TÉCNICAS CUJO OBJETIVO PRIMORDIAL É POSSIBILITAR A ANÁLISE E A INTERPRETAÇÃO DAS INFORMAÇÕES CONTIDAS EM DIFERENTES CONJUNTOS DE DADOS. PODE SER DIVIDIDA EM TRÊS GRANDES GRUPOS. 1 – ESTATÍSTICA DESCRITIVA - SERVE PARA DESCREVER FENÔMENOS, CONSISTINDO EM REDUZIR DADOS E INFORMAÇÕES INVESTIGADAS PARA APRESENTÁ-LOS DA MANEIRA MAIS PRÁTICA E SIMPLES POSSÍVEL. ( SÍNTESE DOS DADOS ( PERDA DE DADOS ( RESULTADOS DISTORCIDOS ( INTERPRETAÇÃO CUIDADOSA 2 – ESTATÍSTICA DAS PROBABILIDADES - É USADA PARA ESTUDAR O RISCO E O ACASO EM EVENTOS FUTUROS E DETERMINA SE É PROVÁVEL OU NÃO SEU ACONTECIMENTO. 3 – ESTATÍSTICA INDUTIVA OU INFERENCIAL ( O PROCESSO DE GENERALIZAÇÃO CARACTERÍSTICO DO MÉTODO INDUTIVO ESTÁ ASSOCIADO A UMA MARGEM DE INCERTEZA QUE É TRATADA MEDIANTE TÉCNICAS E MÉTODOS BASEADOS NA TEORIA DA PROBABILIDADE. É COMUM CALCULAR O ERRO TOLERÁVEL E APRESENTÁ-LO NAS PESQUISAS. A ESTATÍSTICA NAS EMPRESAS A IMPORTÂNCIA DA ESTATÍSTICA NO PROCESSO DE TOMADA DE DECISÃO APLICAÇÕES DA ESTATÍSTICA NA ÁREA DE GESTÃO POPULAÇÃO É O CONJUNTO TOTAL DOS INDIVÍDUOS – ANIMADOS OU INANIMADOS – QUE APRESENTEM PELO MENOS UMA CARACTERÍSTICA COMUM, CUJO COMPORTAMENTO INTERESSA ANALISAR OU INFERIR. EXEMPLO: ESTUDO CENSITÁRIO DAS RENDAS DAS FAMÍLIAS BRASILEIRAS. ( PODE SER FEITO ATRAVÉS DE UMA OBSERVAÇÃO PARA CADA FAMÍLIA DO BRASIL. POPULAÇÃO ( CONJUNTO DAS OBSERVAÇÕES DAS RENDAS. EXEMPLO: ESTUDO SOBRE AS ALTURAS DOS CIDADÃOS BRASILEIROS. POPULAÇÃO ( CONJUNTO DAS OBSERVAÇÕES DAS ALTURAS. POPULAÇÃO FINITA É AQUELA QUE POSSUI UM NÚMERO LIMITADO DE INDIVÍDUOS. EXEMPLO: ESTUDO SOBRE A IDADE DOS SÓCIOS DE UM CLUBE. POPULAÇÃO ( LIMITADA AO NÚMERO DE SÓCIOS. POPULAÇÃO INFINITA É AQUELA CUJO NÚMERO DE OBSERVAÇÕES É INFINITO. EXEMPLO: A PESAGEM DE UM CERTO MATERIAL. ( POR MAIOR QUE FOSSE O CUIDADO NA EXPERIMENTAÇÃO PODERIA, EM CADA PESAGEM, SE OBTER UMA LEITURA DIFERENTE. AMOSTRA É O SUBCONJUNTO DAS OBSERVAÇÕES ABRANGIDAS PELA POPULAÇÃO, MANTENDO AS MESMAS CARACTERÍSTICAS DA POPULAÇÃO. EXEMPLO: QUAL O CONTEÚDO DE FERRO NATURAL A SER EXPORTADO EM UM DETERMINADO NAVIO. POPULAÇÃO ( A POPULAÇÃO CONSISTE EM TODO O MINÉRIO DE FERRO A SER EXPORTADO POR ESSE NAVIO. AMOSTRA ( PARTE DO MINÉRIO, É EXAMINADO, A FIM DE SE DETERMINAR SEU TEOR DE FERRO, COM O OBJETIVO DE TIRAR UMA CONCLUSÃO A RESPEITO DO TEOR DE FERRO NATURAL DO EMBARQUE COMPLETO. A PARTE DO MINERAL SELECIONADO CONSTITUI A AMOSTRA DO EMBARQUE. UMA VEZ QUE SE FARÁ INFERÊNCIA SOBRE TODO O MINÉRIO EMBARCADO A PARTIR DE APENAS UMA PORÇÃO DELE, A BASE DO PROCESSO É A INFORMAÇÃO INCOMPLETA OU DE AMOSTRA. CLASSIFICAÇÃO DAS VARIÁVEIS QUALITATIVAS – VARIÁVEIS QUALITATIVAS SÃO CARACTERIZADAS PELO FATO DE NÃO PODEREM SOFRER OPERAÇÕES ALGÉBRICAS. a) NOMINAL b) ORDINAL QUANTITATIVAS – PODEM SOFRER OPERAÇÕES ALGÉBRICAS. a) DISCRETA b) CONTÍNUA EXEMPLO – UM PESQUISADOR QUE DESEJA ESTUDAR O USO SEMANAL POR ALUNOS DE UMA ESCOLA. DIFERENTES PERGUNTAS PODEM SER FEITAS AOS ALUNOS, TAIS COMO: a) VOCÊ USA A INTERNET DURANTE A SEMANA? ( ) SIM ( ) NÃO b) COM QUE INTENSIDADE USA A INTERNET NA SEMANA? ( ) NENHUMA ( ) PEQUENA ( ) MÉDIA ( ) GRANDE c) QUANTAS VEZES VOCÊ USA A INTERNET DURANTE A SEMANA? ( ) VEZES POR SEMANA d) POR QUANTAS HORAS VOCÊ USA A INTERNET DURANTE A SEMANA? ( ) HORAS POR SEMANA A PRIMEIRA PERGUNTA É QUALITATIVA NOMINAL E A INFORMAÇÃO CONTIDA NA RESPOSTA É MUITO BAIXA. A SEGUNDA PERGUNTA É QUALITATIVA ORDINAL. O ENTREVISTADO NESTA SITUAÇÃO PODE TER DÚVIDAS: O QUE A INTENSIDADE MÉDIA REPRESENTA ESPECIFICAMENTE? PORÉM, A INFORMAÇÃO CONTIDA NESSA VARIÁVEL É MAIOR QUE A CONTIDA NA VARIÁVEL QUALITATIVA NOMINAL. MAS, PODERIA TER SIDO ESTABELECIDO UMA GRADAÇÃO DA INTENSIDADE. A TERCEIRA PERGUNTA É QUANTITATIVA DISCRETA. A INFORMAÇÃO CONTIDA NA VARIÁVEL SERÁ MAIOR QUE NAS DUAS SITUAÇÕES ANTERIORES. A QUARTA PERGUNTA É QUANTITATIVA CONTÍNUA. A INFORMAÇÃO CONTIDA NA VARIÁVEL SERÁ MÁXIMA EM RELAÇÃO ÀS QUATRO PERGUNTAS PROPOSTAS. EXERCÍCIOS DE FIXAÇÃO I – POPULAÇÃO E AMOSTRA 1 – Classifique as variáveis em qualitativas ou quantitativas (contínuas ou descontínuas): Universo: Alunos de uma escola. Variável: Cor dos cabelos ( Universo: Casais residentes em uma cidade. Variável: Número de filhos ( Universo: As jogadas de um dado. Variável: O ponto obtido em cada jogada ( Universo: Peças produzidas por certa máquina. Variável: Número de peças produzidas por hora ( Universo: Peças produzidas por certa máquina. Variável: diâmetro externo ( 2 – Quais das variáveis abaixo são discretas e quais são contínuas: a) População: Alunos de uma cidade. Variável: Cor dos olhos ( b) População: Estação meteorológica de uma cidade. Variável: Precipitação pluviométrica, durante um ano ( c) População: Bolsa de valores de São Paulo. Variável: Número de ações negociadas. ( d) População: Funcionários de uma empresa. Variável: Salários ( e) População: Pregos produzidos por uma máquina. Variável: comprimento ( f) População: Bibliotecas da cidade do Rio de Janeiro. Variável: Número de livros (volumes) ( g) População: Aparelhos produzidos em uma linha de montagem. Variável: Número de defeitos por unidade ( 3 – Uma cidade apresenta o seguinte quadro relativo às suas escolas de 1º grau: ESCOLAS NÚMERO DE ESTUDANTES ALUNOS ALUNAS A 80 95 B 102 120 C 110 92 D 134 228 E 150 130 F 300 290 TOTAL 876 955 Obtenha uma amostra proporcional estratificada de 120 alunos e 120 alunas. 4 – Em uma escola existem 250 alunos, sendo 35 na 1ª série, 32 na 2ª série, 30 na 3ª série, 28 na 4ª série, 35 na 5ª série, 32 na 6ª série, 31 na 7ª série e 27 na 8ª série. Obtenha uma amostra de 40 alunos e preencha o quadro abaixo: SÉRIES POPULAÇÃO CÁLCULO PROPORCIONAL AMOSTRA 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª TOTAL 5 – Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente, n1 = 40, n2 = 100 e n3 = 60. Sabendo que, ao ser realizada uma amostragem estratificada proporcional, nove elementos da amostra forma retirados do 3º estrato,determine o número total de elementos da amostra. 6 – Em uma pesquisa, um cientista social fez as perguntas descritas abaixo. Classifique as variáveis formadas a partir das respostas fornecidas em quantitativas (discreta ou contínua) ou qualitativas (nominal ou ordinal). a) Qual o seu nome? b) Qual sua idade em anos? c) Qual seu gênero? ( 1 ) Masculino ( 2 ) Feminino d) Qual seu CPF? e) Em que cidade nasceu? f) Quanto filhos tem? g) Qual sua renda familiar? h) Classifique a seguinte afirmação: “O presidente da república atual está desempenhando bem as suas funções”. ( 1 ) concordo totalmente ( 2 ) concordo parcialmente ( 3 ) discordo totalmente 7 – Classifique as variáveis, conforme solicitado abaixo. TABELA 1 - BASE DE DADOS CÓDIGO DA COMPRA NOME DO CLIENTE BAIRRO GÊNERO 1 – MASCULINO 2 - FEMININO IDADE RENDA NÚMERO DE ITENS COMPRADOS VALOR DA COMPRA 1 Marcio Colina 1 26 1890,00 3 41,00 2 Juliana Centro 2 17 1090,00 5 58,00 3 Diogo Bom Descanso 1 22 2030,00 5 55,00 4 Thais Prainha 2 16 920,00 2 26,00 5 Aranaldo Colina 1 43 2045,00 2 30,00 6 Tiago Prainha 1 49 2235,00 3 35,00 7 Artur Centro 1 37 1955,00 2 26,00 8 Mariana Bom Descanso 2 15 950,00 3 28,00 9 Vitor Centro 1 45 2175,00 3 39,00 10 Marina Centro 2 18 910,00 1 25,00 11 Gustavo Bom Descanso 11 36 1940,00 2 20,00 12 Marilia Prainha 2 20 950,00 1 10,00 13 Maria Colina 2 60 930,00 1 14,00 14 Neila Prainha 2 21 1120,00 4 50,00 15 Pedro Prainha 1 37 2155,00 4 50,00 16 Jose Colina 1 16 1640,00 2 23,00 17 Vanessa Prainha 2 22 1040,00 2 22,00 18 Samanta Centro 2 17 940,00 2 23,00 19 Ana Prainha 2 18 910,00 1 10,00 20 Lise Bom Descanso 2 18 960,00 2 30,00 21 Paula Colina 2 18 1010,00 3 36,00 22 Rejane Prainha 2 17 940,00 2 22,00 23 Sergio Centro 1 21 1615,00 1 8,00 24 Lauro Colina 1 26 1690,00 1 16,00 25 Vinicius Bom Descanso 1 32 1980,00 3 41,00 VARIAVEL CLASSIFICAÇÃO Código da Compra Nome do Cliente Bairro Gênero Idade Renda Número de Itens Comprados Valor da Compra TABELAS E SÉRIES ESTATÍSTICAS SÉRIE - É TODA COLEÇÃO DE DADOS ESTATÍSTICOS REFERIDOS A UMA MESMA ORDEM DE CLASSIFICAÇÃO: QUANTITATIVA. TIPOS DE SÉRIES 1 – SÉRIE HOMÓGRADA - É AQUELA EM QUE A VARIÁVEL DESCRITA APRESENTA VARIAÇÃO DISCRETA OU DESCONTÍNUA. SÉRIE TEMPORAL - É CHAMADA DE SÉRIE CRONOLÓGICA, SÉRIE HISTÓRICA, SÉRIE EVOLUTIVA OU MARCHA. EXEMPLO: O DIRETOR SOLICITOU A EVOLUÇÃO DAS VENDAS DE 1975, MÊS A MÊS. (TABELA 3.1) SÉRIE GEOGRÁFICA - É CHAMADA DE SÉRIE TERRITORIAL, SÉRIE ESPACIAL OU SÉRIE DE LOCALIZAÇÃO. EXEMPLO: O DIRETOR DESEJA SABER O COMPORTAMENTO DAS VENDAS EFETUADAS NO BRASIL, EM 1975. (TABELA 3.2) SÉRIE ESPECÍFICA - É CHAMADA DE SÉRIE CATEGÓRICA OU SÉRIE POR CATEGORIA. EXEMPLO: O DIRETOR DESEJA SABER O COMPORTAMENTO DAS VENDAS DOS PRODUTOS DA EMPRESA, OS QUAIS FORAM AGRUPADOS EM TRÊS CATEGORIAS OU LINHAS. (TABELA 3.3) 2 – SÉRIE HETERÓGRADA - É AQUELA NA QUAL O FENÔMENO OU FATO APRESENTA GRADAÇÕES OU SUBDIVISÕES. DISTRIBUIÇÃO DE FREQÜÊNCIAS (SERIAÇÃO) - TODOS OS ELEMENTOS ÉPOCA, LOCAL E FENÔMENO SÃO FIXOS. EMBORA FIXO, O FENÔMENO APRESENTA GRADAÇÕES. OS DADOS SÃO DISPOSTOS EM TABELAS DE DUPLA ENTRADA. EXEMPLO: TABELA COM A FREQUÊNCIA DAS VENDAS EFETUADAS EM DETERMINADOS MESES DO ANO. (TABELA 3.4) 3 - TABELAS TABELA 3.1 – SÉRIE TEMPORAL MESES VENDAS JANEIRO 2.300 FEVEREIRO 1.800 MARÇO 2.200 ABRIL 2.210 MAIO 2.360 JUNHO 2.600 JULHO 2.690 AGOSTO 3.050 SETEMBRO 3.500 OUTUBRO 3.440 NOVEMBRO 3.100 DEZEMBRO 2.760 TOTAL ANUAL 31.510 TABELA 3.2 – SÉRIE GEOGRÁFICA ESTADOS VENDAS MINAS GERAIS 4.000 PARANÁ 2.230 RIO GRANDE DO SUL 6.470 RIO DE JANEIRO 8.300 SÃO PAULO 10.090 OUTROS 420 BRASIL 31.510 TABELA 3.3 – SÉRIE ESPECÍFICA LINHA DO PRODUTOS VENDAS LINHA A 6.450 LINHA B 9.310 LINHA C 15.750 TOTAL 31.510 TABELA 3.4 – DISTRIBUIÇÃO DE FREQÜÊNCIAS VENDAS Nº MESES 1.800 a 2.199 1 2.200 a 2.599 4 2.600 a 2.999 3 3.000 a 3.399 2 3.400 a 3.799 2 TOTAL DE MESES 12 DISTRIBUIÇÕES DE FREQÜÊNCIAS DADOS BRUTOS - OS DADOS ORIGINAIS NÃO SE ENCONTRAM PRONTOS PARA ANÁLISE, POR ISSO SÃO CHAMADOS DE DADOS BRUTOS. EXEMPLO: RELAÇÃO CORREPONDENTE AO CONSUMO DE ENERGIA ELÉTRICA, MEDIDO EM KWh, EM UM GRUPO DE 50 USUÁRIOS. (TABELA 3.1) ROL É UMA LISTA EM QUE OS VALORES ESTÃO DISPOSTOS EM UMA DETERMINADA ORDEM. EXEMPLO: RELAÇÃO CORREPONDENTE AO CONSUMO DE ENERGIA ELÉTRICA, MEDIDO EM KWh, EM UM GRUPO DE 50 USUÁRIOS, EM ORDEM CRESCENTE. (TABELA 3.2) TABELA DE FREQÜÊNCIAS - SÃO REPRENTAÇÕES NAS QUAIS OS VALORES SE APRESENTAM EM CORRESPONDÊNCIA COM SUAS REPETIÇÕES, EVITANDO-SE ASSIM, QUE ELES APAREÇAM MAIS DE UMA VEZ. EXEMPLO: NÚMERO DE APARELHOS DEFEITUOSOS REJEITADOS PELA SEÇÃO ENCARREGADA PELO CONTROLE DE QUALIDADE, NO PERÍODO DE 1971 A 1974. (TABELA 3.3) DISTRIBUIÇÃO DE FREQÜÊNCIAS DE DADOS TABULADOS NÃO AGRUPADOS EM CLASSES - É UMA TABELA ONDE OS VALORES DA VARIÁVEL APARECEM INDIVIDUALMENTE. É UTILIZADO PARA REPRESENTAR UMA VARIÁVEL DISCRETA. EXEMPLO: NÚMERO MENSAL DE APARELHOS DEFEITUOSOS REJEITADOS NO PERÍODO DE 1971 A 1974. (TABELA 3.4) DISTRIBUIÇÃO DE FREQÜÊNCIAS DE DADOS AGRUPADOS EM CLASSES - É QUANDO A VARIÁVEL FOR CONTÍNUA, SENDO CONVENIENTE AGRUPAR OS VALORES OBSERVADOS EM CLASSES. TABELA 3.1 – DADOS BRUTOS 58 62 80 57 8 126 136 96 144 19 90 86 38 94 82 75 148 114 131 28 66 95 121 158 64 105 118 73 83 81 50 92 60 52 89 58 10 90 94 74 9 75 72 157 125 76 88 78 84 36 TABELA 3.2 – ROL 8 36 58 66 75 82 89 94 118 136 9 38 58 72 76 83 90 95 121 144 10 50 60 73 78 84 90 96 125 148 19 52 62 74 80 86 92 105 126 157 28 57 64 75 81 88 94 114 131 158 TABELA 3.3 – TABELA DE FREQÜÊNCIAS ANO JAN FEV MAR ABR MAI JUN JUL AGO SET OUT NOV DEZ 1971 6 2 5 6 0 8 7 6 3 4 5 8 1972 10 9 7 6 3 4 6 4 5 4 0 1 1973 3 6 7 9 3 1 4 6 5 3 5 4 1974 7 2 5 8 6 4 2 5 1 6 5 2 TABELA 3.4 – DISTRIBUIÇÃO DE FREQÜÊNCIAS DE DADOS TABULADOS NÃO AGRUPADOS EM CLASSES J Nº APARELHOS COM DEFEITO NÚMERO DE MESES 1 0 2 2 1 3 3 2 4 4 3 5 5 4 7 6 5 8 7 6 9 8 7 4 9 8 3 10 9 2 11 10 1 TOTAL ∑ fj = 48 EXEMPLO: TESTE DE ESTATÍSTICA, CONTENDO 100 PERGUNTAS DO TIPO CERTO-ERRADO, APLICADO EM UMA TURMA DE 500 ESTUDANTES. TABELA 3.5 – DISTRIBUIÇÃO DE FREQÜÊNCIAS DE DADOS AGRUPADOS EM CLASSES NOTAS FREQÜÊNCIAS 000 ⊢ 010 005 010 ⊢ 020 015 020 ⊢ 030 020 030 ⊢ 040 045 040 ⊢ 050 100 050 ⊢ 060 130 060 ⊢ 070 100 070 ⊢ 080 060 080 ⊢ 090 015 090 ⊢ 100 010 TOTAL ∑ fj = 500 Onde: ∑ fj = 5 + 15 + 20 + 45 + 100 + 130 + 100 + 60 + 15 + 10 = 500LIMITES DAS CLASSES REPRESENTAÇÃO LIMITES 70 |--| 80 A BARRA VERTICAL ESTÁ PRESENTE TANTO NO LIMITE INFERIOR COMO NO LIMITE SUPERIOR, INDICANDO QUE O VALOR 70 E O VALOR 80 FAZEM PARTE DA CLASSE. 0 ⊢ 10 A BARRA VERTICAL ESTÁ PRESENTE APENAS NO LIMITE INFERIOR, INDICANDO QUE O VALOR 0 FAZ PARTE DA CLASSE. ENTRETANTO, O VALOR 10 NÃO FAZ PARTE DA CLASSE. 10 -- 15 A BARRA VERTICAL NÃO ESTÁ PRESENTE NO LIMITE INFERIOR NEM NO LIMITE SUPERIOR, INDICANDO QUE O VALOR 10 E O VALOR 15 NÃO FAZEM PARTE DA CLASSE. 40 --| 50 A BARRA VERTICAL ESTÁ PRESENTE APENAS NO LIMITE SUPERIOR, INDICANDO QUE O VALOR 50 FAZ PARTE DA CLASSE. ENTRETANTO, O VALOR 40 NÃO FAZ PARTE DA CLASSE. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS 1 - FREQÜÊNCIA SIMPLES (fj) - É O NÚMERO DE OBSERVAÇÕES CORRESPONDENTES A ESSA CLASSE OU A ESSE VALOR. EXEMPLO: NA TABELA 3.5, TEMOS: f1 = 5; f2 = 15; f3 = 20; ...; f10 = 10. 2 - AMPLITUDE TOTAL (At) - É A DIFERENÇA ENTRE O MAIOR E O MENOR VALOR OBSERVADO DA VARIÁVEL EM ESTUDO. EXEMPLO: A AMPLITUDE TOTAL DO CONSUMO DE ENERGIA, APRESENTADO NA TABELA 3.1, É: At =158 – 8 = 150 3 - CLASSE - É CADA UM DOS GRUPOS DE VALORES EM QUE SE SUBDIVIDE A AMPLITUDE TOTAL DO CONJUNTO DE VALORES OBSERVADOS DA VARIÁVEL. EXEMPLO: NA TABELA 3.5, TEMOS AS SEGUINTES CLASSES: 1ª CLASSE: f =1 ( CLASSE DE 000 A 010 2ª CLASSE: f =2 ( CLASSE DE 010 A 020 ... ... 10ª CLASSE: f =10 ( CLASSE DE 090 A 100 4 – LIMITES DE CLASSES - OS LIMITES DE CLASSE, SUPERIOR E INFERIOR, SÃO SEUS VALORES EXTREMOS. EXEMPLO: NA TABELA 3.5, TEMOS: 1ª CLASSE ( LI = 000; LS = 010. 5 – AMPLITUDE DO INTERVALO DE CLASSE OU INTERVALO DE CLASSE - É O COMPRIMENTO DA CLASSE, DEVENDO-SE TOMAR A DIFERENÇA ENTRE OS DOIS LIMITES INFERIORES OU ENTRE OS DOIS LIMITES SUPERIORES, SUCESSIVOS DE CLASSE. EXEMPLO: NA TABELA 3.5, TEMOS: A = 010 – 000 = 10 6 – PONTO MÉDIO DE CLASSE (Xj) - O PONTO MÉDIO OU VALOR MÉDIO DE CLASSE, É OBTIDO ACRESCENTANDO A METADE DA AMPLITUDE DO INTERVALO DE CLASSE AO SEU LIMITE INFERIOR. EXEMPLO: X1 = 010 + 05 = 15 TIPOS DE FREQÜÊNCIAS FREQÜÊNCIA SIMPLES ABSOLUTA (fj) RELATIVA (frj) FREQÜÊNCIA ACUMULADA ABSOLUTA (Fi) RELATIVA (Fri) 1 - FREQÜÊNCIA SIMPLES FREQÜÊNCIA SIMPLES ABSOLUTA (fj) - É O NÚMERO DE REPETIÇÕES DE UM VALOR INDIVIDUAL OU DE UMA CLASSE DE VALORES DA VARIÁVEL. FREQÜÊNCIA SIMPLES RELATIVA (frj) - REPRESENTA A PROPORÇÃO DE OBSERVAÇÕES DE UM VALOR INDIVIDUAL OU DE UMA CLASSE, EM RELAÇÃO AO NÚMERO TOTAL DE OBSERVAÇÕES. 2 - FREQÜÊNCIA ACUMULADA FREQÜÊNCIA ABSOLUTA ACUMULADA (Fi) - É A SOMA DA FREQÜÊNCIA SIMPLES ABSOLUTA DESSA CLASSE OU DESSE VALOR COM AS FREQÜÊNCIAS SIMPLES ABSOLUTAS DAS CLASSES OU DOS VALORES ANTERIORES. FREQÜÊNCIA RELATIVA ACUMULADA (Fri) - É A SOMA DA FREQÜÊNCIA SIMPLES RELATIVA DESSA CLASSE OU DESSE VALOR COM AS FREQÜÊNCIAS SIMPLES RELATIVA DAS CLASSES OU DOS VALORES ANTERIORES. TABELA DE FREQÜÊNCIAS. ROTEIRO PARA ELABORAÇÃO DE TABELA DE FREQÜÊNCIAS COM DADOS AGRUPADOS EM CLASSES. LISTAR OS DADOS BRUTOS TRANSFORMÁ-LOS EM ROL DETERMINAR A AMPLITUDE TOTAL DETERMINAR O NÚMERO DE CLASSES DETERMINAR A AMPLITUDE DO INTERVALO DE CLASSE DETERMINAR OS LIMITES DAS CLASSES CONSTRUIR A TABELA DE FREQÜÊNCIAS EXERCÍCIOS DE FIXAÇÃO 1 – Classifique as séries estatísticas: a) PRODUÇÃO DE BORRACHA NATURAL ANOS TONELADAS 1991 29.543 1992 30.712 1993 40.663 b) AVICULTURA BRASILEIRA ESPÉCIES NÚMERO (1.000 cabeças) Galinhas 204.160 Galos, frangos, e pintos 435.465 Codornas 2.488 c) VACINAÇÃO CONTRA POLIOMIELITE REGIÕES QUANTIDADE Norte 211.209 Nordeste 631.040 Sudeste 1.119.708 Sul 418.785 Centro-Oeste 185.823 d) AQUECIMENTO DE UM MOTOR DE AVIÃO MINUTOS TEMPERATURA (ªC) 0 20 1 27 2 34 3 41 4 49 5 56 6 63 e) IMPORTADORES 1985 (%) 1990 (%) 1995 (%) América Latina 13,0 13,4 25,6 EUA e Canadá 28,2 26,3 22,2 Europa 33,9 35,2 20,7 Ásia e Oceania 10,9 17,7 15,4 África e Oriente Médio 14,0 8,8 5,5 2 - Construa o ROL das seguintes séries: Série A: {1; 3; 1; 5; 1; 4; 4; 2; 3; 4; 5; 1; 1; 5; 5; 2; 3} Série B: {3,2; 3,2; 3,0; 1,1; 2,8; 0,3; 0,0; 8,5; 2,1; 0,7; 7,4; 3,4; 5,8; 5,5; 3,2; 10,0; 7,6} 3 – Considere os dados apresentados a seguir e calcule o que se pede: i Xi 1 3 2 2 3 5 4 1 5 6 6 0 7 7 8 4 ( 28 a) ( (x) b) ( (x2) c) (15 (x - 1) d) (12 (x + 1)2 DISTRIBUIÇÃO DE FREQÜÊNCIA 1 – As notas obtidas por 50 alunos de uma turma foram: 1 2 3 4 5 6 6 7 7 8 2 3 3 4 5 6 6 7 8 8 2 3 4 4 5 6 6 7 8 9 2 3 4 5 5 6 6 7 8 9 2 3 4 5 5 6 7 7 8 9 Complete a distribuição de freqüências abaixo: i NOTAS fi 1 0 ⊢ 2 2 2 ⊢ 4 3 4 ⊢ 6 4 6 ⊢ 8 5 8 ⊢ 10 (fi = Responda: 1º) Qual a amplitude amostral? 2º) Qual a amplitude da distribuição? 3º) Qual o número de classes da distribuição? 4º) Qual o limite inferior da Quarta classe? 5º) Qual o limite superior da classe de ordem 2? 6º) Qual a amplitude do segundo intervalo de classe? 2 – Complete a distribuição abaixo, determinando as freqüências simples: i Xi fi Fi 1 2 2 2 3 9 3 4 12 4 5 29 5 6 34 (fi = 3 – Conhecidas as notas de 50 alunos: 84 68 33 52 47 73 68 61 73 77 74 71 81 91 65 55 57 35 85 88 59 80 41 50 53 65 76 85 73 60 67 41 78 56 94 35 45 55 64 74 65 94 66 48 39 69 89 98 42 54 Obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10 para intervalo de classe. 4 –Os resultados do lançamento de um dado 50 vezes foram os seguintes: 6 5 2 6 4 3 6 2 6 5 1 6 3 3 5 1 3 6 3 4 5 4 3 1 3 5 4 4 2 6 2 2 5 2 5 1 3 6 5 1 5 6 2 4 6 1 5 2 4 3 Forme uma distribuição de freqüências sem intervalos de classe. 5 – A tabela abaixo representa as vendas diárias de um determinado aparelho elétrico, durante um mês, por uma firma comercial: 14 12 11 13 14 13 12 14 13 14 11 12 12 14 10 13 15 11 15 13 16 17 14 14 Forme uma distribuição de freqüências sem intervalos de classe. 6 – Complete a tabela abaixo: i CLASSES fi fri Fi Fri 1 0 ⊢ 8 4 2 8 ⊢16 10 3 16 ⊢ 24 14 4 24 ⊢ 32 9 5 32 ⊢ 40 3 (fi = (fri = (Fi = (Fri = 7 – Dada a distribuição de freqüências: xi 3 4 5 6 7 8 fi 2 5 12 10 8 3 Determine: ( Fi As freqüências relativas; As freqüências acumuladas; As freqüências relativas acumuladas; A série de valores correspondentes à distribuição de frequências. 8 – A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400 lotes: ÁREAS 300 ⊢ 400 ⊢ 500 ⊢ 600 ⊢ 700 ⊢ 800 ⊢ 900 ⊢ 1.000 ⊢ 1.100 ⊢ 1.200 Nº DE LOTES 14 46 58 76 68 62 48 22 6 Com referência a essa tabela, determine: A amplitudetotal; O limite superior da quinta classe; O limite inferior da oitava classe; O ponto médio da sétima classe; A amplitude do intervalo da segunda classe; A freqüência da quarta classe; A freqüência relativa da sexta classe; A freqüência acumulada da quinta classe; O número de lotes cuja área não atinge 700 m2; O número de lotes cuja área atinge e ultrapassa 800 m2; A percentagem dos lotes cuja área não atinge 600 m2; A percentagem dos lotes cuja área seja maior ou igual a 900 m2; A percentagem dos lotes cuja área é de 500 m2, no mínimo, mas inferior a 1.000 m2; A classe do 72º lote; Até que classe estão incluídos 60% dos lotes. 9 – A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus: Nº ACIDENTES 0 1 2 3 4 5 6 7 Nº MOTORISTAS 20 10 16 9 6 5 3 1 Determine: O número de motoristas que não sofreram nenhum acidente; O número de motoristas que sofreram pelo menos 4 acidentes; O número de motoristas que sofreram menos de 3 acidentes; O número de motoristas que sofreram no mínimo 3 acidentes e no máximo 5 acidentes; A percentagem dos motoristas que sofreram no máximo 2 acidentes; 10 – Complete os dados que faltam na distribuição de freqüência: i Xi fi fri Fi 1 0 1 0,05 2 1 0,15 4 3 2 4 4 3 0,25 13 5 4 3 0,15 6 5 2 18 7 6 19 8 7 (fi = 20 (fri = 1,00 FASES DO MÉTODO ESTATÍSTICO 1ª - DEFINIÇÃO DO PROBLEMA 2ª - PLANEJAMENTO 3ª - COLETA DE DADOS 4ª - APURAÇÃO DOS DADOS 5ª - APRESENTAÇÃO DOS DADOS 6ª - ANÁLISE E INTERPRETAÇÃO DOS DADOS 1ª - DEFINIÇÃO DO PROBLEMA CONSISTE NA FORMULAÇÃO CORRETA DO PROBLEMA A SER ESTUDADO. ( O ANALISTA DEVE VERIFICAR OUTROS TRABALHOS REALIZADOS NO MESMO CAMPO. EXEMPLO: UM FABRICANTE DE SABONETES DESEJA LANÇAR UM NOVO PRODUTO NO MERCADO E DESEJA FAZER UM ESTUDO SOBRE AS CARACTERÍSTICAS DOS CONSUMIDORES ATUAIS. UMA LISTA DE FATORES RELEVANTES DEVERÁ RESULTAR DESSA INVESTIGAÇÃO PRELIMINAR: ( NÚMERO DE UNIDADES CONSUMIDAS POR FAMÍLIA EM CADA ANO; ( NÚMERO MÉDIO DE PESSOAS QUE COMPÕE CADA FAMÍLIA; ( NÚMERO DE MEMBROS ADULTOS DA FAMÍLIA; ( MARCAS PREFERIDAS. 2ª - PLANEJAMENTO CONSISTE EM SE DETERMINAR O PROCEDIMENTO NECESSÁRIO PARA RESOLVER O PROBLEMA. PROCEDIMENTOS ( QUE DADOS DEVERÃO SER OBTIDOS? ( COMO SE DEVE OBTÊ-LOS? ( QUAL O TIPO DE LEVANTAMENTO SERÁ UTILIZADO? . LEVANTAMENTO CENSITÁRIO – CONTAGEM COMPLETA. . LEVANTAMENTO POR AMOSTRAGEM – CONTAGEM PARCIAL. ( CRONOGRAMA DAS ATIVIDADES ( CUSTOS ENVOLVIDOS ( INFORMAÇÕES DISPONÍVEIS ( DELINEAMENTO DA AMOSTRA ( FORMA DE ESCOLHA DOS DADOS 3ª - COLETA DOS DADOS REFERE-SE À OBTENÇÃO, REUNIÃO E REGISTRO SISTEMÁTICO DE DADOS COM UM DETERMINADO OBJETIVO. DADOS PRIMÁRIOS - QUANDO SÃO PUBLICADOS OU COMUNICADOS PELA PRÓPRIA PESSOA OU ORGANIZAÇÃO QUE OS PRODUZIU. EXEMPLO DE FONTE PRIMÁRIA: ( TABELAS DO CENSO DEMOGRÁFICO. DADOS SECUNDÁRIOS - QUANDO SÃO PUBLICADOS OU COMUNICADOS POR OUTROS. EXEMPLO DE FONTE SECUNDÁRIA: ( QUANDO DETERMINADO JORNAL PUBLICA ESTATÍSTICAS EXTRAÍDAS DE VÁRIAS FONTES E ALGUÉM SE UTILIZA DELES EM OUTRA PESQUISA. COLETA DIRETA - QUANDO OS DADOS SÃO OBTIDOS DIRETAMENTE DA FONTE. COLETA CONTÍNUA - QUANDO OS DADOS SÃO OBTIDOS INITERRUPTAMENTE, AUTOMATICAMENTE E NA VIGÊNCIA DE UM DETERMINADO PERÍODO. COLETA PERIÓDICA - QUANDO É REALIZADA EM PERÍODOS CURTOS, DETERMINADOS. EXEMPLO: RECENSEAMENTO DEMOGRÁFICO – 10 EM 10 ANOS. COLETA OCASIONAL - QUANDO OS DADOS FOREM COLHIDOS ESPORADICAMENTE. EXEMPLO: COLETA DE DADOS DE CASOS FATAIS EM UM SURTO EPIDÊMICO. COLETA INDIRETA - É QUANDO É INFERIDA A PARTIR DOS ELEMENTOS CONSEGUIDOS PELA COLETA DIRETA OU ATRAVÉS DO CONHECIMENTO DE OUTROS FENÔMENOS RELACIONADOS COM O FENÔMENO EM QUESTÃO. POR ANALOGIA - QUANDO O CONHECIMENTO É INDUZIDO A PARTIR DE OUTRO FENÔMENO QUE GUARDA COM ELE RELAÇÕES DE CASUALIDADE. POR PROPORCIONALIZAÇÃO - QUANDO O CONHECIMENTO DE UM FATO SE INDUZ DAS CONDIÇÕES QUANTITATIVAS DE UMA PARTE DELE. POR INDÍCIOS - QUANDO SÃO ESCOLHIDOS FENÔMENOS SINTOMÁTICOS PARA DISCUTIR UM ASPECTO GERAL DA VIDA SOCIAL. POR AVALIAÇÃO QUANDO ATRAVÉS DE INFORMAÇÕES FIDEDIGNAS OU DE ESTIMATIVAS CADASTRAIS SE PRESUME O ESTADO QUANTITATIVO DE UM FENÔMENO. 4ª - APURAÇÃO DOS DADOS CONSISTE EM RESUMIR OS DADOS ATRAVÉS DE SUA CONTAGEM E AGRUPAMENTO. É UM TRABALHO DE CONDENSAÇÃO E TABULAÇÃO DOS DADOS. APURAÇÃO MANUAL - A APURAÇÃO NÃO UTILIZA MÁQUINA PARA SER REALIZADA. APURAÇÃO MECÂNICA - A APURAÇÃO É FEITA COM O AUXÍLIO DE MÁQUINAS MECÂNICAS, COMO AS DE SOMAR E DE CALCULAR. APURAÇÃO ELETROMECÂNICA - A APURAÇÃO É REALIZADA COM MÁQUINAS QUE POSSUEM ENGRENAGENS INTERNAS MOVIDAS PELA ENERGIA ELÉTRICA. APURAÇÃO ELETRÔNICA - A APURAÇÃO É REALIZADA POR MÁQUINAS ELETRÔNICAS, COMO OS MICROCOMPUTADORES. 5ª - APRESENTAÇÃO DOS DADOS APRESENTAÇÃO TABULAR - É UMA APRESENTAÇÃO NUMÉRICA DOS DADOS. CONSISTE EM DISPOR OS DADOS EM LINHAS E COLUNAS DISTRIBUÍDAS SEGUNDO ALGUMAS REGRAS, DANDO UMA VISÃO GLOBAL MAIS RÁPIDA DAQUILO QUE SE PRETENDE ANALISAR. APRESENTAÇÃO GRÁFICA - É UMA APRESENTAÇÃO GEOMÉTRICA DOS DADOS NUMÉRICOS, PERMITINDO UMA VISÃO MAIS RÁPIDA, FÁCIL E CLARA DO FENÔMENO E DE SUA VARIAÇÃO. 6ª - ANÁLISE E INTERPRETAÇÃO DOS DADOS O INTERESSE MAIOR, NESTA FASE, RESIDE EM TIRAR CONCLUSÕES QUE AUXILIEM O PESQUISADOR A RESOLVER O SEU PROBLEMA. A ANÁLISE DOS DADOS ESTÁ LIGADA AO USO DO CÁLCULO DE ESTATÍSTICAS QUE AJUDEM A DESCREVER O FENÔMENO. O SIGNIFICADO EXATO DOS VALORES ESTATÍSTICOS OBTIDOS DEVE SER BEM INTERPRETADO. É POSSÍVEL, NESSA FASE, FAZER ALGUMAS GENERALIZAÇÕES MAS QUE ENVOLVERÃO ALGUM GRAU DE INCERTEZA. PREOCUPAÇÕES NA ANÁLISE DE DADOS I. COM VALORES AUSENTES – ATRIBUTOS QUE NÃO FORAM OU NÃO PUDERAM SER COLETADOS PARA AS VARIÁVEIS. II. COM VALORES EXTREMOS – VALORES DESTOANTES DOS DEMAIS ELEMENTOS ANALISADOS QUE INTERFEREM DE FORMA NEGATIVA NAS VARIÁVEIS ESTUDADAS. EXEMPLO – UM PESQUISADOR QUE DESEJA ESTUDAR O USO SEMANAL POR ALUNOS DE UMA ESCOLA. DIFERENTES PERGUNTAS PODEM SER FEITAS AOS ALUNOS, TAIS COMO: a) VOCÊ USA A INTERNET DURANTE A SEMANA? ( ) SIM ( ) NÃO b) COM QUE INTENSIDADE USA A INTERNET NA SEMANA? ( ) NENHUMA ( ) PEQUENA ( ) MÉDIA ( ) GRANDE c) QUANTAS VEZES USA A INTERNET DURANTE A SEMANA? ( ) VEZES POR SEMANA d) POR QUANTAS HORAS VOCÊ USA A INTERNET DURANTE A SEMANA? ( ) HORAS POR SEMANA A PRIMEIRA PERGUNTA ADMITE APENAS DUAS CATEGORIAS DE RESPOSTAS E A INFORMAÇÃO OBTIDA É MUITO BAIXA. A SEGUNDA PERGUNTA ADMITE QUATRO CATEGORIAS DE RESPOSTAS. CONTUDO, O ENTREVISTADO NESTA SITUAÇÃO PODE ACABAR TENDO ALGUMAS DÚVIDAS, TAIS COMO: O QUE A INTENSIDADE MÉDIA REPRESENTA ESPECIFICAMENTE? A INFORMAÇÃO OBTIDA É MAIOR QUE A INFORMAÇÃO OBTIDA NA PERGUNTA ANTERIOR. PARA MELHORAR, PODERIA TER SIDO ESTABELECIDA UMA GRADAÇÃO DA INTENSIDADE. A TERCEIRA PERGUNTA NÃO DÁ MARGEM A DÚVIDAS, COMO NA PERGUNTA ANTERIOR E A INFORMAÇÃO OBTIDA É MAIOR QUE AS DUAS INFORMAÇÕES ANTERIORES. A QUARTA PERGUNTA TAMBÉM NÃO DÁ MARGEM A DÚVIDAS E A INFORMAÇÃO OBTIDA SERÁ MÁXIMA EM RELAÇÃO ÀS PERGUNTAS PROPOSTAS. APRESENTAÇÃO GRÁFICA A APRESENTAÇÃO GRÁFICA PERMITE UMA VISUALIZAÇÃO IMEDIATA DA DISTRIBUIÇÃO DOS VALORES OBSERVADOS. OS GRÁFICOS PROPICIAM UMA IDÉIA PRELIMINAR DA CONCENTRAÇÃO E DISPERSÃO DOS VALORES. PERMITEM, TAMBÉM, OBSERVAR MAIS CLARAMENTE OS FATOS ESSENCIAIS E AS RELAÇÕESQUE PODERIAM SER DIFÍCEIS DE RECONHECER EM MASSAS DE DADOS ESTATÍSTICOS. 1 – CLASSIFICAÇÃO DOS GRÁFICOS SEGUNDO A FORMA DIAGRAMAS - SÃO GRÁFICOS GEOMÉTRICOS DISPOSTOS EM DUAS DIMENSÕES. CARTOGRAMAS - SÃO ILUSTRAÇÕES RELATIVAS A CARTAS GEOGRÁFICAS. ESTEREOGRAMAS - REPRESENTAM VOLUMES E SÃO APRESENTADOS EM TRÊS DIMENSÕES. 2 – CLASSIFICAÇÃO DOS GRÁFICOS SEGUNDO O OBJETIVO (USO) GRÁFICOS DE INFORMAÇÃO - SÃO DESTINADOS AO PÚBLICO EM GERAL, OBJETIVANDO PROPORCIONAR UMA VISUALIZAÇÃO RÁPIDA E CLARA DA INTENSIDADE DAS MODALIDADES E DOS VALORES RELATIVOS AO FENÔMENO OBSERVADO. GRÁFICOS DE ANÁLISE - FORNECEM ELEMENTOS ÚTEIS À FASE DE ANÁLISE DOS DADOS, SEM DEIXAREM DE SER INFORMATIVOS. EXEMPLOS DE GRÁFICOS DISPONÍVEIS NO EXCEL 1 - GRÁFICOS EM BARRAS (HORIZONTAIS) - TÊM POR FINALIDADE COMPARAR GRANDEZAS POR MEIO DE RETÂNGULOS DE IGUAL ALTURA E COMPRIMENTOS PROPORCIONAIS ÀS RESPECTIVAS GRANDEZAS. OUTROS TIPOS DE GRÁFICOS EM BARRAS GRÁFICO EM BARRAS COMPOSTAS - APRESENTA CADA BARRA SEGMENTADA EM PARTES. GRÁFICO EM BARRAS AGRUPADAS - NESTE CASO SÃO MOSTRADAS VÁRIAS BARRAS AGRUPADAS. GRÁFICO EM BARRAS BIDIRECIONAIS - QUANDO SE DESEJA REPRESENTAR QUANTIDADES POSITIVAS E NEGATIVAS, OU PERDAS E GANHOS. 2 - GRÁFICOS EM COLUNAS OU BARRAS VERTICAIS - TÊM A MESMA FINALIDADE DO GRÁFICO EM BARRAS HORIZONTAIS, SENDO ESCOLHIDOS QUANDO AS LEGENDAS FOREM PEQUENAS. OUTROS GRÁFICOS EM COLUNAS GRÁFICO EM COLUNAS SUPERPOSTAS - CORRESPONDE AO GRÁFICO EM BARRAS COMPOSTAS. GRÁFICO DE PORCENTAGENS COMPLEMENTARES - USA A PORCENTAGEM DO COMPLEMENTO POR DIFERENÇA. GRÁFICO EM COLUNAS REMONTADAS - CORRESPONDE AO GRÁFICO EM BARRAS AGRUPADAS. 3 – GRÁFICO EM LINHAS OU LINEARES - NORMALMENTE, SÃO USADOS PARA A REPRESENTAÇÃO DE SÉRIES NO TEMPO 4 - GRÁFICO EM SETORES OU PIZZA - SÃO USADOS PARA REPRESENTAR VALORES ABSOLUTOS OU PORCENTAGENS COMPLEMENTARES. É TAMBÉM CONHECIDO COMO GRÁFICO CIRCULAR, CARTOGRAMA EM SETORES OU PIZZA. 5 - GRÁFICO DE ÁREAS - OS DADOS QUE ESTEJAM DISPOSTOS EM LINHAS OU COLUNAS PODEM SER PLOTADOS EM UM GRÁFICO DE ÁREA. ESSE TIPO DE GRÁFICO ENFATIZA A MAGNITUDE DA MUDANÇA NO DECORRER DO TEMPO. OUTROS GRÁFICOS DE ÁREA GRÁFICO DE ÁREA EM 2D GRÁFICO DE ÁREA EM 3D 6 – GRÁFICO DE DISPERSÃO (XY) OS GRÁFICOS DE DISPERSÃO MOSTRAM AS RELAÇÕES EXISTENTES ENTRE AS VARIÁVEIS X e Y. COSTUMAM SER USADOS PARA EXIBIR E COMPARAR VALORES NUMÉRICOS, COMO DADOS CIENTÍFICOS, ESTATÍSTICOS E DE ENGENHARIA. PODEM SER USADOS QUANDO: - DESEJA-SE ALTERAR A ESCALA DO EIXO HORIZONTAL - DESEJA TORNAR ESSE EIXO NUMA ESCALA LOGARÍTMICA - QUANDO OS VALORES DO EIXO HORIZONTAL NÃO ESTIVEREM UNIFORMEMENTE ESPAÇADOS - EXISTIREM MUITOS PONTOS DE DADOS NO EIXO HORIZONTAL - QUANDO DESEJAR MOSTRAR DADOS QUE INCLUEM CONJUNTOS AGRUPADOS DE VALORES E AJUSTAR AS ESCALAS PARA REVELAR MAIS INFORMAÇÕES SOBRE OS VALORES AGRUPADOS - QUANDO DESEJAR MOSTRAR SIMILARIDADES ENTRE CONJUNTOS DE DADOS EM VEZ DE DIFERENÇAS ENTRE PONTOS - QUANDO QUIZER COMPARAR VÁRIOS PONTOS DE DADOS SEM PREOCUPAÇÃO COM O TEMPO – QUANTO MAIS DADOS FOREM INCLUÍDOS MELHOR SERÁ A COMPARAÇÃO 7 – GRÁFICO DE AÇÕES ESSE GRÁFICO SERVE PARA ILUSTRAR A FLUTUAÇÃO DE PREÇOS DE AÇÕES. PODE TAMBÉM SER USADO PARA FINS CIENTÍFICOS, COMO POR EXEMPLO, NA INDICAÇÃO DA FLUTUAÇÃO DE TEMPERATURAS DIÁRIAS OU ANUAIS. POR EXEMPLO, PARA SE CRIAR UM GRÁFICO DE AÇÕES DE VOLUME-ALTA-BAIXA-FECHAMENTO, OS DADOS DEVEM ESTAR ORGANIZADOS NA MESMA ORDEM. ESSE TIPO DE GRÁFICO REQUER CINCO SÉRIES DE VALORES NA ORDEM CORRETA: VOLUME, ABERTURA, ALTA, BAIXA E FECHAMENTO. 8 - GRÁFICOS DE SUPERFÍCIE ESSE GRÁFICO É ÚTIL QUANDO SE DESEJA ENCONTRAR COMBINAÇÕES VANTAJOSAS ENTRE DOIS CONJUNTOS DE DADOS. COMO EM UM MAPA TOPOGRÁFICO, CORES E PADRÕES INDICAM ÁREAS QUE ESTÃO NO MESMO INTERVALO DE VALORES. 9 – GRÁFICO DE ROSCA ESSE GRÁFICO EXIBE A RELAÇÃO DAS PARTES COM UM TODO. PODE CONTER MAIS DE UMA SÉRIE DE DADOS, PORÉM NÃO É FÁCIL LER GRÁFICOS DE ROSCA. GRÁFICOS DE ROSCA EXIBEM DADOS EM ANÉIS, NOS QUAIS CADA ANEL REPRESENTA UMA SÉRIE DE DADOS. 10 – GRÁFICO DE RADAR ESSE GRÁFICO COMPARA OS VALORES AGREGADOS DE VÁRIAS SÉRIES DE DADOS. 11 - HISTOGRAMA - É FORMADO POR UM CONJUNTO DE RETÂNGULOS JUSTAPOSTOS, DE FORMA QUE A ÁREA DE CADA RETÂNGULO SEJA PROPORCIONAL À FREQÜÊNCIA DA CLASSE QUE ELE REPRESENTA. 12 - POLIGONAL CARACTERÍSTICA - É A REPRESENTAÇÃO DO CONTORNO DO HISTOGRAMA. 12.1 - POLÍGONO DE FREQÜÊNCIAS - UNINDO POR LINHAS RETAS OS PONTOS MÉDIOS DAS BASES SUPERIORES DOS RETÂNGULOS DO HISTOGRAMA. 12.2 - POLÍGONO DE FREQÜÊNCIAS ACUMULADAS - TEM POR FINALIDADE A REPRESENTAÇÃO GRÁFICA DAS TABELAS DE FREQÜÊNCIAS ACUMULADAS. EXERCÍCIOS DE FIXAÇÃO 1 – Um estudo com 80 passageiros que desembarcaram no aeroporto de Brasília revelou as origens apresentadas na seguinte tabela. ESTADO fi São Paulo 23 Rio de Janeiro 22 Bahia 14 Rio Grande do Sul 12 Paraná 7 Mato Grosso do Sul 2 Pede-se: construir um gráfico de colunas para os dados expostos. 2 – Um grupo formado por 78 turistas estrangeiros passou o último verão em um hotel em Maceió, Alagoas. As nacionalidades dos turistas estão apresentadas na tabela a seguir. PAÍS VENDAS Argentina 26 França 14 Inglaterra 8 Estados Unidos 23 Alemanha 7 Empregando os dados fornecidos, construir o gráfico de barras. 3 – Empregando os dados do exercício anterior, construir o gráfico de pizza. 4 – Construa o gráfico de barras, a partir dos seguintes dados. ESCOLARIDADE fi Superior 36 Médio 54 Fundamental 108 Outras 162 5 – Construa o gráfico de linha, a partir dos seguintes dados. VENDAS (R$) CUSTOS (R$) 480 240 640 320 320 200 440 260 730 350 820 390 390 210 HISTOGRAMA 1 – Considerando as distribuições de freqüências seguintes, confeccione, para cada uma: O histograma; O polígono de freqüência; O polígono de freqüência acumulada. 1º) I NOTAS fi 1 40 ⊢ 44 2 2 44 ⊢ 48 5 3 48 ⊢ 52 9 4 52 ⊢ 56 6 5 56 ⊢ 60 4 (fi = 26 2º) i NOTAS fi 1 150 ⊢ 156 1 2 156 ⊢ 162 5 3 162 ⊢ 168 8 4 168 ⊢ 174 13 5 174 ⊢ 180 3 (fi = 30 3º) i SALÁRIOS (R$) fi 1 500 ⊢ 700 8 2 700 ⊢ 900 20 3 900 ⊢ 1.100 7 4 1.100 ⊢ 1.300 15 5 1.300 ⊢ 1.500 2 6 1.500 ⊢ 1.700 1 7 1.700 ⊢ 1.900 1 (fi = 44 2 – Confeccione o gráfico da distribuição: ÁREAS 300 ⊢ 400 ⊢ 500 ⊢ 600 ⊢ 700 ⊢ 800 ⊢ 900 ⊢ 1.000 ⊢ 1.100 ⊢ 1.200 Nº DE LOTES 14 46 58 76 68 62 48 22 6 3 – Examinando o histograma abaixo, que corresponde às notas relativas à aplicação de um teste de inteligência a um grupo de alunos, responda: Qual é o intervalo de classe que tem maior freqüência? Qual a amplitude total da distribuição? Qual o número total de alunos? Qual a freqüência do intervalo de classe 110 ⊢ 120? Quais os dois intervalos de classe que têm, dois a dois, a mesma freqüência? Quais são os dois intervalos de classe tais que a freqüência de um é o dobro da freqüência do outro? Quantos alunos receberam notas de teste entre 90 (inclusive) e 110? Quantos alunos receberam notas não-inferiores a 100? 4 – Conhecidas as notas de 50 alunos: 68 85 33 52 65 77 84 65 74 57 71 35 81 50 35 64 74 47 54 68 80 61 41 91 55 73 59 53 77 45 41 55 78 48 69 85 67 39 6076 94 98 66 66 73 42 65 94 88 89 Determine: A distribuição de freqüência começando por 30 e adotando o intervalo de classe de amplitude igual a 10; As freqüências acumuladas; As freqüências relativas; O histograma e o polígono de freqüência. 5 – A tabela abaixo apresenta os coeficientes de liquidez obtidos da análise de balanço em 50 indústrias: 3,9 7,4 10,0 11,8 2,3 4,5 10,5 8,4 15,6 7,6 18,8 2,9 2,3 0,4 5,0 9,0 5,5 9,2 12,4 8,7 4,5 4,4 10,6 5,6 8,5 2,4 17,8 11,6 0,8 4,4 7,1 3,2 2,7 16,2 2,7 9,5 13,1 3,8 6,3 7,9 4,8 5,3 12,9 6,9 6,3 7,5 2,6 3,3 4,6 16,0 Forme com esses dados uma distribuição com intervalos de classe iguais a 3, tais que os limites inferiores sejam múltiplos de 3; Confeccione o histograma e o polígono de freqüência correspondentes. 6 – Um grau de nebulosidade, registrado em décimos, ocorre de acordo com a distribuição abaixo: NEBUL. 0 ⊢ 0,5 ⊢ 1,5 ⊢ 2,5 ⊢ 3,5 ⊢ 4,5 ⊢ 5,5 ⊢ 6,5 ⊢ 7,5 ⊢ 8,5 ⊢ 9,5 ⊢ 10,0 fi 320 125 75 65 45 45 55 65 90 145 676 Construa o histograma correspondente. 6 – Considerando a distribuição abaixo: CLASSES 1 ⊢ 2 ⊢ 3 ⊢ 4 ⊢ 5 ⊢ 6 ⊢ 7 ⊢ 8 ⊢ 9 ⊢ 10 ⊢ 11 ⊢ 12 ⊢ 13 ⊢ 14 ⊢ 15 ⊢ 16 ⊢ 17 ⊢ 18 fi 7 3 10 11 12 37 35 45 39 30 25 7 10 4 6 1 4 Confeccione: O histograma; O polígono de freqüência. MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL 1 – MÉDIA ARITMÉTICA - é igual a soma das observações dividido pelo número de observações. EX: Média das alturas dos alunos de uma turma. 1.65 1.72 1.73 1.66 1.74 1.69 1.80 1.80 1.70 2.10 1.67 Média = (1.65+1.72+1.73+1.66+1.74+1.69+1.80+1.80+1.70+2.10+1.67)/11 = 19.26/11 = 1.75 EX: Calcular a média das notas abaixo: NOTA PESO 4,0 2 5,0 2 7,0 3 8,0 1 9,0 1 4,0 1 Média Aritmética = (4x2)+(5x2)+(7x3)+(8x1)+(9x1)+(4x1)/(2+2+3+1+1+1) = 60/10 = 6,0 2 - MEDIANA - divide a massa de dados, previamente ordenada, em duas metades. Assim, quando o número de observações é impar, a mediana é o valor que fica no meio da série ordenada. Quando o número de observações for par, a mediana é igual à média entre os dois valores centrais. EX: Alturas dos alunos de uma turma 1.65 1.66 1.67 1.69 1.70 1.72 1.73 1.74 1.80 1.80 2.10 Mediana =1.72 3 - MODA - é o valor mais freqüente da distribuição. Moda = 1.80 Em alguns casos pode ser que o valor mais freqüente ocorra fora do centro da distribuição. Neste caso, o que faz mais sentido é a classe modal, aquela que possui o maior número de observações. A classe modal também é útil no caso de variáveis que não assumem valores, mas sim categorias, como: EX: homem/mulher, casado/solteiro/divorciado/viúvo. EX: Há casos em que a moda pode ser recomendada, como no RJ, em determinado ano, onde quase todas as linhas de ônibus cobravam o mesmo preço pela passagem, de modo que a referência é a tarifa modal. 4 - QUARTIS - são medidas que dividem a série ordenada em quatro partes iguais. EX: 1º quartil = 1,67 2º quartil =1,72 3º quartil = 1,80 5 - COMPARAÇÃO ENTRE A MÉDIA E A MEDIANA Para os conjuntos de valores: A = (1;2;3) B = (1;2;300) Para o conjunto A, tanto a média quanto a mediana são iguais a 2; Para o conjunto B, a mediana continua sendo 2 enquanto a média passa para 101. DIFERENÇAS: A principal diferença entre a média e a mediana, é que a mediana é praticamente insensível aos valores extremos da distribuição, o que não ocorre com a média. 6 – CENTIL - divide a massa de dados, previamente ordenada, em cem partes iguais. Para distribuição de freqüências com intervalo de classes, o cálculo do centil é feito através da seguinte fórmula: Ci = l + c . [(ECi – Fant)/fCi] Onde: Ci – centil de ordem i l – limite inferior da classe centil c – intervalo de classe da distribuição ECi – ordem do elemento centil de ordem i Fant – freqüência acumulada anterior à classe centil fCi – freqüência simples da classe centil Obs: Essa fórmula pode ser adaptada para o cálculo da mediana e do quartil, se a distribuição de freqüências for com intervalo de classes. EXERCÍCIOS DE FIXAÇÃO 1 - Calcule a média, moda e mediana das seguintes séries de valores. a) A = {300, 400, 500, 600} b) B = {300, 400, 300, 400, 500} c) C = NOTAS 4 6 7 8 fj 3 4 2 2 d) CLASSE 7 ⊢ 11 11 ⊢ 15 15 ⊢ 19 19 ⊢ 23 23 ⊢ 27 fj 2 3 4 3 2 e) A TABELA, A SEGUIR, REPRESENTA AS NOTAS OBTIDAS POR 30 ALUNOS DE UMA ESCOLA. 84 90 80 94 77 83 91 92 92 86 99 83 76 70 76 88 78 89 95 81 87 83 90 77 86 93 94 98 81 87 2 – Para a distribuição abaixo, calcular as medidas: CONSUMO (KWh) Nº USUARIOS 5 – 25 4 25 – 45 6 45 – 65 14 65 – 85 26 85 – 105 14 105 – 125 8 125 – 145 6 145 – 165 2 C30 C50 C75 C15 C25 C90 3 – Calcular as medidas C10 e C90 para as seguintes distribuições: a) Tabela 1 CLASSES fi 10 – 20 5 20 – 30 10 30 – 40 15 40 – 50 20 50 – 60 5 b) Tabela 2 CLASSES fi 10 – 20 5 20 – 30 10 30 – 40 15 40 – 50 10 50 – 60 5 c) Tabela 3 CLASSES fi 10 – 20 5 20 – 30 20 30 – 40 15 40 – 50 10 50 – 60 5 II - MEDIDAS DE DISPERSÃO As medidas de dispersão, ao contrário das medidas de tendência central, procuram identificar os afastamentos ou dispersão dos valores de uma determinada série em relação a sua média ou a sua mediana. Na utilização das medidas de dispersão, deve-se levar em consideração os seguintes aspectos: - não há razão alguma para se calcular a média de um conjunto de dados onde não haja variação desses elementos; - se a variabilidade dos dados for muito grande, sua média terá um grau de confiabilidade tão pequeno que será inútil calculá-la; - caracterizar um conjunto de valores apenas através de sua média é descrevê-lo inadequadamente; - para avaliar o grau de variabilidade ou dispersão dos valores de um conjunto de números são usadas as medidas de dispersão. Isso permitirá que se estabeleçam comparações entre fenômenos de mesma natureza e se identifique até que ponto esses valores se distribuem acima ou abaixo de medidas de tendência central. Como exemplo, vamos comparar a performance de dois empregados com base na produção diária (qtde produzida) de determinada peça, conforme mostrado a seguir: Empregado A: {70; 71; 69; 70; 70} Empregado B: {60; 80; 70; 62; 83} XmA = 70 XmB = 71 Observa-se que a média do empregado B é maior do que a média do empregado A. Será que, por isso, a performance de B foi melhor? Verificando a produção diária dos dois empregados, percebe-se que a performance do empregado A foi mais uniforme, pois seus valores foram mais constantes e ficaram mais próximos da média. Por outro lado, verifica-se que a produção diária de B variou bastante e que seus valores ficaram mais afastados da média. Portanto, os valores do empregado B tiveram maior dispersão. Isso pode ser comprovado através do valor do desvio-padrão: SA = 0,707 SB = 10,344 Para avaliar o grau de variabilidade ou dispersão dos valores de um conjunto de números usaremos as medidas de dispersão, conforme listadas a seguir. MEDIDAS DE DISPERSÃO ABSOLUTA a) DESVIO-QUARTIL B) DESVIO-MÉDIOc) DESVIO-PADRÃO MEDIDAS DE DISPERSÃO RELATIVA a) DESVIO-QUARTIL REDUZIDO b) COEFICIENTE DE VARIAÇÃO DE PEARSON MEDIDAS DE DISPERSÃO ABSOLUTA a) DESVIO-QUARTIL (Dq) Dq = (Q3 – Q1)/2 b) DESVIO-MÉDIO (Dm) Dm = (∑|Xi – Xm|. fi)/n Dm = (∑|Xi – Md|. fi)/n c) DESVIO-PADRÃO (S) S = [(∑|Xi – Xm|2. fi)/(n – 1)]1/2 d) VARIÂNCIA VAR = S2 MEDIDAS DE DISPERSÃO RELATIVA a) DESVIO-QUARTIL REDUZIDO (%) Dqr = (Q3 – Q1)/(2.Md) Dqr = Dq/Md b) COEFICIENTE DE VARIAÇÃO DE PEARSON (%) CVp = S/Xm EXERCÍCIOS DE FIXAÇÃO 1 – Calcular o desvio quartil da seguinte distribuição: CLASSES fi 10 – 20 4 20 – 30 12 30 – 40 15 40 – 50 20 50 – 60 15 60 – 70 11 70 – 80 3 2 – Calcular o desvio médio para as seguintes conjuntos de números: A = {10,12,13,20,25,34,45} B = {17,18,19,20,21,22,23} C = {-4,-3,-2,3,5} D = {2,4,6,8,10} 3 - Calcular o desvio médio dos valores representativos do consumo de energia elétrica (KWh) de 80 usuários: CONSUMO (KWh) Nº USUARIOS 5 – 25 4 25 – 45 6 45 – 65 14 65 – 85 26 85 – 105 14 105 – 125 8 125 – 145 6 145 – 165 2 4 – Calcular a variância e o desvio-padrão para os seguintes conjuntos de números: A = {10,12,13,20,25,34,45} C = {-4,-3,-2,3,5} 5 - Calcular a variância e o desvio-padrão para a seguinte distribuição: CONSUMO (KWh) Nº USUARIOS 5 – 25 4 25 – 45 6 45 – 65 14 65 – 85 26 85 – 105 14 105 – 125 8 125 – 145 6 145 – 165 2 6 – Calcular a variância e o desvio-padrão para os seguintes conjuntos de números: A = {1000, 1001, 1002, 1003, 1004, 1005} B = {0, 1, 2, 3, 4, 5} X = {17, 18, 19, 20, 21, 22, 23} Y ={19, 20, 21, 22, 23, 24, 25} 7 – Calcular a variância e o desvio-padrão para os seguintes conjuntos de números: W = {1, 2, 3, 4, 5} Z = {10, 20, 30, 40, 50} U = {40, 50, 60, 70, 80} V = {20, 40, 60, 80, 100} 8 - Calcular a variância e o desvio-padrão para o seguinte conjunto de números: M = {2, 4, 6, 8, 10} 9 – Para a distribuição abaixo, calcule o desvio quartil reduzido: CONSUMO (KWh) fi 5 25 4 25 45 6 45 65 14 65 85 26 85 105 14 105 125 8 125 145 6 145 165 2 10 – Dado o conjunto: {2, 3, 7}. Calcular o CVP. 11 – Dada a Distribuição: Nº SALÁRIOS MÍNIMOS Nº DE OPERÁRIOS 0 2 40 2 4 30 4 6 10 6 8 15 8 10 5 Calcular: Desvio Quartil Desvio Médio Desvio-padrão Desvio Quartil Reduzido Coeficiente de Variação de Pearson 12 – Dada a seguintes distribuições: 12.1 – Distribuição 1 2,0 1,0 2,4 3,2 1,9 1,9 3,2 1,9 1,7 2,3 2,0 1,9 1,0 1,9 3,2 1,7 2,0 1,9 1,9 1,9 3,2 1,0 3,2 2,3 1,0 1,7 2,0 1,0 1,8 1,9 12.2 – Distribuição 2 1,9 2,2 3,1 2,4 3,0 1,7 1,9 3,1 3,0 3,0 3,0 1,7 1,9 2,2 3,0 1,9 3,0 2,2 3,0 2,2 3,0 1,7 3,0 1,7 3,0 1,9 3,0 1,7 1,9 1,7 Calcular: Variância b) Desvio-padrão c) Coeficiente de Variação de Pearson 13 – Dados os conjuntos: A ={1000, 1001, 1002, 1003, 1004, 1005} B = {0, 1, 2, 3, 4, 5} Podemos afirmar que: O desvio-padrão A é igual a 1000 vezes o desvio-padrão de B; O desvio-padrão A é igual ao desvio-padrão de B; O desvio-padrão A é igual ao desvio-padrão de B multiplicado pelo quadrado de 1000; O desvio-padrão A é igual ao desvio-padrão de B dividido por 1000; O desvio-padrão A é igual ao quadrado do desvio-padrão de B; 14 – Realizou-se uma prova para duas turmas, com os seguintes resultados: Turma A: S = 2,5; = 5; Turma B: S = 2; = 4 Pode-se afirmar que: A turma B apresenta maior dispersão absoluta; A dispersão absoluta é igual para ambas as turmas; A dispersão relativa é igual à dispersão absoluta; A dispersão relativa e a absoluta para a turma B são iguais; A dispersão relativa da turma A é igual à da turma B. 15 –A tabela abaixo representa a vida útil de postes telefônicos de madeira: ANOS Nº POSTES SUBSTITUÍDOS 0,5 2,5 11 2,5 4,5 47 4,5 6,5 87 6,5 8,5 134 8,5 10,5 200 10,5 12,5 198 12,5 14,5 164 14,5 16,5 102 16,5 18,5 48 18,5 20,5 6 20,5 22,5 3 Pede-se: O desvio-padrão O coeficiente de Variação de Pearson 1 – A produção de manteiga dos últimos seis meses do Laticínio Sabor do Leite Ltda. é apresentada a seguir. Produção mensal de manteiga, em toneladas: {11; 8; 4; 10; 9; 12} Com base nos números apresentados, calcule: a) desvio-médio b) desvio-quartil c) variância amostral d) desvio-padrão amostral e) desvio-quartil reduzido f) coeficiente de variação de Pearson 2 – Empregando os dados disponibilizados na tabela seguinte. Xi 2 4 6 10 12 16 fi 1 3 4 3 3 6 Pede-se: a) desvio-médio b) desvio-quartil c) variância amostral d) desvio-padrão amostral e) desvio-quartil reduzido f) coeficiente de variação de Pearson 3 – As notas de um determinado aluno em estatística foram iguais a 5,2,1 e 4. Pergunta-se: Qual o desvio-médio destas notas? III – MEDIDAS DE ASSIMETRIA - é o grau de deformação de uma curva de freqüências em relação à curva normal. TIPOS DE CURVAS a) Simétrica ou Distribuição Simétrica - apresenta como principal característica o fato de as três medidas de tendência central (média, moda e mediana) serem iguais. b) Assimétrica positiva à direita ou Distribuição Assimétrica Positiva - é uma distribuição com deformação positiva e se apresenta com uma cauda mais alongada à direita da moda, pois há uma predominância de valores superiores à moda. c) Assimétrica negativa à esquerda ou Distribuição Assimétrica Negativa - é uma distribuição com deformação negativa e se apresenta com uma cauda mais alongada à esquerda da moda, pois há uma predominância de valores inferiores à moda. CÁLCULO DAS MEDIDAS DE ASSIMETRIA a) PRIMEIRO COEFICIENTE DE ASSIMETRIA DE PEARSON Sk = (Xm – Mo)/S Se Sk = 0 então: Xm = Mo ( Curva Simétrica ou Distribuição Simétrica Se Sk > 0 então: Xm > Mo ( Curva Assimétrica Positiva ou Distribuição Assimétrica Positiva Se Sk < 0 então: Xm < Mo ( Curva Assimétrica Negativa ou Distribuição Assimétrica Negativa b) COEFICIENTE QUARTIL DE ASSIMETRIA Sk = (Q3 – 2.Md + Q1)/(Q3 – Q1) c) COEFICIENTE DE ASSIMETRIA ENTRE PERCENTIS 10 E 90 Sk = (P90 – 2.Md + P10)/(P90 – P10) d) SEGUNDO COEFICIENTE DE ASSIMETRIA DE PEARSON As = 3.(Xm – Md)/S EXERCÍCIOS DE FIXAÇÃO 1 – Determine o tipo de assimetria das seguintes distribuições: DISTRIBUIÇÕES Xm Mo A 52 52 B 45 50 C 48 46 2 – Uma Distribuição de Frequências apresenta as seguintes medidas: Xm = 48,1; Md = 47,9; S = 2,12 Calcule o 2º coeficiente de assimetria. 3 – Em uma Distribuição de Frequências foram encontradas as seguintes medidas: Xm = 33,18; Mo = 27,50; Md = 31,67; S = 12,45 a) Classifique o tipo de assimetria b) Calcule o coeficiente de assimetria 4 – Determine o tipo de assimetria das seguintes Distribuições de Frequências: a) Tabela 1 CLASSES fi 10 – 20 5 20 – 30 10 30 – 40 15 40 – 50 20 50 – 60 5 b) Tabela 2 CLASSES fi 10 – 20 5 20 – 30 10 30 – 40 15 40 – 50 10 50 – 60 5 c) Tabela 3 CLASSES fi 10 – 20 5 20 – 30 2030 – 40 15 40 – 50 10 50 – 60 5 IV – MEDIDAS DE CURTOSE - as medidas de curtose indicam até que ponto a curva de freqüência de uma distribuição se apresenta mais afilada ou mais achatada em relação à curva normal. COEFICIENTE DE CURTOSE K = (Q3 – Q1)/2.(C90 – C10) K = 0,263 ( Curva normal ou Distribuição Mesocúrtica K > 0,263 ( Curva ou Distribuição Platicúrtica K < 0,263 ( Curva ou Distribuição Leptocúrtica TIPOS DE CURVAS DE CURTOSE a) CURVA OU DISTRIBUIÇÃO MESOCÚRTICA - apresenta um grau de achatamento equivalente ao da curva normal. K = 0,263 b) CURVA OU DISTRIBUIÇÃO PLATICÚRTICA - apresenta alto grau de achatamento, superior ao da curva normal. K > 0,263 c) CURVA OU DISTRIBUIÇÃO LEPTOCÚRTICA - apresenta alto grau de afilamento, superior ao da curva normal. K < 0,263 EXERCÍCIOS DE FIXAÇÃO 1 – Dada as seguintes Distribuições de Frequências: DISTRIBUIÇÕES Q1 Q3 C10 C90 A 814 935 772 1012 B 63,7 80,3 55 86,6 C 28,8 45,6 20,5 49,8 a) Calcule os respectivos graus de curtose. b) Classifique cada uma das distribuições em relação à curva normal. 2 – Determine o grau de curtose e classifique a distribuição em relação à curva normal. PESOS (Kg) Nº OPERÁRIOS 50 – 58 10 58 – 66 15 66 – 74 25 74 – 82 24 82 – 90 16 90 - 98 10 V – CORRELAÇÃO LINEAR Primeiramente, cabe destacar que foram escolhidas as variáveis X e Y (aleatórias) para representarem dois quaisquer elementos da natureza a serem estudados, tais como: peso, altura, idade, comprimento, nº de filhos, renda familiar, produção diária, perda diária na produção, vendas, gastos, poupança, anos de estudo, quantidade exportada, volume de precipitação pluviométrica, volume de produção de leite, demanda da produção, consumo. Cabe então perguntar: Existe relação entre as variáveis X e Y? Se existe, como é? Essa é uma questão recorrente na vida de qualquer pesquisador. Ao afirmar que a taxa de suicídio entre protestantes é maior do que entre católicos, Durkheim sugere que existe uma correlação entre a denominação religiosa e a propensão ao autocídio. A Correlação linear serve para verificar se existe ou não relação entre duas variáveis. Isso é obtido através do coeficiente de correlação linear (rx,y) que indica se há ou não correlação entre as duas variáveis estudadas. Uma vez caracterizada que existe correlação, procura-se descrever a relação sob forma de uma função matemática denominada regressão linear. Mas, o que significa dizer que duas variáveis estão correlacionadas? CORRELAÇÃO LINEAR SIMPLES O estudo da correlação linear tem por objetivo medir, analisar e avaliar o grau de relação existente entre duas variáveis aleatórias. Assim, por exemplo, podemos medir se a relação entre nº de filhos de uma família e sua renda é forte, fraca ou nula. Alguns exemplos ajudarão a entender o que significa a correlação entre duas variáveis: - pode-se verificar se o peso das pessoas está relacionado com a idade delas; - se o consumo das famílias está relacionado com a renda dessas famílias; - se a venda nas empresas está relacionado com a demanda de determinado produto; - se o gasto promocional está relacionado com o preço do produto. A correlação linear procura identificar se existe relação entre as variáveis X e Y, através da disposição dos pontos (X, Y) em torno de uma reta, de modo a facilitar a tomada de decisões e permitir que previsões sejam realizadas. MEDIDAS DE CORRELAÇÃO - o instrumento de medida da correlação linear é dado pelo cálculo do coeficiente de correlação de Pearson. Rx,y = [∑x,y – (∑x).(∑y)/n]/{[∑x2–(∑x)2/n]. [∑y2–(∑y)2/n]}1/2 Onde: n – nº de observações realizadas nas variáveis estudadas -1 <= rx,y <= 1 ANÁLISE GRÁFICA a) CORRELAÇÃO LINEAR POSITIVA - nesse tipo de correlação a relação existente entre as variáveis X e Y é direta, ou seja, quando X cresce Y também cresce, e quando X diminui Y também diminui. Contudo, ao serem plotados, os pontos (x,y) aparecem desalinhados e situados em torno da reta. 0 < rx,y < 1 b) CORRELAÇÃO LINEAR PERFEITA POSITIVA - nesse tipo de correlação a relação existente entre as variáveis X e Y é direta, ou seja, quando X cresce Y também cresce, e quando X diminui Y também diminui. Contudo, ao serem plotados, os pontos (x,y) aparecem perfeitamente alinhados na reta. rx,y = 1 c) CORRELAÇÃO LINEAR NEGATIVA - nesse tipo de correlação a relação existente entre as variáveis X e Y é inversa, ou seja, quando X cresce Y decresce, e quando X decresce Y cresce. Contudo, ao serem plotados, os pontos (x,y) aparecem desalinhados e situados em torno da reta. -1 < rx,y < 0 d) CORRELAÇÃO LINEAR PERFEITA NEGATIVA - nesse tipo de correlação a relação existente entre as variáveis X e Y é inversa, ou seja, quando X cresce Y decresce, e quando X decresce Y cresce. Contudo, ao serem plotados, os pontos (x,y) aparecem perfeitamente alinhados na reta. rx,y = -1 e) CORRELAÇÃO LINEAR NULA - a correlação é considerada nula quando não há relação entre as variáveis X e Y, ou seja, quando as variações de X e Y ocorrem independentemente de não existir correlação entre elas. rx,y = 0 f) CORRELAÇÃO LINEAR ESPÚRIA - quando não houver relação entre as variáveis X e Y, mas o coeficiente de correlação apresenta um valor próximo de + ou -1. Obs: De acordo com os estudos realizados, pode-se afirmar que a correlação linear será tanto mais forte quanto seu resultado mais se aproximar de + ou -1, e será tanto mais fraca quanto seu resultado mais se aproximar de 0. A seguir, é mostrado o eixo que apresenta os valores possíveis de rxy. __forte____________fraca____fraca___________forte__ -1 0 +1 nula EXERCÍCIOS DE FIXAÇÃO 1 – Calcular o coeficiente de correlação linear entre as variáveis x e y, usando os seguintes dados: Y 10 8 6 10 12 X 2 4 6 8 10 2 – A tabela abaixo mostra os resultados de uma pesquisa com 10 famílias de determinada região. FAMÍLIAS RENDA (R$ 100) POUPANÇA (R$ 1.000) Nº FILHOS MÉDIA DE ANOS DE ESTUDO A 10 4 8 3 B 15 7 6 4 C 12 5 5 5 D 70 20 1 12 E 80 20 2 16 F 100 30 2 18 G 20 8 3 8 H 30 8 2 8 I 10 3 6 4 J 60 15 1 8 Calcular o coeficiente de correlação linear entre: Renda Familiar e Poupança Renda Familiar e Nº Filhos Poupança e Nº Filhos Média de Anos de Estudo da Família e Nº Filhos Renda Familiar e Média de Anos de Estudo da Família 3 – A tabela abaixo mostra o volume de vendas e os gastos promocionais de determinada empresa. Calcular a correlação entre as duas variáveis. VENDAS (1.000 UNID.) PROMOÇÃO (R$ 100.000) 80 2 90 4 95 5 95 6 100 8 110 8 115 10 110 10 120 12 130 15 4 – Seja Y um índice de relação de trocas com base em 1953 e X um índice de quantum exportado (1953 = 100). Calcular a correlação entre os dois índices, com base nos seguintes dados: ANOS INDICE DE RELAÇÃO DE TROCAS INDICE DE QUANTUM EXPORTADO 1953 100 100 1954 134 86 1955 118 100 1956 113 108 1957 117 100 1958 119 96 1959 109 117 1960 101 118 VI – REGRESSÃO LINEAR A análise de regressão linear fornece uma função matemática que procuradescrever a relação entre as duas variáveis escolhidas. Tem como objetivo estimar numericamente o grau de relação existente entre populações de duas variáveis, a partir de amostras selecionadas destas populações. Como exemplo, pode-se citar o caso em que uma rede de lojas de confecções coletou uma amostra de dados referente aos seus gastos com publicidade realizados em determinado período, juntamente com o respectivo volume de vendas, conforme apresentado na tabela abaixo. PERÍODO PESQUISADO jan fev mar abr mai Gastos com publicidade (R$ mil) 3 4 8 12 14 Vendas realizadas no período (R$ mil) 7 14 15 28 32 A análise de regressão permite estudar a relação conjunta entre duas variáveis. Essas variáveis costumam ser apresentadas como variável independente (X), no exemplo acima “gestos com publicidade”, e variável dependente (Y), no exemplo acima “vendas realizadas no período”. Em regressão, considera-se apenas a variável y como aleatória e a variável x como supostamente sem erro. A relação entre X e Y será dada pela equação: y = f(x) + e, onde e irá captar todas as influências sobre Y não devidas a X. Desse modo, a natureza da relação entre as variáveis X e Y fica caracterizada pela função ou equação de regressão: y = a + b.x Onde: a, b - constantes x, y - variáveis A equação de regressão pode ser usada para estimar ou predizer valores futuros de uma variável, com base em valores conhecidos ou supostos da variável relacionada. A regressão linear tem aplicação em várias áreas, tais como: Administração, Economia, Agricultura, Pesquisa médica. Portanto, dado um conjunto de valores observados de X e Y, construir um modelo de regressão linear de Y sobre X consiste em obter, a partir dos valores observados, uma reta que melhor represente a relação verdadeira entre essas variáveis. A determinação dos parâmetros dessa reta é denominada ajustamento. O processo de ajustamento deve partir da escolha da função através do qual os valores de X explicarão os valores de Y. Para isso, recorre-se a um gráfico conhecido como Diagrama de Dispersão. Esse gráfico é construído anotando, em um sistema de coordenadas cartesianas, os pontos correspondentes aos pares de observações de X e de Y, ou seja: P (x,y) A função a ser escolhida será aquela que melhor representar os pontos dispostos no diagrama, conforme apresentado no gráfico, a seguir. Para este gráfico tem-se um conjunto de pontos sugerindo uma função linear (reta): y = a + b.x Onde: a e b são os parâmetros de ajustamento do modelo. Sendo que a é o ponto onde a reta corta o eixo da variável Y, e b é a tangente do ângulo que a reta forma com uma paralela ao eixo da variável X. A reta ajustada é denominada também de reta de mínimos quadrados, pois os valores de a e b são obtidos de tal forma que é mínima a soma dos quadrados das diferenças entre os valores observados de Y e os obtidos a partir da reta ajustada para os valores de X. b = [∑xy–(∑x.∑y)/n]/[∑x2-(∑x)2/n] a = ym –b.xm EXERCÍCIOS DE FIXAÇÃO 1 – Os dados abaixo referem-se ao volume de precipitação pluviométrica e ao volume de produção de leite tipo C, em determinada região do país. ANOS PRODUÇÃO DE LEITE C (Milhões de litros) INDICE PLUVIOMÉTRICO (mm) 1970 26 23 1971 25 21 1972 31 28 1973 29 27 1974 27 23 1975 31 28 1976 32 27 1977 28 22 1978 30 26 1979 30 25 a) Ajustar os dados através de um modelo linear. b) Admitindo-se, em 1980, um índice pluviométrico de 24 mm, qual deverá ser o volume esperado de produção do leite tipo C? 2 - Uma empresa está estudando como varia a demanda de certo produto em função do seu preço de venda. Para isso levantou as seguintes informações: MESES UNIDADES VENDIDAS (Y) PREÇO DE VENDA P/UNIDADE(X) J 248 162,00 F 242 167,00 M 234 165,00 A 216 173,00 M 230 170,00 J 220 176,00 J 213 178,00 A 205 180,00 S 198 182,00 O 195 187,00 Calcular a equação de regressão linear. 3 - Os dados abaixo representam o consumo e a renda disponível. Determinar as estimativas a e b dos parâmetros da reta estimada. Qual o consumo esperado para uma renda de 400 milhões de reais? ANOS CONSUMO(Y) (R$ milhões) RENDA (X) (R$ milhões) 1960 15 18 1961 17 20 1962 18 21 1963 19 22 1964 19 24 1965 20 25 1966 22 25 1967 22 28 1968 24 29 1969 25 30 1970 27 32 1971 29 34 1972 30 37 1973 33 40 EXERCÍCIOS DE FIXAÇÃO 4 – Dada as seguintes distribuições de freqüências: DISTRIBUIÇÕES Q1 Q3 C10 C90 A 814 935 772 1012 B 63,7 80,3 55 86,6 C 28,8 45,6 20,5 49,8 a) Calcule os respectivos graus de curtose b) Classifique cada uma das distribuições em relação à curva normal. 5 – Determine o grau de curtose e classifique a distribuição em relação à curva normal. PESOS (Kg) Nº OPERÁRIOS 50 ⊢ 58 10 58 ⊢ 66 15 66 ⊢ 74 25 74 ⊢ 82 24 82 ⊢ 90 16 90 ⊢ 98 10 6 – Os seguintes dados mostram o nº de pedidos atendidos mensalmente pelo setor de produção da Marcenaria Arte no Traço no período de 2004 e 2005. ANO PEDIDOS ATENDIDOS 2004 13; 22; 29; 37; 39; 46; 51; 58 2005 14; 17; 22; 22; 23; 29; 31; 35; 36; 43; 52 Para os dados fornecidos, pede-se: a) Dq b) Dm c) S d) VAR e) Dqr 7 – Para as séries A e B apresentadas a seguir, pede-se a Assimetria de sua distribuição, pelo segundo coeficiente de Pearson. Série A: {0; 3; 5; 17; 35} Série B: {1; 12; 14; 15; 18} 8 – A quantidade de defeitos encontrada em lotes das Fábricas Tangará está apresentada a seguir. Número de defeitos: {3; 5; 5; 7; 8; 15; 20} Com base nos números fornecidos, pede-se obter o grau de assimetria e curtose dos dados. 9 – Verificar o tipo de assimetria das seguintes distribuições de freqüências: CLASSES fi 10 ⊢ 20 5 20 ⊢ 30 15 30 ⊢ 40 10 40 ⊢ 50 20 50 ⊢ 60 50 10 – Um professor resolveu analisar as notas de uma amostra formada por oito alunos. Os dados coletados estão apresentados na tabela seguinte. Teste 7 5 10 3 8 9 7 5 Prova 10 7 10 5 12 10 10 6 Pede-se: a) Calcule o coeficiente de correlação; b) Comente o resultado do coeficiente obtido; c) Construa um modelo de ajuste linear entre os pontos; d) Calcule a nota esperada na prova para um aluno que obteve nota seis no teste. _1192517994/ole-[42, 4D, C6, B2, 03, 00, 00, 00] _1192518204/ole-[42, 4D, 96, 99, 03, 00, 00, 00] _1145274835.unknown _1192351920/ole-[42, 4D, C6, 8D, 03, 00, 00, 00]