Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA Notas de Aula para o curso de Tecnologia Prof. a Paula Francis Benevides Ministério da Educação Universidade Tecnológica Federal do Paraná Campus Curitiba Gerência de Ensino e Pesquisa Departamento Acadêmico de Matemática Estatística Prof a Paula Francis Benevides 2 Conteúdo AULA 1 .................................................................................................................................... 7 1. CONCEITOS PRELIMINARES: .............................................................................................. 7 1.1 MÉTODO ESTATÍSTICO .......................................................................................................... 7 1.1.1 O método experimental: ........................................................................................ 7 1.1.2 O método estatístico: ............................................................................................. 7 2. A ESTATÍSTICA .................................................................................................................. 7 3. FASES DO MÉTODO ESTATÍSTICO ...................................................................................... 7 3.1 COLETA DE DADOS: .............................................................................................................. 7 3.2 CRÍTICA DE DADOS: ............................................................................................................... 8 3.3 APURAÇÃO DOS DADOS: ........................................................................................................ 8 3.4 EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS: .............................................................................. 8 3.5 ANÁLISE DOS RESULTADOS: .................................................................................................... 8 4. VARIÁVEIS ........................................................................................................................ 9 5. POPULAÇÃO E AMOSTRA.................................................................................................. 9 6. AMOSTRAGEM ............................................................................................................... 10 6.1 AMOSTRAGEM CASUAL OU ALEATÓRIA SIMPLES: ....................................................................... 10 6.2 AMOSTRAGEM PROPORCIONAL ESTRATIFICADA: ....................................................................... 12 SEXO ................................................................................................................................. 12 POPULAÇÃO ..................................................................................................................... 12 AMOSTRA ......................................................................................................................... 12 Total ................................................................................................................................................................................ 12 6.3 AMOSTRAGEM SISTEMÁTICA: ............................................................................................... 12 7. TENDENCIOSIDADE DA AMOSTRA .................................................................................. 13 AULA 2 .................................................................................................................................. 16 8. DISTRIBUIÇÃO DE FREQÜÊNCIA ...................................................................................... 16 Estatística Prof a Paula Francis Benevides 3 9. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA..................................................... 17 9.1 CLASSE: ............................................................................................................................ 17 9.2 LIMITE DE CLASSE: .............................................................................................................. 18 9.3 AMPLITUDE DE UM INTERVALO DE CLASSE: ............................................................................. 18 9.4 AMPLITUDE TOTAL DA DISTRIBUIÇÃO: .................................................................................... 18 9.5 AMPLITUDE AMOSTRAL: ...................................................................................................... 18 9.6 PONTO MÉDIO DE UMA CLASSE: ........................................................................................... 19 9.7 FREQÜÊNCIA SIMPLES OU ABSOLUTA ..................................................................................... 19 9.8 FREQUÊNCIA ABSOLUTA ACUMULADA .................................................................................... 20 9.9 FREQÜÊNCIA RELATIVA ........................................................................................................ 20 AULA 3 .................................................................................................................................. 25 10. REPRESENTAÇÃO GRÁFICA ............................................................................................. 25 10.1 GRÁFICO DE BARRAS:.......................................................................................................... 25 10.2 GRÁFICO DE SETORES (PIZZA): .............................................................................................. 26 10.3 DIAGRAMAS DE DISPERSÃO: ................................................................................................. 26 10.4 HISTOGRAMA (OU OGIVA DE GALTON): ................................................................................. 28 10.5 DIAGRAMA DE PARETO: ...................................................................................................... 29 10.6 GRÁFICO POLÍGONO DE FREQÜÊNCIA: .................................................................................... 30 Tabela 10.4 – PONTOS MÉDIOS DOS INTERVALOS DE CLASSE E FREQUENCIAS PARA ESTATURA DOS ALUNOS DA TURMA A-51 .................................................................................. 30 10.7 GRÁFICO POLÍGONO DE FREQUÊNCIA ACUMULADA (OU OGIVA): ................................................ 31 10.8 PICTOGRAMA: ............................................................................................................... 32 TOTAL ................................................................................................................................... 33 AULA 4 .................................................................................................................................. 36 11. MEDIDAS DE POSIÇÃO .................................................................................................... 36 11.1 MÉDIA ARITMÉTICA ( x ): ..................................................................................................... 36 11.1.1 Dados não Agrupados: ....................................................................................... 36 11.1.2 Desvio em relação à média: ............................................................................... 37 11.1.3 Propriedades da média: ..................................................................................... 37 11.1.4 Dados Agrupados: .............................................................................................. 38 EstatísticaProf a Paula Francis Benevides 4 11.1.4.1 Sem intervalo de classe: .............................................................................................................................. 38 11.1.4.2 Com intervalos de classe: ............................................................................................................................ 39 11.2 A MODA (MO) ................................................................................................................. 40 11.2.1 Dados não agrupados: ....................................................................................... 40 11.2.2 Dados agrupados: .............................................................................................. 41 11.2.2.1 Sem intervalo de classe: .............................................................................................................................. 41 11.2.2.2 Com intervalo de classe: ............................................................................................................................. 41 11.3 A MEDIANA (MD): ............................................................................................................ 41 11.3.1 Dados não agrupados: ....................................................................................... 41 11.3.2 Dados Agrupados: .............................................................................................. 42 11.3.2.1 Sem intervalo de classes: ............................................................................................................................ 43 11.3.2.2 Com intervalos de Classe: ........................................................................................................................... 44 11.4 POSIÇÃO RELATIVA DA MÉDIA, MEDIANA E MODA:.................................................................. 46 AULA 5 .................................................................................................................................. 51 11.5 AS SEPARATRIZES: .............................................................................................................. 51 11.5.1 Os Quartis: ......................................................................................................... 51 11.5.2 Os Percentis: ...................................................................................................... 52 AULA 6 .................................................................................................................................. 55 12. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE ............................................................ 55 12.1 AMPLITUDE: ..................................................................................................................... 55 12.2 DESVIO MÉDIO: ................................................................................................................. 55 12.3 DESVIO PADRÃO: ............................................................................................................... 57 12.3.1 Propriedades do Desvio Padrão ......................................................................... 58 12.3.2 Dados não- agrupados: ...................................................................................... 58 12.3.3 Dados agrupados: .............................................................................................. 58 12.3.3.1 Sem intervalo de Classe: ............................................................................................................................. 58 12.3.3.2 Com intervalo de classe: ............................................................................................................................. 59 12.4 VARIÂNCIA:....................................................................................................................... 60 12.5 COEFICIENTE DE VARIAÇÃO: .................................................................................................. 60 AULA 7 .................................................................................................................................. 64 13. MEDIDAS DE ASSIMETRIA: .............................................................................................. 64 13.1 DISTRIBUIÇÃO DE FREQÜÊNCIA SIMÉTRICA: ............................................................................. 64 Estatística Prof a Paula Francis Benevides 5 13.2 DISTRIBUIÇÃO DE FREQÜÊNCIA ASSIMÉTRICA: .......................................................................... 64 13.3 COEFICIENTE DE ASSIMETRIA: ............................................................................................... 66 14. MEDIDAS DE CURTOSE: .................................................................................................. 68 14.1 COEFICIENTE DE CURTOSE: ................................................................................................... 68 AULA 8 .................................................................................................................................. 72 15. PROBABILIDADE: ............................................................................................................ 72 15.1 INTRODUÇÃO: ................................................................................................................... 72 15.2 EXPERIMENTO ALEATÓRIO: .................................................................................................. 72 15.3 ESPAÇO AMOSTRAL: ........................................................................................................... 72 15.4 EVENTOS: ......................................................................................................................... 73 15.5 PROBABILIDADE: ................................................................................................................ 74 15.6 EVENTOS COMPLEMENTARES: .............................................................................................. 75 15.7 PROBABILIDADE COM REUNIÃO E INTERSECÇÃO DE EVENTOS: ...................................................... 76 15.8 EVENTOS INDEPENDENTES: .................................................................................................. 77 15.9 EXPERIMENTOS NÃO EQUIPROVÁVEIS: .................................................................................... 78 AULA 9 .................................................................................................................................. 80 15.10 PROBABILIDADE CONDICIONADA: .......................................................................................... 80 15.11 DISTRIBUIÇÃO BINOMIAL: .................................................................................................... 81 AULA 10 ................................................................................................................................ 84 16. DISTRIBUIÇÕES DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS DISCRETAS: ................ 84 16.1 INTRODUÇÃO: ................................................................................................................... 84 16.2 VARIÁVEIS ALEATÓRIAS: ...................................................................................................... 84 16.2.1 Variável aleatória discreta: ................................................................................ 84 16.2.2 Variável aleatória contínua: .............................................................................. 84 16.3 FUNÇÃO DE PROBABILIDADE:................................................................................................85 16.4 FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA: ............................................................................... 86 16.5 VALOR ESPERADO OU MÉDIA DE UMA VARIÁVEL ALEATÓRIA DISCRETA: ....................................... 87 16.6 VARIÂNCIA E DESVIO PADRÃO DE UMA VARIÁVEL ALEATÓRIA DISCRETA: ...................................... 88 16.7 DISTRIBUIÇÃO BINOMIAL: .................................................................................................... 89 Estatística Prof a Paula Francis Benevides 6 16.7.1 Medidas Características: .................................................................................... 89 16.8 DISTRIBUIÇÃO DE POISSON: ................................................................................................. 91 16.8.1 Hipótese do modelo de Poisson: ........................................................................ 92 16.9 APROXIMAÇÃO DAS PROBABILIDADES BINOMIAIS COMAS PROBABILIDADES DA DISTRIBUIÇÃO DE POISSON: ...................................................................................................................................... 94 AULA 11 ................................................................................................................................ 96 17. DISTRIBUIÇÃO DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS CONTÍNUAS:................ 96 17.1 DISTRIBUIÇÃO NORMAL: ..................................................................................................... 96 17.2 USO DA TABELA DA DISTRIBUIÇÃO NORMAL PADRONIZADA: ...................................................... 100 AULA 12 .............................................................................................................................. 104 17.3 DISTRIBUIÇÃO T DE STUDENT: ............................................................................................. 104 17.3.1 Uso da tabela da distribuição t de Student: .................................................... 105 17.4 DISTRIBUIÇÃO F: .............................................................................................................. 109 17.4.1 Uso da tabela da distribuição F: ...................................................................... 110 Estatística Prof a Paula Francis Benevides 7 AULA 1 1. CONCEITOS PRELIMINARES: 1.1 MÉTODO ESTATÍSTICO 1.1.1 O MÉTODO EXPERIMENTAL: Consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. É o método preferido no estudo da Física, da Química, etc. 1.1.2 O MÉTODO ESTATÍSTICO: O método estatístico diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. 2. A ESTATÍSTICA A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmo na tomada de decisões. A coleta, a organização e a descrição dos dados, estão a cargo da Estatística Descritiva, enquanto a análise e a interpretação desses dados ficam a carga da Estatística Indutiva ou Inferencial. Em geral, as pessoas desconhecem que o aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam conclusões que transcendam os dados obtidos inicialmente. Assim, a análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de uma empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condições de funcionamento, produtividade), a formação de soluções apropriadas e um planejamento objetivo de ação. 3. FASES DO MÉTODO ESTATÍSTICO 3.1 COLETA DE DADOS: A coleta pode ser direta e indireta. A coleta é direta quando feita sobre elementos informativos de registros obrigatórios (nascimentos, casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes Estatística Prof a Paula Francis Benevides 8 aos prontuários dos alunos de uma escola, ou ainda, quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários, como é o caso das notas de verificação e de exames do censo demográfico, etc. A coleta direta de dados podem ser classificadas relativamente ao fator tempo em: contínua (registro) – quando feita continuamente, tal como a de nascimentos e óbitos e a frequência dos alunos às aulas. periódica – quando feita em intervalos constantes de tempo em tempo,como os censos (de 10 em 10 anos) e as avaliações mensais dos alunos. ocasional – quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizima rebanhos inteiros. A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como por exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta. 3.2 CRÍTICA DE DADOS: Externa: quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas. Interna: quando visa observar os elementos originais dos dados da coleta. 3.3 APURAÇÃO DOS DADOS: Pode ser manual, eletromecânica ou eletrônica. 3.4 EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS: Os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico. 3.5 ANÁLISE DOS RESULTADOS: Como já dissemos, o objetivo último da Estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões. Estatística Prof a Paula Francis Benevides 9 4. VARIÁVEIS Variável: conjunto de resultados possíveis de um fenômeno. Cada fenômeno corresponde um número de resultados possíveis Assim por exemplo: Para o fenômeno ―sexo‖ são dois os resultados possíveis: sexo masculino e sexo feminino. Para o fenômeno ―número de filho‖ há um número de resultados possíveis expresso através dos números naturais: 0, 1, 2, 3, ...., n Para o fenômeno ―estatura‖ temos uma situação diferente, pois os resultados podem tomar um número infinito de valores numéricos dentro de um determinado intervalo. Logo, as variáveis podem ser: Qualitativa: se os valores tomados não são numéricos, como: raça, meio de transporte, sexo do bebe, etc. Quantitativa: se os valores tomados são numéricos, como altura, peso, preço de um produto, etc. Variável quantitativa também se chama variável estatística ou simplesmente variável. Cada valor que essa variável pode assumir chama-se dado estatístico. As variáveis estatísticas podemser: Contínuas: quando podem assumir qualquer valor do intervalo de variação. Por exemplo, na determinação das alturas dos adolescentes de uma escola, a variável ―altura‖ é continua. Discretas: quando só podem assumir valores inteiros. Por exemplo, na determinação do número de alunos de uma certa turma, a variável ―número de alunos‖ é discreta. De um modo geral, as medições dão origem a variável contínuas e as contagens ou enumerações, a variáveis discretas. 5. POPULAÇÃO E AMOSTRA Entende-se por população o conjunto de elementos que tem, em comum, determinada característica. As populações podem ser finitas, como, por exemplo, os alunos matriculados em determinada escola, ou infinitas, como por exemplo, os resultados obtidos quando se joga um dado sucessivamente. Existem populações que embora finita, são consideradas infinitas para qualquer finalidade prática. Como exemplo, imagine o número de peixes que há no mar. Entende-se por amostra qualquer conjunto de elementos, retirados da população, desde que esse conjunto seja não-vazio e tenha menor número de elementos que a população. É um subconjunto finito de uma população Estatística Prof a Paula Francis Benevides 10 6. AMOSTRAGEM Existe uma técnica especial – amostragem – para recolher amostras, que garante, tanto quanto possível, o acaso da escolha. Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o que garante á amostra o caráter de representatividade, e isto é muito importante, pois, como vimos, nossas conclusões relativas á população vão estar baseadas nos resultados obtidos nas amostras dessa população. Daremos, a seguir, três das principais técnicas de amostragem. 6.1 AMOSTRAGEM CASUAL OU ALEATÓRIA SIMPLES: Este tipo de amostragem é equivalente a um sorteio lotérico. Na pratica, a amostragem casual ou aleatória simples pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa sequência, os quais corresponderão aos elementos pertencentes a amostra. Exemplo: Vamos obter uma amostra representativa para a pesquisa da estatura de noventa alunos de uma escola: Numeramos os alunos de 01 a 90. Escrevemos os números, de 01 a 90, em pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos, um a um, nove números que formarão a amostra. Neste caso, 10% da população. Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muito trabalhoso. A fim de facilita-lo, foi elaborada uma tabela – Tabela de Números Aleatórios – construída de modo que os dez algarismos (0 a 9) são distribuidos ao acaso nas linhas e colunas. Estatística Prof a Paula Francis Benevides 11 * TABELA DE NÚMEROS ALEATÓRIOS * C1 C2 C3 C4 C5 C6 C7 C8 C9 C1 0 C1 1 C1 2 C1 3 C1 4 C1 5 C1 6 C1 7 C1 8 C1 9 C2 0 C2 1 C2 2 C2 3 C2 4 C2 5 C2 6 C2 7 C2 8 C2 9 L1 4 1 6 1 6 1 0 2 3 5 7 6 2 0 9 9 8 1 0 3 4 7 2 1 0 8 7 8 4 L2 3 0 7 2 6 3 9 5 5 3 4 8 8 0 9 3 0 1 7 0 4 0 8 3 1 2 0 1 2 L3 2 2 5 3 7 5 0 1 9 8 7 6 3 0 0 1 2 1 4 3 2 4 5 6 7 7 4 3 0 L4 1 9 8 4 7 7 8 6 5 2 7 8 1 0 0 7 5 3 2 2 5 8 1 9 0 3 2 3 4 L5 0 3 4 5 8 9 0 2 0 3 1 0 1 1 2 4 3 1 9 5 6 8 5 0 2 3 4 9 0 L6 0 8 9 6 8 1 7 2 2 2 2 8 6 1 9 4 5 2 0 0 1 3 1 0 9 2 3 4 1 L7 8 3 3 7 9 0 6 3 7 6 4 0 7 1 2 1 0 1 2 8 9 7 5 3 2 1 1 8 2 L8 8 8 0 8 9 2 3 6 3 7 3 7 8 9 4 3 9 2 3 2 3 0 0 4 4 2 3 1 3 L9 5 4 1 9 0 0 2 0 3 7 5 0 9 7 6 5 7 8 0 8 4 5 2 3 0 7 4 3 6 L10 6 7 2 0 0 3 1 1 1 2 6 0 2 0 8 0 9 7 7 7 3 6 7 2 9 0 3 1 0 L11 4 4 0 5 1 9 1 9 4 1 8 4 2 1 3 3 2 7 6 4 4 3 8 9 0 7 2 2 9 L12 3 5 1 4 3 3 0 3 2 3 7 0 3 4 5 8 9 3 5 2 4 0 1 7 9 1 8 1 3 L13 2 6 9 3 5 8 2 3 6 5 0 2 6 3 6 7 0 1 7 9 6 8 3 5 3 3 5 7 2 L14 0 1 2 2 7 4 0 7 0 7 9 0 0 6 5 2 7 8 1 0 0 7 5 3 0 9 1 1 3 L15 9 0 8 1 9 8 3 8 3 9 4 0 1 9 5 2 2 0 0 2 1 2 4 7 6 3 2 1 5 L16 7 2 2 0 2 5 0 5 3 2 1 3 5 8 9 1 2 3 9 6 5 2 7 8 1 0 0 7 0 L17 8 9 3 9 4 7 4 1 1 4 2 4 6 7 0 2 3 7 8 5 3 1 2 5 6 9 0 7 9 L18 6 3 0 8 6 6 0 1 4 6 2 2 3 3 0 1 5 4 5 1 1 3 4 7 8 1 2 8 8 L19 5 8 1 7 8 7 5 9 4 8 0 0 2 3 6 9 6 4 3 6 7 2 1 9 7 0 1 8 5 L20 3 4 0 6 0 1 9 8 4 0 2 9 2 3 2 5 3 5 7 2 7 8 2 5 6 2 2 9 4 L21 8 7 2 1 1 3 5 2 4 1 7 5 7 3 0 0 9 1 2 0 3 4 9 3 0 4 4 9 1 L22 1 4 9 1 3 2 8 6 1 2 0 2 0 1 3 5 4 6 4 3 2 0 0 3 9 6 6 0 2 L23 2 7 3 2 5 4 6 5 8 4 0 8 0 1 9 6 9 5 0 8 0 2 4 9 8 8 8 0 3 L24 4 3 8 2 7 3 7 8 0 3 0 9 2 2 6 7 6 4 9 8 9 4 7 7 7 0 0 2 4 L25 5 0 3 3 9 5 7 0 4 5 8 7 4 2 2 3 8 2 1 2 2 0 7 0 6 1 1 2 5 L26 2 5 7 3 0 4 2 2 6 6 1 1 0 3 9 9 1 0 3 4 3 9 6 3 5 3 3 4 8 L27 1 1 4 4 2 6 3 2 0 8 9 2 3 3 7 7 4 0 5 6 8 8 5 2 4 5 5 4 0 L28 0 2 7 4 3 6 4 3 1 7 1 0 2 0 9 6 4 3 7 9 0 7 6 1 3 7 5 5 8 L29 9 1 5 5 6 8 5 6 9 8 2 0 2 3 0 1 4 3 3 7 7 5 6 7 4 3 4 0 1 Para obtermos os elementos da amostra usando a tabela, sorteamos um algarismo qualquer da mesma, a partir do qual iremos considerar números de dois, três ou mais algarismos, conforme nossa necessidade. Os números assim obtidos irão indicar os elementos da amostra. A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-versa), verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou descendente) ou formando o desenho de uma letra qualquer. A opção porém, deve ser feita antes de iniciado o processo. Assim, para o nosso exemplo, considerando a 18 o linha, tomamos os números de dois algarismo (tantos algarismos quantos formam o maior número da população, obtendo: 63 08 66 01 46 22 33 01 54 51 13 47 81 28 Evidentemente, se constasse um numeral maior que 90, este seria desprezado, pois não consta da população, como será também abandonado um numeral que já tenha aparecido. Temos então: 63 08 66 01 46 22 33 54 51 Medindo as alturas dos alunos correspondentes aos números sorteados obteremos uma amostra das estaturas dos noventa alunos. Estatística Prof a Paula Francis Benevides 12 6.2 AMOSTRAGEM PROPORCIONAL ESTRATIFICADA: Muitas vezes a população se divide em subpopulações – estratos. Como é provável que a variável em estudo apresente de estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos. É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada, que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos. Exemplo: Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam meninos e 36 meninas, vamos obter a amostra proporcional estratificada. São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população. Logo, temos: SEXO POPULAÇÃO 10% AMOSTRA M F 54 36 4,5 100 5410 6,3 100 3610 5 4 Total 90 0,9 100 9010 9 Numeramos os alunos de 01 a 90, sendo que de 01 a 54 corresponde aos meninos e de 55 a 90, meninas. Tomandona Tabela de Números Aleatórios a primeira e a segunda coluna da esquerda, de cima para baixo, obtemos os seguintes números: 41 30 22 19 03 08 83 88 54 67 44 35 26 01 90 72 89 63 58 34 87 14 27 43 50 25 11 02 91 Temos então: 41 30 22 19 03 – para os meninos 83 88 67 90 – para as meninas 6.3 AMOSTRAGEM SISTEMÁTICA: Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referências. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, as linhas de produção, etc. Nestes casos, a seleção dos elementos que constituirão a amostra Estatística Prof a Paula Francis Benevides 13 pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática. Assim, no caso de uma linha de produção, podemos a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da população. Exemplo: Suponhamos uma rua contendo novecentos prédios, dos quais desejamos obter uma amostra formada por cinquenta prédios. Podemos, neste caso, usar o seguinte procedimento: como 900/50 = 18, escolheremos por sorteio casual um número de 1 a 18 (inclusive), o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Assim, se o número sorteado fosse o 4, tomaríamos, pelo lado direito da rua, o 4 o prédio, o 22 o , o 40 o etc, até voltarmos ao início da rua, pelo lado esquerdo.·. 7. TENDENCIOSIDADE DA AMOSTRA Muitas vezes as amostras são constituídas por pessoas que devem executar algum tipo de tarefa, com responder perguntas, preencher um questionário ou até mesmo testar um produto. Algumas pessoas se recusam a cooperar. Nesses casos é preciso ter muito senso crítico para avaliar se a amostra efetivamente utilizada é representativa da população. Sempre é possível que a amostra obtida seja tendenciosa ou viciada, isto é, não representativa da população. O senso crítico ainda é mais importante quando as amostrar são constituídas por voluntários. Muitas vezes, o procedimento usado para solicitar voluntários conduz á formação de amostrar tendenciosas. Como por exemplo, imagine que um professor de educação física peça que três alunos da turma se apresentem como voluntários para apostar uma corrida. Ora, é bastante razoável imaginar que, neste caso, se apresentarão como voluntários apenas os alunos que sabem ser bons corredores. Então, os três alunos não constituirão uma amostra representativa da turma, mas uma amostra tendenciosa ou viciada. Estatística Prof a Paula Francis Benevides 14 AULA 01 - EXERCICIOS 1) O método experimental é mais usados por ciências como:........ 2) As ciências humanas e sociais, para obterem os dados que buscam, lançam mão de que método? 3) O que é Estatística? 4) Cite as fases do método estatístico. 5) Para você o que é coletar dados? 6) Para que serve a crítica dos dados? 7) O que é apurar dados? 8) Como podem ser apresentados os expostos os dados? 9) Cite três ou mais atividades do planejamento empresarial em que a Estatística se faz necessária. 10)Classificar as variáveis em qualitativas ou quantitativas (continuas e discretas): a. População: os alunos de uma escola. Variável: cor dos cabelos b. P: casais residentes em uma cidade V: número de filhos c. P: as jogadas de um dado V: o ponto obtido em cada jogada d. P: peças produzidas por certas máquinas V: número de peças produzidas por hora e. P: peças produzidas por certa máquina V: diâmetro externo f. P: estação meteorológica de uma cidade V: precipitação pluviométrica, durante um ano. g. P: alunos de uma cidade V: cor dos olhos h. P: bolsa de valores de São Paulo V: números de ações negociadas i. P: funcionários de uma empresa V: salários. j. P: pregos produzidos por uma máquina V: comprimento k. P: propriedades agrícolas no Brasil V: produção de algodão l. P: segmento de reta V: comprimento m. P: biblioteca da cidade de Curitiba V: número de volumes Estatística Prof a Paula Francis Benevides 15 n. P: indústrias de uma cidade V: índice de liquidez. 11)A massa (em quilogramas) de 20 trabalhadores de uma empresa com 100 funcionários esta registrada a seguir: 62 52 73 80 65 50 70 75 80 65 70 77 82 91 75 52 68 86 70 80 Com base nos dados obtidos, responda: a. Qual a população e a unidade estatística dessa pesquisa? b. Qual é a sua amostra? c. Qual é a variável nessa pesquisa? Ela é discreta ou contínua? 12) Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente, n1=40, n2= 100 e n3= 60. Sabendo-se que, ao ser realizada uma amostragem estratificada proporcional, nove elementos da amostra foram retirados do 3 o estrato, determine o número total de elementos da amostra. 13) Mostre como seria possível retirar uma amostra de 32 elementos de uma população ordenada formada por 2.432 elementos. Na ordenação geral, qual dos elementos abaixo seria escolhido para pertencer à amostra, sabendo-se que o elemento de ordem 1.420 a ela pertence? 1648, 290, 725, 2025, 1120 Estatística Prof a Paula Francis Benevides 16 AULA 2 8. DISTRIBUIÇÃO DE FREQÜÊNCIA Tabela primitiva: tabela cujos elementos não foram numericamente organizados Rol: Tabela obtida após a ordenação dos elementos da tabela primitiva No exemplo em que trabalharemos, a variável em questão, nota, será observada e estudada muito mais facilmente quando dispusermos valores ordenados em uma coluna e colocarmos, ao lado de cada valor, o número de vezes que aparece repetido. Denominamos de frequência o número de alunos que fica relacionado a um determinado valor da variável. Obtemos assim, uma tabela que recebe o nome de distribuição de frequência. Vamos analisar a seguinte situação: Consideremos o quadro seguinte que mostra as notas de Cálculo dos alunos de uma classe de 2 o período de Eletrotécnica numa determinada Faculdade. Disciplina: Cálculo Turma: 2 o período Número 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Nota 5,0 4,0 6,0 8,0 3,0 5,0 7,0 6,0 8,0 4,0 6,0 9,0 7,0 5,0 7,0 5,0 6,0 8,0 7,0 9,0 4,0 6,0 6,0 8,0 7,0 Tabela 1 Nesse caso temos: População estatística: grupo de 25 alunos do segundo período Unidade estatística: cada aluno desse ano Variável estatística: as notas da prova de Cálculo A partir desse conhecimento, elaboramos a seguinte tabela: i Notas Número de alunos(fi) 1 0 0 2 1,0 0 3 2,0 0 4 3,0 1 5 4,0 3 6 5,0 4 7 6,0 6 8 7,0 5 9 8,0 4 10 9,0 2 11 10,0 0 Total: 25 Tabela 2 EstatísticaProf a Paula Francis Benevides 17 Mas o processo dado é ainda inconveniente, já que exige muito espaço, mesmo quando o número de valores da variável (n) é de tamanho razoável. Sendo possível, a solução mais aceitável, pela própria natureza da variável contínua, é o agrupamento de valores em vários intervalos. Assim, se um dos intervalos for, por exemplo, 0| 4, 0, (é um intervalo fechado à esquerda e aberto à direita, 0 x< 4,0) em vez de dizermos que a nota de nenhum aluno é 0 ou 1,0 ou 2,0 e de 1 aluno é 3,0, diremos que 1 aluno tem nota entre 0, inclusive, e 4,0. Deste modo, estaremos agrupando os valores da variável em intervalos, sendo que, em Estatística, preferimos chamar de classes. Chamando de frequência de uma classe o número de valores da variável pertencentes à classe, os dados da tabela 2, podem ser dispostos como na tabela 3, denominada distribuição de frequência com intervalos de classe. Notas Frequência 0 | 2,0 0 2,0 | 4,0 1 4,0 | 6,0 7 6,0 | 8,0 11 8,0 | 11,0 6 Tabela 3 Ao agruparmos os valores da variável em classes, ganhamos em simplicidade, mas perdemos em pormenores. Assim, na Tabela 2 podemos verificar facilmente, que 2 alunos têm nota 9,0 e que nenhum tem nota 10,0. Já na tabela 3 não podemos ver se algum aluno tem nota 10,0. No entanto, sabemos com segurança, que onze alunos tem nota compreendida entre 6,0 e 8,0. O que pretendemos com a construção dessa nova tabela é realçar o que há de essencial nos dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição, até porque a Estatística tem por finalidade específica analisar o conjunto de valores, desinteressando-se por casos isolados. 9. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA 9.1 CLASSE: Classes de frequência ou, simplesmente, classes são intervalos de variação da variável. As classes são representadas simbolicamente por i, sendo i = 1, 2, 3,..., k (onde k é o número total de classes da distribuição). Estatística Prof a Paula Francis Benevides 18 Assim, em nosso exemplo, o intervalo 2,0 | 4,0 define a segunda classe (i = 2). Como a distribuição é formada de 5 classes, podemos afirmar que k = 5. 9.2 LIMITE DE CLASSE: Denominamos de limite de classe os extremos de cada classe. O menor número é o limite inferior da classe ( i ) e o maior número, o limite superior da classe(Li). Na segunda classe, por exemplo, temos: 2 = 2,0 e L2 = 4,0 Obs.: Os intervalos de classe devem ser escritos, de acordo com a Resolução 886/66 do IBGE, em termos de desta quantidade até menos aquela, empregando, para isso, o símbolo | (inclusão de i e exclusão de Li). Assim, o indivíduo com uma nota de 4,0 está incluído na terceira classe (i = 3) e não na segunda. 9.3 AMPLITUDE DE UM INTERVALO DE CLASSE: Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior dessa classe e indicada por hi . Assim: hi = Li - i Na distribuição da tabela 3 temos: h2 = 4,0 – 2,0 = 2,0 9.4 AMPLITUDE TOTAL DA DISTRIBUIÇÃO: Amplitude total da distribuição (AT) é a diferença ente o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe ( limite inferior mínimo). AT = L(máx) – (mín) Em nosso exemplo, temos: AT = 11,0 – 0 = 11,0 Obs.: É evidente que, se as classes possuem o mesmo intervalo, verificamos a relação: k h AT i 9.5 AMPLITUDE AMOSTRAL: Amplitude amostral (AA) é a diferença entre o valor máximo e o valor mínimo da amostra. AA = x (max.) – x (min.) Estatística Prof a Paula Francis Benevides 19 Em nosso exemplo, temos: AA = 10,0 – 0 = 10,0 Observe que a amplitude total da distribuição jamais coincide com a amplitude amostral. 9.6 PONTO MÉDIO DE UMA CLASSE: Ponto médio de uma classe (xi) é como o próprio nome indica o ponto que divide o intervalo de classe em duas partes iguais. Para obtermos o ponto médio de uma classe, calculamos a semissoma dos limites da classe (média aritmética). 2 ii i L x Assim, o ponto médio da segunda classe, em nosso exemplo é: 9.7 FREQÜÊNCIA SIMPLES OU ABSOLUTA A primeira fase de um estudo estatístico consiste em recolher, contar e classificar os dados pesquisados sobre uma população estatística ou sobre uma amostra dessa população. Escolhida uma característica sobre os elementos de uma população, devemos elaborar uma tabela de dados denominada distribuição estatística. Posteriormente, os resultados podem ser interpretados por meio de um gráfico. Diversos tipos de gráficos são usados em Estatística: de barras, de setores, por pontos, etc. Na coluna ―Notas‖ aparecem os diferentes valores da variável estatística. Na coluna ―Número de alunos‖ está indicado o número de vezes que cada valor se repete é a coluna de frequência absoluta (fi). Logo, frequência absoluta (fi), simples, ou frequência de classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor. Utilizando o somatório ( ): O símbolo é usado para escrever abreviadamente expressões que envolvem adição. Assim, indicamos a adição dos termos fi, com i variando de 1 até k (k |N*), como: K i if 1 ou nf i No exemplo das notas de Cálculo, o desenvolvimento do somatório do 7 1i if é dado por: 7 1i if = f1 + f2 + f3 + f4 + f5 + f6 + f7 7 1i if = 0 + 0 + 0 + 1 + 3 + 4 + 6 = 14 Estatística Prof a Paula Francis Benevides 20 9.8 FREQUÊNCIA ABSOLUTA ACUMULADA A distribuição de frequência absoluta pode ser completada com mais uma coluna, chamada de frequências absolutas acumuladas (fia), cujos valores são obtidos adicionando a cada frequência absoluta os valores das frequências anteriores. Veja como fica o quadro anterior: i Nota fi fia 1 0 0 0 2 1,0 0 0 3 2,0 0 0 4 3,0 1 1 5 4,0 3 1 + 3 = 4 6 5,0 4 4 + 4 = 8 7 6,0 6 8 + 6 = 14 8 7,0 5 14 + 4 = 19 9 8,0 4 19 + 4 = 23 10 9,0 2 23 + 2 = 25 11 10,0 0 25 N = 25 Pelo quadro e usando a frequência acumulada, podemos fazer algumas observações, tais como: 8 alunos não obtiveram nota superior a 5,0 nessa classe 25 – 14 = 11 alunos obtiveram nota 7,0 ou acima de 7,0 nessa classe f6a = 6 1i if = 8 9.9 FREQÜÊNCIA RELATIVA Chama-se frequência relativa (fr) do valor de xi da variável o quociente entre a frequência absoluta (fi) e a frequência total (número de elementos n da amostra), ou seja: i i r f f f Observe o gráfico: Estatística Prof a Paula Francis Benevides 21 Devemos observar que se a frequência relativa (fr) é dada na forma de porcentagem, ela vai tornar mais clara à análise de certos dados. Se tomarmos como exemplo o quadro de frequênciadas notas de Cálculo de uma classe de segundo período de Eletrotécnica, podemos, então, completar o quadro de distribuição de frequência com mais duas colunas; a coluna das frequências relativas (fr) e a coluna das frequências relativas acumuladas (fa). xi fi fia Fr (%) Fra (%) 3,0 1 1 1/25 = 4% 4% 4,0 3 4 3/25 = 12% 16% 5,0 4 8 4/25 = 16% 32% 6,0 6 14 6/25 = 24% 56% 7,0 5 19 5/25 = 20% 76% 8,0 4 23 4/25 =16% 92% 9,0 2 25 2/25 = 8% 100% Observando a tabela, temos: 20% dos alunos obtiveram média 7,0 56% dos alunos obtiveram média inferior a 7,0 100% - 56% = 44% obtiveram média igual ou superior a 7,0 Estatística Prof a Paula Francis Benevides 22 AULA 02 - EXERCÍCIOS 1) Numa pesquisa de opinião pública com 800 telespectadores sobre o programa de televisão de sua preferência, obteve-se a seguinte tabela de frequências absolutas: Programa de TV Número de Telespectadores Novela 360 Esportes 128 Filmes 80 Noticiário 32 Shows 200 Construa um quadro com distribuição de frequências absolutas acumuladas, frequências relativas e frequências relativas acumuladas. 2) Um dado foi jogado 20 vezes. Em cada jogada foram obtidos os seguintes pontos: 1 5 6 5 2 2 2 4 6 5 2 3 3 1 6 6 5 5 4 2 a) Elabore um quadro com distribuição de frequências absolutas, frequências absolutas acumuladas, frequências relativas e frequências relativas acumuladas. b) Observando a tabela responda: I. Quantas vezes o número 3 foi obtido no dado? II. Quantas vezes o número obtido no dado foi menor que 5? III. Qual o índice, em porcentagem, em que o número 6 foi obtido no dado? IV. Qual o índice, em porcentagem, em que números maiores que 4 foram obtidos no dado? 3) Veja os principais motivos alegados por 30 000 devedores, pesquisados em uma região metropolitana, ao justificarem atrasos do crediário ou cheque sem fundo. Com base nessa pesquisa, responda: a) Qual a frequência relativa das pessoas que apresentam outras justificativas? b) Quais as frequências absolutas para cada tipo de devedor? Estatística Prof a Paula Francis Benevides 23 4) Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta alunos, que compõem uma amostra de alunos de um colégio A., resultando a seguinte tabela de valores: 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 Determine: a) O rol da tabela primitiva acima. b) A distribuição de frequência c) Distribuição de frequência com intervalos de classe. (sugestão, de 4 em 4) d) A segunda classe. e) Os limites da segunda classe. f) O intervalo (amplitude) da segunda classe. g) A amplitude total da distribuição. h) A amplitude amostral i) O ponto médio da segunda classe. j) A frequência absoluta da segunda classe. 5) A tabela abaixo apresenta as vendas diárias de um determinado aparelho elétrico, durante um mês, por uma firma comercial: 14 12 11 13 14 13 12 14 13 14 11 12 12 14 10 13 15 11 15 13 16 17 14 14 Forme uma distribuição de frequência sem intervalos de classe. 6) Considerando as notas de um teste de inteligência aplicado a 100 alunos: 64 78 66 82 74 103 78 86 103 87 73 95 82 89 73 92 85 80 81 90 78 86 78 101 85 98 75 73 90 86 86 84 86 76 76 83 103 86 84 85 76 80 92 102 73 87 70 85 79 93 82 90 83 81 85 72 81 96 81 85 68 96 86 70 72 74 84 99 81 89 71 73 63 105 74 98 78 78 83 96 95 94 88 62 91 83 98 93 83 76 94 75 67 95 108 98 71 92 72 73 Forme a distribuição de frequência: Estatística Prof a Paula Francis Benevides 24 7) A tabela abaixo apresenta uma distribuição de frequência das áreas de 400 lotes: Área (m 2 ) 300 |— 400 |— 500 |— 600 |— 700 |— 800 |— 900 |— 1.000 |— 1.100 |— 1.200 N o DE LOTES 14 46 58 76 68 62 48 22 6 Com referência a essa tabela, determine: a) a amplitude total; b) o limite superior da quinta classe; c) o limite inferior da oitava classe; d) o ponto médio da sétima classe; e) a amplitude do intervalo da segunda classe; f) a frequência da quarta classe; g) a frequência relativa da sexta classe; h) a frequência acumulada da quinta classe; i) o número de lotes cuja área não atinge 700 m2; j) o número de lotes cuja área seja maior ou igual a 900 m2; k) a percentagem dos lotes cuja área [e de 500 m2, no mínimo, mas inferior a 1.000 m2; l) a classe do 72o lote; m) até que classe estão incluídos 60% dos lotes. 8) Complete a tabela abaixo: i CLASSES fi fr fia fra 1 2 3 4 5 0 |— 8 8 |— 16 16 |— 24 24 |— 32 32 |— 40 4 10 14 9 3 40 00,1 Estatística Prof a Paula Francis Benevides 25 AULA 3 10. REPRESENTAÇÃO GRÁFICA Em muitos casos, uma representação gráfica de uma distribuição de frequência nos dá uma ideia melhor de um levantamento estatístico do que um quadro com números. Nesse item, estudaremos as representações gráficas mais usadas em Estatística. 10.1 GRÁFICO DE BARRAS: Os gráficos de Barras ou colunas são gráficos que podem ser facilmente elaborados à mão ou com uso de softwares específicos, tais como o software Excel ou outro programa gerador de gráficos. Como exemplo, considere-se uma pesquisa de opinião realizada em determinada comunidade, para a qual os dados coletados indicaram o hábito dos moradores em assistir ou não horário político televisivos. Tais informações constam na Tabela 10.1. Tabela 10.1 - HÁBITO DE ASSISTIR O HORÁRIO POLÍTICO HÁBITO FREQUENCIA PERCENTUAL SIM 1150 31,5% NÃO 2500 68,5% TOTAL 3650 100% A tabela 10.1 facilita a apresentação dos resultados e o entendimento do leitor sobre como se comporta os moradores quanto ao hábito de assistirem ou não o horário político. Igualmente, o gráfico de barras também se constitui em uma excelente forma de apresentação de tais informações. GRÁFICO 10.1 – FREQUENCIA COMPORTAMENTAL DOS MEMBROS DE UMA COMUNIDADE QUANTO AO HÁBITO DE ASSISTIR O HORÁRIO POLITICO TELEVISIVO 1150 2500 31,50% 68,50% 0 500 1000 1500 2000 2500 3000 SIM NÃO Estatística Prof a Paula Francis Benevides 26 10.2 GRÁFICO DE SETORES (PIZZA): O gráfico de setores pode ser utilizado tanto para variáveis quantitativas como para variáveis qualitativas. Este gráfico também possui a peculiaridade de facilitar a visualização de resultados, especialmente quando se trata de porcentagens. GRÁFICO 10. 2 – PORCENTAGENS DOS MEMBROS DE UMA COMUNIDADE QUE POSSUEM O HÁBITO DE ASSISTIR O HORÁRIO POLÍTICO TELEVISIVO O Gráfico é construído com base em um círculo, e é empregado sempre quedesejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total da série corresponde à 360 o . Temos 3650 - 360 0 x1 = 113,4 x1 = 113 o 1150 - x x2 = 246,6 x2 = 247 o Notas: O gráfico em setores só deve ser empregado quando há, no máximo, sete dados. Se a série já apresenta os dados percentuais, obtemos os respectivos valores em graus multiplicando o valor percentual por 3,6. 10.3 DIAGRAMAS DE DISPERSÃO: Às vezes temos dados emparelhados de uma forma que associa cada valor de um conjunto a um determinado valor de um segundo conjunto. Um diagrama de dispersão é um gráfico dos dados emparelhados (x, y), com um eixo x horizontal e um eixo y vertical. Para construir manualmente um diagrama de dispersão, traçamos um eixo horizontal para os valores da primeira 31,50% 68,50% Estatística Prof a Paula Francis Benevides 27 variável e um eixo vertical para os valores da segunda variável e marcamos os pontos. O padrão dos pontos assim marcados costuma ajudar a determinar se existe algum relacionamento entre as duas variáveis. Exemplo: O gráfico de dispersão abaixo mostra a estatura de um grupo de alunos do Curso Superior de Tecnologia de Alimentos do CEFET-PR, Unidade de Medianeira, em função da ordem de coleta. Tabela 10.2 - ESTATURA DOS ALUNOS DA TURMA A-51, DO CEFET-PR, UNIDADE MEDIANEIRA. 2 o SEMESTRE 2003 ALUNOS ESTATURA ALUNOS ESTATURA 1 178 10 160 2 165 11 167 3 168 12 173 4 169 13 167 5 165 14 174 6 168 15 160 7 183 16 160 8 175 17 160 9 167 18 166 O gráfico de dispersão é um importante instrumento de análise preliminar sobre o comportamento de um conjunto de dados. No gráfico acima é possível visualizar, mesmo que subjetivamente, como se comporta a variável estatura dos alunos da turma A-51. 155 160 165 170 175 180 185 0 5 10 15 20 e s ta tu ra alunos Estatística Prof a Paula Francis Benevides 28 10.4 HISTOGRAMA (OU OGIVA DE GALTON): O histograma é um gráfico formado por um conjunto de colunas retangulares. No eixo das abscissas marcamos as classes, cujas amplitudes correspondem às bases dos retângulos. No eixo das ordenadas marcamos as frequências absolutas, que correspondem às alturas dos retângulos. Os pontos médios das bases dos retângulos coincidem com os pontos médios dos intervalos de classes. Os dados da Tabela 10.2 podem ser organizados em uma distribuição de frequência, tal como na tabela abaixo. Tabela 10.3 – DISTRIBUIÇÃO DE FREQUENCIA PARA ESTATURA DOS ALUNOS DA TURMA A-51 CLASSES FREQUENCIAS 160 | 165 4 165 | 170 9 170 | 175 2 175 | 180 2 180 | 185 1 A organização dos dados como na Tabela 10.3 facilita a construção do histograma. Observe que cada um dos intervalos deve-se construir um retângulo de área proporcional à frequência absoluta respectiva.··. Estatística Prof a Paula Francis Benevides 29 10.5 DIAGRAMA DE PARETO: Consideremos a afirmação: De 75.200 mortes por acidente nos EUA, em um ano recente, 43.500 foram causados por veículos motorizados, 12.200 por quedas, 6.400 por envenenamento, 4.600 por afogamentos, 4.200 por incêndios, 2.900 por ingestão de alimentos ou de um objeto, e 1.400 por armas de fogo (com base em dados do conselho de Segurança Nacional). O ponto fraco dessa afirmação escrita é não caracterizar bem um relacionamento entre categorias diferentes de dados qualitativos. Uma forma mais conveniente de indicar relações entre dados qualitativos é a construção de um diagrama de Pareto. Um Diagrama de Pareto é um gráfico em barras pra dados qualitativos, com as barras ordenadas de acordo com a frequência. Tal como no caso dos histogramas, as escalas verticais em um diagrama de Pareto podem representar frequências absolutas ou frequências relativas. A barra mais alta fica à esquerda, e as barras menores na extrema direita. Dispondo as barras por ordem de frequência, o diagrama de Pareto focaliza a atenção sobre as categorias mais importantes. Estatística Prof a Paula Francis Benevides 30 Segundo o gráfico construído acima, podemos ver que as mortes acidentais causadas por veículos motorizados representam um problema muito mais sério do que as outras categorias. Embora as mortes acidentais causadas por armas de fogo mereçam considerável atenção dos jornais, elas constituem um problema relativamente pequeno quando comparadas com as outras categorias. 10.6 GRÁFICO POLÍGONO DE FREQÜÊNCIA: O polígono de frequência também é estruturado a partir da tabela de frequência, tal qual o histograma. Define-se o gráfico polígono de frequência como um gráfico de linha, onde os pontos a serem conectados pela linha são os pontos médios dos intervalos de classe para as abscissas com as correspondentes frequências para as ordenadas. TABELA 10.4 – PONTOS MÉDIOS DOS INTERVALOS DE CLASSE E FREQUENCIAS PARA ESTATURA DOS ALUNOS DA TURMA A-51 PONTO MÉDIO DOS INTERVALOS DE CLASSES FREQÜÊNCIAS 160,0 0 162,5 4 167,5 9 172,5 2 177,5 2 182,5 1 185,0 0Estatística Prof a Paula Francis Benevides 31 10.7 GRÁFICO POLÍGONO DE FREQUÊNCIA ACUMULADA (OU OGIVA): Trata-se de um gráfico importante na análise dos resultados de uma variável, uma vez que em cada valor da abscissa a partir do valor mínimo, corresponde a frequência acumulada. Neste caso também a construção de uma Tabela facilita a construção do gráfico. O polígono de frequência acumulada pode ser definido como um dos gráficos de linhas, ligadas aos pontos correspondentes ao limite superior dos intervalos de classes para as abscissas e as frequências acumuladas para as ordenadas. Destaca-se que o primeiro ponto deve ser o valor mínimo dos dados para a variável independente x e zero para a ordenada. Tabela 10.5 – DISTRIBUIÇÃO DE FREQUENCIA ACUMULADA PARA ESTATURA DOS ALUNOS DA TURMA A-51 CLASSES FREQUENCIAS FREQUENCIA ACUMULADA 160 | 165 4 4 165 | 170 9 13 170 | 175 2 15 175 | 180 2 17 180 | 185 1 18 Estatística Prof a Paula Francis Benevides 32 10.8 PICTOGRAMA: O gráfico que utiliza desenhos para representar um conjunto de dados é denominado pictograma. Os gráficos pictogramas são muitos usados na mídia, imprensa escrita e apresentações visuais. Para elaboração desse tipo de gráfico, é comum a inserção de figuras relacionadas com a variável em estudo, substituindo representando os elementos dos gráficos gerados. - Pictograma do Histograma da Estatura dos alunos da turma A-51 AULA 3 - Exercícios 1) Pergunte aos colegas da sua turma de aula qual a disciplina que cada um mais gosta no semestre e qual é a que cada um menos aprecia. Faça um gráfico de barras para representar os resultados. 2) Os alunos do primeiro ano do Ensino Médio do CEFET-PR, turma M12, fizeram uma prova de Matemática e obtiveram as seguintes notas: 5 8 5 6 7 5 6 8 4 7 5 5 5 8 5 6 2 5 6 0 6 5 6 7 6 6 7 2 7 6 8 3 4 9 0 1 7 6 3 4 Construa a partir destas notas, os gráficos de: a. Dispersão b. Polígono de frequência c. Frequência Acumulada d. Histograma 3) Em um mercado de telefones celulares da Região Oeste do Paraná, considerando-se uma fatia de mercado meramente ilustrativa, obtiveram-se os resultados conforme descritos na tabela abaixo: Estatística Prof a Paula Francis Benevides 33 MARCAS PARTICIPAÇÃO NO MERCADO Nokia 60% Ericson 20% Gradiente 15% Motorola 5% TOTAL 100% Construa um gráfico de setores. 4) Baseando-se no gráfico, responda às questões a seguir: a. Qual o assunto de que ele trata? b. Quantas pessoas contaminadas pelo vírus da Aids morreram em 1995? E em 1999? c. Em que ano se deu a maior contaminação pelo vírus da Aids? Qual o número de pessoas contaminadas? d. Qual a porcentagem de mulheres contaminadas pelo vírus da Aids de 1995 a 1999 em relação ao total de pessoas contaminadas? 5) Analise o gráfico a seguir e responda: a. De que trata o gráfico em questão? b. A que tipo de informação o consumidor brasileiro tem menos acesso? Qual a porcentagem correspondente? 6) O quadro mostra a distribuição dos salários mensais (agrupados em classes) de 40 empregados de uma firma. Estatística Prof a Paula Francis Benevides 34 SALÁRIO (EM REAIS) NÚMERO DE EMPREGADOS (fi) 800 | 900 4 900 | 1000 10 1000 | 1100 18 1100 | 1200 5 1200 | 1300 3 Nessas condições: a. Qual é a amplitude do intervalo de classe? b. Elabore um quadro de distribuição de frequências acumuladas, relativas e relativas acumuladas. A seguir, construa o histograma de frequências. c. Quantos empregados ganham menos que R$ 1.000,00 mensais? d. Qual o índice, em porcentagem, de empregados que ganham R$ 1.000,00 mensais ou mais. e. Quantos empregados ganham entre R$ 800,00 (inclusive) e R$ 1200,00? f. Qual é o índice, em porcentagem, de empregados que ganham menos que R$ 1 000,00? 7) No quadro a seguir estão registradas as massas, em quilogramas, de 50 pessoas que frequentam uma academia de ginástica. 72 81 57 64 87 90 74 69 77 73 80 96 55 58 88 92 47 60 68 80 77 76 59 57 83 81 90 68 65 74 91 97 86 82 73 64 69 71 88 94 77 72 81 91 49 75 52 50 63 70 a. Escolha um intervalo com amplitude conveniente e elabore um quadro de distribuição de frequências absolutas e relativas. b. Construa o histograma para a distribuição. c. Calcule os pontos médios dos intervalos e represente a distribuição por meio de um polígono de frequências. d. Represente essa distribuição por meio de um gráfico de setores com as respectivas frequências relativas. 8) No laboratório de Eletromecânica, um aluno pesquisador testa cinco diferentes ligas metálicas para resistência de tensores. O experimento foi efetuado com diversos ensaios relativos às diferentes ligas. Os resultados obtidos constam da Tabela abaixo: Estatística Prof a Paula Francis Benevides 35 MATERIAL TESTADO RESULTADO DOS ENSAIOS Liga metálica 1 12,4 19,8 15,2 14,8 18,5 Liga metálica 2 8,9 11,6 10 10,3 9,8 Liga metálica 3 10,5 13,8 12,1 11,9 12,6 Liga metálica 4 16,4 15,9 17,8 20,3 18,5 Liga metálica 5 12,8 14,2 15,9 14,1 14,8 Com base nos dados obtidos, construa: a. Um gráfico de linhas que relacione os valores dos ensaios em funções das ligas. b. Um gráfico de colunas para cada tipo de liga. c. Um gráfico de dispersão dos resultados em função das ligas. Estatística Prof a Paula Francis Benevides 36 AULA 4 11. MEDIDAS DE POSIÇÃO As medidas de posição permitem ao pesquisador verificar a distribuição e o comportamento de dados no intervalo fechado [Valor mínimo; Valor máximo]. Entre as medidas de posição citam-se a média aritmética, a mediana e a moda, conhecidas como medidas de tendência central. As separatrizes também são denominadas medidas de posição: 1 o , 2 o e 3 o quartis, decis e percentis. O segundo quartil equivale à mediana. 11.1 MÉDIA ARITMÉTICA ( x ): Média aritmética é o quociente da divisão da soma dos valores das variáveis pelo número deles: nx x i sendo: x = a média aritmética ix = os valores da variável n = o número de valores. 11.1.1 DADOS NÃO AGRUPADOS: Quando desejamos conhecer a média dos dados não agrupados, determinamos a média aritmética simples. Exemplo: Relacionam-se há seguir os tempos (em anos) que os 10 primeiros presidentes americanos sobreviveram à posse. Calcule a média dessa amostra: 10 29 26 28 15 23 17 25 0 20 Solução: x = 10 + 29 + 26 + 28 + 15 + 23 + 17 + 25 + 0 + 20 = 193 3,19 10 193 x A média é 19,3 anos. Estatística Prof a Paula Francis Benevides 37 11.1.2 DESVIO EM RELAÇÃO À MÉDIA: Denomina-se desvio em relação à média a diferença entre cada elemento de um conjunto de valores e média aritmética. Designando o desvio por di , temos: xxd ii Para o exemplo dado, temos: di = 10 – 19,3 = - 9,3 d6 = 23 – 19,3 = 3,7 d2 = 29 – 19,3 = 9,7 d7 = 17 – 19,3 = - 2,3 d3 = 26 – 19, 3 = 6,7 d8 = 25 – 19,3 = 5,7 d4 = 28 - 19,3 = 8,7 d9 = 0 - 19,3 = - 19,3 d5 = 15 – 19, 3 = - 4,3 d10 = 20 – 19,3 = 0,7 11.1.3 PROPRIEDADES DA MÉDIA: 1 a Propriedade: A soma dos desvios tomados em relação à média é nula. n i id 1 0 No exemplo anterior, temos: 10 1i id - 9,3 + 9,7 + 6,7 + 8,7 + (- 4,3) + 3,7 + (- 2,3) + 5,7 + (- 19,3) + 0,7 = 0 2 a Propriedade: Somando-se (ou subtraindo-se) uma constante (c) de todos os valores de uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante. cxycxy ii Somando 2 a cada um dos valores da variável do exemplo dado, temos: y1 = 12, y2 = 31, y3 28, y4 = 30, y5 = 17, y6 = 25, y7 = 19, y8 = 27, y9 = 2 e y10 = 22 10 1i iy 12 + 31 + 28 + 30 + 17 + 25 + 19 + 27 + 2 + 22 = 213 Como n = 10, vem: 223,193,213,21 10 213 xyyy 3 a Propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto final fica multiplicado (ou dividido) por essa constante. cxycxy ii ou c x y c x y ii Estatística Prof a Paula Francis Benevides 38 11.1.4 DADOS AGRUPADOS: 11.1.4.1 Sem intervalo de classe: Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Tabela 11.1 N o DE MENINOS fi 0 2 1 6 2 10 3 12 4 4 = 34 Neste caso, como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: i ii f fx x O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna correspondente aos produtos xifi: Tabela 11.2 xi fi xifi 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 = 34 = 78 Logo: i ii f fx x 3,229,2 34 78 xx meninos Nota: Estatística Prof a Paula Francis Benevides 39 Sendo x uma variável discreta, como interpretar o resultado obtido, 2 meninos e 3 décimos de menino? O valor médio 2,3 meninos sugere, neste caso, que o maior número de famílias tem 2 meninos e 2 meninas, sendo, porém, a tendência geral de uma leve superioridade numérica em relação ao número de meninos. 11.1.4.2 Com intervalos de classe: Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula: i ii f fx x onde xi é o ponto médio da classe. Consideremos a distribuição: Tabela 11.3 i ESTATURAS (cm) fi 1 150 | 154 4 2 154 | 158 9 3 158 | 162 11 4 162 | 166 8 5 166 | 170 5 6 170 | 174 3 = 40 Pela mesma razão do caso anterior, vamos, inicialmente, abrir uma coluna para os pontos médios e outra para os produtos xifi: Tabela 11.4 i ESTATURAS (cm) fi xi xifi 1 150 | 154 4 152 608 2 154 | 158 9 156 1404 3 158 | 162 11 160 1760 4 162 | 166 8 164 1312 5 166 | 170 5 168 840 6 170 | 174 3 172 516 = 40 = 6440 Estatística Prof a Paula Francis Benevides 40 Logo: i ii f fx x 161161 40 6440 xx cm 11.2 A MODA (MO) Denominamos moda o valor que ocorre com maior frequência em uma série de valores, ou seja, é o valor de maior frequência absoluta. Desse modo, o salário modal dos empregados de uma indústria é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa indústria. 11.2.1 DADOS NÃO AGRUPADOS: Quando lidamos com valores não agrupados, a moda é facilmente reconhecida: basta, de acordo com a definição, procurar o valor que mais se repete. A série de dados: 7, 8, 9, 10, 10, 10, 10, 11, 12, 13, 15 tem moda igual a 10. Podemos, entretanto, encontrar séries nas quais não exista valor modal, isto em nas quais nenhum valor apareça mais vezes que outros. É o caso da série: 3, 5, 8, 10, 11, 13, 15 que não apresenta moda, então dizemos que é amodal. Em outros casos, ao contrário, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Na série: 2, 3, 4, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 temos duas modas: 4 e 7, o conjunto se diz bimodal. Se mais de dois valores ocorrem com a mesma frequência máxima, cada uma deles é uma moda, e o conjunto é multimodal. Estatística Prof a Paula Francis Benevides 41 11.2.2 DADOS AGRUPADOS: 11.2.2.1 Sem intervalo de classe: Uma vez agrupado os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior frequência. Na distribuição da Tabela 11.1, à frequência máxima (12) corresponde o valor 3 da variável. Logo: Mo = 3 11.2.2.2 Com intervalo de classe: A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que esta compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. Temos então: 2 Ll Mo , onde l é o limite inferior da classe modal e L é o limite superior. Assim, para a distribuição da Tabela 11.3, temos que a classe modal é i = 3, l = 158 e L = 162. Logo: 160 2 320 2 162158 Mo 11.3 A MEDIANA (MD): A mediana é outra medida de posição definida como o número que se encontra no centro de uma série de números,
Compartilhar