Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Estatística Por que estudar Estatística? As aplicações da estatística se desenvolvem de tal forma que, hoje, praticamente todo campo de estudo se beneficia da utilização de métodos estatísticos. Os fabricantes fornecem melhores produtos a custos menores através de técnicas de controle de qualidade. Controlam-se doenças com auxílio de análises que antecipam epidemias. Espécies ameaçadas são protegidas por regulamentos e leis que reagem a estimativas estatísticas de modificação do tamanho das populações. Visando reduzir as taxas de casos fatais, os legisladores têm melhor justificativa para leis como as que regem a poluição atmosférica, inspeções de automóveis, utilização do cinto de segurança e dirigir em estado de embriaguez. Citamos apenas esses exemplos, porque uma compilação completa das aplicações da estatística facilmente tomaria dezenas de páginas. O estudo da estatística pode tornar o aluno mais crítico em sua análise de informações, e menos sujeito a afirmações enganosas, como as que se acham comumente associadas a pesquisas, gráficos e médias. Como membro educado e responsável da sociedade, o aluno deve aguçar sua capacidade de reconhecer dados estatísticos distorcidos e de interpretar inteligentemente dados que se apresentem sem distorção. Definição de alguns termos: Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. Uma população é uma coleção completa de todos os elementos (valores, pessoas, medidas etc. ) a serem estudados. Um censo é uma coleção de dados relativos a todos os elementos de uma população. ·Uma amostra é um subconjunto de elementos extraídos de uma população. Um parâmetro é uma medida numérica que descreve uma característica de uma população. Uma estatística é uma medida numérica que descreve uma característica de uma amostra Exemplo Em uma pesquisa com 1.015 pessoas escolhidas aleatoriamente, 269 (ou 26,5%) possuíam computador. Como a cifra de 26,5 % se baseia em uma amostra, e não em toda população, trata-se de uma estatística (e não um parâmetro). 2 Abusos da Estatística Alguns dos que abusam da estatística o fazem simplesmente por descuido ou ignorância; outros, porém, têm objetivos pessoais, pretendendo suprimir dados desfavoráveis enquanto dão ênfase aos dados que lhes são favoráveis. Passemos a alguns exemplos das diversas maneiras como os dados podem ser distorcidos. Perguntas Tendenciosas – as perguntas em pesquisa podem ser formuladas de modo a “sugerirem” uma resposta. Um caso famoso envolve o candidato à presidência dos EUA, Ross Perot, que formulou a seguinte pergunta em um questionário: “O presidente deve ter o poder de vetar decisões no Congresso?”Noventa e sete por cento das respostas foram “sim”. Entretanto, o percentual de respostas “sim” caiu para 57% quando a pergunta foi “O presidente deve ter, ou não, o poder de vetar decisões no Congresso?” Às vezes as perguntas se apresentam involuntariamente tendenciosas em virtude de fatores como a ordem dos itens a serem considerados. Por exemplo, uma pesquisa alemã formulou estas duas perguntas: O leitor diria que o tráfego contribui em maior ou menor grau do que a indústria para a poluição atmosférica? O leitor diria que a indústria contribui em maior ou menor grau do que o tráfego para a poluição atmosférica? Quando o tráfego foi mencionado em primeiro lugar, 45% acusaram o tráfego e 32% acusaram a indústria; quando a indústria foi citada em primeiro lugar, as porcentagens se modificaram grandemente para 24% e 57%, respectivamente. Gráficos Enganosos – muitos dispositivos visuais – como gráficos em barras e gráficos em setores – podem ser utilizados para exagerar ou diminuir a verdadeira natureza de um conjunto de dados. Os dois gráficos abaixo representam os mesmos dados, mas a parte (b) tem como objetivo exagerar a diferença entre os ganhos dos homens e das mulheres. Estimativas por Suposição – Outra fonte de engano estatístico envolve estimativas que são, na verdade, suposições (ou, na linguagem popular, “palpites”), podendo apresentar erros substanciais. É preciso 0 200 400 600 800 Mulheres HomensG a n h o s e m a n a l m e d in o 500 550 600 650 700 750 Mulheres Homens G a n h o s e m a n a l m e d ia n o 3 considerar a fonte da estimativa e a maneira como foi estabelecida. Quando o Papa visitou Miami, as fontes oficiais estimaram a multidão em 250.000 pessoas, mas, utilizando fotos aéreas e grades, chegou a uma cifra mais precisa de apenas 150.000. Pressão do Pesquisador – quando se formulam perguntas a indivíduos, esses freqüentemente dão respostas favoráveis à sua auto-imagem. Em uma pesquisa telefônica 94% dos que responderam disseram que lavavam suas mãos após usar um banheiro, mas a observação em lugares tais como a Estação Penn, em Nova York e Golden Park em São Francisco mostraram que o percentual efetivo é de apenas 68%. Más Amostras – outra fonte de estatística enganosa são os métodos inadequados de coleta de dados. É comum um pesquisador analisar dados, formular conclusões errôneas porque o método de coleta de dados foi deficiente. Um exemplo típico é a pesquisa “Nightline” em que 186.000 espectadores de televisão pagaram 50 centavos para discar um número de telefone “900” dando sua opinião sobre se a sede das Nações Unidas deve permanecer nos EUA. Os resultados mostraram que 67% dos que foram consultados eram favoráveis a que a sede da ONU saísse dos EUA. Como os próprios espectadores é que decidiram se seriam incluídos na pesquisa, temos um exemplo de pesquisa auto-selecionada, que se define como segue. Uma pesquisa auto-selecionada é uma pesquisa em que os próprios entrevistados decidem se serão incluídos. Em tais pesquisas, o que frequentemente ocorre é que participam apenas aqueles que têm uma opinião firmada, resultando daí que a amostra dos que respondem não é representativa da população como um todo. Como 67% dos 186.000 pesquisados eram favoráveis à mudança da sede da ONU dos EUA, nada podemos concluir sobre a população em geral, dada a maneira como se obteve a amostra. Na realidade, uma pesquisa “científica” de 500 pessoas revelou que 72% delas desejavam que a sede da ONU permanecesse nos EUA. Nessa pesquisa de 500 pessoas, os que responderam foram selecionados aleatoriamente pelo pesquisador, de modo que o resultado tende muito mais a refletir a verdadeira opinião da população em geral. Exercícios 1) Uma pessoa foi encarregada de pesquisar o reconhecimento da marca Nike, devendo contactar por telefone 1500 consumidores nos EUA. Por que razão é incorreta a utilização de listas telefônicas como população para fornecer a amostra? 2) Um jornal afirma que as mães grávidas podem aumentar sua chances de ter um bebê sadio comendo lagostas. A alegação se baseia em um estudo mostrando que as crianças nascidas de mães que comem lagostas têm menos problemas de saúde do que as nascidas de mães que não comem lagostas. Qual é o erro nesta alegação? 4 Natureza dos dados Alguns conjuntos de dados (como altura, peso, número de filhos, salário, etc.) constituem em números, enquanto outros são não-numéricos (estado civil, sexo, religião, nível de educação, etc. ). Aplica-se as expressões dados qualitativos e dados quantitativos para distinguir esses dois tipos. Definições Os dados quantitativos constituem em números que representam contagens ou medidas. Os dados qualitativos (ou dados categóricos, ou atributos) podem ser separados em diferentes categorias que se distinguem por alguma característica não-numérica. Podemos ainda descrever os dados quantitativos entre os tipos discreto e contínuo. Variáveis quantitativas discretas, cujospossíveis valores formam um conjunto finito ou enumerável de números que resultam, frequentemente, de uma contagem, como por exemplo números de filhos. Variáveis quantitativas contínuas, cujos possíveis valores formam um intervalo de números reais e que resultam, normalmente, de uma mensuração, como por exemplo estatura ou peso de um indivíduo. Dentre as variáveis qualitativas, ainda podemos fazer uma distinção entre dois tipos: variável qualitativa nominal, para a qual não existe nenhuma ordenação nas possíveis realizações, e variável qualitativa ordinal, para a qual existe uma certa ordem nos possíveis resultados. Exemplo Variável qualitativa nominal : sexo, religião, etc. Variável qualitativa ordinal : grau de instrução (1º grau, 2º grau ou superior); classe social (baixa, média ou alta). A tabela a seguir fornece informações sobre estado civil, grau de instrução, número de filhos, salário (expresso com fração do salário mínimo), idade e procedência de 36 funcionários da seção de orçamentos da Companhia Milsa. 5 Nº Estado civil Grau de instrução Nº de filhos Salário ( x Sal. Min.) Idade Região de procedência 1 solteiro 1º grau - 4 26 Interior 2 casado 1º grau 1 4,56 32 Capital 3 casado 1º grau 2 5,25 36 Capital 4 solteiro 2º grau - 5,73 20 Outro 5 solteiro 1º grau - 6,26 40 Outro 6 casado 1º grau 0 6,66 28 Interior 7 solteiro 1º grau - 6,86 41 Interior 8 solteiro 1º grau - 7,39 43 Capital 9 casado 2º grau 1 7,59 34 Capital 10 solteiro 2º grau - 7,44 23 Outro 11 casado 2º grau 2 8,12 33 Interior 12 solteiro 1º grau - 8,46 27 Capital 13 solteiro 2º grau - 8,74 37 Outro 14 casado 1º grau 3 8,95 44 Outro 15 casado 2º grau 0 9,13 30 Interior 16 solteiro 2º grau - 9,35 38 Outro 17 casado 2º grau 1 9,77 31 Capital 18 casado 1º grau 2 9,8 39 Outro 19 solteiro superior - 10,53 25 Interior 20 solteiro 2º grau - 10,76 37 Interior 21 casado 2º grau 1 11,06 30 Outro 22 solteiro 2º grau - 11,59 34 Capital 23 solteiro 1º grau - 12 41 Outro 24 casado superior 0 12,79 26 Outro 25 casado 2º grau 2 13,23 32 Interior 26 casado 2º grau 2 13,6 35 Outro 27 solteiro 1º grau - 13,85 46 Outro 28 casado 2º grau 0 14,69 29 Interior 29 casado 2º grau 5 14,71 40 Interior 30 casado 2º grau 2 15,99 35 Capital 31 solteiro superior - 16,22 31 Outro 32 casado 2º grau 1 16,61 36 Interior 33 casado superior 3 17,27 43 Capital 34 solteiro superior - 18,75 33 Capital 35 casado 2º grau 2 19,4 48 Capital 36 casado superior 3 23,3 42 Interior Tabela 1 6 Distribuição de Frequências Quando se estuda uma variável, o maior interesse do pesquisador é conhecer a distribuição dessa variável através das possíveis realizações (valores) da mesma. O objetivo da distribuição de frequência é dispor um conjunto de valores, de modo a se ter uma ideia global sobre estes valores, ou seja, de sua distribuição. Grau de instrução Frequência Proporção Porcentagem 1º grau 12 0,3333 33,33 2º grau 18 0,50000 50,00 Superior 6 0,1667 16,67 Total 36 1,0000 100,00 Tabela 2 – Distribuição de frequências da variável grau de instrução, usando-se os dados da tabela 1. A construção de tabelas de frequências para variáveis contínuas necessita de certo cuidado. Por exemplo, a construção da tabela de frequências da variável salário não resumirá as 36 observações num grupo menor, pois não existem observações semelhantes. A solução empregada é agrupar os dados por faixas de salário. Classe de salários Frequência ( fi ) Porcentagem 4,00 8,00 10 27,78 8,00 12,00 12 33,33 12,00 16,00 8 22,22 16,00 20,00 5 13,89 20,00 24,00 1 2,78 Total 36 100,00 Tabela 3 – Frequências e porcentagens dos 36 empregados da seção de orçamentos da Companhia Milsa, por faixa de salário Representação Gráfica da Variáveis A representação gráfica da distribuição de frequências de uma variável tem a vantagem de, rápida e concisamente, informar sobre a variabilidade da mesma. 7 0 2 4 6 8 0 1 2 3 5 nº de filhos F re q ü ê n c ia Exemplo Estamos interessados em estudar a distribuição do número de filhos dos empregados casados da seção de orçamentos da Cia. Milsa. Nº de filhos Frequência (fi) Porcentagem (100.fi) 0 4 20% 1 5 25% 2 7 35% 3 3 15% 5 1 5% Total 20 100% Tabela 4 – Frequências e porcentagens dos empregados da seção de orçamento da Companhia Milsa, segundo o número de filhos. Para variáveis quantitativas contínuas necessita-se de alguma adaptação, como no exemplo a seguir. Queremos representar graficamente a distribuição da variável S (salário dos empregados) da seção de orçamentos da Cia. Milsa. Classe de salários Ponto médio Pmi Frequência fi Porcentagem 100. fi 4,00 8,00 6,00 10 27,78 8,00 12,00 10,00 12 33,33 12,00 16,00 14,00 8 22,22 16,00 20,00 18,00 5 13,89 20,00 24,00 22,00 1 2,78 Total __ 36 100,00 Tabela 5 –Distribuição de frequência da variável S = salário dos empregados da seção de orçamento da Cia. Milsa. 8 0% 10% 20% 30% 40% 6 10 14 18 22 Salários P o rc e n ta g e m 0 4 8 12 16 20 24 0 1 2 3 4 5 6 7 8 9 10 11 12 F re qü ên ci a O artifício usado para representar a variável contínua faz com que se perca muito das informações nela contidas. Uma alternativa a ser usada nestes casos é o gráfico conhecido como histograma. Tipos de Frequências Frequências simples ou absolutas ( fi ) são os valores que realmente representam o número de dados de cada classe. obs: a soma das frequências simples é igual ao número total dos dados ( n ): Frequências relativas ( fri ) são os valores das razões entre as frequências simples e a frequência total: nf i n f f f fr i i i i 9 Frequência acumulada (Fi) é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe: ou Frequência acumulada relativa (Fri) de uma classe é a frequência acumulada da classe, dividida pela frequência total da distribuição. Considere a distribuição de frequência com intervalos de classe abaixo: Estaturas de 40 alunos do colégio A. Estaturas (cm) Frequência ( fi ) 150 154 4 154 158 9 158 162 11 162 166 8 166 170 5 170 174 3 Total 40 Considerando a tabela anterior, podemos montar a seguinte tabela com as frequências estudadas: i i Estaturas (cm) Frequência fi Ponto médio Pm Frequência Relativa fri Frequência Acumulada Fi Frequência Acumulada relativa - Fri 1 150 154 4 152 0,100 4 0,100 2 154 158 9 156 0,225 13 0,325 3 158 162 11 160 0,275 24 0,600 kik fffF ...2 k i ik fF 1 n F Fr ii 10 4 162 166 8 164 0,200 32 0,800 5 166 170 5 168 0,125 37 0,925 6 170 174 3 172 0,075 40 1,000 =40 = 1,000 O conhecimento dos vários tipos de frequências ajuda-nos a responder a muitas questões com relativa facilidade, como as seguintes: a) Quantos alunos têm estatura entre 154 cm, inclusive, e 158 cm ? Esses são os valores da variável que formam a segunda classe. Como n2 = 9, a resposta é : nove alunos. b) Qual a percentagem de alunos cujas estaturas são inferiores a 154 cm ? Esses valores são os que formam a primeira classe. Como f1=0,100, obtemos a resposta multiplicando a frequência relativa por 100: 0,100 x 100 = 10 Logo, a percentagem de alunos é 10%. c) Quantos alunos têm estatura abaixo de 162 cm ? É evidente que as estaturas consideradas são aquelas que formam as classes de ordem 1,2 e 3. Assim, o número de alunos é dado por:Portanto, 24 alunos têm estatura abaixo de 162 cm. d) Quantos alunos têm estatura não inferior a 158 cm ? O número de alunos é dado por: ou então: Polígono de Frequências Um polígono de frequência é um gráfico de linha em que as frequências são locadas sobre perpendiculares levantadas nos pontos médios. Pode-se também obtê-los, ligando-se os pontos médios dos topos dos retângulos de um histograma. 243 3 1 321 Fffff i i 27358116543 6 3 fffff i i 2713402 2 6 1 FnFf i i 11 Polígono de Frequência Acumulada O polígono de frequência acumulada é traçado marcando-se as frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. 148 152 156 160 164 168 172 176 0 2 4 6 8 10 12 14 F re q ü ê n c ia Estatura ( cm ) 152 156 160 164 168 172 0 5 10 15 20 25 30 35 40 45 F re q ü ê n c ia Estatura ( cm ) 12 Exercícios 1) A tabela abaixo apresenta uma distribuição de frequência das áreas de 400 lotes: Classe - i ÁREAS (m 2 ) Nº de LOTES 1 2 3 300 400 14 2 400 500 46 3 500 600 58 4 600 700 76 5 700 800 68 6 800 900 62 7 900 1000 48 8 1000 1100 22 9 1100 1200 6 Total 400 Com referência a essa tabela, determine: a) a amplitude total; b) o limite superior da quinta classe; c) o limite inferior da oitava classe; d) o ponto médio da sétima classe; e) a amplitude do intervalo da segunda classe; f) a frequência da quarta classe; g) a frequência relativa da sexta classe; h) a frequência acumulada da quinta classe; i) o número de lotes cuja área não atinge 700 m2; j) o número de lotes cuja área atinge e ultrapassa 800 m2; k) a percentagem dos lotes cuja área não atinge 600 m2; l) a percentagem dos lotes cuja área seja maior ou igual a 900 m2; m) a percentagem dos lotes cuja área é de 500 m2, no mínimo, mas inferior a 1.000 m2; n) a classe do 72º lote; o) até que classe estão incluídos 60% dos lotes. 2) Conhecidas as notas de 50 alunos: 68 85 33 52 65 77 84 65 74 57 71 35 81 50 35 64 74 47 54 68 80 61 41 91 55 73 59 53 77 45 41 55 78 48 69 85 67 39 60 76 94 98 66 66 73 42 65 94 88 89 determine: a) a distribuição de frequência começando por 30 e adotando o intervalo de classe de amplitude igual a 10; b) as frequências acumuladas; c) as frequências relativas; d) o histograma e o polígono de frequência;
Compartilhar