Baixe o app para aproveitar ainda mais
Prévia do material em texto
- 1 - DISCIPLINA: Estatística - AULA 04 - Prof. Vander Dados Absolutos e Dados Relativos Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou medida, são chamados dados absolutos. A leitura dos dados absolutos é sempre enfadonha e inexpressiva: embora traduzam um resultado exato e fiel, não têm a virtude de ressaltar de imediato as suas conclusões numéricas. Daí o uso imprescindível que faz a estatística dos dados relativos. Dados relativos são o resultado de comparações por quociente (razões) que se estabelecem entre dados absolutos, e têm por finalidade realçar ou facilitar as comparações entre quantidades. Traduzem-se os dados relativos, em geral, por meio de percentagens, índices, coeficientes e taxas. As Percentagens Consideremos a seguinte série: Calculemos as percentagens dos alunos de cada nível: - 2 - Educação Básica: 1.926 100 90,96 91,0% 21.201 x = = Ensino Médio: 1.681 100 7,92 7,9% 21.201 x = = Ensino Superior: 234 100 1,10 1,1% 21.201 x = = Com estes dados podemos formar uma nova coluna na série de estudo: Os valores desta nova coluna nos dizem que de cada 100 alunos da cidade A, 91 estão matriculados na Educação Básica, 8, aproximadamente, no Ensino Médio, e 1 no Ensino Superior. O emprego da percentagem é de grande valia quando o nosso intuito é destacar a participação da parte no todo. Consideremos agora a série: - 3 - Qual das cidades tem, comparativamente, maior número de alunos em cada nível? Como o número total de alunos é diferente nas duas cidades, não é fácil concluir a respeito usando os dados absolutos. Porém, usando as porcentagens, tal tarefa fica bastante facilitada. Assim, acrescentando na tabela anterior as colunas correspondentes às percentagens, obtemos: O que nos permite dizer que, comparativamente, contam praticamente com o mesmo número de alunos em cada nível. Observação: Quando usamos a base 100 para comparação, devemos arredondar os dados obtidos até a primeira casa decimal e, quando usamos a base 1 (para valores menores que 1), arredondamos os dados obtidos até a terceira casa decimal. Os Índices Os índices são razões entre duas grandezas tais que uma não inclui a outra. São exemplos de índices: - 4 - Os Coeficientes Os coeficientes são razões entre os números de ocorrências com o número total (número de ocorrências e o número de não ocorrências). São exemplos de coeficientes: As Taxas As taxas são os coeficientes multiplicados por uma potência de 10 (10, 100, 1.000, etc), para tornar o resultado mais inteligível. São exemplos de taxas: Taxa de mortalidade = coeficiente de mortalidade X 1.000 Taxa de natalidade = coeficiente de natalidade X 1.000 - 5 - Taxa de evasão escolar = coeficiente de evasão escolar X 100 Tabulação: Imaginemos que um tese foi aplicado em uma turma de 50 alunos. Lembre-se que estes 50 alunos constituem a população a ser pesquisada. Imaginemos também que, à medida que faz a correção dos testes, o professor anote as notas obtidas pelos alunos. A transcrição destes resultados constitui o que denominamos, na Estatística, de dados brutos. Dados brutos: São a relação dos resultados obtidos em uma pesquisa e que foram transcritos aleatoriamente, ou seja, fora de qualquer ordem. Os dados brutos são os dados originais, coletados em uma pesquisa, e que ainda não se encontram prontos para análise por não estarem numericamente organizados. Vamos supor que as notas dos testes a que nos referimos tenham sido as seguintes: 7 - 6 – 8 – 9 – 6 – 5 – 7 – 4 – 6 – 8 – 9 – 8 – 7 – 6 – 10 – 8 – 4 – 5 – 6 – 10 – 5 – 8 – 4 – 3 – 8 – 7 – 9 – 6 10 – 7 – 7 – 7 – 9 – 5 – 4 – 5 – 9 – 10 – 8 – 8 – 6 – 7 – 5 – 10 – 8 – 6 – 7 – 7 – 10 – 6 Uma simples olhada para esses números, poucas ou nenhuma informação nos transmite. É preciso, então, primeiramente, coloca-los em ordem, ou seja, transformá-los em “rol”. Rol, portanto, é a relação dos resultados obtidos em uma pesquisa e que foram colocados em ordem numérica, crescente ou decrescente. Coloquemos em ordem crescente os dados brutos anteriormente relacionados. 3 – 4 – 4 – 4 – 4 – 5 – 5 – 5 – 5 – 5 – 5 – 6 – 6 – 6 – 6 – 6 – 6 – 6 – 6 – 6 – 7 – 7 – 7 – 7 – 7 – 7 – 7 – 7 – 7 – 7 – 8 – 8 – 8 – 8 – 8 – 8 – 8 – 8 – 8 – 9 – 9 – 9 – 9 – 9 – 10 – 10 – 10 – 10 – 10 – 10 Melhorou? No entanto, ainda está confuso para tirarmos alguma conclusão. O que devemos fazer então? - 6 - Precisamos, agora, agrupar os valores que são iguais, para que possamos deduzir alguma coisa a respeito dos resultados obtidos nesse teste aplicado à turma de 50 alunos. O primeiro passo consiste em verificarmos se termos nota que se repetem, isto é, se existem dois ou mais alunos com a mesma nota. Ao número de vezes que um mesmo valor se repete, denominamos de frequência. Frequência ou frequência Absoluta é o número de vezes que um mesmo resultado acontece durante uma pesquisa. Nós a denominaremos de f. No exemplo que estamos analisando, temos os resultados que estão na tabela abaixo: Tabela 1 – Notas obtidas pelos alunos Notas Frequências 3 1 4 4 5 6 6 9 7 10 8 9 9 5 10 6 Fonte: Dados fictícios Agora ficou mais fácil interpretar os resultados obtidos pela turma. Verificamos que a menor nota foi 3 e a maior foi 10. Verificamos ainda que a nota que ocorreu com maior frequência foi 7. Frequência absoluta acumulada ou Frequência acumulada (fa) Frequência acumulada é o somatório das frequências dos valores inferiores ou iguais ao valor dado. Nós a designaremos por fa. Observe o exemplo abaixo: - 7 - Tabela 2 – Frequência acumulada da idade dos alunos Notas Frequência (f) Frequência Acumulada (fa) 4 4 4 5 5 9 6 7 16 7 4 20 Fonte: Dados fictícios Distribuição de Frequência Consideremos as estaturas de 40 alunos do Colégio A: 150 – 154 – 155 – 157 – 160 – 161 – 162 – 164 – 166 – 169 151 – 155 – 156 – 158 – 160 – 161 – 162 – 164 – 167 – 170 152 – 155 – 156 – 158 – 160 – 161 – 163 – 164 – 168 – 172 153 – 155 – 156 – 160 – 160 – 161 – 163 – 165 – 168 – 173 Neste exemplo, a variável em questão, estatura, será observada e estudada muito mais facilmente quando dispusermos valores ordenados em uma coluna e colocarmos, ao lado de cada valor, o número de vezes que aparece repetido. Ao número de alunos que fica relacionado a um determinado valor da variável, denominamos frequência. Obtemos, assim, uma tabela que recebe o nome de distribuição de frequência: - 8 - O processo apresentado é, ainda, inconveniente, já que exige muito espaço, mesmo quando o número de valores da variável (n) é de tamanho razoável. Sendo possível, a solução mais aceitável, pela própria natureza da variável contínua, é o agrupamento dos valores em vários intervalos. Assim, se um dos intervalos for, por exemplo, 154 Ⱶ 158, ao invés de dizermos que a estatura de 1 aluno é de 154 cm, de 4 alunos, 155 cm, de 3 alunos, 156 cm e de 1 aluno de 157 cm, diremos que 9 alunos têm entre 154, inclusive, e 158 cm. Deste modo, estaremos agrupando os valores da variável em intervalos, sendo que, em Estatística, preferimos denominar casses aos intervalos. Chamamos de frequência de uma classe ao número de valores da variável pertencentes à classe. Os dados da tabela a seguir dispõem a mesma informação através da distribuição de frequência com intervalos de classe: - 9 - O que pretendemos com a construção dessa nova tabela é realçar o que há de essencial nos dados e, também, tornar possível o uso de técnicas analíticas para a sua total descrição. Até porque a Estatística tem por finalidade específica analisarconjuntos de valores, desinteressando-se por casos isolados. Elementos de uma Distribuição de Frequência Classe: Classes de frequências ou simplesmente classes, são intervalos de variação da variável. As classes são representadas simbolicamente por i, sendo i = 1, 2, 3..., k (onde k é o número total de classes da distribuição). Assim, no nosso exemplo, o intervalo 154 Ⱶ 158 define a segunda classe (i = 2) e, como a distribuição é formada de seis classes, podemos afirmar que k = 6. Limites de classe: Aos extremos de cada classe, denominamos limites de classe. O menor número é o limite inferior da classe ( i ), e o maior número o limite superior da classe ( iL ). Na segunda classe, por exemplo, temos: 2 = 154 e 2L = 158 - 10 - Amplitude de um intervalo de classes: Ou, simplesmente, intervalo de classe é a medida do intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior dessa classe, e será indicada por ih . Assim: ih = iL - i Na distribuição da tabela anteriormente apresentada, temos: 2 2 2 2 2158 154 4 4h L h h cm= − = − = = Amplitude total da distribuição: É a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo): AT = ( ) ( )L máx mín− AT = 174 - 150 = 24 AT = 24 cm Amplitude amostral: é a diferença entre o valor máximo e o valor mínimo da amostra. AA = x( ) ( )máx x mín− AA = 173 - 150 = 23 AA = 23 cm Ponto médio de uma classe: É, como o próprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais, sendo indicado por 1x . - 11 - Para obtermos o ponto médio de uma classe, basta adicionar ao limite inferior da classe a metade do intervalo de classe. Assim, o ponto médio da segunda classe, em nosso exemplo, é: 2 2 2 2 2 4 154 154 2 156 156 2 2 h x x x cm= + = + = + = = Frequência simples ou absoluta: Ou, simplesmente, frequência de uma classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor. A frequência simples é simbolizada por if (lemos f índice i, ou frequência da classe i). Assim, em nosso exemplo, temos: 1 2 3 4 5 64; 9; 11; 8; 5 e 3f f f f f f= = = = = = A soma de todas as frequências será representada pelo símbolo de somatório: 1 k i i f = É evidente que: 1 k i i f n = = Para a distribuição em estudo, temos: 6 1 40i i f = = - 12 - Não havendo possibilidade de engano, usamos: 40if = Podemos, agora, dar à distribuição de frequência das estaturas dos alunos do colégio A, a seguinte representação tabular técnica: Número de Classes A primeira preocupação que temos na construção de uma distribuição de frequência, é a determinação do número de classes e, consequentemente, da amplitude e dos limites dos intervalos de classe. Uma das maneiras de se definir o número de classes é através da obtenção da raiz de n ( n ). No caso do nosso exemplo, n = 40, então 40 = 6,32, que, arredondando, podemos adotar n = 6. Decidido o número de classes que deve ter a distribuição, resta-nos resolver o problema da determinação da amplitude do intervalo de classe, o que conseguimos dividindo a amplitude total (AT) pelo número de classes (n): AT h n = Se o resultado não for exato, também devemos arredondá-lo. - 13 - Exercícios: 1) O Estado de São Paulo apresentou 733.986 matrículas na 1ª série, no início do ano de 1973 e 683.816 no fim do ano. O Estado do Rio de Janeiro apresentou, respectivamente, 436.127 e 412.457 matrículas. Qual o estado que apresentou maior evasão escolar? 2) Uma escola registrou em março, na 1ª série, a matrícula de 40 alunos e a matrícula efetiva, em dezembro, de 35 alunos. A taxa de evasão foi de: 3) Calcule a taxa de aprovação de um professor de uma classe de 45 alunos, sabendo que obtiveram aprovação somente 36 alunos. 4) Considerando a série estatística abaixo, complete-a determinando as percentagens com uma casa decimal e fazendo a compensação, se necessário. 5) Complete a tabela abaixo: - 14 - 6) Uma escola apresentava no final do ano o seguinte quadro: A) Calcule a taxa de evasão por série; B) Calcule a taxa de evasão da escola. 7) Considerando a tabela abaixo, complete-a com uma coluna de taxas percentuais: 8) São Paulo tinha, em 1975, uma população estimada de 20.636.874 habitantes. Sabendo-se que sua área terrestre é de 247.320 km², calcule a sua densidade demográfica. 9) Considerando que Minas Gerais, em 1975, apresentou os seguintes dados: - População estimada: 12.550.575 habitantes; - 15 - - Superfície: 582.586 km²; - Nascimentos: 504.686; - Casamentos: 104.943. Calcule: a) O índice de densidade demográfica; b) A taxa de natalidade; c) A taxa de nupcialidade. 10) Uma frota de 40 caminhões, transportando, cada um, 8 toneladas, dirige-se a duas cid6ades A e B. na cidade A são descarregados 65% desses caminhões, por 7 homens trabalhando 7 horas. Os caminhões restantes seguem para a cidade B, onde 4 homens gastam 5 horas para o seu descarregamento. Pergunta-se: em que cidade se deu a melhor produtividade? 11) As notas obtidas por 50 alunos de uma classe foram: 1 2 3 4 5 6 6 7 7 8 2 3 3 4 5 6 6 7 8 8 2 3 4 4 5 6 6 7 8 9 2 3 4 5 5 6 6 7 8 9 2 3 4 5 5 6 7 7 8 9 a) Determine o número de classes, o intervalo de classes e monte a tabela. b) Agora, responda: 1. Qual a amplitude amostral? 2. Qual a amplitude da distribuição? 3. Qual o número de classes da distribuição? 4. Qual o limite inferior da quarta classe? 5. Qual o limite superior da classe de ordem 2? c) Complete: 1. 3h =.......... 2. n=............ 3. 1 =............ - 16 - 4. 3L =........... 5. 2x =............ 6. 5f =............ 12) A quantidade de produtos vendidos em uma loja durante um mês é representada, de forma ordenada, na tabela abaixo: 7 8 8 8 12 14 14 14 16 20 20 24 24 30 31 31 34 40 41 44 44 44 45 45 45 45 48 48 49 50 Definir: a) A amplitude da distribuição; b) O número de classes; c) A distribuição de frequências; d) A tabela. 13) Considere os dados abaixo referentes ao consumo de água, em m3, de 75 contas da Cia abastecedora: 32 6 22 11 34 40 16 26 23 31 27 10 38 17 13 45 25 50 18 23 35 22 30 14 18 20 13 24 35 29 33 48 20 12 31 39 17 58 19 16 12 21 15 12 20 51 12 19 15 41 29 25 13 23 32 14 27 43 37 21 28 37 26 44 11 53 38 46 17 36 28 49 56 19 11 a) Organize os dados numa distribuição de frequência com classes de amplitudes iguais. b) Monte a tabela.
Compartilhar