Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Aplicada à Educação Regina Maria Sigolo Bernardinelli Revisada por Ricardo de Souza (setembro/2012) É com satisfação que a Unisa Digital oferece a você, aluno(a), esta apostila de Estatística Aplicada à Educação, parte integrante de um conjunto de materiais de pesquisa voltado ao aprendizado dinâmi- co e autônomo que a educação a distância exige. O principal objetivo desta apostila é propiciar aos(às) alunos(as) uma apresentação do conteúdo básico da disciplina. A Unisa Digital oferece outras formas de solidificar seu aprendizado, por meio de recursos multidis- ciplinares, como chats, fóruns, aulas web, material de apoio e e-mail. Para enriquecer o seu aprendizado, você ainda pode contar com a Biblioteca Virtual: www.unisa.br, a Biblioteca Central da Unisa, juntamente às bibliotecas setoriais, que fornecem acervo digital e impresso, bem como acesso a redes de informação e documentação. Nesse contexto, os recursos disponíveis e necessários para apoiá-lo(a) no seu estudo são o suple- mento que a Unisa Digital oferece, tornando seu aprendizado eficiente e prazeroso, concorrendo para uma formação completa, na qual o conteúdo aprendido influencia sua vida profissional e pessoal. A Unisa Digital é assim para você: Universidade a qualquer hora e em qualquer lugar! Unisa Digital APRESENTAÇÃO SUMÁRIO INTRODUÇÃO ............................................................................................................................................... 5 1 NOÇÕES BÁSICAS ................................................................................................................................. 7 1.1 Arredondamento de Dados.........................................................................................................................................7 1.2 Dados Absolutos e Dados Relativos .........................................................................................................................8 1.3 População e Amostra ..................................................................................................................................................21 1.4 Resumo do Capítulo ....................................................................................................................................................24 1.5 Atividades Propostas ...................................................................................................................................................24 2 ORGANIZAÇÃO DE DADOS .......................................................................................................... 31 2.1 Tipos de Variáveis ..........................................................................................................................................................31 2.2 Distribuição de Frequências .....................................................................................................................................35 2.2 Resumo do Capítulo ....................................................................................................................................................38 3 GRÁFICOS ESTATÍSTICOS ............................................................................................................... 39 3.1 Gráfico de Setores, Disco ou Pizza, ou Diagrama Circular .............................................................................39 3.2 Gráfico de Colunas ou Barras ...................................................................................................................................40 3.3 Histograma ......................................................................................................................................................................40 3.4 Polígono de Frequências ...........................................................................................................................................41 3.5 Ogiva de Galton ............................................................................................................................................................42 3.6 Resumo do Capítulo ....................................................................................................................................................42 3.7 Atividades Propostas ...................................................................................................................................................43 4 MEDIDAS ................................................................................................................................................... 47 4.1 Medidas de Posição .....................................................................................................................................................47 4.2 Medidas de Dispersão ................................................................................................................................................65 4.3 Medidas de Assimetria e Curtose – Curva Normal ..........................................................................................71 4.4 Resumo do Capítulo ....................................................................................................................................................80 4.5 Atividades Propostas ...................................................................................................................................................80 5 CONSIDERAÇÕES FINAIS ............................................................................................................... 85 RESPOSTAS COMENTADAS DAS ATIVIDADES PROPOSTAS ..................................... 87 REFERÊNCIAS ............................................................................................................................................. 91 APÊNDICE ..................................................................................................................................................... 93 Unisa | Educação a Distância | www.unisa.br 5 INTRODUÇÃO As sociedades modernas acumulam grande quantidade de dados numéricos relativos a eventos sociais, econômicos, científicos, esportivos, educacionais etc., como pode ser observado nos exemplos abaixo: 1. a taxa de analfabetismo no Brasil; 2. a taxa de mortalidade infantil na região Nordeste; 3. a porcentagem de crianças vacinadas na última campanha de vacinação; 4. o índice de densidade corpo discente por corpo docente nas diversas regiões do Brasil; 5. a porcentagem de tendência de votos em uma campanha eleitoral; 6. a porcentagem mostrando a preferência dos espectadores para que uma emissora de TV or- ganize sua programação. Desse modo, notamos que o uso da pesquisa é bastante comum nas várias atividades humanas. A disciplina Estatística Aplicada à Educação tem, por objetivo, fornecer subsídios a você, aluno(a) do curso de Pedagogia, que o auxiliem em sua carreira profissional, que possam desenvolver em você a ca- pacidade de utilizar os diversos métodos estatísticos e o raciocínio necessário à interpretação e à análise de pesquisas na área do magistério. A realização de uma pesquisa envolve muitas etapas, tais como: a escolha da amostra, a coleta e a organização dos dados, o resumo e a apresentação desses dados, bem como a interpretação dos resulta- dos para a obtenção de conclusões e a tomada de decisões razoáveis. Todas essas etapas são trabalhadas com métodos científicos pela Estatística. O tratamento estatístico de um conjunto de dados pode envolver dois processos distintos, isto é, a descrição dos dados e o estabelecimento de conclusões sobre a população a partir dos dados obtidos por amostragem. Para tanto, temos: �� Estatística Descritiva: utiliza métodos numéricos e gráficos para mostrar os padrões de com- portamento dos dados, para resumir a informação contida nesses dados e para apresentar a informação de forma conveniente. �� Inferência Estatística: utiliza dados de amostras paraobter estimativas sobre a população. Saiba maisSaiba mais A palavra ‘estatística’, de origem latina, significou, por muito tempo, “ciência dos negócios do Estado”. Os que gover- navam, sentindo necessidade de informações, organizavam departamentos que tinham a responsabilidade de fazer essas investigações. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 6 Esta apostila reúne os principais tópicos de Estatística Descritiva de forma condensada e objetiva, com a finalidade de orientar você, aluno(a) do Ensino a Distância (EAD), no desenvolvimento do conteú- do desta disciplina. Assim, no Capítulo 1, você estudará as regras de arredondamento de dados a serem aplicadas no decorrer dos demais capítulos, vendo, também, ao estudar os dados relativos, aplicações diretamente relacionadas com a área da Educação. No Capítulo 2, aprenderá a organizar dados em tabelas ou distribuição de frequências, de acordo com o tipo de variável em estudo. No Capítulo 3, com os gráficos estatísticos, complementará o estudo feito no Capítulo 2, apren- dendo a interpretar os diferentes tipos de gráficos. No Capítulo 4, não tive a pretensão de demonstrar as diversas fórmulas matemáticas, mas de mos- trar suas aplicações nos diversos exemplos, principalmente aos que se relacionam à área de Educação. A apostila ainda apresenta vários exemplos e exercícios resolvidos e propostos, apresentados por meio de Listas de Exercícios. Vários tópicos desses capítulos encontram-se minuciosamente explicados nas aulas WEB e tam- bém serão abordados nas aulas SATÉLITE, sendo extremamente importante que você assista às aulas, pois elas o auxiliarão na resolução dos demais exercícios e das atividades propostas no decorrer do mó- dulo. Para que o ciclo da aprendizagem feche-se harmoniosamente, é necessário que você não deixe as dúvidas acumularem-se e usufrua das ferramentas disponíveis para perguntas e respostas, tais como os Fóruns de Dúvidas, o Correio e a Sala de Bate-papo. Também fique atento ao Mural e ao Material de Apoio, pois no primeiro me comunicarei com você e no segundo disponibilizarei as aulas Satélite e qualquer outro tipo de material pertinente e interessante. Desejo a você um ótimo Módulo com a seguinte frase do filósofo francês, Charles de Montes- quieu: “É preciso estudar muito para saber um pouco.” Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 7 NOÇÕES BÁSICAS1 De acordo com o Instituto Brasileiro de Geografia e Estatística (IBGE), o arredondamento é feito da seguinte forma: a) Quando o primeiro algarismo a ser abandonado é 0, 1, 2, 3, ou 4, fica inalterado o último alga- rismo a permanecer. Exemplo: aproximação de uma casa decimal: 53,24 passa a 53,2. b) Quando o primeiro algarismo a ser abandonado é 6, 7, 8 ou 9, aumenta-se de uma unidade o algarismo a permanecer. Exemplos: aproximação de uma casa decimal: 42,87 passa a 42,9 25,08 passa a 25,1 53,99 passa a 54,0 c) Quando o primeiro algarismo a ser abandonado é 5, há duas soluções: �� Se ao 5 seguir, em qualquer casa, um algarismo diferente de zero, aumenta-se uma unida- de ao algarismo a permanecer. Exemplos: aproximação de uma casa decimal: 2,352 passa a 2,4 25,6501 passa a 25,7 76,25002 passa a 76,3 �� Se o 5 for o último algarismo ou se ao 5 só se seguirem zeros, o último algarismo a ser con- servado só será aumentado de uma unidade se for ímpar. 1.1 Arredondamento de Dados Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 8 Exemplos: aproximação de uma casa decimal: 24,75 passa a 24,8 24,65 passa a 24,6 24,75000 passa a 24,8 24,6500 passa a 24,6 1.2 Dados Absolutos e Dados Relativos Dados Absolutos São dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação senão a conta- gem ou medida. Embora traduzam um resultado exato e fiel, não ressaltam de imediato as suas conclu- sões numéricas. Dados Relativos São o resultado de comparações por quociente (razões) que se estabelecem entre dados absolutos e têm por finalidade facilitar as comparações entre quantidades. Os dados relativos são traduzidos por meio das porcentagens, dos índices, dos coeficientes e das taxas. Porcentagens São razões que consistem em considerar um total qualquer igual a 100% e, por meio de uma regra de três simples, estabelecer qualquer relação com as parcelas que compõem o total. Assim: As porcentagens podem ser utilizadas de inúmeras formas, segundo a circunstância que queremos estudar. a) Para analisar a estrutura de um fato, devemos calcular as porcentagens dos itens que com- põem esse fato, ou seja, destacar a participação da parte no todo. Exemplo: consideremos a seguinte série ou tabela: TOTAL ---- 100% PARCELA ---- x% Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 9 Tabela 1 – Matrículas nas escolas da cidade “A” – 2005. CATEGORIAS NÚMERO DE ALUNOS 1º grau 19.286 2º grau 1.681 3º grau 234 Total 21.201 Dados fictícios Vamos calcular as porcentagens dos alunos de cada grau: 1º grau: 2º grau: 3º grau: Substituindo na Tabela 1, fica: Tabela 2 – Matrículas nas escolas da cidade “A” – 2005. CATEGORIAS NÚMERO DE ALUNOS (%) 1º grau 19.286 91,0 2º grau 1.681 7,9 3º grau 234 1,1 Total 21.201 100,0 Dados fictícios Os valores dessa nova coluna nos dizem que, de cada 100 alunos da cidade “A”, 91 estão matricula- dos no 1º grau, e, aproximadamente, 8 e 1 estão matriculados, respectivamente, no 2º e 3º graus. b) Para estudar a dinâmica de um fato, ou seja, acompanhar a evolução de um fato ao longo do tempo, devemos estabelecer um período (ano, mês, dia etc.), uma produção, uma renda etc., como sendo a base, considerando-a como 100% e, a partir daí, calcular as outras porcentagens. Exemplo: consideremos a seguinte série ou tabela: Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 10 Tabela 3 – Renda bruta escola “A” – 2003/2007. ANOS RENDA 2003 R$ 40.046,00 2004 R$ 42.549,00 2005 R$ 42.834,00 2006 R$ 44.629,00 2007 R$ 38.065,00 Dados fictícios Vamos considerar como base a renda relativa ao ano de 2003. Então, temos: 2003: 2004: 2005: 2006: 2007: Substituindo esses valores na Tabela 3, temos: Tabela 4 – Renda bruta escola “A” – 2003/2007 (Base Fixa: 2003). ANOS RENDA ANO-BASE 2003 (%) VARIAÇÃO PORCENTUAL COM RELAÇÃO À BASE (%) 2003 R$ 40.046,00 100,0 0,0 2004 R$ 42.549,00 106,3 6,3 2005 R$ 42.834,00 107,0 7,0 2006 R$ 44.629,00 111,4 11,4 2007 R$ 38.065,00 95,1 - 4,9 Dados fictícios 100% Base Valorx% x%Valores 100%Base ×=⇒ → → Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 11 Vamos considerar, agora, uma base móvel, isto é, uma base que se modifique para cada dado. As- sim, cada novo dado sempre será relacionado com o dado anterior. Tabela 3 – Renda bruta escola “A” – 2003/2007. ANOS RENDA 2003 R$ 40.046,00 2004 R$ 42.549,00 2005 R$ 42.834,00 2006 R$ 44.629,00 2007 R$ 38.065,00 Dados fictícios 2004: 2005: 2006: 2007: Substituindo esses valores na Tabela 3, temos: Tabela 5 – Renda bruta escola “A” – 2003/2007 (Base Móvel). ANOS RENDA BASE MÓVEL (%) VARIAÇÃO PORCENTUAL COM RELAÇÃO À BASE (%) 2003 R$ 40.046,00 2004 R$ 42.549,00 106,3 6,3 2005 R$ 42.834,00 100,7 0,7 2006 R$ 44.629,00 104,2 4,2 2007 R$ 38.065,00 85,3 - 14,7 Dados fictícios Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 12 Índices São razões entre duas grandezas tais que uma não inclui a outra, ou seja, grandezas independen- tes. Exemplos: Quociente Intelectual (QI) = Densidade Demográfica = Produção per capita = (mede a produtividade) Consumo per capita = (mede o padrão de vida) Renda per capita = Receita per capita = No âmbito escolar, destacamos os índices de densidade escolar, análogos ao índice de densidade demográfica, como podemos observar a seguir, relacionando algunsdeles: Densidade Densidade Densidade Densidade (É considerada ótima a densidade de 1 aluno por m2) Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 13 Exemplos: 1. São dadas duas tabelas contendo dados sobre o Estado de São Paulo, obtidos no censo esco- lar de 2006. Vamos calcular alguns índices de densidade escolar corpo discente por unidade escolar. Número de Matrículas no Ensino Fundamental de 1ª a 4ª Série, na zona urbana, por Turno e Depen- dência Administrativa, segundo a Região Geográfica e a Unidade da Federação, em 29/3/2006. Tabela 6 – Matrículas no ensino fundamental de 1ª a 4ª série. Total Federal Estadual Municipal Privado São Paulo 3.045.091 181 1.004.978 1.619.677 420.255 Fonte: MEC/INEP – censo de 2006. . Número de Estabelecimentos que Oferecem Ensino Fundamental Exclusivamente de 1ª a 4ª Série, na zona urbana, por Localização e Dependência Administrativa, segundo a Região Geográfica e a Unida- de da Federação, em 29/3/2006. Tabela 7 – Estabelecimentos que oferecem ensino fundamental exclusivamente de 1ª a 4ª série. Total Federal Estadual Municipal Privado São Paulo 4.945 1 1.179 2.904 861 Fonte: MEC/INEP – censo de 2006. Total: Densidade alunos por escola. Federal: Densidade alunos por uma escola. Estadual: Densidade alunos por escola. Fica como exercício a determinação do número de alunos por escola para a rede Municipal e Pri- vada de ensino. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 14 2. Calcular alguns índices de densidade escolar corpo discente por turma utilizando os dados da Tabela 6 e da Tabela 8, fornecida a seguir: Número de Turmas no Ensino Fundamental de 1ª a 4ª Série, na zona urbana, por Localização e De- pendência Administrativa, segundo a Região Geográfica e a Unidade da Federação, em 29/3/2006. Tabela 8 – Turmas no ensino fundamental de 1ª a 4ª série. Total Federal Estadual Municipal Privado São Paulo 107.965 8 31.071 54.900 21.986 Fonte: MEC/INEP – censo de 2006. Total: Densidade alunos por turma. Federal: Densidade alunos por turma. Estadual: Densidade alunos por turma. Fica como exercício a determinação do número de alunos por turma para a rede Municipal e Pri- vada de ensino. Coeficientes e Taxas a) Coeficientes São razões entre o número de ocorrências e o número total. É a comparação entre duas grandezas em que uma está contida na outra. b) Taxas São os coeficientes multiplicados por 10n (10, 100, 1.000 etc.) para tornar o resultado mais inteligí- vel. TAXA = COEFICIENTE × 10n Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 15 Exemplos: Coeficiente de Natalidade = Taxa de Natalidade = Coeficiente de Natalidade × 1.000 Coeficiente de Mortalidade = Taxa de Mortalidade = Coeficiente de Mortalidade × 1.000 Coeficiente de Aproveitamento Escolar = Coeficiente de Evasão Escolar = Taxa de Evasão Escolar = Coeficiente de Evasão Escolar × 100 Coeficiente de Recuperação Escolar = Com relação à administração escolar, podemos classificar os coeficientes em três grupos significa- tivos: coeficientes de desperdício, de escolarização e de produtividade. 1. Coeficientes de Desperdício Veremos dois coeficientes de desperdício: a) Coeficiente de Repetência (CR): é o quociente entre o número de matrículas de repetentes e o número de matrículas total. onde: Mr = matrículas de repetentes M = matrículas totais CR = M Mr Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 16 b) Coeficiente de Evasão (CE): é o quociente entre o número de alunos evadidos (diferença en- tre o número de matrículas inicial e o número de matrículas no final do ano = matrículas efeti- vas) e o número de matrículas inicial. onde: Mi = matrículas iniciais Me = matrículas efetivas Para o cálculo da Taxa de Repetência (TR) e da Taxa de Evasão (TE) multiplica-se, respectivamente, o Coeficiente de Repetência (CR) e o Coeficiente de Evasão (CE) por 100 ou por 1.000, obtendo-se os re- sultados em por cento (%) ou por mil (‰), respectivamente. Exemplos: 1. Dadas as tabelas 6 e 9 com dados sobre a zona urbana do Estado de São Paulo, calcular o Coeficiente e a Taxa de Repetência total e também por tipo de dependência administrativa. Tabela 9 – Alunos reprovados no ensino fundamental de 1ª a 4ª série - 2005. Total Federal Estadual Municipal Privado São Paulo 134.326 3 32.848 95.798 5.677 Fonte: MEC/INEP – censo de 2006. Total: CR = TR = CR x 100 = 0,0441 x 100 = 4,41% Pela taxa de repetência temos que em cada 100 alunos, aproximadamente 4 alunos repetiram. Se fizermos: TR = CR x 1000 = 0,0441 x 1000 = 44,1‰, ou seja, para cada 1.000 alunos tivemos 44 alunos reprovados. Federal: CR = TR = CR x 100 = 0,0166 x 100 = 1,66% CE = i ei M MM − Tabela 6 – Matrículas no ensino fundamental de 1ª a 4ª série. Total Federal Estadual Municipal Privado São Paulo 3.045.091 181 1.004.978 1.619.677 420.255 Fonte: MEC/INEP – censo de 2006. Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 17 Estadual: CR = TR = CR x 100 = 0,0327 x 100 = 3,27% Municipal: CR = TR = CR x 100 = 0,0591 x 100 = 5,91% Privado: CR = TR = CR x 100 = 0,0135 x 100 = 1,35% Podemos concluir que, por tipo de dependência administrativa, a maior taxa de reprovação se deu no ensino municipal, e a menor, no ensino privado. 2. Dadas as tabelas 10 e 11 com dados sobre a zona urbana do Estado de São Paulo, calcular o Coeficiente e a Taxa de Evasão total e também por tipo de dependência administrativa. Número de Matrículas no Ensino Fundamental, por Localização e Dependência Administrativa, se- gundo a Região Geográfica e a Unidade da Federação, em 30/3/2005. Tabela 10 – Matrículas no Ensino Fundamental – 30/03/2005. Total Federal Estadual Municipal Privado São Paulo 5.755.969 188 2.905.684 2.059.339 790.758 Fonte: MEC/INEP – censo de 2005. Número de Matrículas no Ensino Fundamental, por Localização e Dependência Administrativa, se- gundo a Região Geográfica e a Unidade da Federação, no fim do ano de 2005. Tabela 11 – Matrículas no Ensino Fundamental – fim do ano de 2005. Total Federal Estadual Municipal Privado São Paulo 5.688.506 188 2.853.968 2.044.526 789.824 Fonte: MEC/INEP – censo de 2006. Total: CE = TE = CE x 100 = 0,0117 x 100 = 1,17% ou TE = CE x 1000 = 0,0117 x 1000 = 11,7‰ Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 18 Federal: CE = TE = CE x 100 = 0 x 100 = 0% Estadual: CE = TE = CE x 100 = 0,0178 x 100 = 1,78% ou TE = CE x 1000 = 0,0178 x 1000 = 17,8‰ Municipal: CE = TE = CE x 100 = 0,0072 x 100 = 0,72% ou TE = CE x 1000 = 0,0072 x 1000 = 7,2‰ Privado: CE = TE = CE x 100 = 0,0012 x 100 = 0,12% ou TE = CE x 1000 = 0,0012 x 1000 = 1,2‰ Convém observar que, nesse caso, o cálculo da taxa de evasão permite-nos uma melhor compara- ção entre as dependências administrativas quando feito em relação a mil alunos. 2. Coeficiente de Escolarização É o quociente entre a matrícula geral (M), que representa a população escolarizada e a popu- lação escolarizável (Pesc). Para o cálculo da Taxa de Escolarização (Tesc), multiplica-se o Coeficiente de Escolarização (Cesc) por 100 ou por 1.000, obtendo-se o resultado em por cento (%) ou por mil (‰), respectivamente. O complemento do Coeficiente de Escolarização, isto é, 1 – Cesc fornece-nos o Coeficiente de não Escolarização ou Déficit Escolar (DE), que representa quantas crianças estão sem escola. O mesmo se aplica em relação à Taxa de Escolarização (Tesc), onde o Déficit Escolar (DE) pode ser obtido em por cento (%), quando fazemos 100 – Tesc, ou em por mil (‰), quando é feito 1.000 – Tesc. esc esc P MC = Estatística Aplicada à Educação Unisa | Educação a Distância |www.unisa.br 19 Exemplos: 1. O censo de 2005 (IBGE, 2005) e o censo escolar de 2005 (MEC/INEP, 2005) informam-nos que, no Brasil, em uma população escolarizável, na faixa de 7 a 14 anos, igual a 27.814.240, tínha- mos 27.063.256 matrículas no Ensino Fundamental. Calcular o Coeficiente e a Taxa de Escola- rização. Tesc = Cesc x 100 = 0,973 x 100 = 97,3% 2. O censo de 2005 (IBGE, 2005) e o censo escolar de 2005 (MEC/INEP, 2005) informam-nos que a Taxa de Escolarização (TE) na Região Sudeste é de 98,2%, com uma população escolarizada de 10.510.205. Calcular a população escolarizável dessa região e o Déficit Escolar (DE). Tesc = Cesc x 100 98,2% = Cesc x 100 DE = 100% - Tesc = 100% - 98,2% = 1,8% Se quisermos calcular a população não escolarizada, basta determinar 1,8% de 10.702.856 = 1,8% x 10.702.856 = . Observe, ainda, que a soma da população escolarizada com a população não escolarizada fornece- -nos a população escolarizável: 192.651 + 10.510.205 = 10.702.856. 3. Coeficientes de Produtividade Veremos dois tipos de coeficientes de produtividade: a) Coeficiente de Produtividade Anual (CPA): é o quociente entre a aprovação no fim do ano (A) e a matrícula final (Mf). fM ACPA = Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 20 b) Coeficiente de Produtividade Curricular (CPC): é um indicador de diplomação na escola, sendo determinado pelo quociente entre diplomação após um período de curso (D) e a matrí- cula no início do período (Mi) Para o cálculo da Taxa de Produtividade Anual (TPA) e da Taxa de Produtividade Curricular (TPC), multiplica-se, respectivamente, o Coeficiente de Produtividade Anual (CPA) e o Coeficiente de Produti- vidade Curricular (CPC) por 100 ou por 1.000, obtendo-se o resultado em por cento (%) ou por mil (‰), respectivamente. Exemplos: 1. Os censos escolares de 2005 (MEC/INEP, 2005) e de 2006 (MEC/INEP, 2006) fornecem-nos que, para o Estado de São Paulo, em relação à 1ª série do Ensino Fundamental, foram efetuadas 745.192 matrículas em 30/03/2005, 6.089 alunos foram afastados por abandono em 2005, e 704.404 foram aprovados, no mesmo ano. Calcular o Coeficiente de Produtividade Anual (CPA) e a Taxa de Produtividade Anual (TPA). , com A = 704.404 e Mf = 745.192 – 6.089 = 739.103 TPA = CPA x 100 = 0,9531 x 100 = 95,31% 2. O censo escolar de 1998 (MEC/INEP, 1998) nos fornece 736.799 matrículas na 1ª série do En- sino Fundamental para o Estado de São Paulo, e o censo escolar de 2006 (MEC/INEP, 2005) nos fornece 574.014 alunos aprovados na 8ª série do Ensino Fundamental de 2005. Calcular o Coeficiente de Produtividade Curricular (CPC) e a Taxa de Produtividade Curricular (TPC). TPC = CPC x 100 = 0,7791 x 100 = 77,91% cursodoinícionomatrículasdenº cursodofinalaoaprovadosdenº M DCPC i == Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 21 População É o conjunto de todos os elementos envolvidos no fenômeno a ser estudado. Amostra É o conjunto de elementos retirados da população para a realização do estudo. É, portanto, um subconjunto da população. Exemplos: 1. Queremos obter informações sobre a audiência de certo programa de TV, na Grande São Paulo. População: é o conjunto de todos os domicílios da Grande São Paulo que possuem TV. Amostra: é o conjunto dos domicílios que serão visitados. 2. Estudar a procedência dos candidatos a uma certa universidade. População: conjunto de todos os candidatos à referida universidade. Amostra: conjunto dos candidatos que serão entrevistados. 3. Queremos fazer um estudo sobre a idade dos alunos do curso de Publicidade e Propaganda de uma determinada universidade. População: todos os alunos do curso de Publicidade e Propaganda. Amostra: uma classe do primeiro ano do curso de Publicidade e Propaganda. Quando são obtidos dados de toda uma população, dizemos que foi feito um recenseamento, e a este conjunto de dados damos o nome de censo. Quando os dados são obtidos de parte da população, foi feita uma amostragem. A Escolha da Amostra Os métodos de escolha da amostra devem garantir a representatividade do grupo. É necessário escolher, no mínimo, 10% do número total dos elementos da população e garantir, por meio de um cri- tério de seleção, que nenhum elemento tenha maior chance de ser escolhido do que outro. Desse modo, podemos recorrer a diferentes formas de amostragem: amostragem aleatória simples, amostragem sistemática e amostragem estratificada proporcional. Vejamos o procedimento por meio de dois exemplos. 1.3 População e Amostra Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 22 Exemplo 1: Suponhamos uma pesquisa sobre o nível de escolaridade de um grupo de 800 pessoas. Vamos es- colher uma amostra com, no mínimo, 80 pessoas (10% de 800) selecionadas por meio de: a) Amostragem Aleatória Simples: em primeiro lugar, elaboramos uma lista com os 800 nomes dos elementos da população, numerados de 1 a 800, para serem submetidos a um sorteio. Bo- las ou cartões, também numerados de 1 a 800, são colocados em uma urna e bem misturados. Em cada etapa do sorteio, todo número ainda não escolhido tem a mesma probabilidade de ser sorteado. Esse processo não é muito prático para grandes populações, quando podemos, então, trabalhar com uma numeração de 0 a 9, sorteando os números por meio de blocos de três algarismos e tomando o cuidado de repor na urna todo algarismo dela retirado. Como temos dez algarismos, cada um deles tem de probabilidade de aparecer em determinada posição. Sempre que um bloco de algarismos indicar um elemento já selecionado, ou um ele- mento que não exista na população será descartado. Suponhamos que os seguintes algarismos foram obtidos no sorteio: 2 4 3 5 6 4 7 2 0 0 3 5 8 1 1 0 0 5 1 9 8 6 4 3 5 2 4 7 8 9 7 7 6 5 4 2 2 3 0 1 2 1 1 6 7 8 9 1 0 3 4 5 6 7 2 2 8 8 1 9 0 0 6 0 7 2 1 0 5 6 4 3 Agrupando-os em blocos de três, teremos os números: 243 564 720 035 811 005 198 643 524 789 776 542 230 121 167 891 034 567 228 819 006 072 105 643. Observem que devemos descartar 811, 891 e 819, porque não pertencem à população, e 643, porque já foi selecionado. Continuamos o sorteio até completarmos os 80 elementos da amostra. b) Amostragem Sistemática: sorteamos um número de 1 a 10, ao acaso. Supondo que tenha sido obtido o número 6, ele será o primeiro elemento da amostra, e os demais serão determinados em intervalos de dez unidades. Nossa amostra, então, será: 6 16 26 36 46 56 66 76 86 96 106 . . . 796 Esse tipo de amostragem é simples de ser realizado, e é aconselhável no caso de amostras muito grandes. Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 23 Exemplo 2: Na escola Sapequinha, deseja-se fazer um estudo sobre o peso dos alunos de 7 anos de idade. Existem 120 crianças na faixa de 7 anos distribuídas em cinco classes, do seguinte modo: a primeira série A tem 20 alunos com 7 anos, a primeira B tem 15, a C tem 35, a D, 30, e a E tem 20. Vamos escolher uma amostra com, no mínimo, 12 crianças (10% de 120), selecionadas por meio de: c) Amostragem Estratificada Proporcional: sorteamos os nomes das crianças em quantidades proporcionais ao número de crianças com 7 anos de cada classe, que constituem os estratos da amostra. Vamos, agora, determinar a porcentagem de crianças com 7 anos em cada classe em relação à população (120 crianças). A: B: De modo análogo, determinamos as porcentagens para as classes C, D e E, obtendo: C: c = 29,2% D: d = 25% E: e = 16,7% Para calcularmos quantas crianças de cada classe serão sorteadas para uma amostra de 12 crianças, fazemos: A: 16,7% de 12 = B: 12,5% de 12 = 0,125 . 12 = 1,5 = 2 C: 29,2% de 12 = 0,292 .12 = 3,504 = 3 (neste caso, arredondamos para 3 em vez de 4 porque o total de crianças da amostra é 12) D: 25% de 12 = 0,25 . 12 = 3 E: 16,7% de 12 = 0,167 . 12 = 2,004 = 2 Desse modo, obtivemos a quantidade de elementos de cada estrato e o total da amostra. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 24 Neste capítulo, você teve a oportunidade de conhecer os critérios de arredondamento do IBGE. Esse tipo de tratamento da informação ajuda a simplificar a informação matemática dada em forma de números sem perder, contudo, o rigor do levantamento de dados prévios realizado anteriormente à ta- bulação dos dados. Aprendeu, também, a identificar a diferença entre taxas, índices e coeficientes, aprimorando a leitu- ra de dados estatísticos numéricos e aperfeiçoando a análise e a construção de dados pautados por refe- rências e informações combinadas entre si. Viu, também, como uma amostra pode ser definida em uma pesquisa ou um levantamento estatístico e conheceu alguns termos utilizados na linguagem estatística, como é o caso da palavra “população”. Caro(a) aluno(a), se você desejar conhecer uma publicação interessante sobre noções básicas da Estatística, o se- guinte livro poderá auxiliá-lo(a): VIEIRA, Sonia. Estatística básica. São Paulo: Cengage Learning, 2012. Trata-se de uma obra indicada como leitura complementar e está alinhada com os objetivos de nossa disciplina. MultimídiaMultimídia 1.4 Resumo do Capítulo 1.5 Atividades Propostas1 1 Exercícios retirados de Crespo, Estatística Fácil, 1998. Exercícios retirados de Martins e Donaire, Princípios de Estatística, 1979. Exercícios retirados de Nazareth, Curso Básico de Estatística, 1991. Exercícios retirados de Oliveira, Estatística Aplicada à Educação, 1982. 1. Arredonde cada um dos numerais abaixo conforme a precisão pedida: a) para o décimo mais próximo: 23,40 234,7832 45,09 48,85002 78,85 12,35 120,4500 129,98 199,97 b) para o centésimo mais próximo: 46,727 28,255 299,951 253,65 123,842 37,485 Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 25 c) para a unidade mais próxima: 26,6 128,5 68,2 67,5 49,98 39,49 d) para a dezena mais próxima: 42,3 59 446,4 265,31 265,0 265 295 302,7 2995,000 2. Seja a seguinte série ou tabela: Tabela 12 – Matrículas nas escolas das cidades “A” E “B”. CATEGORIAS Nº DE ALUNOS CIDADE “A” CIDADE “B” 1º grau 19.286 38.660 2º grau 1.681 3.399 3º grau 234 424 Total 21.201 42.483 Dados Fictícios Qual das cidades tem, comparativamente, o maior número de alunos em cada grau? 3. Uma escola registrou em março, na 1ª série, a matrícula de 40 alunos, e a matrícula efetiva, em dezembro, de 35 alunos. Calcule a taxa de evasão. 4. Calcule a taxa de aprovação de um professor de uma classe de 45 alunos sabendo que obtive- ram aprovação 36 alunos. 5. São Paulo tinha, em 1992, uma população de 32182,7 mil habitantes. Sabendo que sua área terrestre é de 248256 km2, calcule a sua densidade demográfica. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 26 6. Um professor preencheu um quadro, enviado pela D.E., com os seguintes dados: Tabela 13 Sé ri e e Tu rm a N º d e A lu no s 30 /0 3 N º d e A lu no s 30 /1 1 Pr om ov id os s em Re cu pe ra çã o Re ti do s se m R ec u- pe ra çã o Em Re cu pe ra çã o Re cu pe ra do s N ão re cu pe ra do s Total Geral Pr om ov id os Re ti do s 1º B 49 44 35 03 06 05 01 40 04 1º C 49 42 42 00 00 00 00 42 00 1º E 47 35 27 00 08 03 05 30 05 1º F 47 40 33 06 01 00 01 33 07 Total 192 161 137 09 15 08 07 145 16 Calcule: a) a taxa de evasão, por classe; b) a taxa de evasão total; c) a taxa de aprovação, por classe; d) a taxa de aprovação geral; e) a taxa de recuperação, por classe; f ) a taxa de recuperação geral; g) a taxa de reprovação na recuperação geral; h) a taxa de aprovação, sem a recuperação; i) a taxa de retidos, sem a recuperação 7. Acompanhe a evolução da produção da empresa A, utilizando porcentagens: a) considerando como base o ano de 2000; b) considerando como base o ano anterior. Tabela 14 – Produção empresa “a” – 2000/2006. Anos 2000 2001 2002 2003 2004 2005 2006 Prod. 40.046 42.549 42.834 44.629 38.065 40.127 46.316 8. Na Escola São Leopoldo, para estudar a preferência em relação a refrigerantes, sortearam-se 150 estudantes entre os 1.000 matriculados. Responda: a) Qual é a população envolvida na pesquisa? b) Que tipo de amostragem foi utilizado e qual é a amostra considerada? Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 27 9. A população envolvida em uma pesquisa sobre a incidência de cárie dentária em escolas da cidade de Morro Grande é apresentada na Tabela 15: Tabela 15 Escola População A 500 B 250 C 440 D 360 Total 1.550 Baseando-se nesses dados, estratifique uma amostra com 200 elementos. 10. Em uma cidade com 30.000 habitantes, deseja-se fazer uma pesquisa sobre a preferência por tipo de lazer entre pessoas de 20 anos de idade, levando em conta o sexo a que pertencem. a) Qual a população envolvida na pesquisa? b) Supondo que na cidade haja 5.500 mulheres e 6.000 homens com 20 anos, determine uma amostra com 1.200 pessoas. 11. Dadas as tabelas a seguir, calcule os Coeficientes de Repetência (CR) e as Taxas de Repetência (TR) correspondentes à 4ª série do Ensino Fundamental, em relação às cinco Regiões do Brasil, dizendo qual delas apresentou a menor Taxa de Repetência. Tabela 16 Regiões do Brasil Matrículas no Ensino Fundamental – 4ª série Norte 406.247 Nordeste 1.295.231 Sudeste 1.519.232 Sul 516.909 Centro-Oeste 283.056 Fonte: MEC/INEP – censo de 2006. Tabela 17 Regiões do Brasil Alunos Reprovados no Ensino Fundamental – 4ª série Norte 47.230 Nordeste 179.131 Sudeste 131.242 Sul 46.353 Centro-Oeste 22.811 Fonte: MEC/INEP – censo de 2006. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 28 12. Dadas as tabelas abaixo, calcule os Coeficientes de Evasão (CE) e as Taxas de Evasão (TE) cor- respondentes à 4ª série do Ensino Fundamental, em relação as cinco Regiões do Brasil, dizendo qual delas apresentou a maior Taxa de Evasão. Tabela 18 Regiões do Brasil Matrículas no Ensino Fundamental – 4ª série (30/03/2005) Norte 415.146 Nordeste 1.366.487 Sudeste 1.550.349 Sul 529.778 Centro-Oeste 284.640 Fonte: MEC/INEP – censo de 2005. Tabela 19 Regiões do Brasil Matrículas no Ensino Fundamental – 4ª série (final de 2005) Norte 381.617 Nordeste 1.256.065 Sudeste 1.525.785 Sul 525.160 Centro-Oeste 274.315 Fonte: MEC/INEP – censo de 2006. 13. Dada a tabela a seguir, calcule os Coeficientes e as Taxas de Escolarização correspondentes a uma população escolarizável, na faixa de 7 a 14 anos, em relação às cinco Regiões do Brasil, dizendo qual delas apresenta o maior Déficit Escolar e qual é esse Déficit em porcentagem. Tabela 20 Regiões do Brasil População escolarizada (M) População escolarizável (Pesc) Norte 2.635.291 2753.700 Nordeste 8.224.317 8.522.608 Sudeste 10.510.205 10.702.856 Sul 3.720.531 3.800.338 Centro-Oeste 1.972.912 2.021.426 Fonte: MEC/INEP – censo de 2005; IBGE – censo 2005. 14. Dada a tabela abaixo, calcule os Coeficientes de Produtividade Anual (CPA) e as Taxas de Pro- dutividade Anual (TPA) correspondentes à 4ª série do Ensino Fundamental, em relação às cinco Regiões do Brasil, dizendo qual delas apresentou, respectivamente, a menor e a maior Taxa de Produtividade Anual. Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 29 Tabela 21 Regiões do Brasil Matrículas 4ª série - Fundamental final de 2005 Aprovados (2005) Norte 381.617 329.919 Nordeste 1.256.065 1.053.352 Sudeste 1.525.785 1.375.949 Sul 525.160 472.461 Centro-Oeste 274.315 245.647 Fonte: MEC/INEP – censo de 2006. 15. Dada a tabelaabaixo, calcule os Coeficientes de Produtividade Curricular (CPC) e as Taxas de Produtividade Curricular (TPC) correspondentes ao Ensino Fundamental (8 anos), em relação às cinco Regiões do Brasil, dizendo qual delas apresentou, respectivamente, a menor e a maior Taxa de Produtividade Curricular. Tabela 22 Regiões do Brasil Matrículas 1ª série - Fundamental 25/03/98 Aprovados 8ª série 2005 Norte 913.179 181.459 Nordeste 3.327.772 711.389 Sudeste 1.750.473 1.074.838 Sul 661.243 355.971 Centro-Oeste 427.075 196.896 Fonte: MEC/INEP – censo de 1998; MEC/INEP – censo de 2006. 16. Dada a tabela abaixo, calcule os seguintes números relativos: a) coeficiente de produtividade; b) índice de densidade aluno/professor; c) índice de densidade aluno/sala de aula; d) índice de densidade aluno/unidade. Tabela 23 Municípios A B C Matrículas 60.000 6.000 8.000 Professores 1.200 100 200 Aprovação 36.000 2.500 4.800 Unidades 300 60 40 Salas-aula 1.000 75 170 Unisa | Educação a Distância | www.unisa.br 31 Caro(a) aluno(a), com base em um conjunto de dados, vamos estudar como devemos “tratar” os valores, numéricos ou não, a fim de extrair informações a respeito de uma ou mais características de interesse. Suponhamos, por exemplo, que um questionário foi aplicado a alunos do 1º ano de uma escola fornecendo as seguintes informações: Id: identificação do aluno Turma: A ou B Sexo: feminino (F) ou masculino (M) Idade: em anos Alt: em metros Peso: em quilogramas Filhos: nº de filhos na família Fuma: hábito de fumar: sim (S) ou não (N) Toler: tolerância ao cigarro: (I) indiferente; (P) incomoda pouco; (M) incomoda muito Exercícios: horas de atividade física, por semana Cine: nº de vezes que vai ao cinema por semana Op Cine: opinião a respeito das salas de cinema na cidade: (B) regular a boa; (M) muito boa TV: horas gastas assistindo à TV, por semana Op TV: opinião a respeito da qualidade da programação na TV: (R) ruim; (M) média; (B) boa; (N) não sabe. O conjunto de informações após a tabulação do questionário ou pesquisa de campo é denominado tabela de dados brutos, e contém os dados da maneira que foram coletados inicialmente (Tabela 24). Cada uma das características perguntadas aos alunos, tais como o peso, a idade, a altura etc., é de- nominada variável, e, como podemos observar, tem naturezas diferentes quanto aos possíveis valores que pode assumir. ORGANIZAÇÃO DE DADOS2 2.1 Tipos de Variável Existem dois tipos de variável: quantitativas (variáveis numéricas) e qualitativas (variáveis não numéricas). Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 32 Variáveis Qualitativas Seus valores representam uma qualidade (ou atributo) do indivíduo pesquisado. Exemplos: sexo, turma, estado civil, grau de instrução, hábito de fumar etc. Dentre as variáveis qualitativas ainda existem dois tipos: Variável Qualitativa Nominal Não existe ordenação em seus possíveis resultados. Exemplos: sexo, turma, hábito de fumar. Variável Qualitativa Ordinal Existe uma certa ordem em seus possíveis resultados. Exemplos: tamanho (P, M, G); classe social (baixa, média, alta); grau de instrução (1º grau, 2º grau, grau supe- rior); estado civil. Variáveis Quantitativas Seus valores são numéricos resultantes de uma contagem ou mensuração. Exemplos: número de filhos, salário, peso, altura etc. Dentre as variáveis quantitativas ainda existem dois tipos: Variáveis Quantitativas Discretas Seus possíveis valores formam um conjunto finito ou enumerável de números que resultam fre- quentemente de uma contagem. Exemplos: número de filhos, idade (em anos), cine (número de vezes que vai ao cinema por semana). Variáveis Quantitativas Contínuas Seus possíveis valores formam um intervalo de números reais que resultam normalmente de uma mensuração. Exemplos: peso, altura, salário. Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 33 ESQUEMA Figura 1 – Classificação de variáveis. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 34 Tabela 24 – Informações de questionário estudantil – dados brutos. Id Turma Sexo Idade Altura Peso Filho Fuma Toler Exerc Cine OpCine TV OpTV 1 A F 17 1,60 60,5 2 Não P 0 1 B 16 R 2 A F 18 1,69 55,0 1 Não M 0 1 B 7 R 3 A M 18 1,85 72,8 2 Não P 5 2 M 15 R 4 A M 25 1,85 80,9 2 Não P 5 2 B 20 R 5 A F 19 1,58 55,0 1 Não M 2 2 B 5 R 6 A M 19 1,76 60,0 3 Não M 2 1 B 2 R 7 A F 20 1,60 58,0 1 Não P 3 1 B 7 R 8 A F 18 1,64 47,0 1 Sim I 2 2 M 10 R 9 A F 18 1,62 57,8 3 Não M 3 3 M 12 R 10 A F 17 1,64 58,0 2 Não M 2 2 M 10 R 11 A F 18 1,72 70,0 1 Sim I 10 2 B 8 N 12 A F 18 1,66 54,0 3 Não M 0 2 B 0 R 13 A F 21 1,70 58,0 2 Não M 6 1 M 30 R 14 A M 19 1,78 68,5 1 Sim I 5 1 M 2 N 15 A F 18 1,65 63,5 1 Não I 4 1 B 10 R 16 A F 19 1,63 47,4 3 Não P 0 1 B 18 R 17 A F 17 1,82 66,0 1 Não P 3 1 B 10 N 18 A M 18 1,80 85,2 2 Não P 3 4 B 10 R 19 A F 20 1,60 54,5 1 Não P 3 2 B 5 R 20 A F 18 1,68 52,5 3 Não M 7 2 B 14 M 21 A F 21 1,70 60,0 2 Não P 8 2 B 5 R 22 A F 18 1,65 58,5 1 Não M 0 3 B 5 R 23 A F 18 1,57 49,2 1 Sim I 5 4 B 10 R 24 A F 20 1,55 48,0 1 Sim I 0 1 M 28 R 25 A F 20 1,69 51,6 2 Não P 8 5 M 4 N 26 A F 19 1,54 57,0 2 Não I 6 2 B 5 R 27 B F 23 1,62 63,0 2 Não M 8 2 M 5 R 28 B F 18 1,62 52,0 1 Não P 1 1 M 10 R 29 B F 18 1,57 49,0 2 Não P 3 1 B 12 R 30 B F 25 1,65 59,0 4 Não M 1 2 M 2 R 31 B F 18 1,61 52,0 1 Não P 2 2 M 6 N 32 B M 17 1,71 73,0 1 Não P 1 1 B 20 R 33 B F 17 1,65 56,0 3 Não M 2 1 B 14 R 34 B F 17 1,67 58,0 1 Não M 4 2 B 10 R 35 B M 18 1,73 87,0 1 Não M 7 1 B 25 B 36 B F 18 1,60 47,0 1 Não P 5 1 M 14 R 37 B M 17 1,70 95,0 1 Não P 10 2 M 12 N 38 B M 21 1,85 84,0 1 Sim I 6 4 B 10 R 39 B F 18 1,70 60,0 1 Não P 5 2 B 12 R 40 B M 18 1,73 73,0 1 Não M 4 1 B 2 R 41 B F 17 1,70 55,0 1 Não I 5 4 B 10 B 42 B F 23 1,45 44,0 2 Não M 2 2 B 25 R 43 B M 24 1,76 75,0 2 Não I 7 0 M 14 N 44 B F 18 1,68 55,0 1 Não P 5 1 B 8 R 45 B F 18 1,55 49,0 1 Não M 0 1 M 10 R 46 B F 19 1,70 50,0 7 Não M 0 1 B 8 R 47 B F 19 1,55 54,5 2 Não M 4 3 B 3 R 48 B F 18 1,60 50,0 1 Não P 2 1 B 5 R 49 B M 17 1,80 71,0 1 Não P 7 0 M 14 R 50 B M 18 1,83 86,0 1 Não P 7 0 M 20 B Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 35 2.2 Distribuição de Frequências A partir da tabela de dados brutos (Tabela 24), vamos construir uma nova tabela com as informa- ções resumidas para cada variável, denominada tabela de frequência, que conterá os valores da variá- vel e suas respectivas contagens, as quais são denominadas frequências absolutas ou, simplesmente, frequências. No caso de variáveis qualitativas ou quantitativas discretas, a tabela de frequência consiste em lis- tar os valores possíveis da variável, numéricos ou não, e fazer a contagem na tabela de dados brutos do número de suas ocorrências. Notação: Para efeito de comparação com outros grupos ou conjuntos de dados, é conveniente trabalharmos com a frequência relativa, definida por . Exemplos: Tabela de Frequência para a Variável Sexo (extraída da Tabela 24): Sexo: variável qualitativa nominal Tabela 25 – Variável Sexo. Sexo (%) F 37 0,74 74 M 13 0,26 26 Total n=50 1,00 100 Note que, para variáveis cujos valores possuem ordenação natural (qualitativas ordinais e quanti- tativas em geral), incluímos na tabela de frequência uma coluna contendo as frequências acumuladas (fac) (quando o número de valores i for maior do que 2). A frequência acumulada até um certo valor é obtida pela soma das frequências de todos os valores da variável, menores ou iguais ao valor considera- do. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 36 Tabela de Frequência para a Variável Toler (extraída da Tabela 24): Toler: variável qualitativa ordinal Tabela 26 – Toler - Variável qualitativa ordinal. Toler fac (%) fac (%) I 10 10 0,20 20 20 P 21 31 0,42 42 62 M 19 50 0,38 38 100 Total n = 50 1,00 100 Tabela de Frequência para a VariávelIdade (extraída da Tabela 24): Tabela 27 – Variável Idade. Idade fac fac (%) 17 9 9 0,18 18 18 18 22 31 0,44 44 62 19 7 38 0,14 14 76 20 4 42 0,08 8 84 21 3 45 0,06 6 90 22 0 45 0,00 0 90 23 2 47 0,04 4 94 24 1 48 0,02 2 96 25 2 50 0,04 4 100 Total n = 50 1,00 100 Observe, pela fac, que 90% dos alunos têm idades até 21 anos. A variável Peso, classificada como quantitativa contínua, apresenta valores que podem ser qual- quer número real em um certo intervalo. Pela Tabela 24, verificamos que os valores variam entre 44,0 kg e 95,0 kg, e, como existe um grande número de valores diferentes, vamos construir faixas ou classes de valores e contar o número de ocor- rências em cada faixa. Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 37 Não existe uma regra formal para determinar o número de faixas ou classes a serem utilizadas. Entretanto, deve-se observar que, com um pequeno número de classes, perde-se informação, e, com um número grande de classes, o objetivo de resumir os dados fica prejudicado. No geral, é conveniente trabalharmos com 5 a 8 faixas de mesma amplitude, devendo ressaltar que faixas de tamanho desigual podem ser convenientes para representar valores nas extremidades da tabela. Para a variável Peso, usaremos faixas de amplitude 10 e iniciaremos com 40,0 kg. Tabela de Frequência para a Variável Peso (extraída da Tabela 24): Tabela 28 – Variável Peso. Peso fac fac (%) Ponto Médio 40,0 ├─ 50,0 8 8 0,16 16 16 45,0 50,0 ├─ 60,0 22 30 0,44 44 60 55,0 60,0 ├─ 70,0 8 38 0,16 16 76 65,0 70,0 ├─ 80,0 6 44 0,12 12 88 75,0 80,0 ├─ 90,0 5 49 0,10 10 98 85,0 90,0 ├─ 100,0 1 50 0,02 2 100 95,0 Total n = 50 1,00 100 Peso: variável quantitativa contínua Observe, pela fac, que 76% dos alunos pesam menos de 70,0 kg, e 100 – 88 = 12% têm peso maior ou igual a 80,0 kg. Na Tabela 28 temos 6 faixas, ou classes ou intervalos. Consideremos, por exemplo, a 1ª classe ou intervalo: 40,0 ├─ 50,0, onde temos: Limite inferior (li): 40,0 Ponto Médio (PM) = ( ) Limite superior (ls): 50,0 Amplitude ou tamanho do intervalo (h): h = ls – li; (h = 50,0 – 40,0 = 10,0) O símbolo ├─ : indica que o intervalo é fechado à esquerda e aberto à direita (40,0 faz parte dessa classe, mas 50,0 não; 50,0 está na 2ª classe). Na Tabela 24, a variável TV (quantitativa discreta) tem valores inteiros entre 0 e 30, e uma tabela re- presentando tais valores e respectivas frequências seria muito extensa e pouco prática. Por esse motivo, trataremos essa variável como quantitativa contínua, criando, por exemplo, faixas de amplitude 6 para representar seus valores. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 38 Tabela de Frequência para a Variável TV (extraída da Tabela 24): Tabela 29 – Variável TV. TV fac fac (%) 0 ├─ 6 14 14 0,28 28 28 6 ├─ 12 17 31 0,34 34 62 12 ├─ 18 11 42 0,22 22 84 18 ├─ 24 4 46 0,08 8 92 24 ├─┤30 4 50 0,08 8 100 Total n = 50 1,00 100 TV: variável quantitativa discreta que foi “tratada” como contínua Observe que, na última classe, o intervalo é fechado à esquerda e à direita, incluindo, portanto, o valor 30, e não tendo, assim, que abrir mais uma classe por causa de um único valor. Outra sugestão seria usar uma amplitude maior nessa última classe, como, por exemplo, 24 ├─ 36, que inclui o valor 30. 2.2 Resumo do Capítulo Neste capítulo, você teve a oportunidade de conhecer a forma como as informações são organiza- das. As variáveis são divididas em quantitativas e qualitativas. Dentre as variáveis quantitativas podemos temos as grandezas discretas e contínuas. Dentre as variáveis qualitativas temos aquelas que podem ser ordenadas por algum critério, as chamadas variáveis qualitativas ordinais, e aquelas que não podem ser ordenadas, as chamadas variáveis qualitativas ordinais. Você viu, também, como organizar as informa- ções em uma tabela de frequências. Unisa | Educação a Distância | www.unisa.br 39 Adapta-se muito bem às variáveis qualitativas, mas também pode ser usado para as variáveis quan- titativas discretas. Fazendo uso do computador para o traçado do gráfico, basta conhecer as porcentagens de cada valor da variável. Se, ao contrário, formos traçar o gráfico com o auxílio de compasso e transferidor, preci- saremos determinar a medida, em graus, de cada setor correspondente aos valores da variável, lembran- do que o disco todo mede 360°. Exemplo: Gráfico de Setores para a variável Toler (Tabela 26). I: 20% P: 42% M: 38% Procedemos de maneira análoga para os valores de P e M. 3.1 Gráfico de Setores, Disco ou Pizza, ou Diagrama Circular GRÁFICOS ESTATÍSTICOS3 A organização dos dados em tabelas de frequência proporciona um meio eficaz de estudo do com- portamento de características de interesse. Muitas vezes, a informação contida nas tabelas pode ser mais facilmente visualizada por meio de gráficos. Vamos definir quatro tipos básicos de gráficos: setores ou pizza, colunas ou barras, histogra- ma e polígono de frequências. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 40 Gráfico 1– Setores. Gráfico de Setores: Variável Toler M 38% P 42% I 20% Adapta-se melhor às variáveis discretas ou qualitativas ordinais. Utiliza o plano cartesiano com os valores da variável no eixo das abscissas e as frequências ou por- centagens no eixo das ordenadas. Exemplo: Gráfico de Colunas para a variável Idade (Tabela 27) Gráfico 2 – Colunas. Gráfico de Colunas: Variável Idade 9 22 7 4 3 0 2 1 20 10 20 30 Idade ni 3.2 Gráfico de Colunas ou Barras 3.3 Histograma É utilizado para variáveis quantitativas contínuas. Consiste em retângulos contíguos ou adjacentes em que a base, colocada no eixo das abscissas, corresponde aos intervalos das classes, e a altura, colocada no eixo das ordenadas, é dada pela frequên- cia absoluta ou relativa das classes. Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 41 Observação: a área de um histograma é proporcional à soma das frequências absolutas. No caso de trabalharmos com as frequências relativas, a área será igual à constante de proporcionalidade. Exemplo: Histograma para a variável Peso (Tabela 28) Gráfico 3 – Histograma. Histograma: Variável Peso 22 8 5 1 8 6 0 5 10 15 20 25 Peso ni 40,0 50,0 60,0 70,0 80,0 90,0 100,0 É também utilizado para variáveis quantitativas contínuas. Para construir o polígono de frequências, admitem-se como representantes de cada classe os pon- tos médios de cada intervalo que as definem. Após obter os pontos (ponto médio, frequência correspon- dente) em relação a cada intervalo, estes são ligados entre si por meio de segmentos de retas, sendo que o primeiro e o último deles são ligados ao eixo das abscissas, na metade de classes hipotéticas, imediata- mente anterior à primeira e posterior à última. Gráfico 4 – Polígono de Frequências. 3.4 Polígono de Frequências Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 42 É também utilizada para variáveis quantitativas contínuas. Para a sua construção consideramos os pontos cujas coordenadas são limite superior de cada inter- valo de classe, frequência acumulada correspondente a cada intervalo de classe. Ligando-se os pontos assim obtidos, construímos a Ogiva de Galton. Vejam o exemplo para a variável Peso. Gráfico 5 – Ogiva de Galton. Ogiva de Galton - Variável Peso (100, 50)(90, 49) (80, 44) (70, 38) (60, 30) (50, 8) 0 10 20 30 40 50 60 50 60 70 80 90 100 Peso fac 3.5 Ogiva de Galton 3.6 Resumo do Capítulo Querido(a) aluno(a), neste capítulo, você teve a oportunidade de entender como as informações estatísticas são organizadas graficamente. Percebeu que existem vários tipos de gráficos, entre eles: grá- ficos de setores, gráficos de colunas, histograma, polígono de frequência e ogiva de Galton. O objetivo deste capítulo é auxiliá-loa interpretar informações sintetizadas de forma gráfica. Saiba maisSaiba mais Lembre-se que a informação contida nas tabelas pode ser mais facilmente visualizada por meio de gráficos. É importante que você conheça os quatro tipos básicos de gráficos: setores ou pizza, colunas ou barras, histograma e polígono de frequências. Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 43 1. Em uma fábrica, foram testadas 400 lâmpadas; a duração delas aparece na distribuição por frequência da Tabela 30: Tabela 30 Duração (em horas) Número de lâmpadas 300 ├─ 400 14 400 ├─ 500 46 500 ├─ 600 58 600 ├─ 700 76 700 ├─ 800 68 800 ├─ 900 62 900 ├─ 1.000 48 1.000 ├─ 1.100 22 1.100 ├─ 1.200 6 Total 400 a) Complete a tabela dada com as demais colunas que você conhece. b) Qual a amplitude de cada classe? c) Qual o limite inferior da 3ª classe? d) Qual o limite superior da 8ª classe? e) Qual o ponto médio da 5ª classe? f ) Qual a frequência relativa da 6ª classe? g) Qual a porcentagem de lâmpadas com durabilidade máxima de 500 horas? h) Qual a porcentagem de lâmpadas com durabilidade de 900 horas ou mais? 2. Com relação às variáveis: Turma, Alt, Filhos, Fuma, Exerc, Cine, Op Cine, Op TV, da Tabela 24 a) Classifique essas variáveis. b) Faça a distribuição de frequência para cada uma delas. c) A variável Exerc poderia ser tratada de forma diferente com relação à sua classificação? Justi- fique sua resposta e, em caso afirmativo, construa a nova distribuição de frequência. d) Construa os gráficos que melhor se adaptam a cada uma das variáveis acima. 3. Quinze pacientes de uma clínica de ortopedia foram entrevistados quanto ao número de me- ses previstos de fisioterapia, se haverá (S) ou não (N) sequelas após o tratamento e o grau de complexidade da cirurgia realizada: alto (A), médio (M) ou baixo (B). Os dados são apresentados na Tabela 31: 2 Exercícios retirados de Nazareth, Curso Básico de Estatística, 1991. Exercícios retirados de Magalhães e Lima, Noções de Probabilidade e Estatística, 2004. Exercícios retirados de Azevedo e Campos, Estatística Básica, 1986. 3.7 Atividades Propostas2 Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 44 Tabela 31 Pacientes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Fisioterapia 7 8 5 6 4 5 7 7 6 8 6 5 5 4 5 Sequelas S S N N N S S N N S S N S N N Cirurgia A M A M M B A M B M B B M M A a) Classifique cada uma das variáveis. b) Para cada variável, construa a tabela de frequência e faça uma representação gráfica. c) Para o grupo de pacientes que não ficaram com sequelas, faça um gráfico de barras para a variável Fisioterapia. Você acha que essa variável se comporta de modo diferente nesse grupo? 4. Os dados da Tabela 32 referem-se ao salário (em salários mínimos) de 20 funcionários admi- nistrativos em uma indústria. Tabela 32 10,1 7,3 8,5 5,0 4,2 3,1 2,2 9,0 9,4 6,1 3,3 10,7 1,5 8,2 10,0 4,7 3,5 6,5 8,9 6,1 a) Construa uma tabela de frequência agrupando os dados em intervalos de amplitude 2 a partir de 1. b) Construa o histograma, o polígono de frequência e a ogiva de Galton. 5. Um grupo de estudantes do ensino médio foi submetido a um teste de matemática resultando em: Tabela 33 Nota Frequência 0 ├─ 2 14 2 ├─ 4 28 4 ├─ 6 27 6 ├─ 8 11 8├─ 10 4 a) Construa o histograma, o polígono de frequência e a ogiva de Galton. b) Se a nota mínima para aprovação é 5, qual será a porcentagem de aprovação? Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 45 6. Seja a distribuição de notas apresentada na Tabela 34: Tabela 34 Notas ni 0 ├─ 10 2 10├─ 20 8 20├─ 30 10 30├─ 40 25 40├─ 50 50 50├─ 60 84 60├─ 70 55 70├─ 80 20 80├─ 90 8 90├─ 100 18 Total 280 a) Qual a classe de notas do 140º? E do 100º? b) Quantos alunos obtiveram notas de 20 |--- 90? E de 0 |--- 50? c) Qual a porcentagem dos alunos com notas de 0 |--- 50? E de 30 |--- 70? Unisa | Educação a Distância | www.unisa.br 47 Nosso interesse é caracterizar o conjunto de dados por meio de medidas que resumam a infor- mação, como, por exemplo, representando a tendência central dos dados ou a maneira pela qual esses dados estão dispersos. MEDIDAS4 Se estivermos em uma parada de ônibus e nos pedirem alguma informação sobre a demora em passar um determinado ônibus, ninguém imagina que poderíamos dar como resposta uma tabela de frequências que coletamos no último mês. Quem perguntou deseja uma resposta breve e rápida que sin- tetize a informação de que dispomos, e não uma completa descrição dos dados. É para isso que servem as medidas de posição. Medidas de Posição para um Conjunto de Dados Seja uma variável X com observações representadas por . Média Aritmética ou Simplesmente Média ( ) É a soma dos valores da variável dividida pelo número total de observações. (dados não agrupados); (dados agrupados) Exemplo: Calcular a média aritmética dos valores: 9, 12, 8, 6, 14, 11, 5 4.1 Medidas de Posição Saiba maisSaiba mais As medidas de posição, ou medidas de tendência central, para um conjunto de dados qualquer (população ou amostra) são: a média, a moda, a mediana e demais separatrizes. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 48 Para calcularmos a média quando os dados estão agrupados em classes, representamos todos os valores de cada classe pelo ponto médio da classe. Moda (mo) É o valor da variável mais frequente da distribuição. Exemplo: Calcular a moda para o seguinte conjunto de dados: 65, 87, 49, 58, 65, 65, 67, 83, 87, 79, 87. mo = 65 (aparece 3 vezes) e mo = 87 (aparece 3 vezes). Temos duas modas, portanto a distribuição é bimodal. Quando a distribuição não apresentar moda, será chamada de amodal; se tiver uma só moda, recebe o nome de unimodal, e se apresentar várias modas será multimodal. Mediana (md) É o valor da variável que ocupa a posição central dos dados ordenados, isto é, o valor da variável que é precedido e seguido pelo mesmo número de observações. Temos duas considerações a fazer: a) O número de observações (n) é ímpar: a mediana será o valor da variável que ocupa a posição de ordem 2 1n + . Exemplo: Calcular a mediana dos valores: 9, 12, 8, 6, 14, 11, 5. Em primeiro lugar, vamos organizar os dados em ordem crescente: 5, 6, 8, 9, 11, 12, 14 n = 7 (ímpar) AtençãoAtenção Para calcularmos a moda quando os dados estão agrupados em classes, usaremos o seguinte processo (Método de Czuber): 1º) Identifica-se a classe modal (a que possuir maior frequência) 2º) Aplica-se a fórmula: , onde: = limite inferior da classe modal 1∆ = diferença entre a frequência da classe modal e a imediatamente anterior 2∆ = diferença entre a frequência da classe modal e a imediatamente posterior Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 49 b) O número de observações (n) é par: não existe, portanto, um valor que ocupe o centro; con- vencionou-se que a mediana será a média aritmética dos valores que ocupam as posições de ordem 1 2 ne 2 n + . Exemplo: Calcular a mediana dos valores já ordenados: 6, 8, 9, 11, 12, 14. n = 6 (par) oentrearitméticamédiapeladadaserámedianaa41 2 ne3 2 n ∴=+=∴ Para calcularmos a mediana quando os dados estão agrupados em classes, não levamos em consi- deração se n é par ou ímpar e procedemos do seguinte modo: 1. Calcula-se 2 n . 2. Pela frequência acumulada identifica-se a classe que contém a mediana. 3. Aplica-se a fórmula: , onde: = limite inferior da classe md n = nº total de elementos da amostra fac = frequência acumulada da classe anterior à classe md h = amplitude da classe md = frequência da classe md Separatrizes (Se) Para o cálculo das separatrizes, os valores da variável devem estar ordenados, como foi feito para o cálculo da mediana. Uma separatriz é o valor da variável que divide o conjunto de valores em duas partes quaisquer. A mediana é uma separatriz, pois, como já foi dito, ela divide o conjunto de valores da variável em duas partesiguais. As principais separatrizes são a mediana, os quartis, os decis e os percentis (ou centis). Os quartis, decis e percentis são as separatrizes que dividem o conjunto de valores da variável, res- pectivamente, em quatro, dez e cem partes iguais. Quartis: são representados por Q1, Q2 e Q3, sendo chamados, respectivamente, primeiro, segundo e terceiro quartil. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 50 O primeiro quartil (Q1) de um conjunto de dados ordenados é o valor da variável que é precedido por 25% dos dados (n / 4) e seguido pelos restantes 75% (3n / 4). O segundo quartil coincide com a mediana (Q2 = 2n / 4 = n / 2 = md), dividindo, portanto, o conjun- to de valores da variável em duas partes iguais. O terceiro quartil (Q3) de um conjunto de dados ordenados é o valor da variável que é precedido por 75% dos dados (3n / 4) e seguido pelos restantes 25% (n / 4). Decis: são representados por D1, D2, D3, ..., D9, sendo chamados, respectivamente, primeiro, segun- do, terceiro, ..., nono decil. O primeiro decil (D1) de um conjunto de dados ordenados é o valor da variável que é precedido por 10% dos dados (n / 10) e seguido pelos restantes 90% (9n / 10). O segundo decil (D2) de um conjunto de dados ordenados é o valor da variável que é precedido por 20% dos dados (2n / 10) e seguido pelos restantes 80% (8n / 10). De maneira análoga definimos os demais decis. Convém observar que o quinto decil também coincide com a mediana (D5 = 5n / 10 = n / 2 = md). Percentis: são representados por P1, P2, P3, ..., P99, sendo chamados, respectivamente, primeiro, se- gundo, terceiro, ..., nonagésimo nono percentil. O primeiro percentil (P1) de um conjunto de dados ordenados é o valor da variável que é precedi- do por 1% dos dados (n / 100) e seguido pelos restantes 99% (99n / 100). O segundo percentil (P2) de um conjunto de dados ordenados é o valor da variável que é precedi- do por 2% dos dados (2n / 100) e seguido pelos restantes 98% (98n / 100). Analogamente definimos os demais percentis. Pelas definições de quartis, decis, percentis e mediana, concluímos que: Com exceção da mediana, as demais separatrizes serão calculadas para dados agrupados em clas- ses, mediante aplicação da seguinte fórmula: , onde: Se = separatriz desejada (mediana, quartil, decil ou percentil) liSe = limite inferior da classe que contém a separatriz Pi = posição da separatriz fac = frequência acumulada da classe anterior à classe que contém a separatriz h = amplitude da classe que contém a separatriz niSe = frequência absoluta da classe que contém a separatriz Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 51 Para determinarmos a posição da separatriz (Pi), devemos considerar: 1. Se for genericamente um quartil de ordem i, vem: conforme se tratar, respectivamente, do primeiro, segundo ou terceiro quartil. 2. Se for genericamente um decil de ordem i, vem: conforme se tratar, respectivamente, do primeiro, segundo, terceiro, ..., nono decil. 3. Se for genericamente um percentil de ordem i, vem: conforme se tratar, respectivamente, do primeiro, segundo, terceiro, ..., nonagésimo nono percentil. 4. Se for a mediana, , 2 nPi = não importando se n é par ou ímpar, como já foi visto. Após determinarmos a posição da separatriz, identificamos a classe que contém a separatriz pela frequência acumulada e aplicamos a fórmula para o cálculo da separatriz. Ao índice de um percentil damos o nome de Ordem Percentílica (OP). Esse número indica o percen- tual de elementos de uma série ordenada de modo crescente, que é inferior à separatriz correspondente. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 52 Exemplos: 1. Calcule média, mediana e moda para a variável Idade. (Tabela 35) (Ver Tabela 27): Tabela 35 Idade ( ix ) in fac ii xn ⋅ 17 9 9 153 18 22 31 396 19 7 38 133 20 4 42 80 21 3 45 63 22 0 45 0 23 2 47 46 24 1 48 24 25 2 50 50 Total n = 50 ∑ =⋅ 945)xn( ii (média) n = 50 é par, portanto, a mediana será a média aritmética dos dois valores centrais . Pela fac observamos que o valor da frequência acumulada até 18 é igual a 31, e, portanto, o 25º elemento é igual ao 26º elemento e ambos correspondem ao valor da variável igual a 18 (mediana) Para o cálculo de mo, olhamos a maior frequência (22) que corresponde à idade de 18 anos. (moda) Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 53 2. Calcule média, mediana e moda para a variável Peso. (Tabela 36) (Ver Tabela 28): Tabela 36 Peso in fac Ponto Médio )x( i ii xn ⋅ 40,0 ├─ 50,0 8 8 45,0 360,0 50,0 ├─ 60,0 22 30 55,0 1210,0 60,0 ├─ 70,0 8 38 65,0 520,0 70,0 ├─ 80,0 6 44 75,0 450,0 80,0 ├─ 90,0 5 49 85,0 425,0 90,0 ├─ 100,0 1 50 95,0 95,0 Total n = 50 ∑ =⋅ )xn( ii 3060,0 (média) . Pela fac (30), a 2ª classe contém a mediana, isto é, o intervalo 50,0 ├─ 60,0. (mediana) (moda) Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 54 3. Para uma distribuição de ganhos horários, encontramos: md = R$ 15,85/h; Q3 = R$ 17,25/h; P84 = R$ 18,17/h e D7 = R$ 16,86/h. Determinar e interpretar as ordens percentílicas dessas separatrizes. md = P50 ∴ OP = 50 Q3 = P75 ∴ OP = 75 P84 ∴ OP = 84 D7 = P70 ∴ OP = 70 Interpretando esses resultados, temos que: �� 50% dos empregados percebem salários inferiores (ou superiores) a R$ 15,85/h; �� 75% dos empregados ganham menos de R$ 17,25/h (ou que 25% deles recebem mais que esse valor); �� 84% dos empregados recebem até R$ 18,17/h (ou que apenas 16% deles recebem mais que essa quantia); �� 70% dos empregados ganham até R$ 16,86/h (ou que 30% dos empregados recebem mais que R$ 16,86/h). 4. Dada a distribuição de pesos (Tabela 37), determine a coluna de frequência acumulada (fac) e calcule com aproximação de décimos: a) a mediana e o primeiro quartil indicando as respectivas ordens percentílicas e significados; b) a separatriz, com o respectivo significado, cuja ordem percentílica é 74; c) o peso acima do qual temos 20% de pessoas com pesos superiores a ele; d) a separatriz cuja ordem percentílica é 80, com o respectivo significado; e) a ordem percentílica correspondente a 64,4 kg e o seu significado; f ) determinar faixas de ordens percentílicas e de pesos, dividindo as pessoas em classes de gordos (20% dos indivíduos mais pesados), médios (55% das pessoas com pesos abaixo dos gordos) e magros (25% das pessoas mais magras). Tabela 37 Pesos (kg) ni fac 60├─ 66 120 120 66├─ 72 180 300 72├─ 78 80 380 78├─ 84 40 420 84├─ 90 20 440 Total 440 a) Para determinarmos a classe que contém a mediana calculamos 220 2 440 2 n == . Assim, a mediana é o peso correspondente ao 220º elemento da série ordenada, que, pela fac = 300, se encontra na classe 66├─ 72 (onde se situam desde o 121º elemento até o 300º). Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 55 Aplicando a fórmula para o cálculo da mediana, temos: = , cuja ordem percentílica é 50, significando que 50% das pessoas têm pesos inferiores (ou superiores) a 69,3 kg. Para determinarmos a classe que contém o primeiro quartil, fazemos: Q1: Pi = i . Assim, o primeiro quartil é o peso correspondente ao 110º elemento da série ordenada, que, pela fac = 120, se encontra na classe 60├─ 66 (onde se situam desde o 1º elemento até o 120º). Aplicando a fórmula geral para o cálculo de uma separatriz, vem: , cuja ordem percentílica é 25, significando que 25% das pessoas pesam até 65,5 kg (ou o que é o mesmo que 75% das pessoas têm peso superior a 65,5 kg). b) 100 n.iPi = = 380, a classe que contém o septuagésimo quarto per- centil é: 72├─ 78. Aplicando a fórmula geral para o cálculo de uma separatriz, vem: , o que significa que 74% das pessoas pesam menos que 73,9 kg. c) O peso acima do qual temos 20% de pessoas com pesos superiores a ele é o mesmo abaixo do qual se situam 80% de pessoascom pesos inferiores, ou seja, é a separatriz, cuja ordem per- centílica é 80, isto é, P80 = D8. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 56 D8: pela fac = 380, a classe que contém o octogésimo percentil é: 72├─ 78. Aplicando a fórmula geral para o cálculo de uma separatriz, vem: d) Pelo item anterior, P80 = 75,9 kg, o que significa que 80% das pessoas pesam até 75,9 kg. e) Se = Pi = 64,4 kg que pertence à classe 60├─ 66. Logo, temos: liS = 60; niS = 120; fac = 0; h = 6. Aplicando a fórmula: , temos: (posição da separatriz) Como , vem: . Assim, 20% das pessoas pesam menos que 64,4 kg. f ) Tabela 38 Classificação Faixas OP Pesos (kg) Magros 0 ⊢ 25 60,0 ⊢ 65,5 Médios 25 ⊢ 80 65,5 ⊢ 75,9 Gordos 80 ⊢ 100 75,9 ⊢ 90,0 Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 57 O exemplo que veremos a seguir é uma aplicação das separatrizes para testes iniciais, exames de seleção ou admissão e provas de classificação, na qual o que interessa é medir a posição do aluno no grupo a que pertence. 5. Seja a distribuição de frequências (Tabela 39) relativa ao número de pontos obtidos por 400 alunos na prova inicial de certa Inspetoria: Tabela 39 – Número de Pontos na Prova Inicial. Pontos ni fac 0 ⊢ 5 5 5 5 ⊢ 10 8 13 10 ⊢ 15 26 39 15 ⊢ 20 43 82 20 ⊢ 25 50 132 25 ⊢ 30 65 197 30 ⊢ 35 82 279 35 ⊢ 40 54 333 40 ⊢ 45 35 368 45 ⊢ 50 18 386 50 ⊢ 55 10 396 55 ⊢ 60 4 400 Total n = 400 Para dividirmos a escala de notas em quatro notas-conceito, a técnica estatística apropriada para a construção da escala é a dos quartis, resultando no seguinte esquema básico: Tabela 40 Notas-Conceito (Tipos) Pontos Q Péssimo Até Q1 Fraco De Q1 a Q2 Bom De Q2 a Q3 Ótimo Acima do Q3 Vamos, agora, determinar os quartis: Q1: Pi = i ⇒== 1004 400.1 4 n pela fac = 132, a classe que contém o 1º quartil é: 20 ⊢ 25. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 58 Q1 = Q2: Pi = i pela fac = 279, a classe que contém o 2º quartil é: 30 ⊢ 35. Q2 = pontos Q3: Pi = i ⇒== 3004 400.3 4 n pela fac = 333, a classe que contém o 3º quartil é: 35 ⊢ 40. Q3 = Portanto, a Tabela 40 terá os seguintes valores: Tabela 41 Notas-Conceito (Tipos) Pontos: Q Péssimo 0,0 ⊢ 21,8 Fraco 21,8 ⊢ 30,2 Bom 30,2 ⊢ 36,9 Ótimo 36,9 ⊢ 60,0 Convém observar que, embora válida e útil como primeira fase do estudo analítico da prova, a escala de quartis é mais grosseira, pois engloba em uma mesma categoria resultados significativamente diferentes, como é o caso do aluno que obteve 36,9 pontos como o que obteve 59,9 pontos serem clas- sificados como ótimos, bem como o aluno que obteve 1,0 ponto e aquele que obteve 21,7 pontos terem a mesma classificação de péssimos. Devemos, portanto, completar a classificação por conceitos feita por meio dos quartis por uma escala de dez notas, decis ou de cem notas, percentis ou, ainda, de 20 notas, envolvendo somente os percentis P5, P10, P15, P20, ..., P95. Vamos, agora, determinar os decis: Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 59 D1: Pi = i pela fac = 82, a classe que contém o 1º decil é: 15 ⊢ 20. D1 = D2: Pi = i pela fac = 82, a classe que contém o 2º decil é: 15 ⊢ 20. D2 = D3: Pi = i pela fac = 132, a classe que contém o 3º decil é: 20 ⊢ 25 D3 = D4: Pi = i pela fac = 197, a classe que contém o 4º decil é: 25 ⊢ 30 D4 = D5 = Q2 = 30,2 pontos D6: Pi = i pela fac = 279, a classe que contém o 6º decil é: 30 ⊢ 35 Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 60 D6 = D7: Pi = i pela fac = 333, a classe que contém o 7º decil é: 35 ⊢ 40 D7 = D8: Pi = i pela fac = 333, a classe que contém o 8º decil é: 35 ⊢ 40 D8 = D9: Pi = i pela fac = 368, a classe que contém o 9º decil é: 40 ⊢ 45 D9 = Teremos, então, a seguinte tabela de notas: Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 61 Tabela 42 Notas Pontos: D 1 0,0 ⊢ 15,1 2 15,1 ⊢ 19,8 3 19,8 ⊢ 23,8 4 23,8 ⊢ 27,2 5 27,2 ⊢ 30.2 6 30,2 ⊢ 32,6 7 32,6 ⊢ 35,1 8 35,1 ⊢ 38,8 9 38,8 ⊢ 43,9 10 43,9 ⊢ 60,0 Note que a Tabela 42 é bem mais discriminativa do que a Tabela 41. Observe, pela tabela, que o mesmo aluno que obteve 36,9 pontos corresponde a ter tirado nota 8,0, enquanto o aluno com 56,9 pontos tirou 10,0, e agora estão em situações de classificação diversa da obtida na Tabela 41. Para obtermos uma classificação ainda mais discriminativa do que as duas anteriores, vamos calcu- lar os 19 percentis, obtendo, assim, uma classificação para 20 notas. P5: Pi = i pela fac = 39, a classe que contém o 5º percentil é: 10 ⊢ 15 P5 = P10 = D1 = 15,1 pontos P15: Pi = i pela fac = 82, a classe que contém o 15º percentil é: 15 ⊢ 20 P15 = P20 = D2 = 19,8 pontos P25 = Q1 = 21,8 pontos Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 62 P30 = D3 = 23,8 pontos P35: Pi = i pela fac = 197, a classe que contém o 35º percentil é: 25 ⊢ 30 P35 = P40 = D4 = 27,2 pontos P45: Pi = i pela fac = 197, a classe que contém o 45º percentil é: 25 ⊢ 30 P45 = P50 = D5 = Q2 = md = 30,2 P55: Pi = i pela fac = 279, a classe que contém o 55º percentil é: 30 ⊢ 35 P55 = P60 = D6 = 32,6 pontos P65: Pi = i pela fac = 279, a classe que contém o 65º percentil é: 30 ⊢ 35 Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 63 P65 = P70 = D7 = 35,1 pontos P75 = Q3 = 36,9 pontos P80 = D8 = 38,8 pontos P85: Pi = i pela fac = 368, a classe que contém o 85º percentil é: 40 ⊢ 45 P85 = P90 = D9 = 43,9 pontos P95: Pi = i pela fac = 386, a classe que contém o 95º percentil é: 45 ⊢ 50 P95 = Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 64 Assim, teremos a tabela de 20 notas percentis: Tabela 43 Notas Pontos: P 5 0,0 ⊢ 11,3 10 11,3 ⊢ 15,1 15 15,1 ⊢ 17,4 20 17,4 ⊢ 19,8 25 19,8 ⊢ 21,8 30 21,8 ⊢ 23,8 35 23,8 ⊢ 25,6 40 25,6 ⊢ 27,2 45 27,2 ⊢ 28,7 50 28,7 ⊢ 30,2 55 30,2 ⊢ 31,4 60 31,4 ⊢ 32,6 65 32,6 ⊢ 33,8 70 33,8 ⊢ 35,1 75 35,1 ⊢ 36,9 80 36,9 ⊢ 38,8 85 38,8 ⊢ 41,0 90 41,0 ⊢ 43,9 95 43,9 ⊢ 48,3 100 48,3 ⊢ 60,0 Nesta tabela, se considerarmos o aluno que obteve 35,0 pontos e o que obteve 44,0 pontos, cons- tatamos que o primeiro, com nota correspondente a 7,0, encontra-se classificado como médio superior, enquanto o outro, com nota correspondente a 9,5 encontra-se classificado como superior. Observe, ain- da, que o aluno que obteve 44,0 pontos tem nota correspondente igual a 10,0 pela Tabela 42. AtençãoAtenção As medidas de posição podem ser utilizadas em conjunto para auxiliar a análise dos dados, mas existem situações em que uma pode ser mais conveniente do que a outra. Por exemplo, quando existe um ou mais valores muito dis- crepantes, a média é muito influenciada por esse valor e se torna inadequada para representar o conjunto de dados, sendo melhor trabalhar com a mediana. Por outro lado, para conjuntos de dados muito numerosos, a ordenação é custosa, e a mediana se torna difícil de calcular. INFERIOR MÉDIO INFERIOR MÉDIO SUPERIOR SUPERIOR INFERIOR SUPERIOR Estatística Aplicada à Educação Unisa | Educação a Distância | www.unisa.br 65 Um bairro nobre da capital paulista inclui uma das maiores favelas de São Paulo. O que podemos dizer da renda média do bairro? Certamente, os altos rendimentos de alguns residentes serão suficientes para fazer a média atingir um patamar comparável às melhores economias do mundo, porém a discre- pância entre os diversos valores deve ser muito grande. O que podemos estar esquecendo é a variabili- dade dos valores da variável, e isso não é captado pela média, e sim pelas medidas de dispersão. As medidas de dispersão ou de variabilidade servem para quantificar a variabilidade dos valores da variável, isto é, a dispersão dos dados, ou a forma como os valores de cada conjunto espalham-se ao redor das medidas de tendência central.
Compartilhar