Prévia do material em texto
NILSON SÁ COSTA FILHO ESTATÍSTICA EDUCACIONAL Disciplina na Modalidade a Distância São Luís 2014 Universidade Federal do Maranhão Reitor Natalino Salgado Filho Vice-Reitor Antonio José Silva Oliveira Pró-Reitora de Ensino Sônia Maria Corrêa Pereira Mugschl Diretor do Núcleo de Ensino a Distância - NEaD Wilma dos Santos Eugênio Diretor do Núcleo de Tecnologia da Informação - NTI Nélio Alves Guilhon Coordenador do Curso de Pedagogia João Batista Bottentuit Júnior Coordenador de Tutoria do Curso de Pedagogia Francilene Duarte Santos Coordenador de Gestão Pedagógica Reinaldo Portal Domingo Coordenadora Pedagógica de Hipermídia para Aprendizagem - NEaD Rosane de Fátima Antunes Obregon Coordenador Tecnológico - NEaD Leonardo de Castro Mesquita Coordenador da Universidade Aberta do Brasil na UFMA Cenidalva Miranda Sousa Teixeira Coordenador Adjunto da Universidade Aberta do Brasil na UFMA João Batista Bottentuit Júnior Projeto Gráfico, Capa Luciana Santos Sousa Diagramação Erika Veras de Castro Edição – Livro didático Copyright @ UFMA/NEaD, 2013 Todos os direitos reservados à Universidade Federal do Maranhão. Créditos: Universidade Federal do Maranhão – UFMA UFMA – Núcleo de Educação a Distância Av. dos Portugueses, s/n Campus Universitário do Bacanga Telefone: 098 - 3301-8057 e 3301-8055 e-mail: neadufma@ufma.br site: www.nead.ufma.br Costa Filho, Nilson Sá Estatística Educacional/ Nilson Sá Costa Filho. – São Luís: NEAD/UFMA, 2014. fl; 84 Il. 1. Estatística educacional I. Universidade Federal do Maranhão II. Nucleo de Educação a Distância III Titulo CDU 37.014 CAPÍTULO 1 Organização de Dados e sua Distribuição de Frequências e sua Evo- lução.....................................................................................................................11 1.1 Uma abordagem histórica da evolução da ciência...........................................11 1.2 Desenvolvimento científico e tecnologia no Brasil...........................................15 1.3 Tabelas..........................................................................................................16 1.4 Gráficos.........................................................................................................20 CAPÍTULO 2 Distribuição de Frequências..........................................................29 2.1 Dados brutos, Rol e Amplitudes......................................................................29 CAPÍTULO 3 Medidas Estatísticas......................................................................41 3.1 Medidas de Tendência Cetral..........................................................................41 3.2 Medidas de Dispersão.....................................................................................51 CAPÍTULO 4 Aplicação de Procedimentos Estatísticos a Dados Evidenciados na Escola...................................................................................................................67 4.1 Planejamento..................................................................................................68 4.2 Tipos de Pesquisas..........................................................................................69 4.3 Coleta de Dados.............................................................................................69 4.4 Classificação dos Dados..................................................................................71 4.5 Instrumentos de Coleta de Dados....................................................................71 4.6 Tipos de Variáveis...........................................................................................73 4.7 Apuração dos Dados.......................................................................................73 4.8 Plano de Amostragem ...................................................................................74 4.9 Apresentação dos Dados.................................................................................77 Referências............................................................................................................83 SU M Á R IO A elaboração deste material tem como propósito levá-lo a refletir sobre a utilização das os conceitos básicos de um curso de estatística direcionados para área de educação, isto é, enfoca a estatística descritiva, as medidas sobre uma dis- tribuição nos capítulos iniciais, e coloca os principais estimadores necessá-rios ao desenvolvimento posterior de inferência estatística no Capitulo Medidas Estatísticas. Encerra o material com o conteúdo Aplicação de procedimentos estatísticos a dados evidenciados na escola tais como Coeficiente de Evolução, Matrícula, Evasão, Produtividade Anual entre oou- tros. Este conteúdo foi escolhido por alguns motivos. A nossa experiência ao desen- volver cursos nesta área nos conven-zu de que este conteúdo pode ser desenvolvido com bom aproveitamento um curso anual de 72 horas ou em curso semestral equi- valente. A Estatística Educacional é utlizada como ferramenta auxiliar à prática pe- dagógica bem como, contribuir para sua formação profissional a partir das questões aqui tratadas. Logo a ênfase do estudo recai sobre a utilização de alguns tópicos de Estatística no processo de ensino e aprendizagem e na pesquisa sobre a evolução desse processo. A pretensão é aguçar sua curiosidade e desejo de buscar mais, visto que o conhecimento não é algo acabado, esgotado. Para tanto são apresentadas questões que contribuirão para suscitar questio- namentos e reflexões que fortalecerão sua atitude investigativa. Se acaso surgirem dificuldades ou incertezas a medida que você inicie os estudos, desejamos que sirvam de incentivo para continuar a caminhada. Com a intenção de colaborar com você, este material traz alguns ícones que têm por objetivo chamar sua atenção, assim como oferecer-lhe informações comple- mentares, dicas de estudos e filmes, entre outros. Tudo isso para facilitar seu estudo. Portanto, mãos à obra! Bons estudos. A P R E SE N TA Ç Ã O Em meio às transformações decorrentes do avanço científico e tecnológi- co, está a educação, dela fazem parte a escola, o corpo técnico administrativo, corpo docente e discente. Ao professor cabe a tarefa de integrar a vários recursos para a melhoria do processo de ensino e aprendizagem, para tanto, é necessário que esteja capacitado no intuito de compreender que as ferramentas educacionais só têm sen- tido em sala de aula se forem utilizadas para a construção do conhecimento. A Educação tem de continuar a melhorar a qualidade de seus produtos e serviços se quiser continuar a crescer. Uma porção significante desse esforço de melhoria da qualidade será comandada por pesquisadores e cientistas, porque esses são os indivíduos que projetam e desenvolvem novos produtos e sistemas e proces- sos, sendo também aqueles que contribuem para melhoria dos sistemas existentes . Métodos estatísticos são uma importante ferramenta nessas atividades, porque eles fornecem aos educadores com métodos descritivos e analíticos para lidar com a variabilidade nos dados observados. A utilização de pesquisas em diversos campos assim como na área educa- cional, so tem sentido se contribuirem para a transformação de informações em conhecimento, e este para a formação de sujeitos críticos e reflexivos. Desta forma iniciamos a discussão, fazendo uma abordagem sobre a evolu- ção da ciência e a contribuição para a evolução da matemática estatística e tecnolo- gias no Brasil Dando continuidade, fazemos uma reflexão sobre a utilização dos recursos estatísticos como Organização de Dados e sua Distribuição de Frequências, assim como sua relação com a educação. Seguimosfazendo referência à Medidas Estatísticas no contexto não só da sala de aula como ferramenta para facilitar o processo de ensino assim com para avalição de dados em todo ambiente educacional. Mais adiante damos ênfase à aplicação de procedimentos estatísticos a da- dos evidenciados na escol, discutindo sobre o papel do professor como pesquisador. IN T R O D U Ç Ã O O rg an iz aç ão d e D ad os e s ua D is tr i- b ui çã o de F re qu ên ci as e s ua E vo lu çã o 1CAPÍTUL O OBJETIVO DESTE CAPÍTULO Fornecer as bases conceituais de modelos estatísticos para analisar e interpre- tar dados. A ciência como se apresenta hoje, é considerada um conhecimento recente, como afirmam Cervo e Bervian (1996, p.29). Conjunto de saberes e aquisições inte- lectuais para a explicação racional e objetiva da realidade. Contudo, desde a Grécia antiga, o conhecimento se mostra como objeto de desejo do homem. Na pré história, os conhecimentos eram passados de geração para geração a partir da tradição oral. Com o advento da escrita, tornou-se possível armazenar o conhecimento para divulgá-lo às gerações futuras com maior fidelidade. A matemática é considerada essencial para muitas ciências, o que é possível perceber a partir dos cálculos estatísticos necessários em pesquisas de cunho quan- titativas em diferentes áreas, na expressão de modelos científicos, na coleta e repre- sentação de dados, o que requer uso da matemática e cálculos estatísticos. Alguns pensadores vêem os matemáticos como cientistas, outros discordam, visto que a matemática não requer teste experimental de suas teorias e hipóteses. O pensamento lógico já se demonstrou ineficiente para a criação de teorias científicas e para des- crever a natureza. Descartes, afirmava que a matemática é uma ferramenta para se fazer ciên- cia, mas não é uma ciência, palavras e números não existem na natureza, portanto não são ciência. 1.1 Uma abordagem histórica da evolução da ciência N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 14 NILSON SÁ COSTA FILHO Para Chauí (1995, p.252), (...) as experiências científicas são realizadas com o objetivo de verificar e confir- mar as demonstrações teóricas e não para produzir o conhecimento do objeto, visto que este é conhecido exclusivamente pelo pensamento. De acordo com Galileu, valoriza-se o conhecimento obtido pela razão, e o mundo real possui uma estrutura matemática, “o grande livro da Natureza está escri- to em caracteres matemáticos” Esta é a concepção racionalista de ciência, que vai da Grécia antiga ao final do século XVI, presenciou a Revolução Científica e estabeleceu a ciência como ori- gem de todo o crescimento do conhecimento científico, período de progresso inicia- do com Nicolau Copérnico e culminou com Isaac Newton. No século XIX, a prática da ciência se tornou profissional e institucionali- zada e dependente de avanços tecnológicos que trazem, a cada momento, novas descobertas. A ciência moderna é complexa, ampla e tem desenvolvido pesquisas em todas as instâncias do mundo físico e humano, buscando explicar o mundo para poder nele intervir. De certo que muitos dos problemas atuais são frutos dos avanços científicos (bomba atômica, armas de destruição em massa, gases venenosos. Não se pode ne- gar, contudo, que a ciência tem buscado solução para os problemas que afligem ho- mens e mulheres, podendo-se citar as experiências realizadas com implantes, células tronco, cura para certos tipos de câncer, entre outros. O que se espera é que surjam inovações e soluções para os grandes problemas da humanidade. Você já se questionou sobre os avanços da ciência. Para onde irá nos levar? Onde conseguirá chegar o homem caminhando tanto no que diz respeito aos avan- ços científicos?O que o texto tem haver com a Estatística? O trecho abaixo foi escrito por Lewis Carrol, então professor de matemática da universidade de Oxford, em Alice no país das maravilhas. Está citado no livro Filosofando de Maria Lúcia Aranha. 15 ESTATÍSTICA EDUCACIONAL 1.2 Desenvolvimento da Matemática e da Pesquisa no Brasil A história da ciência no Brasil tem início no século XIX com a chegada da família real ao Brasil, então colônia de Portugal. D. João VI, habitando em terras brasileiras por conta do Bloqueio Continental, precisava desfrutar do estilo de vida e hábitos da metrópole, com este propósito dá início ao desenvolvimento do progresso com a fundação da Academia Militar Naval Real e Academia Militar Real, Biblioteca Nacional, Jardim Botânico, Escola de Cirurgia da Bahia e a Escola de Anatomia, Medicina e Cirurgia do Rio de Janeiro e a Escola Politécnica do Rio de Janeiro, destinada a formação de militares e oferecia cursos de Engenharia, Matemática e Ciências físicas e naturais. É importante citar, que ainda no século XIX, Charles Darwim esteve no Bra- sil, por volta de1830, assim como fizeram o naturalista Francis Burton e o botânico Saint Hilaire, dando indícios da presença da pesquisa e, consequentemente da ciên- cia, em terras brasileiras. Entre 1941 e 1945 é publicado na Revista Brasileira de Estatística, o trabalho de Lélio Gama; Introdução à Teoria dos Conjuntos, momento de relevância para a Ciência, assim como para a Matemática no Brasil, visto que a partir daí, professores estrangeiros são contratados como visitantes da Universidade de São Paulo – USP, entre estes, destaca-se a figura de Ubiratan D’Ambrósio, Chaim Samuel Hong, Ale- xandre Augusto Martins Rodrigues. O progresso científico no Brasil começa a ganhar estrutura no campo da tec- nologia com a criação do Instituto de Pesquisas e Tecnologia de São Paulo, ainda na década de 1930. Mais tarde, no início dos anos 50, é criado o Conselho Nacional de Pesquisa (CNPq), que teria como um de seus objetivos levar o Brasil a alcançar o desenvolvimento econômico, o que se daria a partir do investimento na produção científica e tecnológica, além do investimento na formação do cientista. A criação do CNPq possibilitou o surgimento de instituições científicas como o Instituto Nacional de Matemática Pura e Aplicada. Como reforço ao alcance dos objetivos do CNPq, foi criada a Coordenado- ria de Aperfeiçoamento de Pessoal de Nível Superior – CAPES, com o objetivo de capacitar o docente universitário, por meio de bolsa de estudo e auxílio à pesquisa (Moraes, 2011). Cientistas brasileiros ganharam notoriedade no estrangeiro e conseguiram resultados de repercussão internacional na pesquisa científica e tecnológica como; o desenvolvimento de uma lógica matemática paraconsistente, dirigido pelo professor Newton Afonso da Costa. N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 16 NILSON SÁ COSTA FILHO Investindo cerca de 0,7% de seu Produto Interno Bruto (PIB) em Ciência e Tecnologia, o governo Federal consolidou, em meados dos anos 80, a pesquisa acadêmica no país (Santos e Andrade, 2006). De acordo com os autores, em grande parte, estudos e descobertas ainda não estão voltados para o atendimento dos inte- resses e necessidades da sociedade. Espera-se, porém que a ciência esteja voltada aos interesses da humanidade, para a solução de problemas e aflições, cura de doenças, viver bem no mundo das tecnologias e aperfeiçoamento das técnicas, entre outros. O conhecimento ainda é visto como forma de separação da sociedade em estratos, a separação se esta- belece entre os que pensam e utilizam a cabeça, e os que executam e utilizam as mãos. (...) a ciência, ao invés de aumentar, entre as mãos do operário, as forças pro- dutivas deste último e de fazer com que delas tireproveito, está por quase toda parte dirigida contra ele. O saber torna-se instrumento que se pode separar do trabalho e até ser-lhe oposto. ( Gorz, apud Santos e Andrade, 2006, p.13) Um filme que faz refletir sobre essa questão é “O Óleo de Lorenzo”. Além de emocionante, aborda a questão da pes- quisa e a comunicação científica, interesses dos pesquisa- dores no que se refere ao que pesquisar, a questão do pa- trocínio e investimento em pesquisa. É um filme baseado em fatos reais, conta a história de um casal que descobre a doença incurável do filho, uma doença rara e hereditária que ataca crianças entre os cinco e dez anos, deteriorando as células do cérebro lentamente, provocando nelas uma cascata de efeitos irreverssíveis. Existe um jogo de raciocínio lógico encontrado em vários sites como o http:// rachacuca.com.br/teste-de-einstein/ chamado desafio de Einstein que é um fascinan- te desafio lógico, é supostamente visto por sua aparente enorme complexidade de solução. Vamos brincar um pouco: Teste de QI de Einstein Albert Einstein criou este teste de QI e afirmou que 98% da população mun- dial não é capaz de resolvê-lo. Bem as informações são as seguintes: 1.3 Tabelas 17 ESTATÍSTICA EDUCACIONAL Há cinco casas de 5 diferentes cores, em cada casa mora uma pessoa de uma diferente nacionalidade. Esses cinco proprietários bebem diferentes bebidas, fumam diferentes tipos de cigarro e têm um certo animal de estimação. Aliás, nenhum deles possui o mesmo animal nem fumam o mesmo cigarro ou bebem a mesma bebida. São dadas 15 pistas abaixo: 1. O Norueguês vive na primeira casa. 2. O Inglês vive na casa Vermelha 3. O Sueco tem Cachorros como animais de estimação. 4. O Dinamarquês bebe Chá. 5. A casa Verde fica do lado esquerdo da casa Branca. 6. O homem que vive na casa Verde bebe Café. 7. O homem que fuma Pall Mall cria Pássaros. 8. O homem que vive na casa Amarela fuma Dunhill. 9. O homem que vive na casa do meio bebe Leite. 10. O homem que fuma Blends vive ao lado do que tem Gatos. 11. O homem que cria Cavalos vive ao lado do que fuma Dunhill. 12. O homem que fuma BlueMaster bebe Cerveja. 13. O Alemão fuma Prince. 14. Norueguês vive ao lado da casa Azul. 15. O homem que fuma Blends é vizinho do que bebe Água. Agora vem a questão intrigante quem tem um peixe como animal de estima- ção? Bem como você percebeu existe várias informações onde a maiorias dos sites que contem o desafio apresenta um recurso estatístico para resolvê-lo que é nada mais é que uma tabela, contudo sem esse recurso a resolução desse desafio seria muito mais complicado. Então é percebido que depois da coleta de dados há a necessidade de tabulá-os para que possamos estudá-los, fazer comparações entre dados e fazer inferências. Podemos representar ou organizar esses dados através de tabelas ou gráficos. Estudaremos agora cada um deles. A tabela deve ser elaborada segundo a Resolução nº 886, de 26 de outubro de 1966, do Conselho Nacional de Estatística. Na construção de tabelas devemos estar atentos a alguns detalhes: - Não deve conter casas, ou seja, células em branco; - Em toda a tabela deve-se manter a mesma quantidade de casas decimais; - Na lateral a tabela não é fechada, não se coloca linha vertical para fechar a tabela. - É facultativo o uso de linhas verticais para separar colunas. Saiba mais Ficou curioso com o nosso desafio? Então acesse o site do desafio e faça parte desse grupo seleto que conseguiu resolver esse problema tão intrigante. N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 18 NILSON SÁ COSTA FILHO A tabela possui vários elementos, são eles denominados essenciais 1.3.1 Elementos essenciais: • Título - o título deve sempre responder a três questões: o que? Onde? Quando? Em nosso exemplo acima a tabela respondeu as três perguntas: Número de salas existentes na escola por dependência responde a pergunta: o que? Brasil, responde a pergunta: onde? E o ano 2012 responde a pergunta: quando? • Corpo - onde estão contidas as informações numéricas das linhas. • Cabeçalho - parte que fica acima e identifica o conteúdo das linhas. Na tabela acima, onde temos: número de salas existentes, total, pública e privada, tem-se o cabeçalho. • Coluna Indicadora - também identifica o conteúdo das linhas, por exemplo, onde temos total, temos uma coluna indicadora, e em pública outra coluna indicadora 19 ESTATÍSTICA EDUCACIONAL 1.3.2 Elementos complementares: • Chamadas- são explicações, esclarecimentos a respeito de detalhes de determinada célula. • Fonte- informa a origem dos dados. Aparece abaixo da tabela, ou seja, no rodapé. • Notas- são explicações acerca do geral. Assim como a fonte também aparece no rodapé da tabela. Exemplo: N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 20 NILSON SÁ COSTA FILHO 1.4 Gráficos Os gráficos servem para representar dados de forma mais simples, onde qualquer pessoa possa analisar as informações. Existem vários tipos, a escolha de qual gráfico utilizar depende da maneira que se requer esclarecer informações. Tem-se os gráficos de setores, barras, colunas, pictogramas, dentre outros. Aqui falaremos dos principais gráficos. 1.4.1 Gráficos de Setores É utilizado quando se pretende analisar dados comparando cada um com o total. Para a construção deste tipo de gráfico utilizaremos a freqüência relativa simples em porcentagem, conceito que você já estudou anteriormente. O gráfico de setores também é chamado de gráfico de pizza. Assim como a tabela, os gráficos também devem ter títulos, que deverão res- ponder as perguntas: o que? Onde? Quando? Para construir o gráfico de setores é necessário que haja uma certa propor- ção. Faz-se um cálculo para descobrir o ângulo correspondente a cada dado. Utili- zando regra de três simples temos que 1% corresponde a 3,6°. Por exemplo, se você quer representar 26% no gráfico, deve-se multiplicar 26% por 3,6°, e encontramos o ângulo correspondente a esta porcentagem que é 93,6°. 21 ESTATÍSTICA EDUCACIONAL Educação Superior Matrículas por dependência administrativa no Brasil e Regiões – 2011 Fonte: Anuário Brasileiro de Educação Básica 2013 Fonte: Censo Escolar da Educação Básica 2012 Resumo Técnico N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 22 NILSON SÁ COSTA FILHO 1.4.2 Gráfico de Colunas Neste tipo de gráfico, utilizam-se retângulos na posição vertical. Como nos exemplos abaixo que representam dados sobre a educação especial retirados do Anuário Brasileiro de Educação Básica 2013. 23 ESTATÍSTICA EDUCACIONAL 1.4.3 Gráfico de Barras É semelhante ao gráfico de colunas. A diferença é que neste tipo de gráfico os retângulos estão dispostos na posição horizontal. Segundo Anuário Brasileiro de Educação Básica 2013 o professor Tufi Ma- chado Soares, da Universidade Federal de Juiz de Fora (UFJF), utilizou dados e tabelas para estudar em profundidade a questão do atraso escolar N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 24 NILSON SÁ COSTA FILHO Gráficos de Linhas Este gráfico é utilizado quando se deseja comparar os dados em relação ao tempo. 25 ESTATÍSTICA EDUCACIONAL 1.4.4 Pictogramas Este gráfico tem como objetivo trazer clareza nas informações de forma que até pessoas leigas tenham acesso a tais informações. Geralmente utiliza-se de dese- nhosrelacionados ao objeto de estudo. ________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ __________________________________ N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 26 NILSON SÁ COSTA FILHO ATIVIDADE Prezado(a) acadêmico(a), como você deve ter percebido o os gráficos e tabe- las é um recurso que pode ser usado por qualquer pessoa, eles são aplicáveis desde a educação elementar até a pesquisa avançada em várias áreas. Agora sugerimos que você faça as seguintes atividades. 1) Responda: qual é o gráfico que representa melhor as informa- ções da tabela abaixo e contrua esse gráfico. 2) Abaixo temos representado em uma tabela o número de horas que 38 alunos gastam em frente ao computador nas horas livres. Cons- trua uma tabela para as freqüências relativas e um gráfico de setores que represente estas freqüências. Número de alunos Número de horas 12 10 5 4 5 6 3 8 13 12 27 ESTATÍSTICA EDUCACIONAL 3) A tabela abaixo foi retirada do Anuário de Educação Brasileira, ela representa o número de matrículas por modalidade de ensino no ano de 2007. Construa um gráfico de setores e um gráfico de colunas. 4) Represente os dados da tabela abaixo através de gráfico de bar- ras: Modalidade de Ensino Número de matrículas em 2007 Educação Infantil 18.389 Educação Fundamental 151.323 Ensino Médio 14.987 Educação Especial 103 EJA 23.403 N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 28 NILSON SÁ COSTA FILHO 5) Descreva sobre o que o grafico representa. D is tr ib ui çã o de F re qu ên ci as2CAPÍTUL O OBJETIVO DESTE CAPÍTULO Fornecer as bases conceituais de modelos estatísticos para calcular e interpre- tar números índices Nas aulas anteriores você aprendeu que os dados podem ser organizados em tabelas e gráficos. Vimos os elementos de uma tabela e os principais tipos de gráficos e você deve ter percebido a importância dessas ferramentas na organização de um conjunto de dados. Neste capítulo, estudaremos distribuição de frequências de dados. Em alguns casos, existem conjuntos de dados com muitas informações, muitas entradas e é pra- ticamente inviável analisar esses dados. Então, buscando uma melhor análise desses dados, utilizamos uma tabela resumida na qual agrupamos os valores em intervalos de classes, ou seja, em grupos de classes. Denominamos essa tabela distribuição de frequência. Para construirmos uma distribuição de frequência, devemos estudar e enten- der alguns conceitos: 2.1 Dados brutos, Rol e Amplitudes N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 30 NILSON SÁ COSTA FILHO 2.1.1 Dados brutos São os dados obtidos na coleta de dados e eles ainda não estão organizados. 2.1.2 Rol de Dados É uma forma de organizar os dados brutos, na qual eles são dispostos em ordem crescente ou decrescente. Exemplo: Dados brutos: 2 9 4 8 11 89 6 1 0 66 Rol de Dados: 0 1 2 4 6 8 9 11 66 89 2.1.3 Amplitude total Esta medida é dada pela diferença entre o maior e o menor valor. Para o exemplo acima a amplitude total é: têm como objetivo representar dados de forma resumida. São elas: média, moda e mediana. 2.1.4 Amplitude de classe é a diferença entre o limite superior e o limite inferior da classe. 31 ESTATÍSTICA EDUCACIONAL 2.1.5 Limite das classes São os limites inferior, que é o menor valor do intervalo de classe e os limites superior que é o maior valor do intervalo de classe. Utilizamos a notação nos limites de classe. Ex: 15|- 20 15 é o limite inferior 20 é o limite superior E o símbolo representa inclusão do limite inferior e exclusão do limite superior. Para melhor compreensão, é como se os dois valores estivessem expressos em intervalo fechado e aberto: [ 15, 20), ou seja o 15 pertence ao intervalo e o 20 não pertence ao intervalo. 2.1.6 Classes Numa tabela com intervalos de classe precisamos saber o número de classes necessárias para agrupar os dados. Existem duas fórmulas para descobrirmos o número de classes: que é a Regra de Sturges Em que n é o total de valores do conjunto. 2.1.7 Intervalo de classes Conhecendo o número de classes, devemos determinar o intervalo de clas- ses. Utilizamos a seguinte fórmula: N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 32 NILSON SÁ COSTA FILHO Em que At é a amplitude total e k o número de classes. Ponto médio: é a média aritmética entre o limite inferior e o limite superior. 2.2.1 Frequência simples É a frequência dos valores de um intervalo. 2.2.2 Frequência relativa simples É a frequência simples dividida pelo total das frequências, ou seja, pelo tamanho da amostra. Exemplo: 2.2 Tipos de Frequêcias (frequência simples) (frequência relativa) % 10 4 29 3 2 14 4 5 36 7 3 21 Total 14 100 33 ESTATÍSTICA EDUCACIONAL As respectivas frequências relativas de nossa tabela são: Perceba que essas frequências são dadas em porcentagem e por isso está es- pecificado na tabela o símbolo de porcentagem. Ao fazermos as divisões, multiplica- se o resultado por 100 para que se tenham as frequências percentuais. 2.2.3 Frequência acumulada É a soma da frequência da classe com a frequência das classes anteriores a ela. 2.2.4 Frequência relativa acumulada É a frequência acumulada dividida pelo total das frequências, ou seja, pelo tamanho da amostra. (frequência simples) (frequência acumulada) 10 4 4 3 2 6 (4+2) 4 5 11(4+2+5) 7 3 14 (4+2+5+3) Total 14 N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 34 NILSON SÁ COSTA FILHO Exemplo: As respectivas frequências relativas acumuladas de nossa tabela são: Então vamos agora construir uma distribuição de frequências. Na tabela abaixo temos as notas de 40 alunos do Ensino Médio da Escola Esperança. Organize esses dados através de distribuição de frequências. Primeiramente, organizaremos esses dados brutos em rol de dados crescente: 35 ESTATÍSTICA EDUCACIONAL A amplitude total é: O número de classes: O intervalo de classes: Obs: Na hora de contar a frequência da classe, lembre-se que o limite inferior pertence ao intervalo, mas que o limite superior não pertence. Na primeira classe,conferem-se os valores de 3,0 até 4,1 inclusive o 3,0; mas o valor 4,1 não é conferido. Na segunda classe, conferem-se os valores de 4,1 até 5,2 inclusive o 4,1; mas o valor 5,2 não é conferido. O mesmo acontece para as outras classes. N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 36 NILSON SÁ COSTA FILHO Cálculo das frequência relativas simples: Podemos representar uma distribuição de frequência através do histograma e polígono de frequência. Histograma de frequência: é um gráfico de barras em que os retângulos são justapostos, na vertical estão representadas as frequências das classes. 37 ESTATÍSTICA EDUCACIONAL Polígono de frequências: é um gráfico de linhas. Na construçãodesse tipo de gráfico precisamos do ponto médio de cada intervalo de classes. N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 38 NILSON SÁ COSTA FILHO ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ _____________________________________________________________ Prezado (a) acadêmico(a), como você deve ter percebido que distribuição de frequências de dados otimiza a análise de dados. No entanto vale ressaltar que apesar dessa vantagem, é necessário estarmos atentos às atividades de forma mais ampla. Convidamos agora a você a resolver algumas questões sobre esse assunto. 1) Na tabela abaixo, calcule as frequências relativas do número de instituições por região nas Universidades, Centros Universitários, Faculdades, IF e CEFET. ATIVIDADE 39 ESTATÍSTICA EDUCACIONAL 2) Seja o conjunto de dados: 3, 4, 4, 5, 7, 6, 6, 7, 7, 4, 5, 5, 6, 6, 7, 5, 8, 5, 6, 6. a) Construa a tabela de intervalo de classes. b) Construa o histograma de frequências. c) Construa o polígono de frequências. d) Qual é a porcentagem de elementos maiores que 5? M ed id as E st at ís ti ca s 3CAPÍTUL O OBJETIVO DESTE CAPÍTULO Demonstrar os fundamentos teóricos e práticos de duas importantes medidas da estatística Você aprendeu anteriormente a organizar informações e dados através de tabelas, gráficos e distribuições de frequências. Agora você estudará medidas de tendência central, essa denominação decorre do fato que todos os valores de dados estão agrupados em torno de um valor central. Mas também podem ser chamadas de medidas de posição. Essas medidas que estudaremos têm como objetivo representar dados de forma resumida. São elas: média, moda e mediana. 3.1.1 Média Existem alguns tipos de média, são eles: média aritmética simples, média aritmética ponderada, média geométrica e média harmônica. 3.1.2 Média Aritmética Simples Você já deve ter ouvido falar em média aritmética – afinal, quem nunca cal- culou sua média na escola? A maioria das pessoas conhece essa medida e já sabe até calcular. 3.1 Medidas de tendência central N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 42 NILSON SÁ COSTA FILHO Esta média é a medida de tendência central utilizada com mais frequência. Se tivermos um conjunto de dados não agrupados, a média aritmética simples é dada pela soma de todos os valores desse conjunto, dividida pelo total desses valores. Vamos expressar matematicamente: Em que i= 1, 2, 3, ..., n e n é o total de valores. Perceba que ao tratarmos de média amostral usamos a notação e para média da população usamos µ. Vejamos alguns exemplos: 1. Determinar a média aritmética simples dos seguintes valores: 1, 2, 7, 8 e 9. 2. Determinar a média aritmética simples do conjunto de notas dos alunos da Escola Santa Maria: 7,0; 2,5; 4,0; 7,5; 8,0 e 9,5. 3. Abaixo está parte de uma tabela que indica quantidade de matrículas em tempo integral no ano de 2011 (Fonte: Anuário Brasileiro da educação básica,2013). De- termine a média das matrículas nos estados do Pará, Rondônia e Acre. 43 ESTATÍSTICA EDUCACIONAL Fonte: Anuário Brasileiro da educação básica, 2013 No Pará, temos que a média aritmética simples é dada por: Em Rondônia, temos que a média aritmética simples é dada por: No Acre, temos que a média aritmética simples é dada por: Observação: a média é influenciada por valores extremos. Exemplo: encontre a média da amostra de idades de uma classe. 19 19 18 18 21 21 69 20 20 20 20 20 N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 44 NILSON SÁ COSTA FILHO A média foi influenciada pelo valor 69, a média encontrada é maior que 11 desses dados. Para este exemplo, a média não é a melhor medida de tendência cen- tral a ser utilizada. 3.1.3 Média Aritmética Ponderada Esta média é utilizada quando temos um conjunto de dados agrupados. Quando existem valores que se repetem mais do que outros, ou seja, aparecem com maior frequência que outros dados. O cálculo consiste em multiplicar cada valor da distribuição por sua respectiva frequência, que depois de somados, serão divididos pela quantidade total de valores.Esse processo é representado matematicamente pela seguinte fórmula: Em que i= 1, 2, 3, ..., n, fi é a frequência simples e n é o total de valores. Exemplos xi fi 10 2 3 1 2 0 5 3 45 ESTATÍSTICA EDUCACIONAL Neste exemplo, a tabela nos forneceu apenas a freqüência acumulada. Mas precisamos também da frequência simples.Para isso, basta acrescentar uma coluna e descobriremos as frequências simples. Determine a média aritmética da distribuição abaixo: Neste caso precisaremos calcular o ponto médio de cada intervalo: Idade Frequência Ponto médio 10 14 5 12 14 18 1 16 18 22 4 20 22 26 3 24 N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 46 NILSON SÁ COSTA FILHO 3.1.4 Média Geométrica É utilizada para o cálculo do índice do custo de vida, da estimativa do cresci- mento demográfico, etc. A média geométrica é dada por: Em que n é o total de valores do conjunto de dados. Exemplos: Determine a média geométrica dos valores 3, 1 e 9. Determine a média geométrica dos valores 3, 5, 7, 1 e 8. 3.1.5 Média Harmônica Um exemplo de utilização desta medida de tendência central é o cálculo das médias de velocidade. A média geométrica é dada por: Em que n é o total de valores do conjunto de dados. Determine a média harmônica dos valores 4, 2, 3 e 5 47 ESTATÍSTICA EDUCACIONAL Determine a média harmônica dos valores 1, 3, 5 3.1.6 Mediana Esta medida de tendência central é aquela que divide o conjunto de dados em duas partes iguais. É preciso que os valores estejam ordenados de forma cres- cente ou crescente. Para o cálculo da mediana, procedemos da seguinte forma: Para n ímpar, a mediana é dada por Para n par, a mediana é dada pela média entre os termos n/2 e (n/2) +1. Veja alguns exemplos: Determine a mediana dos valores 3, 8, 2, 11, 9, 7, 1 e 12. Ordenando os dados: 1, 2, 3, 7, 8, 9, 11 e 12 n = 7, n é ímpar, então a mediana é dada por [(7+1)/2]=4. A mediana será o 4° valor do conjunto de dados, logo . Determine a mediana dos valores 20, 3, 4, 14, 19, 8, 9 e 2 Ordenando os dados: 2, 3, 4, 8, 9, 14, 19 e 20 n = 8, n é par, então a mediana é dada por (8/2)=4. A mediana será o 4° valor do conjunto de dados, logo . N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 48 NILSON SÁ COSTA FILHO Quando os dados estão agrupados em intervalos de classes, o procedimento para o cálculo da mediana é outro. É dado pela fórmula abaixo: lMd limite inferior da classe mediana fa frequência acumulada da classe anterior a classe mediana n é o número de elementos h amplitude da classe mediana FMd freqüência da classe mediana Dada a distribuição abaixo, determine a mediana: Acrescentamos uma coluna que conterá a frequência acumulada. Idade Frequência 10 13 513 16 2 16 19 4 19 22 3 Idade Frequência 10 13 5 5 13 16 2 7 16 19 4 11 19 22 3 14 49 ESTATÍSTICA EDUCACIONAL A classe da mediana é a segunda, pois , e este valor encontra-se na segun- da classe. Calculemos a mediana: 3.1.7 Moda Moda de um conjunto de dados é aquele valor que aparece com maior fre- quência em uma circunstância dada. Podemos ter uma distribuição que não tenha moda, que chamamos de amodal; e podemos ter distribuição bimodal, com duas modas;trimodal, com três modas; e polimodal, em que mais de três valores se repe- tem. A moda não é influenciada por valores extremos. Exemplos: 2, 7, 9, 6, 4 Temos um conjunto de dados amodal, pois todos os valores tem a mesma frequência, pois aparecem apenas uma vez. 3, 4, 5, 5, 5, 8 A moda é 5, pois é o valor de maior frequência, já que ele aparece mais vezes que os outros. Idade Frequência 35 45 5 5 45 55 12 17 55 65 14 31 65 75 3 34 75 85 6 40 85 95 9 49 N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 50 NILSON SÁ COSTA FILHO O cálculo da moda para dados agrupados em intervalos de classe é dado por: h= amplitude da classe l = limite inferior da classe modal = frequência da classe modal – frequência da classe anterior =frequência da classe modal – frequência da classe posterior Vamos calcular a moda: A classe modal é a 3ª, pois é a que tem a maior frequência. Idade Frequência 35 45 5 45 55 12 55 65 14 65 75 3 75 85 6 85 95 9 51 ESTATÍSTICA EDUCACIONAL 3.2 Medidas de Dispersão No tópico anterior, estudamos as medidas de tendência central. Mas além da tendência central, um conjunto de dados também pode ser analisado em relação a sua variação: a dispersão dos valores em torno de um valor central, que é a média. Esse cálculo é chamdo de medidas de dispersão ou medidas de variação. Mas aqui adotaremos a denominação medidas de dispersão. São elas: amplitude total, desvio absoluto, variância, desvio padrão e coeficiente de variação. 3.2.1 Amplitude total De todas as medidas de dispersão, esta é a mais simples e é bem limitada, pois depende somente dos valores externos. A amplitude total é determinada pela diferença entre o maior e menor valor do conjunto de dados. Para determinar a amplitude, ordenam-se os valores em ordem crescente ou decrescente, sendo mais comum em ordem crescente. Exemplo: Duas faculdades contrataram 5 professores. Os salários iniciais, tanto na faculdade A, como na B, estão mostrados nas tabelas a seguir: FaculdadeA (Salário em reais) Faculdade B (Salário em reais) 2.500 3.700 3.100 2.850 3.000 2.800 2.750 3.000 3.200 4.000 N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 52 NILSON SÁ COSTA FILHO Amplitude total para a faculdade A Ordenando os valores: 2.500, 2.750, 3.000, 3.100, 3.200 Amplitude total para faculdade B Ordenando os valores: 2.800, 2.850, 3.000, 3.700, 4.000 O que você pode concluir com esses resultados? ______________________________________________________________________ ______________________________________________________________________ ____________________________________________________________________ 3.2.2 Desvio Absoluto Médio Utilizando o exemplo anterior, vamos calcular quanto cada salário está afas- tado da média aritmética. Faremos a diferença entre o salário e a média aritmética. A média aritmética para os salários da faculdade A é Agora fazendo as diferenças: 2.500- 2.910= -410 2.750- 2.910= -160 3.000- 2.910=90 3.100- 2.910= 190 3.200- 2.910=290 53 ESTATÍSTICA EDUCACIONAL Ao somarmos todos esses valores, encontraremos o resultado igual a zero. Então, utilizamos um artifício matemático para que essa soma não dê zero, utiliza- mos módulo, pois o módulo de um número sempre é positivo. Ao módulo de cada um desses desvios chamamos de desvio absoluto. E quando calculamos a média desses desvios absolutos temos o desvio ab- soluto médio, que é uma das medidas de dispersão. Agora vamos calcular o desvio médio absoluto dos salários da faculdade B. A média aritmética para os salários da faculdade B é: Agora fazendo as diferenças: 2.800- 3.270 = -470 2.850- 3.270 = -420 3.000- 3.270 = -270 3.700- 3.270 = 430 4.000- 3.270 =730 N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 54 NILSON SÁ COSTA FILHO O que você pode concluir com esses resultados, já que o desvio médio abso- luto da faculdade A é menor que o da faculdade B? ______________________________________________________________________ ______________________________________________________________________ _____ Em resumo, temos que o desvio absoluto médio é dado pela fórmula: ou Em que é a média aritmética e n o total de valores. 3.2.3 Variância A variância é outra medida de dispersão que avalia a variabilidade de valores em torno da média. Utilizamos a notação para representar a variância. A variância para dados não agrupados é dada pela média aritmética entre os quadrados dos desvios. Observe que a fórmula é parecida com a do desvio absoluto médio, a diferença é que cada desvio é elevado ao quadrado. ou 55 ESTATÍSTICA EDUCACIONAL Vamos calcular a variância para dados não agrupados. Exemplo: Utilizando o exercício anterior, que informa os salários de funcio- nários de duas faculdades: Para a faculdade A tivemos o seguinte desvio absoluto médio: Então, para calcular a variância devemos elevar cada desvio ao quadrado: Para dados não agrupados ponderados: No caso de variância amostral, o denominador deve ser igual a n-1. E a no- tação não é mais e sim S². Faculdade A (Salário em reais) Faculdade B (Salário em reais) 2.500 3.700 3.100 2.850 3.000 2.800 2.750 3.000 3.200 4.000 N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 56 NILSON SÁ COSTA FILHO Exemplo: Determine a variância da distribuição amostral abaixo: Para sermos práticos, acrescentamos mais uma coluna na tabela: Calculamos a média aritmética: E inserimos mais duas colunas na tabela: xi fi 5 2 7 3 8 5 9 4 5 2 10 7 3 21 8 5 40 9 4 36 5 2 10 (5 - 7,64)² = 6,97 13,94 7 3 21 (7 - 7,64)² = 0,41 1,23 8 5 40 (8 - 7,64)² = 0,13 0,65 9 4 36 (9 - 7,64)²= 1,85 7,40 Total 14 23,21 57 ESTATÍSTICA EDUCACIONAL No caso de dados agrupados em intervalos de classes, utilizaremos o ponto médio de cada intervalo. Exemplo: Seja o exemplo abaixo uma distribuição populacional Vamos calcular primeiramente a média aritmética: Idade Frequência Ponto médio 10 14 5 12 14 18 1 16 18 22 4 20 22 26 3 24 Idade Frequência Ponto médio 10 14 5 12 60 14 18 1 16 16 18 22 4 20 80 22 26 3 24 72 Total 13 228 N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 58 NILSON SÁ COSTA FILHO Agora vamos determinar a variância: 3.2.4 Desvio padrão No exemplo acima calculamos o desvio padrão da distribuição populacional cuja variável de estudo é a idade. A variância tem como resultado a unidade da variável ao quadrado, então temos o resultado idade ao quadrado, o que não tem muita lógica. Então, para retornarmos à unidade anterior que é idade, calculamos a raiz quadrada da variância. Esta nova medida de dispersão é chamada de desvio padrão. A fórmula resume-se a: , quando se trata de população;e , quando se trata de amostra. Parece bem simples, a fórmula é pequena, mas lembre-se que para obter o desvio padrão você deve primeiramentecalcular a variância. Então vamos aos exemplos: Usaremos os exemplos anteriores para os quais já calculamos a variância. Para esse exemplo de distribuição amostral, encontramos a variância: Idade fi Ponto médio 10 14 5 12 60 (12-17,54)²=30,67 153,37 14 18 1 16 16 (16-17,54)²=2,37 2,37 18 22 4 20 80 (20-17,54)²=6,05 24,1 22 26 3 24 72 (24-17,54)²=6,46 125,19 total 13 228 305,15 5 2 7 3 8 5 9 4 59 ESTATÍSTICA EDUCACIONAL Logo, o desvio padrão será dado por: Preste sempre atenção nas notações em relação à amostra e à população. Vamos ao outro exemplo: Temos que a variância é 23,47 e o desvio padrão será: Idade fi Ponto médio 10 14 5 12 60 (12- 17,54)²= 30,67 153,37 14 18 1 16 16 (16- 17,54)²= 2,37 2,37 18 22 4 20 80 (20- 17,54)²= 6,05 24,1 22 26 3 24 72 (24- 17,54)²= 6,46 125,19 total 13 228 305,15 N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 60 NILSON SÁ COSTA FILHO 3.2.5 Coeficiente de variação É uma medida de dispersão que nos permite fazer comparações entre dife- rentes séries analisando a dispersão de cada série em torno da média. Essa medida é dada em porcentagem e utilizamos a seguinte fórmula: Em que é média populacional. E chamamos atenção mais uma vez em relação às notações. A notação aci- ma é para o cálculo do coeficiente de variação populacional. E no caso de variação amostral? Mudamos para: Vamos calcular o coeficiente de variação da faculdade A do exemplo que vimos no começo do livro, no tópico de amplitude total. Vimos que a média aritmética e a variância da faculdade A são respectiva- mente: Temo que o desvio padrão é Então, o coeficiente de variação será: 61 ESTATÍSTICA EDUCACIONAL Deixaremos como exercício o cálculo do coeficiente de variação dos salários da faculdade B, descritos no tópico de amplitude total. Prezado(a) acadêmico(a), para minimizar as dúvidas sugerimos que você faça as atividades abaixo e tire suas dúvidas com os turores eles estão sempre a disposição. 1) Determine a média aritmética entre os valores: a) 2, 7, 9, 6, 4 b) 2, 3, 3, 3, 3, 4, 4, 4, 5,5, 5 c) 5, 7, 0, 4 2) Determine a média aritmética em cada caso: a) Média de matrículas nos Estados de Tocantins e Amazonas ATIVIDADE N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 62 NILSON SÁ COSTA FILHO b) Média do Ideb nas Regiões Sudeste e Sul na escola pública e privada Fonte: Anuário Brasileiro da educação básica 2013 c) Média de matrículas de jovens e adultos no ensino fundamental no ano de 2009 Fonte: Anuário Brasileiro da educação básica 2013 63 ESTATÍSTICA EDUCACIONAL d) Média das estaturas de 20 alunos 3) Uma escola quer analisar o desempenho de seus discentes do 6° ano do ensino fundamental. Calcule a média, a mediana e a moda das seguintes notas: 0,00 3,00 1,00 1,00 7,00 4) Determine a média geométrica entre os valores: a) 2, 8, 9, 7, 4, 5 b) 3, 5, 7, 9, 4, 2 5) Determine a média harmônica entre os valores a seguir: a) 2, 7, 9, 6, 4 c) 3, 5, 7, 9, 10, 13 6) Determine a moda entre os valores: a) 2, 2, 3, 3, 3, 5, 5, 5, 7 b) 6, 5, 3, 10, 11 Estatura (cm) Frequência 150 155 5 155 160 4 160 165 7 165 170 3 170. 175 1 N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 64 NILSON SÁ COSTA FILHO 6) Determine a moda entre os dados de matrículas na educação profissional nas Regiões Norte e Nordeste. E interprete o resultado encontrado. Fonte: Anuário Brasileiro da educação básica 2013 7) Para os valores abaixo, obtidos de uma amostra, calcule o desvio absoluto mé- dio, a variância e o desvio padrão: a) 5, 7, 10, 12, 4, 13, 9 b) 20, 2, 4, 8, 9, 12 65 ESTATÍSTICA EDUCACIONAL 8) Determine a variância e o desvio padrão das distribuições amostrais: a) b) c) 5 2 7 3 1 8 9 1 2 7 5 5 7 4 3 1 9 1 Classes Frequência 20 24 3 24 28 1 28 32 4 32 36 0 36 40 3 N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 66 NILSON SÁ COSTA FILHO 9) Na tabela abaixo, os dados não estão agrupados em intervalos de classes. Pede-se para calcular: a) amplitude total de matrículas em tempo integral no ensino médio. b) o desvio médio absoluto de matrículas em áreas remanescentes de quilom- bos nos anos iniciais. c) a variância de matrículas em áreas remanescentes de quilombos nos anos iniciais. d) o desvio padrão de matrículas em áreas remanescentes de quilombos nos anos iniciais. e) a variância de matrículas em tempo integral no ensino médio. f) o desvio padrão de matrículas em áreas remanescentes de quilombos nos anos finais. g) Interprete os resultados encontrados. Fonte: Anuário Brasileiro da educação básica 2013 A pl ic aç ão d e P ro ce di m en to s E st at ís ti - co s a D ad os E vi de nc ia do s na E sc ol a 4CAPÍTUL O Objetivos do capítulo O objetivo deste capítulo é fazer com que o aluno seja capaz de criticar sendo alicerçando com uso de estatística como parte da pesquisa científica Introdução Caro aluno vamos supor a seguinte situação: Você é um profissional da área da educação e deseja estudar as taxas de repetência em escolas do seu município. Pois você já ouviu as pessoas falarem que no Brasil essas taxas ainda são muito altas. Então diante dessa situação você quer conhecer especificamente a verdadeira realidade da educação na cidade em que você mora. Mas como você procederia inicialmente? Você deve ter respondido que iria atrás de informações na secretaria da esco- la ou que buscaria essas informações que estão disponíveis no MEC. Certo, essas são algumas fontes importantes onde encontramos dados que foram encontrados através de um censo escolar. Pergunta-se como instituições tais como o MEC obtiveram esses dados e tira- ram conclusões a respeito deles? É o que iremos estudar em nosso capítulo. A Estatística é divida em descritiva e inferencial. A Estatística Descritiva é aquela responsável por coletar, organizar, resumir e apresentar dados, enquanto a Inferencial trata de fazer inferências, tirar conclusões sobre esses dados. Como primeiro passo para uma pesquisa utilizaremos a Estatística Descritiva. Mas o que você entende por pesquisa? Para que serve uma pesquisa? Por que gasta-se com pesquisas? Segundo GIL (1989, pg 43) a pesquisa é baseada pela simples satisfação de conhecer ou também é uma prática, quando deseja-se conhecer para agir. N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 68 NILSON SÁ COSTA FILHO Por que o Brasil faz censos? Com o objetivo de conhecer a sua realidade em termos de educação, economia, por exemplo quando se faz um censo nas escolas, o intuito é conhecer para que se possa trabalhar nas áreas que estão deficientes, como qualidade do ensino, estrutura escolar, dentre outras. Quando temos um objeto de estudo, temos que coletar dados. Você deve estar pensando que é o primeiro passo a realizar. Não esqueça que tudo deve ser planejado, você não concorda que sem um planejamento as coisas nunca saem do jeito que esperamos? Em vários outros ramos, o Planejamento está presente, por exemplo: na Ad- ministração ele é fundamental e tem até subdivisões, que não cabe comentarmos aqui. Então na Estatística não é diferente, ainda mais que ao tratarmos de pesquisa onde tiraremos conclusões, elas tem que ser confiáveis. Sem o devido planejamento nossa pesquisa pode até desviar-se doseu objetivo. O planejamento da pesquisa estatística tem algumas etapas: Etapa 1: é a etapa em que define-se o problema a ser pesquisado. Vejamos a seguir a idéia de Gil em relação a escolha do problema: No processo de investigação social, a primeira tarefa é escolher o problema a ser pesquisado. Esta escolha, por sua vez, conduz a indagações: Por que pesquisar? Qual a importância do fenômeno a ser pesquisado? Que pessoas ou grupos se beneficiarão com seus resultados? (GIL, 1989, p. 53). Etapa 2: elaborar os objetivos da pesquisa Etapa 3: refere-se a execução da pesquisa Etapa 4: etapa em que faz-se o levantamento dos dados Etapa 5: análise dos dados Etapa 6: resultados alcançados segundo os objetivos traçados Etapa 7: a conclusão da pesquisa 4.1 Planejamento 69 ESTATÍSTICA EDUCACIONAL Você percebeu que o Planejamento diz respeito a toda a pesquisa até chegar à conclusão? Pois sim, cada etapa tem que ser planejada. Atente-se a isto. Pesquisa de levantamento Nesta pesquisa levantamos informações da população ou amostra, utilizan- do-se de ferramentas tais como questionários, entrevistas, etc. Pesquisa Experimental Esta pesquisa é bastante utilizada para resolver problemas específicos. Para GIL: [...] o delineamento experimental consiste em determinar um obje- to de estudo, selecionar as variáveis que seriam capazes de influen- ciá-lo, definir as formas de controle e de observação dos efeitos que a variável produz no objeto. (GIL, 1989, p. 73). Há muitas maneiras de fazer a coleta de dados. O critério de escolha do tipo de coleta de dados depende do objeto de estudo. São algumas delas: Censo- é a contagem de toda uma população. É o que o IBGE geralmente usa. Tenho certeza que você já recebeu em sua casa um agente de pesquisa do IBGE, perguntando quantas pessoas tem em sua casa, quantas trabalham. Então você está participando de um censo, onde todos são entrevistados. Você deve ter assistido em telejornais que o objetivo do censo é alcançar todos os elementos (pessoas) e faz-se até um apelo através dos meios de comunicação para que as pessoas atendam os agentes de pesquisa facilitando assim o processo para realização do censo. Para a educação não é diferente, por exemplo os dados que colocamos neste livro foram tirados de fontes tais como o Anuário Brasileiro de Educação que traz informações cuja fonte é o MEC. E essas informações foram coletadas a parti de um censo escolar. 4.2 Tipos de Pesquisas 4.3 Coleta de Dados N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 70 NILSON SÁ COSTA FILHO Amostra- diferentemente do censo, a amostra é uma contagem de uma par- te da população, o que chamamos de subconjunto da população. Neste tipo de co- leta algumas pessoas são entrevistadas, por exemplo: na sua cidade, deseja-se fazer uma pesquisa sobre o uso de um determinado produto, por se tratar de um objetivo urgente, seria mais demorado entrevistar todos os moradores da cidade, então se decide por entrevistar um determinado número de pessoas. Então você pode perceber que a amostra tem algumas vantagens: o custo é bem menor, você terá economia de tempo, dentre outras. Simulação - é o tipo de coleta que na vida real não seria apropriada. Então este tipo de coleta utiliza modelos matemáticos para reproduzir uma determinada situação. Por exemplo: em automóveis os fabricantes utilizam bonecos para analisar efeitos de colisões sobre um ser humano. Experimento- neste tipo de coleta aplica-se um tratamento a uma parte da população, e a outra parte que não recebe o tratamento recebe o nome de placebo. As conclusões são tiradas a partir de comparações. Temos ainda que a coleta pode ser direta ou indireta. A primeira é aquela onde os dados são obtidos diretamente da fonte, enquanto a coleta indireta é inferi- da de elementos obtidos pela coleta direta. Temos que a coleta direta subdivide-se em: Contínua - quando os dados são obtidos ininterruptamente. Por exemplo: os registros de nascimento, de casamento, de óbito. Periódica - é a coleta realizada em períodos de tempo, em intervalos de tempo. Os censos exemplificam este tipo de coleta, os censos são realizados de 10 em 10 anos. Ocasional - é aquela realizada com a finalidade de atender uma emergên- cia, é feita extemporaneamente. Temos como exemplo a coleta de dados no caso de epidemias. 71 ESTATÍSTICA EDUCACIONAL 4.4 Classificação dos Dados Os dados tem duas classificações: Dados de levantamento ou dados secundários - são dados originais. O objetivo é analisar relações de causa e efeito originados de situações onde existe controle de influência de outros fatores nos dados. Dados de experimento ou dados primários - são dados que estão a nossa disposição, mas foram obtidos de outros estudos. E diferentemente dos se- cundários, neste tipo de dados não há controle de influência de outros fatores nos dados. • Entrevista Segundo GIL (1989, pg 113) pode-se definir entrevista como a técnica que o investigador utiliza frente ao investigado e lhe formula perguntas, com o objetivo de obtenção de dados que lhe interessem a investigação. A entrevista é o instrumento de coleta de dados mais utilizado. Ela serve para obter informações sobre o que as pessoas pensam, esperam, sabem, etc. Citaremos algumas vantagens da entrevista É uma técnica eficiente para entendermos o comportamento de uma pessoa, como citado anteriormente é capaz de mostrar qual é a preferência, desejo, pensa- mento de um ser humano; Possibilita acesso a informações dos mais variados tipos, tais como: preferên- cia por um certo produto doméstico (informação para empresas, industrias), número de pessoas em uma residência família (informação importante para o governo) ; Não exige alfabetização do entrevistado, pois qualquer pessoa pode respon- der a uma entrevista; 4.5 Instrumentos de Coleta de Dados N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 72 NILSON SÁ COSTA FILHO Oferece flexibilidade, pois em numa entrevista quando o investigado não entende as perguntas o entrevistador pode esclarecê-las. A entrevista também tem desvantagens: Respostas falsas que não condizem com a realidade; Custo com aplicação da entrevista e treinamento de entrevistadores. • Questionário São questões apresentadas por escrito as pessoas, onde elas mesmas escre- verão suas respostas. Assim como a entrevista, o questionário tem vantagens e des- vantagens. É capaz de alcançar um bom número de pessoas, pois pode ser enviado por correio; Há economia de recursos, por não precisar de treinamento de pessoal; As pessoas não precisam se identificar, então o questionário não expõe as pessoas; Não há influência do pesquisador. Desvantagens do questionário: Diferente da entrevista, o questionário exclui as pessoas analfabetas; Não há auxílio ao investigado no surgimento de dúvidas em relação as per- guntas. Não há garantia que as pessoas que receberam o questionário, o devolva preenchido. 73 ESTATÍSTICA EDUCACIONAL 4.6 Tipos de Variáveis Um pesquisador precisa conhecer e identificar quatro tipos de variáveis. As variáveis classificam-se em: Qualitativas - são aquelas variáveis que não são numéricas, são variáveis que apresentam atributos ou qualidades. São dividas em: • Nominais- Não existe nenhuma hierarquia ou ordena- mento neste tipo de variável. Exemplo: cidade onde nasceram os alunos do curso de pedagogia • Ordinária- São aquelas em que há uma hierarquia. Por exemplo na sua faculdade tem o diretor, coordenador, secre- tário, aí temos um ordenamento, uma hierarquia. Quantitativas - são variáveis numéricas, podemos mensurá-las. São divi- didas em: •Discreta- São as variáveis quantitativas que assumem va- lores inteiros. Exemplo: número de filhos, número de matrícu- las em uma escola. • Ordinária- São as variáveis quantitativas que assumem valore reais. Exemplo: altura de um aluno da turma B, notas dos alunos da escola Aprender. É a etapa em que os dados são resumidos através de contagem. Os dados são sumarizados e condensados, com o objetivo de deixá-los organizados para a pessoa que vai fazer a análise. Análise Crítica dos Dados Após colhido os dados, devemos analisá-los de forma cuidadosa, com o ob- jetivo de procurar erros, falhas, evitando-se assim erros que possam interferir nos resultados. 4.7 Apuração dos Dados N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 74 NILSON SÁ COSTA FILHO Temos que a crítica pode ser: Externa- quando as causas das falhas originaram-se dos dados obtidos pelo informante (entrevistado) ou por má fé, falta de atenção, má interpretação. Interna- quando observa dos elementos originais dos dados coletados. Análise Exploratória dos Dados São técnicas para extrair informações de conjunto de dados. Já com os dados resumidos e organizados em tabelas e gráficos podemos iniciar o delineamento de hipóteses em nosso objeto de estudo. Em uma pesquisa cada observação individual recebe o nome de unidade elementar. Por exemplo: ao descrevermos nome, idade, temos as pessoas como uni- dade elementar. Empresas também são unidade elementar, podemos descrever o seu CNPJ, número de empregados, etc... E variável é uma característica ou atributo de uma unidade da população. Depois da definição dos objetivos faz-se um plano de amostragem. Neste plano deve constar a unidade a ser selecionada. A escolha da unidade é feita por meio de sorteio, este sorteio define os elementos da população que farão parte da pesquisa. Nem sempre é possível executar uma pesquisa em toda uma população, por questão de tempo, custo, inviabilidade. Então se trabalha com uma amostra, ou seja, uma parte da população. Mas essa amostra tem que conservar as mesmas caracterís- ticas da população, é o que chamamos de representatividade da amostra. Então por isso utilizamos o Plano de Amostragem, em que escolheremos a amostra de forma que continue sendo representativa. Há vários tipos de amostragem, não trataremos de todos e sim dos principais. 4.8 Plano de Amostragem 75 ESTATÍSTICA EDUCACIONAL Amostra aleatória simples É o tipo de amostragem em que todos os elementos de uma população tem a mesma probabilidade de serem selecionados. Na amostra aleatória simples cada elemento da população recebe um núme- ro. Faz-se um sorteio ou pode-se utilizar a TNA (tabela de números aleatórios) para a seleção dos elementos. A TNA pode ser obtida através de softwares. Exemplificando: O professor de educação física desejar pesquisar e estudar a altura dos alunos da sua escola. São 250 alunos matriculados nesta escola, então cada aluno receberá um numero. Os alunos são numerados de 1 a 100 e sorteia-se a amostra desejada. Ou pode-se escolher essa amostra através de TNA. Para calcularmos o tamanho de uma amostra aleatória simples, temos duas fórmulas: Sem conhecer o tamanho da população usamos a fórmula: Conhecendo o tamanho da população usamos a fórmula: Em que N é o tamanho da população e n é o tamanho da amostra e E é o erro tolerável da amostra. Exemplo: Planeja-se um levantamento por amostragem aleatória simples, onde pre- tende-se avaliar várias características da população, que é formada por 600 alunos matriculados numa escola pública de São Luís. Qual deve ser o tamanho mínio de uma amostra aleatória simples, tal que o erro amostral não seja superior a 5%? Como conhecemos a população usamos: N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 76 NILSON SÁ COSTA FILHO Amostra estratificada È uma técnica onde a amostragem é proporcional. É utilizada quando a po- pulação está dividida em estratos, ou seja, sub-populações. E e cada estrato tem características diferentes. Por exemplo, em uma pesquisa eleitoral, não faz sentido entrevistar somente pessoas sem escolarização e tirar conclusões dessa pesquisa. Esta pesquisa estaria errada, ela não seria representativa. Então o que se faz, entre- vista-se pessoas com escolarização, sem escolarização, pessoas da classe média alta, da classe média baixa, idosos e jovens. Então deve haver uma proporção, seleciona- se uma porcentagem de cada estrato e forma-se uma amostra representativa. Exemplo: Em uma turma há 90 alunos, 40 meninos e 50 meninas, deseja-se estudar a variável estatura destes alunos. Objetiva-se fazer o estudo a partir de uma amostra de 15% da turma. Neste caso temos que a amostra deve conter meninos e meninas Temos que 10% da turma é 9 alunos. Amostragem sistemática É a técnica utilizada quando os elementos a serem estudados em uma pes- quisa estão ordenados. O procedimento para escolha de uma amostra sistemática é a seguinte: Divide-se a população pela amostra: Sexo População Porcentagem Amostra F 50 0,10 x 50 5 M 40 0,10 x 40 4 Total 90 9 77 ESTATÍSTICA EDUCACIONAL Cada elemento é numerado de 1 até n, onde n é o total da amostra. Escolhe-se o ponto inicial ou ponto de partida. Escolhe-se o próximo elemento a cada intervalo k. Exemplo: em uma pesquisa que será realizada em um bairro que tem 250 domicílios, e terá uma amostra de 50 domicílios. Atribui-se um número para cada domicilio, de 1 a 250. E faz-se a seguinte divisão Escolhe-se o ponto de partida, o domicílio de número 10. O próximo domicílio escolhido será o de número 15, e assim a cada 5 domi- cílios escolhemos o domicílio que fará parte da amostra. Você começou a fazer uma pesquisa, escolheu o tema, o tipo de pesquisa, coletou os dados, agora você deve apresentar os dados de forma adequada. Você já aprendeu que existem duas maneiras de apresentar os dados: tabelas e gráficos. Aqui iremos comentar alguns aspectos que não foram mostrados em capítulos ante- riores. Apresentação tabular É a forma em que os dados numéricos são apresentados. A tabela é a ferra- menta que nos permite escrevermos os dados de forma ordenada. O processo de representação de dados com uma visão resumida do objeto estudo também acontece por meio de séries estatísticas. Uma série estatística é toda coleção de dados. 4.9 Apresentação dos Dados N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 78 NILSON SÁ COSTA FILHO Vamos ao tipo de séries: Série geográfica- série em que o elemento variável é o local e os elementos fi- xos são fenômeno e época. Essa série também é chamada de Espacial ou Territorial. Fonte Anuário Brasileiro de Educação Básica Série cronológica- série em que o elemento variável é época e os elementos fixos são fenômeno e local. Essa série também é chamada de Histórica ou Temporal. Fonte: Censo Escolar Básico 2012 79 ESTATÍSTICA EDUCACIONAL Série específica- série em que o elemento variável é fenômeno e os elementos fixos são época e local. Também é chamada de Categórica. Fonte: Censo Escolar Básico 2012 Apresentação gráfica Este tipo de apresentação de dados visa facilitar a análise numérica dos da- dos, em que os dados são dispostos através de figuras geométricas, tais como retân- gulos (gráficos de barras e colunas), linhas (gráfico de linha), etc. Resumindo as etapas de uma pesquisa temos: • Planejamento • Coleta de Dados • Apuração dos Dados • Apresentação dos Dados • Análise dos Dados N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 80 NILSON SÁCOSTA FILHO Caro aluno agora chegou o momento de aplicar o que você aprendeu. Os exercícios abaixo são ferramentas para que você assimile melhor o conteúdo. Lem- bre do que estudou e vá em frente. ________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ __________________________________________________________________ Segundo o site Wikipédia a enciclopédia livre, a pesquisa é usada para esta- belecer ou confirmar fatos, reafirmar os resultados de trabalhos anteriores, resolver problemas novos ou já existentes, apoiar teoremas e desenvolvimento de novas teo- rias. Agora vamos por em práticas essa definição com as atividades abaixo: 1) Indique razões de ordem e prática para realização de pesquisa sobre: reli- giosidade, agressividade, preconceito racial e motivação no trabalho. 2) Em uma pesquisa o objetivo é conhecer relação aluno/curso em uma fa- culdade no curso de Licenciatura. Abaixo estão relacionados o que se quer conhecer em relação aos alunos. Pede-se classificar as variáveis em quantitativa contínua, quantitativa discreta, qualitativa ordinal, qualitativa nominal: ATIVIDADE 81 ESTATÍSTICA EDUCACIONAL a) Tempo médio dos alunos para conclusão do curso b) Disciplina em que existe um grande número de reprovação em cada semestre. c) Grau de satisfação do aluno com o curso d) Pontos positivos e negativos do curso, segundo a visão do aluno. e) Interesse dos alunos pelo curso, evitando com isto o abandono. 3) Identifique em cada caso o tipo de coleta de dados: a) Deseja-se fazer uma pesquisa como todas as escolas de São Luís para conhecer a taxa de evasão escolar. b) Uma pesquisa será feita em cinco escolas de São Luís, para estudar a relação idade/ série. c) Uma fábrica vai testar cadeiras brancas, para conhecer qual a capacidade de peso que ela pode suportar. Para isso será utilizado um peso que é elevado e jogado de cima para baixo na cadeira. 4) A UFMA com 3.000 servidores técnicos administrativos deseja estimar a aceitação dos funcionários a um tipo de capacitação relacionada a seu trabalho. Qual deve ser o tamanho de uma amostra aleatória com um não superior a 2%? 5) Deseja-se fazer uma pesquisa em relação a preferência dos moradores de Montes Altos em relação a um certo programa de TV sobre educação. Qual deve ser o tamanho de uma amostra aleatória com um não superior a 1%? 6) Deseja-se estudar a taxa e repetência em duas escolas do mesmo municí- pio no maranhão. Sabe-se que a população é de 456 alunos. Qual deve ser o tama- nho de uma amostra aleatória com um não superior a 3%?l 8) Uma pesquisa a ser feita nas regiões nordeste, com o objetivo de estudar o nível do desempenho dos alunos de escolas públicas em três estados: Pará, com 700 alunos, Maranhão, com 420 alunos, Piauí, com 270 alunos, pretende utilizar uma amostra de tamanho igual a 200 alunos. Represente uma amostragem estratificada desta população através de uma tabela. N ú c le o d e E d u c a ç ã o a D is tâ n c ia - U F M A 82 NILSON SÁ COSTA FILHO 9) Pretende-se utilizar uma amostra sistemática em um grande bairro que tem 350 domicílios, deseja-se conhecer e pesquisar a participação dos pais na educação escolar. A amostra terá 35 domicílios que farão parte da amostra. Descreva os domi- cílios que serão escolhidos. 83 ESTATÍSTICA EDUCACIONAL REFERÊNCIAS BIBLIOGRÁFICAS Anuário Brasileiro da Educação Básica <www.todospelaeducacao.org.br> acessado em 02 de janeiro 2014. ARANHA, Maria Lúcia de Arruda. Filosofando. 4. ed. São Paulo: Moderna.2000. FILHO, Augusto. Estatística Básica Usando o R. Belo Horizonte:Universidade Federal de Minas Geras, 2006. Censo da educação básica: 2012 – resumo técnico. – Brasília Instituto Nacio- nal de Estudos e Pesquisas Educacionais Anísio Teixeira, 2013. CERVO, Amado Luiz; BERVIAN, Pedro Alcino. Metodologia Científica: para uso dos estudantes universitários. 3. ed. São Paulo : MCCRAW-HILL do Brasil, 1983. CERVO, Amado Luiz; BERVIAN, Pedro Alcino. Metodologia científica. 5. ed. São Paulo: Prentice Hall, 2002. 242 p. CHAUÍ, Marilena. Convite à Filosofia. São Paulo: Ática, 1994. GIL, Antonio Carlos. Métodos e Técnicas de Pesquisa Social. São Paulo: Atlas, 1989. GONÇALVES, Fernando Antonio. Estatística Descritiva: uma introdução. São Paulo: Atlas, 1978. LEVIN, Jack. Estatística Aplicada às Ciências Humanas. São Paulo: Harper &Row do Brasil, 1977. NICK, Eva & KELNER, Sheillah. Fundamentos de Estatística para as Ciências do Comportamento. Rio de Janeiro: Renes, 1971. OLIVEIRA, Terezinha. Estatística Aplicada à Educação: Descritiva. Rio de Janeiro: LTC. 1983. TANEJA, Inder Jeet. Estatística aplicada a educação matemática. Florianopó- lis; UFSC/ NEAD/ CED/ CFM, 2007.