Baixe o app para aproveitar ainda mais
Prévia do material em texto
Disciplina Introdução à Estatística Coordenador da Disciplina Prof. José Valter Lopes Nunes 5ª Edição Copyright © 2010. Todos os direitos reservados desta edição ao Instituto UFC Virtual. Nenhuma parte deste material poderá ser reproduzida, transmitida e gravada por qualquer meio eletrônico, por fotocópia e outros, sem a prévia autorização, por escrito, dos autores. Créditos desta disciplina Coordenação Coordenador UAB Prof. Mauro Pequeno Coordenador Adjunto UAB Prof. Henrique Pequeno Coordenador do Curso Prof. Marcos Ferreira de Melo Coordenador de Tutoria Prof. Celso Antônio Silva Barbosa Coordenador da Disciplina Prof. José Valter Lopes Nunes Conteúdo Autor da Disciplina Prof. Marcos Ferreira de Melo Colaborador José Ailton Forte Feitosa Setor Tecnologias Digitais - STD Coordenador do Setor Prof. Henrique Sergio Lima Pequeno Centro de Produção I - (Material Didático) Gerente: Nídia Maria Barone Subgerente: Paulo André Lima / José André Loureiro Transição Didática Dayse Martins Pereira Elen Cristina Bezerra Enoe Cristina Fátima Silva Souza Hellen Paula Pereira José Adriano Oliveira Karla Colares Viviane Sá de Lima Formatação Camilo Cavalcante Elilia Rocha Emerson Mendes Oliveira Francisco Ribeiro Givanildo Pereira Sued de Deus Publicação João Ciro Saraiva Design, Impressão e 3D André Lima Vieira Eduardo Ferreira Iranilson Pereira Luiz Fernando Soares Marllon Lima Programação Andrei Bosco Damis Iuri Garcia Jaques Oliveira Gerentes Audiovisual: Andréa Pinheiro Desenvolvimento: Wellington Wagner Sarmento Suporte: Paulo de Tarso Cavalcante Sumário Aula 01: Conceitos Básicos ....................................................................................................................... 01 Tópico 01: Introdução ............................................................................................................................ 01 Tópico 02: Variável ................................................................................................................................ 04 Tópico 03: População e Amostra ........................................................................................................... 05 Aula 02: Organização de Dados em Tabelas .......................................................................................... 07 Tópico 01: Tabelas ................................................................................................................................. 07 Tópico 02: Tabela de Distribuição de Frequências .............................................................................. 12 Aula 03: Organização de Dados em Gráficos ......................................................................................... 19 Tópico 01: Gráfico de Barras ................................................................................................................. 19 Tópico 02: Gráfico de Linhas ................................................................................................................. 24 Tópico 03: Gráfico de Setores ................................................................................................................ 26 Tópico 04: Distribuição de Frequências ................................................................................................. 27 Aula 04: Medidas de Tendência Central ................................................................................................ 32 Tópico 01: Média ................................................................................................................................... 32 Tópico 02: Moda .................................................................................................................................... 37 Tópico 03: Mediana ............................................................................................................................... 39 Aula 05: Medidas de Dispersão ............................................................................................................... 44 Tópico 01: Introdução ............................................................................................................................ 44 Tópico 02: Amplitude ............................................................................................................................ 45 Tópico 03: Variância .............................................................................................................................. 46 Tópico 04: Desvio Padrão ...................................................................................................................... 51 Tópico 05: Coeficiente de Variação Relativo ........................................................................................ 52 Tópico 06: Aplicações do Desvio Padrão .............................................................................................. 54 Aula 06: Índices ......................................................................................................................................... 57 Tópico 01: Percentagem ......................................................................................................................... 57 Tópico 02: Outros Índices ...................................................................................................................... 61 TÓPICO 01: INTRODUÇÃO Estatística constitui-se basicamente na: Constatamos sua utilização, por exemplo: • No cálculo e registro do número de habitantes, número de nascimentos e mortes por regiões de um país ou estado; • No estudo dos efeitos de diversos tipos de alimentação e medicamentos; • Na previsão das taxas de preferência de um produto por parte da população ou índices de intenção de voto face a uma eleição; • Na apresentação de índices de repetência e evasão escolar, de índices relativos a escolaridade da população e na avaliação de técnicas de ensino e aprendizagem; • No acompanhamento da evolução dos dados econômicos de um país ou estado. Sendo assim o nosso contato com estatística dá-se quase que diariamente, ao ouvirmos rádio, ao assistirmos televisão, ao lermos jornal ou revista, ao visitarmos páginas da internet, etc. Necessitamos de suas técnicas para efetuarmos previsão do tempo, previsão orçamentária, previsão de investimentos, previsão do número de turmas a serem ofertadas no ano seguinte, previsão das doses de um determinado remédio a serem prescritas, etc. Daremos agora uma breve explicação sobre as quatro etapas que compõem o levantamento de dados estatísticos e que foram citadas no início deste capítulo: INTRODUÇÃO À ESTATÍSTICA AULA 01: CONCEITOS BÁSICOS 1 COLETA Etapa em que os dados são obtidos através de um levantamento feito por coletores de informação. Nesta etapa necessitamos do trabalho de um profissional com conhecimento de técnicas para obtenção de dados. Citemos o exemplo de uma pesquisa para obter informações sobre o nível de popularidade de um determinado programa de governo. Neste exemplo é necessário saber o que perguntar, como perguntar e a quem perguntar para que o resultado não seja tendencioso. A pergunta:“Você acha que este dispendioso programa de governo deve ser encerrado?”é inválida, pois ela já sugere que o programa de governo é no mínimo muito caro, e tende a induzir uma resposta negativa do entrevistado. Um outro exemplo ocorre quando pretende-se obter a reação dos consumidores sobre determinado alimento de preparo rápido, onde o entrevistador visita casa por casa, de uma lista pré-determinada,não havendo, entretanto, previsão de retorno quando não há ninguém em casa. Com certeza esta pesquisa falhará em obter a resposta daqueles que mais provavelmente apreciariam o produto: solteiros ou casais nos quais os dois trabalham fora. PROCESSAMENTO Fase em que os dados são organizados através de uma classificação ou de uma ordenação para permitir sua análise e apresentação posterior. É comum dizer que nesta fase os dados são compilados. No exemplo da pesquisa para obter a preferência da população sobre os candidatos em uma eleição, pode-se aproveitar e fazer perguntas acerca da idade, escolaridade, profissão e sexo dos entrevistados. Após uma análise destes dados, pode-se traçar um perfil do eleitor que vota no candidato A, no candidato B, e assim por diante. Tal análise é impossível de ser feita a menos que os dados sejam previamente organizados e classificados. 2 INTERPRETAÇÃO Fase em que os dados são analisados, previsões anteriores são confir- madas ou são desfeitas, novas previsões são efetuadas, dados são confrontados. Nesta fase os dados são analisados e podemos encontrar justificativas para as medidas encontradas. Como um exemplo bem simples analise a situação: Suponha que, após um levantamento, os números 8,9, 9, 8,10, 9,10, 10,9, 8,9, 8, 8,8, 17,10, sejam as idades de 16 alunos de uma classe de segundo ano do ensino fundamental. Temos aí um caso atípico: um aluno com 17 anos entre alunos cujas idades variam entre 8 e 10 anos. O cálculo da média das idades destes alunos será, então, bastante içlnfluenciado pela idade de 17 anos, o que por várias razões pode não ser o desejado. Após uma análise podemos descartar esta idade para obtenção da média. APRESENTAÇÃO Esta é a fase em que os dados são mostrados, na maioria das vezes através de tabelas e gráficos. Veja a tabela 1: Fonte [2] Esta tabela é um exemplo do produto final de um levantamento estatístico. Ela só foi possível de ser confeccionada após a realização das três tarefas anteriores: coleta, processamento e interpretação das informações. Nestas notas será dada atenção somente às fases de processamento, interpretação e apresentação de dados estatísticos. FONTES DAS IMAGENS 1. http://www.adobe.com/go/getflashplayer 2. http://datafolha.folha.uol.com.br/ Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 3 TÓPICO 02: VARIÁVEL Toda informação devidamente coletada é um dado estatístico. O conjunto de valores que um dado estatístico pode assumir é o que nós chamamos de variável. EXEMPLO • Para o dado “sexo” temos dois resultados possíveis: masculino e feminino. Neste caso a variável correspondente ao sexo de um indivíduo pode assumir dois valores. • Para o dado “idade” os resultados possíveis encontram-se no conjunto dos números naturais {0, 1, 2, 3, 4, 5, 6, 7,... }. • Para o dado “grau de instrução” temos como resultados possíveis: 1° Grau, 2° Grau e 3° Grau. VARIÁVEIS QUANTITATIVAS Número de filhos; taxa de evasão escolar; nota, idade, altura e peso de uma pessoa; população de uma cidade, de um estado ou de um país. VARIÁVEIS QUALITATIVAS Nome de um estado, de um país ou de uma cidade; nome, cor de pele e cor de cabelo de uma pessoa situação civil; grau de instrução. EXERCITANDO Classifique as variáveis abaixo como qualitativas ou quantitativas: ◾ Renda familiar ◾ Religião ◾ Jornada semanal de trabalho ◾ Livro mais retirado de uma biblioteca ◾ Candidato de sua preferência ◾ Nível de escolaridade ◾ Taxa de evasão escolar de uma escola no ano de 2009 ◾ Formação profissional ◾ Velocidade de um carro em uma via pública ◾ Tempo de duração de uma pilha. FONTES DAS IMAGENS INTRODUÇÃO À ESTATÍSTICA AULA 01: CONCEITOS BÁSICOS Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 4 TÓPICO 03: POPULAÇÃO E AMOSTRA POPULAÇÃO Entende-se por população um conjunto formado por elementos que têm em comum uma certa característica ou que satisfazem uma mesma propriedade. Como exemplo: o conjunto dos eleitores de um estado, o conjunto dos alunos de uma universidade, o conjunto dos professores de uma cidade, o conjunto dos livros de uma biblioteca, etc. AMOSTRA Uma amostra é um subconjunto finito da população. Veja que neste caso o termo população é mais abrangente do que o usado na linguagem comum, o qual significa o conjunto dos habitantes de um certo lugar. Antes de uma eleição, todas as pesquisas de opinião para eleição de um prefeito são feitas sobre um subconjunto da população. A amostra neste caso é formada pelos eleitores que foram entrevistados e a população é o conjunto de todos os eleitores da cidade. A única pesquisa feita sobre a população é a própria eleição, onde todos os eleitores devem dar a sua opinião (voto) sobre quem deve ser o prefeito. No censo demográfico também são consultadas, em princípio, todas as residências de um país. A coleta dos dados é feita sobre a população. Porém, mesmo neste caso, como podemos verificar no último recenseamento brasileiro, existe um conjunto de informações que são coletadas sobre um INTRODUÇÃO À ESTATÍSTICA AULA 01: CONCEITOS BÁSICOS 5 subconjunto da população, pois de dez em dez casas o número de perguntas a serem feitas é maior do que o normal. Temos aí duas coletas em uma mesma pesquisa: uma sobre a população e uma sobre uma amostra. FÓRUM Discuta, no Fórum da Aula 1, com os colegas ou com o professor tutor, as dúvidas sobre os exercícios ou sobre a matéria da Aula 1. Lembre que sua participação no Fórum vale presença e nota de avaliação. ATIVIDADE DE PORTFÓLIO Vá para a seção Material de Apoio do ambiente SOLAR e baixe o arquivo EXERCICIOS_AULA_1 (Visite a aula online para realizar download deste arquivo.) para abrir a Lista de Exercícios desta aula. Resolva a quantidade máxima de exercícios que puder, individualmente ou em grupo. Os exercícios 2, 3, 4 e 5 correspondem ao trabalho dessa aula que deve ser postado no Portfólio Individual no período marcado na Agenda do ambiente SOLAR, num único documento de texto (doc, docx ou pdf) ou manuscrito e escaneado.” FONTES DAS IMAGENS Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 6 TÓPICO 01: TABELAS Em geral dados estatísticos não podem ou não devem ser apresentados da maneira como foram colhidos. É necessário antes organizá-los como um conjunto de medidas estruturadas que podem ser usadas para extrair informações rápidas e seguras. Na maioria dos casos isto se consegue com a confecção de tabelas e gráficos a partir dos dados obtidos. Uma tabela é essencialmente um quadro que apresenta um conjunto de dados dispostos em linhas e colunas. Uma tabela é constituída pelos seguintes elementos: título, cabeçalho, corpo, coluna indicadora e fonte. A definição de cada um destes elementos será dada tomando como exemplo a tabela abaixo: VERSÃO TEXTUAL Conceitos Titulo Define o tipo de dado que a tabela contém, sua natureza e data que foram colhidos. Cabeçalho Define o tipo de dado contido em cada coluna. Corpo É constituído pelos dados dispostos em linhas e colunas. Coluna Indedificadora Indeficar a origem das informações que cada linha contém . No Caso da tabela 2 os dados pentencem aos estados da região Nordeste. INTRODUÇÃO À ESTATÍSTICA AULA 02: ORGANIZAÇÃO DE DADOS EM TABELAS 7 Fonte É a entidade resposável pelo fornecimento dos dados. O dados apresentados na tabela 2 foram fornecidos Pelo Instituto Brasileiro de Geografia e Estatistica, IBGE. Tabela Completa:1.1 SÉRIES ESTATÍSTICAS Chamamos de série estatística toda tabela que apresenta os dados distribuídos em função do tempo, do local ou da categoria a que eles pertencem. De acordo com a variação dos dados podemos classificar as séries estatísticas em quatro tipos: cronológica, geográfica, categórica e mista. SÉRIE CRONOLÓGICA Também conhecida como série temporal. Os dados variam em função do tempo. A tabela abaixo apresenta o número de telefones no Brasil desde 1997 até 2003. Tabela 3: Número de linhas telefônicas no Brasil por 100 habitantes. Previsão até o ano 2003. 8 SÉRIE GEOGRÁfiCA Também conhecida como série de localização. Os dados são descritos em função de regiões geográficas. Observe o exemplo dado pela tabela abaixo, onde o preço da gasolina é relacionado para onze países: Tabela 4: Preço, em dólares, do litro de gasolina por país. SÉRIE CATEGÓRICA Apresenta os dados distribuídos por diferentes categorias em determinado tempo e local. A tabela abaixo apresenta a distribuição da população brasileira por cor no ano de 1980: Tabela 5: População residente no Brasil segundo a cor de acordo com o censo demográfico Brasileiro de 1980. SÉRIE MISTA Podemos, muitas vezes por necessidade, apresentar combinações dos três tipos de séries. Como exemplo, observe a tabela abaixo: Tabela 6: Terminais Telefônicos em Serviço. Na tabela acima vemos a combinação dos tipos geográfica e cronológica. Os dados são descritos em função da região e do ano. 9 No próximo exemplo temos a combinação dos tipos geográfica e categórica: Tabela 7: População residente no Brasil por sexo, segundo a região, de acordo com o censo demográfico de 1980. Os dados da tabela 7 são apresentados de acordo com a região do país e com o sexo. 1.2 DADOS ABSOLUTOS E DADOS RELATIVOS A tabela abaixo mostra a distribuição dos alunos da Organização Educacional São Santo Santíssimo pelas séries do ensino médio: Tabela 8: Contagem das Matrículas da Organização Educacional São Santo Santíssimo -1999. Os dados representando o número de alunos por cada série estão em valores absolutos. Não foi realizada nenhuma operação sobre eles, a não ser a coleta e contagem desses dados. Os dados apresentados sem nenhuma operação prévia sobre eles, exceto a coleta e a contagem, são chamados de DADOS ABSOLUTOS. Para efeito de comparação é melhor apresentar este dados em termos relativos. Para isso calculemos agora as percentagens de alunos por cada série. Com estes valores podemos formar uma nova tabela: Tabela 9: Contagem das Matrículas da Organização Educacional São Santo Santíssimo -1999. 10 A tabela 9 indica que de cada 100 alunos, 52 frequentam a 1ª série, 36 frequentam a 2ª série e 12 frequentam a 3ª série. Desta forma vemos de maneira direta a contribuição de cada parte no todo. Dados absolutos expressam os resultados de uma coleta de maneira exata e fiel mas não conseguem, de maneira imediata, evidenciar as relações de tamanho entre as grandezas apresentadas. Com este objetivo usamos os dados relativos. Os DADOS RELATIVOS são obtidos dividindo-se as medidas das partes pela medida do todo. Temos assim uma forma rápida de fazer comparações entre as partes. FONTES DAS IMAGENS 1. http://www.adobe.com/go/getflashplayer Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 11 TÓPICO 02: TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS Nesta seção veremos como organizar dados numéricos provenientes de uma amostra muito grande ou mesmo de toda uma população, quando estes se referem a uma única variável quantitativa, tal como: salário dos funcionários de uma empresa; nota dos alunos de uma escola; idade, altura ou peso de um grupo de pessoas; tempo de duração de um conjunto de peças; número de filhos de um grupo de famílias; contagem diária do número de carros que passam por uma via pública. Suponha que os dados abaixo se referem às notas de 52 alunos de uma escola. Percorrendo o conjunto de valores fica fácil encontrar que a menor nota é 2, a maior nota é 8 e os valores observados são 2, 3, 4, 5, 6, 7, e 8. Escrevendo cada valor observado uma única vez segundo uma coluna, obtemos a tabela abaixo: Percorrendo novamente a tabela contamos o número de vezes que cada valor se repete. Chamamos este número de frequência do valor. Deste modo a frequência do valor 2 é 4, do valor 3 é 8, do valor 4 é 8, do valor 5 é 12, do valor 6 é 10, do valor 7 é 6 e do valor 8 é 4. Acrescentando, à última tabela, uma nova coluna contendo as frequências de cada valor obtemos a tabela a seguir: TABELA 11: NOTAS DOS ALUNOS. A tabela acima apresenta os valores de forma mais organizada e nos fornece de maneira imediata informações tais como: menor valor (2), maior INTRODUÇÃO À ESTATÍSTICA AULA 02: ORGANIZAÇÃO DE DADOS EM TABELAS 12 valor (8) e o valor que ocorre mais vezes (5). Além disso, ao final da confecção desta tabela, os valores encontram-se ordenados. Este é um exemplo de uma tabela de distribuição de frequências. Em uma tabela de distribuição de frequências cada linha contém um valor seguido do número de vezes que este valor se repete. A primeira coluna é chamada coluna dos valores e a segunda coluna das frequências. Convém observar que em uma tabela de distribuição de frequências a soma de todas as frequências é necessariamente igual ao número total de dados (tamanho da amostra). Para o nosso exemplo temos 4 + 8 + 8 + 12 + 10 + 6 + 4 = 52. 2.1 ORGANIZAÇÃO DE DADOS EM CLASSES No exemplo que acabamos de descrever, as notas variam entre os números 2 e 8 e assumem somente valores inteiros, isto faz com que a tabela resultante tenha no máximo sete linhas. Isto nem sempre é o que ocorre. Suponha que o conjunto de valores dados abaixo são as notas de 52 alunos de uma classe, cada nota com no máximo uma casa decimal. Como podemos verificar, estas notas podem assumir qualquer valor decimal entre 2,0 (menor nota) e 8,9 (maior nota). Se organizarmos estas notas numa forma semelhante à da tabela 11, poderemos ter de confeccionar uma tabela com um número razoavelmente grande de linhas, o que pode ser inconveniente. Neste caso a melhor coisa a fazer é organizar os dados em intervalos (faixas) de valores. Sendo assim, em vez de contar quantos alunos tiraram nota 2,0, quantos alunos tiraram nota 2,1, nós contamos quantos alunos tiraram nota entre 2,0 e 2,9 por exemplo. Agrupando estas notas nos intervalos ficaremos com a seguinte distribuição: TABELA 12 Notas por Intervalo. 13 De posse da tabela acima podemos, caso seja necessário, ordenar as notas de maneira mais rápida e fácil, bastando ordená-las por cada linha. Feito isso obtemos TABELA 13 Notas Ordenadas por Intervalo. o que nos dá automaticamente a seguinte ordenação para o conjunto de notas: Em estatística, os intervalos acima mencionados, recebem genericamente o nome de classes de frequência ou simplesmente classes. Classes são intervalos de variação de uma variável. Chamamos de extremos ou limites da classe os valores que delimitam o intervalo da classe. Substituindo na tabela 12 ou tabela 13 a coluna de notas pela coluna contendo o número de notas em cada classe obtemos a tabela abaixo: TABELA 14 Distribuição das Notas. Este é um exemplo de uma tabela de distribuição de frequências por classes. 14 OBSERVAÇÃO Em uma tabela de distribuição de FREQUÊNCIAS POR CLASSES cada linha contém uma classe seguida da frequência desta classe. A FREQUÊNCIA DE UMA CLASSE é o número de valores que pertencem a esta classe. Em uma tabela de distribuição de frequências com classes ganhamosem concisão e simplicidade mas perdemos em detalhes, por exemplo: de posse somente da tabela 14 nós sabemos que 10 alunos tiraram notas entre 6,0 e 6,9, mas não sabemos de fato quais são estas notas; não sabemos nem responder se algum aluno tirou nota 6,5. 2.2 LIMITES DE CLASSE No que diz respeito aos limites de uma classe, o símbolo indica que os limites direito e esquerdo pertencem à classe. Entretanto, o símbolo indica que somente o limite esquerdo pertence à classe, o limite direito pertence somente à classe seguinte. Já o símbolo indica que o limite direito pertence mas o limite esquerdo não pertence à classe em questão. Considere, por exemplo, as tabelas abaixo: TABELA 15 Altura (em cm) dos Alunos da 8a Série do Ensino Fundamental do Colégio 6 de Agosto. Esta tabela nos diz que 6 alunos têm altura entre 164 cm e 168 cm, podendo algum destes alunos medir 164 cm mas nenhum desses alunos mede 168 cm. Se algum dos alunos da classe mede 168 cm, então ele faz parte do grupo de 11 alunos que tem altura entre 168 cm e 172 cm. A indicação nos informa que um valor igual ao extremo direito de uma classe, quando existe, entra na contagem da classe seguinte e não da classe em questão, ao contrário do limite esquerdo. TABELA 16 Já o símbolo indica que o limite direito pertence mas o limite esquerdo não pertence à classe em questão. Observe a tabela abaixo: PESO (EM QUILOS) DOS ALUNOS DA 8A SÉRIE DO ENSINO FUNDAMENTAL DO COLÉGIO 6 DE AGOSTO. 15 Esta tabela nos diz que se um aluno pesa 76 Kg então ele faz parte do grupo dos 11 alunos que pertencem à classe 72 76, e se algum aluno pesa 72 Kg então ele faz parte do grupo de 6 alunos que pertencem à classe 68 72. Mas um aluno que pesa 72,09Kg (72 quilos e 90 gramas) faz parte dos 11 alunos que pertencem à classe 72 76. 2.3 FREQUÊNCIA RELATIVA As tabelas de distribuição de frequências podem conter além das frequências, as frequências relativas. Calculamos as FREQUÊNCIAS RELATIVAS dividindo a frequência de cada valor ou a frequência de cada classe pelo tamanho total da amostra. Vamos calcular agora as frequências relativas para os dados da tabela 11: Como o total é 52, a Obtemos então a seguinte tabela: TABELA 17 Notas dos Alunos. 16 2.4 FREQUÊNCIA ACUMULADA Observe a tabela 15. O tamanho da amostra para esta tabela é 2 + 7 + 6 + 11 + 8 + 6 + 1 = 41. Se quisermos saber quantos desses 41 alunos medem menos de 164 cm basta somar o número de alunos que medem entre 156 cm e 160 cm com o número de alunos que medem 160 cm e 164 cm. Neste caso temos que 9 alunos do grupo medem menos de 164 cm. Em estatística dizemos que 9 é a frequência acumulada da segunda classe 160 164. A frequência acumulada de uma classe é a soma da frequência dessa classe com as frequências das classes anteriores. Para a tabela 15 a frequência acumulada da terceira classe é 2 + 7 + 6 = 15; A frequência acumulada da quarta classe é 2 + 7 + 6 + 11 = 26; e assim por diante. Convém ressaltar que a frequência acumulada da primeira classe é a frequência dessa classe pois não existem classes anteriores à primeira. Por outro lado a frequência da última classe é igual ao tamanho total da amostra, pois para obtê-la somamos todas as frequências. Acrescentando à tabela 15 uma nova coluna com as frequências acumuladas obtemos a seguinte tabela: TABELA 18 Altura (em cm) dos Alunos da 8a Série do Ensino Fundamental do Colégio 6 de Agosto. Esta tabela nos diz, por exemplo, que 34 alunos medem menos de 176 cm. 17 EXERCITANDO (a) Identifique e destaque o título, o cabeçalho, o corpo, a coluna indicadora e a fonte da tabela abaixo: (b) Esta tabela é uma série estatística de que tipo? (c) Quais cursos apresentaram maior e menor número de matrículas em 1995? E em 1996? FÓRUM Discuta, no Fórum da Aula 2, com os colegas ou com o professor tutor, as dúvidas sobre os exercícios ou sobre a matéria da Aula 2. Lembre que sua participação no Fórum vale presença e nota de avaliação. ATIVIDADE DE PORTFÓLIO Vá para a seção Material de Apoio do ambiente SOLAR e baixe o arquivo exercícios-1 (questões: 3, 5 e 6) (Visite a aula online para realizar download deste arquivo.) e exercícios 2 (questões: 3 e 4) da aula 2. (Visite a aula online para realizar download deste arquivo.) da aula 2 para abrir a Lista de Exercícios desta aula. Resolva a quantidade máxima de exercícios que puder, individualmente ou em grupo. Os arquivo exercícios-1 (questões: 1, 2 e 6) (Visite a aula online para realizar download deste arquivo.) e exercícios 2 (questões: 1 e 3) (Visite a aula online para realizar download deste arquivo.) da aula 2 correspondem ao trabalho dessa aula que deve ser postado no Portfólio Individual no período marcado na Agenda do ambiente SOLAR, num único documento de texto (doc, docx ou pdf) ou manuscrito e escaneado.” FONTES DAS IMAGENS Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 18 TÓPICO 01: GRÁfiCO DE BARRAS Neste capítulo veremos como expor em gráficos os dados apresentados em tabelas. A diferença entre as duas apresentações reside no fato de que enquanto as tabelas apresentam os dados de forma mais precisa e abrangente, os gráficos dão uma visão mais direta e resumida dos dados numéricos coletados e das razões de tamanho entre eles. O gráfico de barras é usado para representar séries cronológicas, geográficas e categóricas. Confeccionaremos a seguir alguns gráficos de barras referentes aos dados da tabela abaixo. TABELA 20 Número de Instituições de Ensino Superior no Brasil por Região e Dependência Administrativa -1996. MEC/INEP/SEEC. Como exemplo, o primeiro gráfico de barras descreverá a distribuição do total de instituições de ensino superior por região. Neste caso escrevemos ao longo de um eixo horizontal os valores que se encontram na coluna indicadora, como no gráfico 1. Como estamos querendo representar o número total de instituições por região, construímos barras verticais cujas alturas são determinadas pelos valores 34, 97, 575, 122 e 94. Para ajudar na confecção do gráfico é melhor começar desenhando a barra correspondente ao maior valor, no caso 575 que é o número total de instituições da região Sudeste. Escolhida a altura da maior barra, para manter a proporção, usamos regra de três simples para determinar a altura correta das outras barras: se a altura da maior barra é 10 cm então a altura x da barra da região Norte é encontrada por INTRODUÇÃO À ESTATÍSTICA AULA 03: ORGANIZAÇÃO DE DADOS EM GRÁfiCOS 19 Calculando desta forma, as alturas das regiões Nordeste, Sul e Cento- Oeste serão respectivamente1,68 cm ≈ 17 mm, 2,12 cm ≈ 21 mm e 1,63 cm ≈ 16 mm. “ no primeiro quadro,deixando no segundo quadro apenas a expressão “Colocando título obtemos a figura abaixo: GRÁFICO 2: DISTRIBUIÇÃO DO NÚMERO DE INSTITUIÇÕES DE ENSINO SUPERIOR NO BRASIL POR REGIÃO - 1996 Todas as barras devem ter a mesma largura e ficar afastadas umas das outras. Neste exemplo colocamos o valor correspondente à cada região no topo de sua barra, mas isto não é obrigatório.” no segundo quadro, deixando no terceiro apenas “Podemos, ao invés disso, usar um eixo vertical numerado, como no gráfico 3, onde os valores de cada região podem ser extraídos a partir da altura das barras. Note que neste caso o valor encontrado para a altura é um valor aproximado, mas isto não é problema desde que o objetivo do gráfico seja dar uma visão global e resumida dos valores observados e da relação de grandeza entre eles. GRÁFICO 3: DISTRIBUIÇÃO DO NÚMERO DE INTITUIÇÕES DE ENSINO SUPERIORNO BRASIL POR REGIÃO - 1996. Podemos ainda fazer como no gráfico abaixo, onde o eixo vertical é substituído por linhas horizontais, cada uma com um valor de altura associado. GRÁfiCO 4: DISTRIBUIÇÃO DO NÚMERO DE INSTITUIÇÕES DE ENSINO SUPERIOR NO BRASIL POR REGIÃO -1996. 20 A tabela 20 contém outras informações além do número total de instituições por região. Ela também apresenta o número de instituições por dependência administrativa. Mas não é necessário um novo gráfico para cada conjunto de valores. Se quisermos podemos apresentar estes valores simultaneamente como no gráfico a seguir. Faz-se necessário uma cor de barra para cada conjunto de valores. No nosso exemplo as barras correspondentes ao número de instituições públicas são mais claras do que as barras que indicam o número de instituições privadas. Esta junção de barras é útil quando se deseja fazer comparação entre os dados obtidos. Gráficos deste tipo são chamados de gráficos de barras múltiplas. GRÁFICO 5: DISTRIBUIÇÃO DO NÚMERO DE INSTITUIÇÕES POR DE-PENDÊNCIA ADMINISTRATIVA, SEGUNDO AS REGIÕES - 1996 O gráfico 6 apresenta um outro exemplo de gráfico de barras múltiplas. Neste caso utilizamos a sobreposição de barras para mostrar num mesmo gráfico três conjuntos de dados: os valores das escolas municipais, particulares e estaduais. A expressão mil alunos significa que em 1987 haviam aproximadamente 1.300 ×1.000 = 1.300.000 alunos matriculados na pré-escola em colégios municipais. GRÁFICO 6: MATRICULA INICIAL POR DEPENDÊNCIA ADMINISTRATIVA NA PRÉ-ESCOLA (MIL ALUNOS)- BRASIL - 1987 / 1998. Os gráficos mostrados até agora recebem o nome de gráficos de barras verticais. Podemos também apresentar gráficos de barras horizontais, como mostra o gráfico 7 a seguir. 21 GRÁFICO 7: PERCENTUAL DE CRIANÇAS, ENTRE 4 E 6 ANOS,MATRICULADAS NA PRÉ - ESCOLA 1998. Ano Percentual Recife 77 Fortaleza 76 Salvador 72 Rio de Janeiro 71 São Paulo 57 Belo Horizonte 56 Curitiba 42 Porto Alegre 41 Neste caso colocamos os dados referentes à coluna indicadora dispostos segundo um eixo vertical, e as barras são desenhadas na posição horizontal. Apenas para efeito de comparação entre os dois tipos gráficos ( barra horizontal e vertical ) vamos construí-los para os dados percentuais da tabela 21 abaixo. TABELA 21 Pessoas Analfabetas na População de 15 anos ou mais.Números absolutos e Números relativos - 1920/1996. IBGE Os dois gráficos a seguir apresentam os números percentuais (terceira coluna) em função dos anos (série cronológica). No gráfico 8 usamos barras verticais e no gráfico 9 usamos barras horizontais. É mais comum o uso de barras verticais, no entanto quando a coluna indicadora tem muitos nomes e estes são longos, é preferível o uso de barras horizontais, pois assim podemos escrevê-los em posição horizontal e sem o uso de abreviações, como é o caso do gráfico 7 (série geográfica). 22 FONTES DAS IMAGENS Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 23 TÓPICO 02: GRÁfiCO DE LINHAS O gráfico de linhas é usado para representar séries cronológicas. Usamos uma linha poligonal para mostrar a evolução da série. Como um exemplo considere os dados percentuais da tabela 21 ilustrada no tópico anterior. VERSÃO TEXTUAL 1-Usamos dois eixos perpendiculares 2-No eixo horizontal colocamos as datas e no eixo vertical numeramos de acordo com as medições, no nosso caso as percentagens 3-Para cada ano construa um ponto no plano cuja altura corresponda ao valor da percentagem deste ano. A altura dos pontos devem estar em proporção com as medições, como no gráfico de barras. Neste caso se 70 corresponde a 7 cm então a altura x do primeiro ponto (ano 1920) é 6,49 cm ≈6,5 cm, a altura do segundo ponto (1940) é 5,6 cm, a altura do terceiro ponto é 5,05 cm ≈5,1 cm, e assim por diante. 4-Unimos os pontos por segmentos de retas 5-Obtemos o seguinte gráfico de linhas GRÁFICO 10: PERCENTUAL DE PESSOAS ANALFABETAS NA POPULAÇÃO DO BRASIL COM 15 ANOS OU MAIS - 1920 A 1996. É comum também o não uso do eixo vertical auxiliar. Sendo assim as medições correspondentes as datas são colocadas ao longo da linha poligonal, como no gráfico a seguir. Neste caso é aconselhável, para facilitar a visualização, o uso de linhas verticais ligando o ano ao ponto correspondente na linha poligonal. INTRODUÇÃO À ESTATÍSTICA AULA 03: ORGANIZAÇÃO DE DADOS EM GRÁfiCOS 24 Podemos também usar um mesmo gráfico de linhas para representar a evolução de duas variáveis ao longo do tempo. O gráfico seguinte mostra a evolução do número de matrículas por dependência administrativa ao longo dos anos. Vemos rapidamente que o número de matrículas nas escolas municipais vem tendo um aumento considerável em relação ao número de matrícula na rede particular e na rede estadual, onde observamos uma estabilização e uma queda respectivamente. FONTES DAS IMAGENS Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 25 TÓPICO 03: GRÁfiCO DE SETORES Usamos gráfico de setores para representar dados relativos. O total é representado pelo círculo (100%) e os setores representam as partes. Considere a tabela abaixo. MEC, INEP, SEEC Podemos obter a medida do ângulo em graus de cada setor por meio de uma regra de três simples e direta. Vejamos o valor das matrículas em instituições federais. Portanto o número de matrículas nas instituições federais será representado por um setor que mede aproximadamente 76º. Descobrindo o ângulo dos setores para os demais valores podemos construir o gráfico de setores abaixo. Para uma maior clareza colocamos as taxas (percentagens) de matrículas de cada instituição nos setores correspondentes (gráfico 13). Se o objetivo é fazer apenas um comparação entre os valores obtidos isto não é necessário e podemos apresentar simplesmente o gráfico 14. FONTES DAS IMAGENS INTRODUÇÃO À ESTATÍSTICA AULA 03: ORGANIZAÇÃO DE DADOS EM GRÁfiCOS Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 26 TÓPICO 04: DISTRIBUIÇÃO DE FREQUÊNCIAS Os dados organizados em tabelas de distribuição de frequências também podem ser apresentados em gráfico de barras (histograma) ou gráfico de linhas (polígono de frequências). Para distribuição de frequências os gráficos de barras são chamados histogramas e os gráficos de linhas são chamados polígonos de frequências. 4.1 HISTOGRAMAS A tabela a seguir representa uma distribuição de frequências sem intervalos de classes. Para construir o histograma desta tabela... •Dispomos os valores (número de filhos) segundo um eixo horizontal e usamos barras (retângulos) com bases neste eixo para representar as frequências. •As barras devem estar afastadas umas das outras e devem possuir a mesma largura. •Os pontos médios das suas bases devem corresponder aos valores e suas alturas devem ser proporcionais aos valores das frequências correspondentes. Procedendo desta forma obtemos o seguinte histograma para a tabela 23. INTRODUÇÃO À ESTATÍSTICA AULA 03: ORGANIZAÇÃO DE DADOS EM GRÁfiCOS 27 Para uma distribuição de frequências com INTERVALOS DE CLASSES procedemos de maneira semelhante, mas neste caso as barras ficam juntas. Além disso a largura de cada barra deve ser igual a largura da classe. Isto faz com que o ponto médio da classe coincida com o ponto médio da base da barra. Veja por exemplo a tabela abaixo. Construindo o histograma para esta tabela obtemos o gráfico 16. Na tabela acima as classes têm o mesmo comprimento. COMO PROCEDER ENTÃONO CASO EM QUE AS CLASSES NÃO POSSUEM UM MESMO COMPRIMENTO? A tabela 25 exemplifica este caso. Na construção do histograma desta tabela as áreas das barras é que devem ser proporcionais às frequências das classes correspondentes. Portanto a altura de cada barra será proporcional ao quociente entre a frequência e o comprimento da classe, que é o que chamamos de densidade de frequência. A densidade de frequência da classe é obtida dividindo-se a frequência da classe pelo comprimento da classe. Por exemplo, a densidade de frequência da primeira e da segunda classe são respectivamente. A densidade de frequência das demais classes nós calculamos de modo análogo. 28 Como as alturas devem ser proporcionais às densidades de frequências, nós colocamos na terceira coluna os valores das densidades multiplicados por 200. Por que 200? Apenas para facilitar a marcação das alturas das barras. Nós podíamos ter multiplicado por 100, ou por 300, ou por 150. Veja que com a multiplicação por 200, a altura da primeira barra pode ser 10 cm, a da segunda barra 12,5 cm, a da terceira barra 15,0 cm, e assim por diante. Observamos mais uma vez que o objetivo principal de um gráfico não é descrever os dados de forma precisa, mas apresentá-los de uma maneira tal que possamos ter uma visão geral destes e que sejamos capazes de fazer comparações diretas e rapidas. O gráfico a seguir mostra o histograma para a tabela 25. GRÁFICO 17 OBSERVAÇÃO Observe mais uma vez que, num gráfico como este, a frequência de cada classe deve ser proporcional a área da barra e não à altura da mesma. É com este objetivo que ele é confeccionado. POLÍGONO DE FREQUÊNCIAS O polígono de frequências é utilizado para representar graficamente uma distribuição de frequências com classes. Não faz sentido falar em polígono de frequências para uma distribuição de frequências sem classes. Um polígono de frequências de uma distribuição com classes é um gráfico de linhas no qual as frequências devem ser marcadas 29 sobre perpendiculares ao eixo horizontal, traçadas a partir do ponto médio da classe e com comprimento proporcional à frequência desta classe. O gráfico 18 mostra esta marcação para a tabela 24. Observe por este gráfico que se faz necessário a marcação de dois pontos auxiliares: ◾ O ponto médio de uma classe imaginária anterior à primeira classe ◾ O ponto médio de outra classe imaginária posterior à última classe. Isto é obrigatório para que o gráfico seja uma poligonal fechada. Em seguida unimos estes pontos e obtemos então o polígono de frequências como mostrado no gráfico 19. Veja que não devemos colocar, no eixo horizontal do gráfico final, o valor do ponto médio das classes imaginárias. EXERCITANDO Jogue um dado 30 vezes e anote a ocorrência dos números. Repita a experiência mais duas vezes. Faça então um gráfico de barras para mostrar o resultado nas três experiências. Faça o mesmo com uma moeda. FÓRUM Discuta, no Fórum da Aula 3, com os colegas ou com o professor tutor, as dúvidas sobre os exercícios ou sobre a matéria da Aula 3. Lembre que sua participação no Fórum vale presença e nota de avaliação. 30 ATIVIDADE DE PORTFÓLIO Vá para a seção Material de Apoio do ambiente SOLAR e baixe para abrir a Lista de Exercícios desta aula. Resolva a quantidade máxima de exercícios que puder, individualmente ou em grupo. Os exercícios 2, 3, 6,8 e 9 (Visite a aula online para realizar download deste arquivo.) correspondem ao trabalho desa aula que deve ser postado no Portfólio Individual no período marcado na Agenda do ambiente SOLAR, num único documento de texto (doc, docx ou pdf) ou manuscrito e escaneado.” FONTES DAS IMAGENS Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 31 TÓPICO 01: MÉDIA A descrição e a apresentação de um conjunto de dados numéricos podem ser feita desde uma forma muito completa e elaborada até uma forma bastante concisa e resumida, dependendo do objetivo a que estes dados se propõem. Podemos apresentar os dados de maneira crua, isto é, da forma como eles foram colhidos, ou utilizando tabelas e gráficos ou mesmo usando um simples número que seja até certo ponto um representante do conjunto de dados em questão. Muitas vezes se faz necessário a apresentação resumida de um conjunto de dados numéricos através de um único número que possa, em um certo sentido, descrever o conjunto inteiro. O tipo de número a ser escolhido depende do tipo de característica do conjunto que nós desejamos descrever. MÉDIA A média ou média aritmética é a medida de tendência central mais utilizada. Suponha, por exemplo, que os números abaixo 8, 48, 87, 56, 59, 28, 26, 57, 3 sejam as notas em matemática de um aluno durante um semestre letivo. Usamos como nota semestral desse aluno o número obtido pela divisão por 8 da soma de todas as notas, ou seja, O número 7,8 é o que chamamos de média do aluno no semestre. É o número a ser utilizado para representar todas as 8 notas durante o semestre e dirá se o aluno está ou não aprovado. De maneira geral temos a seguinte definição: A média de um conjunto com n números é a soma dos números dividida por n EXEMPLO Vejamos um outro exemplo: Em 12 meses de 2000, o departamento de polícia de uma certa cidade obteve os seguintes números de roubos à mão armada 20 27 35 33 28 26 29 32 34 26 27 31. Assim a média do número de roubos à mão armada durante o ano foi INTRODUÇÃO À ESTATÍSTICA AULA 04: MEDIDAS DE TENDÊNCIA CENTRAL 32 Portanto ocorreram, à cada mês, em média, 29 roubos à mão armada durante esse ano. De maneira geral, para n números quaisquer a média, comumente indicada por será 1.1 MÉDIA E DISTRIBUIÇÃO DE FREQUÊNCIAS A tabela abaixo apresenta a distribuição dos pesos de 50 alunos de uma classe. Como nos demais casos, a média dos pesos será a divisão por 50 da soma de todos os pesos. OBSERVAÇÃO Observe que a soma dos pesos NÃO É 55 + 57 + 60 + 62 + 65 + 68 + 71 + 75. É um erro comum, observando a tabela, achar que tal soma é a soma de todos os pesos. Veja que temos que somar 50 pesos e não 8 como acima. Na soma temos que colocar o peso 55 como parcela 2 vezes, o peso 57 como parcela 4 vezes, o peso 60 como parcela 7 vezes e assim por diante, obtendo assim a soma dos 50 pesos (50 = 2 + 4 + 7 + 9 + 11 + 8 + 6 + 3). Sendo assim a média dos pesos para a tabela 26 é O peso médio dos 50 alunos é então 64,52 Kg. EXEMPLO Vejamos um outro exemplo: 33 A tabela abaixo apresenta a nota de 100 alunos que prestaram um certo exame. A média das notas dos 100 alunos é então De maneira geral, para uma tabela de distribuição de frequências como a tabela 28, a média é calculada pela fórmula ou seja, a média é a divisão, pela soma das frequências, da soma dos produtos de cada valor por sua respectiva frequência. É comum, no cálculo da média, estender a tabela original colocando uma terceira coluna onde aparecem os produtos de cada valor por sua respectiva frequência. Colocamos então, abaixo da segunda coluna, a soma das frequências e, abaixo da terceira coluna, a soma dos produtos de cada valor por sua frequência, originando assim a tabela a seguir. A extensão da tabela 27 é dada pela tabela 34 TABELA 30 1.2 MÉDIA E DISTRIBUIÇÃO DE FREQUÊNCIAS COM CLASSES Em uma tabela de distribuição de frequências com classes substituímos cada classe pelo seu ponto médio, o qual é a média aritmética dos extremos da classe, e então procedemos como na secção anterior, como se os valores fossem de fato os pontos médios das classes. OBSERVAÇÃO Observe que é impossível calcular o valorexato da média dos valores a partir de uma tabela de distribuição de frequências com classes. Olhando para a tabela 31 sabemos que temos, por exemplo, 7 alturas entre 160 cm e 164 cm, mas não podemos dizer precisamente quais são os valores dessas alturas. O que fazemos sempre é assumir que todos os valores em uma classe sejam iguais ao ponto médio da classe (o que não é necessariamente verdade) e assim estipulamos a média usando os pontos médios de todas as classes. EXEMPLO Vejamos um outro exemplo: A tabela a seguir apresenta as notas de 40 alunos de uma turma distribuídas em 5 classes. 35 Acrescentando a coluna contendo o ponto médio das classes e a coluna contendo o produto dos pontos médios das classes pelas respectivas frequências, obtemos a tabela A média da turma é então FONTES DAS IMAGENS Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 36 TÓPICO 02: MODA Fonte [1] Uma outra medida que é usada para descrever o centro de um conjunto de dados numéricos é a moda. A moda de um conjunto de dados numéricos é o valor que ocorre o maior número de vezes. 26 25 28 23 25 24 24 21 23 26 28 26 24 32 25 27 24 23 24 22 Para calcular a moda desses valores é aconselhável ordená-los antes. Feito isso obtemos: 2.1 MODA E DISTRIBUIÇÃO DE FREQUÊNCIAS Em uma tabela de distribuição de frequências, a frequência de cada valor é o número de vezes que tal valor ocorre no conjunto. Portanto, para encontrar a moda, basta verificar qual a maior frequência. Sendo assim a moda para a tabela 26 é 65, que é o peso com maior frequência (11). A moda para a tabela 27 é 6,0, que é a nota com maior frequência (30). No caso em que a maior frequência ocorre em dois valores distintos, dizemos que não existe moda. Sendo assim, o conjunto de dados abaixo não possui moda. OBSERVAÇÃO Os valores 23 e 24 são os que ocorrem mais vezes e com a mesma frequência (4). Portanto tal conjunto não tem moda. 2.2 MODA E DISTRIBUIÇÃO DE FREQUÊNCIAS COM CLASSES No caso de uma distribuição de frequências com classes, como não é possível exibir os valores exatos que ocorrem em cada classe, dizemos simplesmente que a classe que possui o maior número de valores é a CLASSE MODAL. De fato existe uma fórmula matemática para estipular a moda neste caso, mas esta não será deduzida e nem mostrada neste texto. Para a tabela 31 a classe modal é 168 172, que possui a maior frequência (11). INTRODUÇÃO À ESTATÍSTICA AULA 04: MEDIDAS DE TENDÊNCIA CENTRAL 37 Para a tabela 33 a classe modal é 4 6, a qual possui o maior número de notas (12). No caso da maior frequência ocorrer em duas classes distintas, dizemos que o conjunto de dados não possui classe modal. FONTES DAS IMAGENS 1. http://1.bp.blogspot.com/_8zi9Gqb33bU/SHJ9FlI- V6I/AAAAAAAAAdA/oNO0XNB6yT0/S220/lupa.jpg Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 38 TÓPICO 03: MEDIANA Estando o conjunto de dados numéricos ordenados, a mediana é o valor que se encontra no centro. A mediana de um conjunto de valores numéricos ordenados é o valor que separa o conjunto em dois outros com o mesmo número de elementos, segundo a ordenação. EXEMPLO 1 Considere o conjunto com 9 valores abaixo 14 24 10 19 24 10 5 12 8. Após ordená-lo obtemos 5 8 10 10 12 14 19 24 24. Vemos que o valor 12 encontra-se no centro do conjunto ordenado pois o divide em dois subconjuntos com 4 elementos cada, a saber: 5 8 10 10 e 14 19 24 24. A mediana então é o valor 12 e sua ordem é 5 =(9 + 1) ÷ 2. Veja que neste caso o conjunto possui um valor que se encontra no meio do conjunto apenas por que seu número de elementos é ímpar (9). Se um conjunto ordenado tiver 27 elementos a mediana será o valor de ordem 14 =(27 + 1) ÷ 2, se um conjunto ordenado tiver 35 elementos a mediana será o valor de ordem 18 =(35 + 1) ÷ 2. De modo geral quando um conjunto ordenado tem n elementos e n é ímpar, a sua mediana é o termo de ordem (n + 1) ÷2. EXEMPLO 2 Vejamos agora o conjunto de dados com 12 valores 13 21 17 12 13 21 3 13 21 19 24 7. Ordenando-o obtemos 3 7 12 13 13 13 17 19 21 21 21 24. Como o número de elementos é par (12) o conjunto não possui um valor que se encontra na posição central. Existem dois valores centrais: 13 que é o termo de ordem 6 = 12 ÷2 e 17 que é o termo de ordem 7 = 12 ÷2 + 1. Neste caso dizemos que a mediana é a média aritmética dos dois valores centrais. Assim a mediana deste conjunto será INTRODUÇÃO À ESTATÍSTICA AULA 04: MEDIDAS DE TENDÊNCIA CENTRAL 39 Perceba que 15, sendo um valor entre 13 e 17, separa o conjunto de 12 valores em dois conjuntos com 6 elementos cada, a saber: 3 7 12 13 13 13 e 17 19 21 21 21 24. O primeiro contendo os 6 valores menores ou iguais a 15 e o segundo contendo os 6 valores maiores ou iguais a 15. Se um conjunto ordenado tiver 26 elementos a sua mediana é a media aritmética dos 2 valores centrais, que são os termos de ordem 13 = 26 ÷2e 14 = 26 ÷2 + 1. Se um conjunto ordenado tiver 68 elementos a sua mediana é a media aritmética dos termos de ordem 34 = 68 ÷2 e 35 = 68 ÷2 + 1. De modo geral quando um conjunto ordenado tem n elementos e n é par, a sua mediana é a média aritmética dos dois termos centrais, que são os termos de ordem n ÷2 e ordem n ÷2 + 1 respectivamente. EXEMPLO 3 Para o conjunto ordenado com 11 valores 12 15 15 16 17 17 17 19 21 22 22, a sua mediana é 17, o termo de ordem 6 =(11 + 1) ÷2. Para o conjunto ordenado com 14 valores 5 6 12 15 15 17 17 17 18 23 25 25 28 29, a sua mediana é a média aritmética dos termos de ordem 7 = 14 ÷2 e ordem 8 = 14 ÷2 + 1. Neste último caso, como os dois termos centrais são iguais, a mediana pertence ao conjunto. OLHANDO DE PERTO Quando o número de elementos do conjunto é ímpar, a mediana é um dos valores do conjunto. Quando o número de elementos do conjunto é par, a mediana será um valor do conjunto se e somente se os dois termos centrais forem iguais. Perceba a distinção enfatizada no texto e existente entre a mediana e a ordem da mediana. 3.1 MEDIANA E DISTRIBUIÇÃO DE FREQUÊNCIAS Para achar a mediana de um conjunto de valores descritos por uma distribuição de frequências precisamos, como nos demais casos, encontrar a ordem do termo central (número de elementos ímpar) ou a ordem dos dois termos centrais (número de elementos par) como explicado anteriormente. Vejamos agora alguns exemplos. 40 EXEMPLO 1 A tabela 26 apresenta a distribuição de 50 pesos. Portanto o peso mediano é a média aritmética dos valores centrais de ordem 25 =(50÷2) e ordem 26 =(50 ÷2+1). Uma boa forma de encontrar esses valores centrais é formar a tabela estendida contendo uma terceira coluna, com as frequências acumuladas, como a seguir. Vemos assim que o 25º termo é 65 e o 26º termo é também 65. Portanto o peso mediano é EXEMPLO 2 A tabela abaixo apresenta a distribuição dos números de filhos de 64 famílias. Para esta distribuição os termos de ordem 32 =(64 ÷2) e 33 =(64 ÷2 + 1) são os centrais. Olhando para a frequência acumulada concluímos que o 32º termo é 2 e o 33° termo é 3. Sendo assim a mediana do número de filhos é EXEMPLO 3 A tabela a seguir apresenta a distribuição das notas de 91 alunos. A mediana das notas é o termo de ordem 46 =(91 + 1)/2. Olhando a coluna das freqüências acumuladas vemos que o termo de ordem 46 é 7. Portanto a nota mediana é 7. 41 3.2 MEDIANA E DISTRIBUIÇÃO DE FREQUÊNCIAS COM CLASSES Em uma distribuição de frequências com classes não é possívelexibir os valores exatos que ocorrem em cada classe. Portanto não podemos calcular a mediana de forma exata. Existem fórmulas para estipular a mediana nesses casos mas elas não serão estudadas neste texto. EXERCITANDO A tabela abaixo apresenta a distribuição das estaturas de 100 alunos de uma classe. Determinar a estatura média, a classe modal e a classe da mediana. FÓRUM Discuta, no Fórum da Aula 4, com os colegas ou com o professor tutor, as dúvidas sobre os exercícios ou sobre a matéria da Aula 4. Lembre que sua participação no Fórum vale presença e nota de avaliação. ATIVIDADE DE PORTFÓLIO Vá para a seção Material de Apoio do ambiente SOLAR e baixe o arquivo dos exercícios exercícios-1 (questões: 3, 4 e 8) (Visite a aula online para realizar download deste arquivo.) e exercícios 2 (questões: 3 e 6) (Visite a aula online para realizar download deste arquivo.) para abrir a Lista de Exercícios desse tópico da aula 4. Resolva a quantidade máxima de exercícios que puder, individualmente ou em grupo. Os exercícios exercícios-1 (questões: 3, 4 e 8) (Visite a aula online para realizar download deste arquivo.) e exercícios 2 (questões: 3 e 6) (Visite a aula online para realizar download deste arquivo.) da aula 4 são as respectivas 42 questões do trabalho dessa aula a ser postado no Portfólio Individual do ambiente Solar.” FONTES DAS IMAGENS Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 43 TÓPICO 01: INTRODUÇÃO Dado um conjunto de valores numéricos, uma medida de tendência central dá o centro do conjunto, isto é, o número em torno do qual os valores estão distribuídos. No entanto uma medida de tendência central não fornece nenhuma informação adicional sobre como os valores encontram-se distribuídos (dispersos, espalhados) em torno do valor central. Admita, por exemplo, que os valores abaixo são as notas obtidas por quatro equipes de oito alunos durante um ano letivo. A média das quatro equipes é 7. Entretanto as notas das quatro equipes apresentam variações distintas. As notas da equipe A não apresentam dispersão. As notas da equipe B apresentam pouca dispersão. As notas da equipe C apresentam dispersão maior que as anteriores. As notas da equipe D apresentam a maior dispersão. Vemos claramente neste exemplo que conjuntos com médias idênticas podem apresentar variações (dispersões) diferente. Apresentaremos neste capítulo medidas que indicam a dispersão dos valores de um conjunto numérico. Estas medidas são: amplitude, variância, desvio padrão e coeficiente de variação relativo FONTES DAS IMAGENS INTRODUÇÃO À ESTATÍSTICA AULA 05: MEDIDAS DE DISPERSÃO Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 44 TÓPICO 02: AMPLITUDE Dado um conjunto de valores, a amplitude é a diferença entre o maior e o menor valor. Para o exemplo anterior temos ◾ A amplitude das notas da equipe A é 7−7 = 0. ◾ A amplitude das notas da equipe B é 8−6 = 2. ◾ A amplitude das notas da equipe C é 9−5 = 4. ◾ A amplitude das notas da equipe D é 10−4 = 6. A amplitude de um conjunto de valores numéricos é a diferença entre o maior e o menor valor do conjunto. A amplitude é a medida de variação mais simples pois somente dois valores do conjunto de dados são necessários para o seu cálculo. Este é, entretanto, o motivo que limita sua utilidade. Os conjuntos abaixo apresentam as alturas (em cm) de dois grupos de oito pessoas. Os dois grupos apresentam a mesma amplitude: 170−160= 10 cm. Mas o grupo 2 apresenta uma maior dispersão nas alturas. Concentrando-se em apenas dois valores de uma distribuição, o maior e o menor valor, a amplitude não dá informação sobre a dispersão dos demais valores. Precisamos de medidas de dispersão que levem em conta todos os valores do conjunto em questão. FONTES DAS IMAGENS INTRODUÇÃO À ESTATÍSTICA AULA 05: MEDIDAS DE DISPERSÃO Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 45 TÓPICO 03: VARIÂNCIA Estando os dados dispersos em torno da média, uma medida que indique a dispersão deve levar em conta o desvio de cada valor em relação à média (a diferença entre cada valor e a média). A variância é uma medida de dispersão que considera este fato. OBSERVAÇÃO Para calcular a variância de um conjunto de valores: ◾ Primeiro calculamos a média desse conjunto. ◾ Então subtraímos a média de cada valor e elevamos cada resultado ao quadrado. ◾ Finalmente computamos a média desses quadrados e obtemos o que chamamos de variância do conjunto. Vejamos como exemplo as notas da equipe B citadas anteriormente: Equipe B: 6; 7; 8; 6; 7; 7; 8; 7. A média da equipe B é: Subtraímos agora a média de cada uma das notas. É conveniente agrupar esses valores em uma tabela. Os desvios estão dispostos na segunda coluna da tabela 38. Calculamos agora os quadrados dos desvios e os colocamos na terceira coluna da tabela 38. Calculando a média dos valores da terceira coluna (média dos quadrados) obtemos a variância. Confira os resultados da Variância das demais equipes: Da mesma maneira que para equipe B, e sendo a média da equipe C igual a 7, obtemos a tabela 39 para equipe C. INTRODUÇÃO À ESTATÍSTICA AULA 05: MEDIDAS DE DISPERSÃO 46 A variância da equipe C é então Para a equipe D, obtemos a tabela 40, cuja média é 7. Portanto a variância da equipe D é Finalmente para equipe A temos a tabela 41 que, como esperado, da variação nula para as notas da equipe Temos então que: ◾ A variância das notas da equipe A é 0. ◾ A variância das notas da equipe B é 0,5. ◾ A variância das notas da equipe C é 3,25. ◾ A variância das notas da equipe D é 7,75. Portanto, quanto maior a variância maior a dispersão. Observe, por estes exemplos, que a soma dos desvios é sempre zero. Isto é um fato e não uma coincidência particular a estes exemplos. Para qualquer 47 conjunto de dados a soma dos desvios é sempre zero e, assim, não podemos usá-la para obter a medida da dispersão. Portanto, em vez da soma dos desvios, usamos a soma dos quadrados dos desvios, que é sempre um número positivo, para obter a variância. Dado um conjunto com n valores o desvio de cada valor é a diferença entre o valor e a média do conjunto. A variância do conjunto é a média dos quadrados dos desvios. Vejamos agora a variância para os grupos 1 e 2 de alturas. GRUPO 01 Para o grupo 1, cuja média é 165, obtemos a tabela 42. Portanto a variância do grupo 1 é: GRUPO 02 Para o grupo 2, cuja média também é 165, temos a tabela 43. A variância deste grupo é então dada por: Constatamos agora através da variância o que já tínhamos observado: as idades do segundo grupo têm maior dispersão que as idades do primeiro grupo. 3.1 VARIÂNCIA DE DISTRIBUIÇÃO DE FREQUÊNCIAS 48 No caso em que os dados estão agrupados devemos levar em consideração, assim como no cálculo da média, o valor de cada frequência. Por exemplo, a tabela 44 apresenta a distribuição dos pesos (em Kg) de 40 alunos de uma classe. Inicialmente calculamos a média como mostrado no capítulo. Para isso é conveniente acrescentar outras colunas à tabela 44 para inclusão de valores a serem utilizados no cálculo da média e da variância. Tais extensões são apresentadas na tabela 45. Acrescentamos nesta tabela uma terceira coluna contendo o produto da cada valor por sua respectiva frequência. Portanto a média para esta distribuição é: Acrescentamos uma quarta coluna contendo os desvios e uma quinta coluna contendo os quadrados dos desvios. Observe que no cálculo davariância precisamos da soma de todos os quadrados dos desvios, que neste caso são 40 quadrados e não 8. Portanto NÃO BASTA SOMAR OS VALORES DA QUARTA COLUNA. Acrescentamos uma sexta coluna contendo o produto de cada quadrado pela respectiva frequência. A soma dos valores desta coluna é que será usada no cálculo da variância. Portanto a variância para esta distribuição de pesos é dada por 49 EXEMPLO CONFIRA MAIS UM EXEMPLO DE DISTRIBUIÇÕES DE FREQUÊNCIA A tabela 46 apresenta a distribuição de frequências em classes das notas de 70 alunos. Novamente convém estender esta tabela acrescentando novas colunas com valores a serem utilizados para cálculo da média e da variância. Obtemos a tabela 47 onde a terceira coluna contém os pontos médios das classes e a quarta coluna contém os produtos de cada ponto médio por sua respectiva frequência. A média para a distribuição da tabela 46 é então A quinta coluna da tabela 47 contém o desvio de cada ponto médio e a sexta coluna contém o quadrado de cada desvio. Finalmente acrescentamos uma sétima coluna contendo o produto do quadrado de cada desvio por sua respectiva frequência. A variância para a distribuição da tabela 46 será então dada por FONTES DAS IMAGENS Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 50 TÓPICO 04: DESVIO PADRÃO O fato de trabalharmos com os quadrados dos desvios, no cálculo da variância, cria um descompasso entre a medida obtida (variância) e as unidades de medida do conjunto. Por exemplo: se as medidas do conjunto são alturas e estão em centímetro (cm), então a unidade de medida da variância é centímetro ao quadrado (cm2). Para correção deste fato introduzimos o desvio padrão, que é definido como a raiz quadrada da variância. Desta forma a unidade de medida do desvio padrão é a mesma unidade de medida dos valores do conjunto. O desvio padrão (DP) é a raiz quadrada da variância. Desta forma temos: O desvio padrão das notas da equipe A é DP = √0 = 0 O desvio padrão das notas da equipe B é DP = √ 0,5 = 0,707 O desvio padrão das notas da equipe C é DP = √ 3,25 = 1,803 O desvio padrão das notas da equipe D é DP = √ 7,75= 2,784 O desvio padrão das alturas do Grupo 1 é DP = √ 7,75 = 2,784 O desvio padrão das alturas do Grupo 2 é DP = √ 14,75 = 3, 841 O desvio padrão para os pesos dos 40 alunos da tabela 44 é DP = √ 3,94 = 1,985 O desvio padrão para os pesos dos 70 alunos da tabela 46 é DP = √ 4,99 = 2,234 FONTES DAS IMAGENS INTRODUÇÃO À ESTATÍSTICA AULA 05: MEDIDAS DE DISPERSÃO Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 51 TÓPICO 05: COEFICIENTE DE VARIAÇÃO RELATIVO Os dois conjuntos abaixo contêm as idades de dois grupos de pessoas A média de idade do grupo de crianças é e a média de idade do grupo de adultos é Portanto a variância e o desvio padrão das idades do grupo de crianças são respectivamente e a variância e o desvio padrão das idades do grupo de adultos são respectivamente Portanto temos dois grupos distintos com a mesma variância e consequentemente mesmo desvio padrão, ou seja, os dois grupos têm a mesma dispersão. Mas, observando a natureza dos grupos podemos ver que uma diferença de 4 anos no grupo de crianças tem muito mais relevância do que uma diferença de 4 anos nas idades do grupo de adultos. As diferenças físicas entre duas crianças de 4 e 8 anos são muito mais visíveis do que as diferenças físicas entre dois adultos de 53 e 57 anos. Estes detalhes não são capitados pela variância, pois esta medida leva em conta apenas os desvios dos conjuntos de dados, e não leva em conta as dimensões das grandezas envolvidas. Para corrigir este fato definimos o coeficiente de variação relativo (CVR) como sendo a razão entre o desvio padrão e a média. O coeficiente de variação relativo para as idades do grupo de crianças é Como efetuamos uma divisão do desvio padrão pela média, o coeficiente de variação relativo reflete a relação entre a variação nos dados de um conjunto e as dimensões das grandezas envolvidas e, escrevendo em forma de percentagem, o temos como uma percentagem da média: no grupo das crianças é 19,9% da média e no grupo dos adultos é 2,1% da média. Isto nos INTRODUÇÃO À ESTATÍSTICA AULA 05: MEDIDAS DE DISPERSÃO 52 diz que a dispersão relativa no grupo de crianças é maior que a dispersão relativa no grupo de adulto, o que já era esperado por causa das observações anteriores. Quando as dimensões dos dados envolvidos são relevantes, principalmente para efeito de comparação de variações, a medida de dispersão a ser utilizada deve ser o coeficiente de variação relativo. O coeficiente de variação relativo (CVL) e a razão entre o desvio padrão e a média. FONTES DAS IMAGENS Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 53 TÓPICO 06: APLICAÇÕES DO DESVIO PADRÃO Na definição da variância e do desvio padrão, a inspiração foi usar o fato de que a dispersão de um conjunto de valores é grande quando estes encontram-se muito espalhados em torno de um valor central e, a dispersão é pequena, quando todos os valores encontram-se próximos de um valor central. Podemos dizer agora que, se o desvio padrão de um conjunto de valores é pequeno então tais valores encontram-se distribuídos muito próximos da média e, se o desvio padrão é grande, então os valores encontram-se espalhados com respeito a média, isto é, possivelmente não todos mas uma boa parte dos valores estão razoavelmente distantes da média. As observações anteriores são expressas de forma mais precisa através do teorema enunciado a seguir e devido ao matemático russo P. L. Chebyshev (1821-1894). Tal resultado é conhecido como TEOREMA DE CHEBYSHEV.Vejamos agora uma aplicação. EXEMPLO Suponha que um conjunto de valores tem média 42 e desvio padrão 2,5. Então, usando c = 2, concluímos que pelo menos dos valores do conjunto estão entre os números 42−3×2,5 = 34,5 e 42+3×2,5 = 49,5. O Teorema de Chebyshev nos dá informação sobre a localização dos valores de um conjunto em torno da média e aplica-se a qualquer coleção de dados. Ele afirma que pelo menos uma parte dos valores estão situados dentro de uma região. Na prática percebe-se que, em geral, a quantidade de INTRODUÇÃO À ESTATÍSTICA AULA 05: MEDIDAS DE DISPERSÃO 54 valores situados dentro dos limites especificados é bem maior do que a percentagem estabelecida pelo Teorema de Chebyshev. De fato, podemos afirmar em geral que, dado um conjunto. Tais resultados são empíricos pois são verificados na prática, ao contrário do Teorema de Chebyshev, o qual possui uma demonstração matemática rigorosa e que não será dada neste texto devido ao nível de matemática necessário a sua demonstração. Como aplicação suponha agora que a média das notas de todos os alunos de uma classe é 6,5 e que o desvio padrão do conjunto de notas foi 2. Então podemos afirmar, com base nos resultados empíricos, que cerca de 68% dos alunos tiraram nota entre 4,5 e 8,5 e cerca de 95% dos alunos tiraram nota entre 2,5 e 10,0 (Admitindo que não existe nota superior a 10). EXERCITANDO Em 12 dias uma escola registrou o seguinte número de faltas Manhã: 23; 24; 18; 19; 21; 25; 26; 19; 20; 22; 17; 19. Tarde: 14; 15; 13; 16; 16; 17; 18; 11; 14; 15; 15; 17. Qual turno apresenta maior dispersão relativa no número de faltas? FÓRUM Discuta, no Fórum da Aula 5, com os colegas ou com o professor tutor, as dúvidas sobre os exercícios ou sobre a matéria da Aula 5. Lembre que sua participação no Fórum vale presença e notade avaliação. ATIVIDADE DE PORTFÓLIO Vá para a seção Material de Apoio do ambiente SOLAR e baixe o arquivo dos exercícios-1 (questões: 5, 9 e 10) (Visite a aula online para realizar download deste arquivo.) e exercícios 2 (questões: 2 e 5) (Visite a aula online para realizar download deste arquivo.). Resolva a quantidade máxima de exercícios que puder, individualmente ou em grupo. Os exercícios exercícios-1 (questões: 5, 9 e 10) (Visite a aula online para realizar download deste arquivo.) e exercícios 2 (questões: 2 e 5) (Visite a aula online para realizar download deste arquivo.)da aula 5 são as 55 respectivas questões do trabalho dessa aula a ser postado no Portfólio Individual do ambiente Solar.” FONTES DAS IMAGENS Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 56 TÓPICO 01: PERCENTAGEM Atualmente é bastante comum o uso de índices (em particular percentagens) para indicar as características populacionais de uma região, indicar a evolução dos dados econômicos, entre outras aplicações. Neste capítulo daremos algumas dicas de como alguns desses índices são calculados. Nesta seção faremos uma revisão sobre percentagem, veremos qual o seu significado, como calcular percentagem de um determinado valor e como representar um valor como uma percentagem de um outro valor. Primeiro devemos entender que: Uma percentagem é nada mais nada menos que uma fração. Tome por exemplo 25%, que lê-se vinte e cinco por cento e que é a fração com numerador 25 e denominador 100 (razão por que se diz por cento), ou seja e também Desta forma temos: CLIQUE AQUI PARA VER ALGUNS EXEMPLOS Como o cálculo de percentagens é uma multiplicação de frações, podemos utilizar todas as regras de simplificação que são possíveis para obter o produto de duas frações. 1.1 VALOR RELATIVO E VALOR ABSOLUTO INTRODUÇÃO À ESTATÍSTICA AULA 06: ÍNDICES 57 Uma percentagem, sendo uma fração, é um valor relativo. Quando dizemos que 75% dos alunos de uma classe tem mais de 15 anos de idades, não estamos dando o número de alunos com mais de 15 anos (valor absoluto). Para descobrir o número de alunos com mais de 15 anos precisamos saber qual o número total de alunos da classe. Supondo que a classe tem 48 alunos então a quantidade de alunos com idade superior a 15 anos é Perceba então a distinção entre Até agora em todos os exemplos citados nos foi dado o valor relativo (percentagem) e foi calculado o valor absoluto. Veremos agora como fazer o contrário: calcular o valor relativo a partir do valor absoluto. Primeiro vejamos como transformar um fração ordinária em uma percentagem, digamos 2/5. É simples, basta observar que um número não se altera quando o multiplicamos e o dividimos por 100 (ou por qualquer outro número). Sendo assim temos Analogamente temos: CLIQUE AQUI PARA VER ALGUNS EXEMPLOS Refletindo bem a respeito das contas anteriores concluímos que para transformar qualquer número em percentagem basta multiplicar por 100 e 58 colocar no final o sinal %. Assim temos 1.2 CÁLCULO DE VALOR RELATIVO Em muitas ocasiões o valor relativo é mais importante do que o valor absoluto. Considere um exemplo de duas cidades onde a primeira tem uma população de 8.000 habitantes, sendo que 4.500 desses estão alfabetizados, e a segunda tem uma população de 20.000 habitantes, sendo que 7.500 desses estão alfabetizados. Em valores absolutos a segunda cidade tem mais pessoas alfabetizadas do que a primeira. Entretanto a fração das pessoas alfabetizadas na primeira cidade é (dividindo a parte pelo todo) e a fração das pessoas alfabetizadas na segunda cidade é Portanto na área de educação a primeira cidade tem, em termos relativos, um desempenho melhor do que a segunda cidade. Mais da metade da população da primeira cidade está alfabetizada enquanto menos da metade da população da segunda cidade está alfabetizada. É um fato que, em termos de indicadores sociais, os valores relativos são mais importantes do que os valores absolutos. Vejamos um outro exemplo: VEJA Em uma escola com 640 alunos, 224 alunos estudam pela manhã, 240 estudam à tarde e 176 estudam à noite. Portanto a fração dos alunos da escola que estudam pela manhã é a fração dos alunos que estudam à tarde é 59 e a fração dos alunos que estudam à noite é Portanto 35% dos alunos desta escola estudam pela manhã, 37,5% estuda à tarde e o estante, 27,5%, estuda à noite. A tabela a seguir apresenta o desempenho de quatro escolas no vestibular. Qual a percentagem e aprovação de cada escola? Qual escola obteve melhor desempenho relativo? Calculando a fração de aprovados para cada escola temos: VERSÃO TEXTUAL FONTES DAS IMAGENS 1. http://www.adobe.com/go/getflashplayer Responsável: Prof. José Valter Lopes Nunes Universidade Federal do Ceará - Instituto UFC Virtual 60 TÓPICO 02: OUTROS ÍNDICES 2.1 ÍNDICE DE EVASÃO ESCOLAR Um índice bastante importante no âmbito da educação de um município, estado ou país é o índice de evasão escolar, que é sempre utilizado como uma das medidas de eficiência de um determinado sistema de ensino. Para calcular o índice de evasão escolar em um determinado período, fazemos a diferença entre o número de estudantes matriculados no início do período e o número de estudantes que efetivamente estão presentes em sala de aula no final deste período, isto nos dá o número de estudantes que abandonaram a escola no período. Dividimos a diferença pelo total de alunos matriculados no início. O resultado é o índice de evasão escolar. Vejamos um exemplo. EXEMPLO Suponha que um município tem 2435 alunos matriculados no ensino fundamental no início do ano 2000. No final do ano 2000 verificou-se que o total de alunos que efetivamente concluíram o período foi de 2138 alunos. O índice de evasão escolar em 2000 será então Veja que 297 é o número de estudantes que abandonaram a escola. Este valor corresponde a 12,19% do número de estudantes matriculados no início do ano. Fonte [1] 2.2 ÍNDICE RELATIVO DE PREÇO O índice relativo de preço de um produto é a razão entre o preço do produto em determinado instante e o preço do produto em um instante base. Multiplicando esta razão por 100 temos o índice relativo de preço em percentagem. A tabela 48 mostra os preços de um produto fictício no período de 1997 a 2001. INTRODUÇÃO À ESTATÍSTICA AULA 06: ÍNDICES 61 Tomando como base o ano de 1998 temos que o índice relativo de preços do produto A em 1997 é igual a = 99,25% em 1998 é igual a = 100% em 1999 é igual a = 102,97% em 2000 é igual a = 120,14% em 2001 é igual a = 153,41% Podemos assim montar a tabela 49 com os preços e o índice relativo de preços do produto A. EXERCITANDO Um produto é vendido por apenas três empresas em um determinado mercado. Em certo ano, para um total de 18.000 unidades vendidas, tivemos a seguinte distribuição das vendas. Encontre a distribuição percentual de vendas. 62 FÓRUM Discuta, no Fórum da Aula 6, com os colegas ou com o professor tutor, as dúvidas sobre os exercícios ou sobre a matéria da Aula 6. Lembre que sua participação no Fórum vale presença e nota de avaliação. ATIVIDADE DE PORTFÓLIO Vá para a seção Material de Apoio do ambiente SOLAR e baixe o arquivo dos exercícios-1 (questões: 2, 4 e 7) e exercícios 2 (questões: 1 e 2) da aula 6 (Visite a aula online para realizar download deste arquivo.) para abrir a Lista de Exercícios desta aula. Resolva a quantidade máxima de exercícios que puder, individualmente ou em grupo. . Os exercícios exercícios-1
Compartilhar