Prévia do material em texto
Apresentação Dados Profa. Me. Graciela Piacentini Apresentação dos Dados Um dos obje�vos da Esta�s�ca é resumir os valores que uma ou mais variáveis podem assumir, para ter uma visão geral da variação dessa ou dessas variáveis. Conseguimos isso apresentando esses valores em tabelas e(ou) gráficos, que irão fornecer rápidas e seguras informações a respeito das variáveis em estudo. 1. Tabelas Esta�s�cas Tabela é uma maneira de apresentar de forma resumida um conjunto de dados. A tabela se apresenta da seguinte forma: Título Cabeçalho Corpo Rodapé Elementos de uma tabela • Título: O �tulo deve responder as seguintes perguntas: O que está sendo apresentado? Onde? Quando? • Cabeçalho: é o local dos informes dos conteúdos das linhas e colunas. • Corpo: parte da tabela com a coluna indicadora e a zona enumera�va. • Coluna indicadora: coluna que contém as discriminações correspondentes aos valores distribuídos na zona enumera�va. • Zona enumera�va: serve para apresentação das expressões numéricas e fatos. • Rodapé: é o espaço onde são colocadas as notas de natureza informa�va (fonte, notas e chamadas). Exemplo: Coluna indicadora Tabela 1: Produção de café Brasil - 2014 a 2018 Fonte: Dados fic�cios. Anos Rodapé Título Cabeçalho Casa ou célula Zona enumera�va 2014 2015 2016 2017 2018 2535 2666 2111 3750 2054 Produção (1000t) A apresentação tabular de dados esta�s�cos é normalizada pela resolução nº 886 do Conselho Nacional de Esta�s�ca a fim de uniformizar a apresentação de dados. De acordo com a Resolução 886 da Fundação IBGE, nas casas ou células devemos colocar: • - para dado numérico igual a zero; • ... quando não temos os dados; • ? quando temos dúvida na informação; • 0 quando o valor for muito pequeno. OBS: Se fecharmos as linhas laterais ela deixa de ser tabela e passa ser um quadro. 2. Distribuições de frequência Pra�camente se resume na maneira de ordenar os dados esta�s�cos em linhas ou colunas, tornando possível sua leitura, tanto no sen�do horizontal quanto no ver�cal. Definição: A distribuição de frequência é uma tabela que mostra classes ou intervalos das entradas de dados com uma contagem do número de entradas em cada classe. Dados Brutos: são aqueles que ainda não foram numericamente organizados. Rol: é uma lista em que os valores estão dispostos em uma determinada ordem, crescente ou decrescente. Apresentação de dados simples em uma tabela de distribuição de frequências. • Conte quantas vezes cada valor se repete. • Escreva os dados em ordem crescente. • Organize a tabela Exemplo: Considere que um gestor deseja saber o número de empregos anteriores dos candidatos à vaga para operador de caixa. Organize os dados brutos numa distribuição de frequência. Apresentação de dados agrupados em uma tabela de distribuição de frequências. Quando a variável objeto de estudo for con�nua, será sempre conveniente agrupar os valores observados em classes. Se, por outro lado, a variável for discreta e o número de valores representa�vos dessa variável for muito grande, recomenda-se o agrupamento dos dados em classes. O número de classes deve ficar entre 5 e 15. Dados brutos: Nº de empregos anteriores Fonte: Adaptado do livro Esta�s�ca Básica. VIEIRA, Sonia Total 26 Frequência 1 3 0 3 0 1 2 3 4 5 6 5 4 8 6 1 0 2 0 4 2 2 2 2 1 3 2 2 0 0 0 1 2 6 0 6 3 2 1 3 Tabela 2. Distribuição dos incritos para concorrer à vaga de operador de caixa do supermercado quanto ao número de empregos anteriores. Contagem dos dados brutos de quantos candidatos não �veram nenhum emprego anterior. O processo de construção de uma tabela de dados agrupados: Passo 1: Determinar o número de classes. Um dos métodos é a regra de Sturges: k=1+3,3logn com n= número total de observações e k=número de classes Exemplo: OBS: Além da regra de Sturges, existem outras fórmulas para determinar o número de classes, há quem prefira k=√n. Entretanto, a verdade é que essas fórmulas não nos levam a uma decisão final; esta vai depender de um julgamento pessoal, que deverá estar ligado a natureza dos dados, procurando sempre que possível, evitar classes com frequência nula ou frequências exageradamente grandes. Passo 2: Determinar a amplitude da classe: Amplitude é a diferença entre o maior e o menor valor. Arredondar o resultado para mais, até um número conveniente. A amplitude da classe deve ser constante em toda distribuição de frequências. Passo 4: Some a amplitude de classe ao ponto de par�da e termos o limite superior. Os limites de classes podem ser representados por: 10|-|12 : valores entre 10 e 12; 10-|12: valores de 10 a 12, excluindo o 10; 10|-12: valores de 10 a 12, excluindo o 12. Obs.: Neste curso iremos u�lizar a úl�ma representação. Passo 5: A contagem de dados para cada classe. Passo 3: Escolher como limite inferior da primeira classe o menor valor observado ou um valor ligeiramente inferior a ele. Esse valor serve como ponto de par�da. Se o número de observações for 500: n=500 k=1+3,3log500 log500=2,69897 k=1+(3,3×2,69897) k=9,906601 ou arredondando, k=10. Amplitude de classe= Amplitude número de classes Tabela 3. Distribuição de frequência para uso de internet ( em minutos) Fonte: Adaptado do livro Esta�s�ca Aplicada. Larson/ Farber Tempo 6 10 13 8 5 42 f 7 -18 18 -29 29 -40 40 -51 51 -62 Depois de construir uma distribuição de frequência tal como tabela 2 e a tabela 3, podemos incluir diversas caracterís�cas adicionais que ajudarão a fornecer um melhor entendimento dos dados. Essas caracterís�cas podem ser incluídas como colunas adicionais em sua tabela. eja a tabela 4 e na sequência o que representa cada coluna: Primeira coluna (x): encontra-se os valores (classes) da variável. Neste exemplo temos o tempo em minutos. Segunda coluna (f): contém o número de vezes que o valor foi observado no intervalo de classe. Essa medida é chamada de frequência absoluta simples e é representada por f. Por exemplo na terceira classe a frequência absoluta é igual a 13. Isto quer dizer que 13 usuários u�lizam internet de 29 até 40 minutos. Terceira coluna (fr): a frequência rela�va de uma classe é a porção ou porcentagem de dados que está em determinada classe. Para encontrar a frequência rela�va, divida a frequência f pelo tamanho da amostra. Para representar a porcentagem mul�plique o resultado por 100. Na terceira classe a frequência rela�va mul�plicada por 100 é 30,95. Esse resultado significa que 30,95% dos usuários u�lizam internet de 29 até 40 minutos. Quarta coluna (F): a frequência acumulada de uma classe é a soma da frequência para aquela classe e todas as anteriores. A frequência acumulada da úl�ma classe é igual ao tamanho n da amostra. Na terceira classe a frequência acumulada é 29. Isso quer dizer que 29 usuários u�lizam internet de 7 até 40 min. Quinta coluna (Fr): a frequência acumulada rela�va é a soma das frequências rela�vas dos valores inferiores ou iguais ao valor dado. Na terceira classe a frequência acumulada rela�va é 69,05. Isso significa que 69,05% doa usuários u�lizam internet de 7 até 40 min. Tabela 4. Distribuição de frequência para uso de internet (em minutos) Fonte: Adaptado do livro Esta�s�ca aplicada. Larson/ Farber Tempo Número de usuários Porcentagem de usuário 6 10 13 8 5 14,29 23,81 30,95 19,00 11,90 6 16 29 37 42 14,29 38,10 69,05 88,10 100 fr F Frf 42 100 7 -18 18 -29 29 -40 40 -51 51 -62 frequência rela�va = f n Classe f fr F Fr 7 -18 6 100 = 14,29 14,29 14,29+ x 426 6 6 + 10 6+10+13 10 13 18 -29 29 -40 10 100 = 23,81 23,81 14,29+ 23,81+ x 42 13 100 = 30,95 30,95x 42 3. Representação gráfica Os gráficos são uma forma de apresentação visual dos dados. Normalmente, contém menos informações que as tabelas, mas são de mais fácil leitura. O �po de gráfico depende da variável em questão. O gráfico deve receber um �tulo adequado, cada um dos eixos deve ser iden�ficado e apresentar uma escala sensata. 3.1 Gráficos de linhas Usualmente u�lizadospara apresentar séries cronológicas e dados exclusivamente numéricos. 3.2 Gráfico de colunas ou barras Os gráficos em barras (horizontais) e em colunas (ver�cais) estão entre os mais u�lizados na representação gráfica. Esse �po de gráfico pode ser u�lizado para todos os �pos de dados, exceto para dados con�nuos. Para dados con�nuos as colunas são dispostas sem espaços vazios como será descrito mais adiante com o histograma. Exemplos: a) Gráfico de colunas 3500 3000 2500 2000 1500 1000 500 0 Anos Produção de café Brasil - 2014 a 2018 Pr od uç ão (1 00 0t ) 2014 2015 2016 2017 2018 1500 1000 500 0 Bom Não sabe regular RESPOSTAS Ruim Opinião dos brasileiros sobre determinado técnico de futebol 1500 1000 500 0 1300 450 125 625 Bom Não sabe regular RESPOSTAS Ruim Opinião dos brasileiros sobre determinado técnico de futebol Fonte: Adaptado do livro Esta�s�ca básica. VIEIRA, Sonia. Fonte: Adaptado do livro Esta�s�ca básica. VIEIRA, Sonia. Fonte: Adaptado do livro Esta�s�ca Aplicada. Larson/ Farber. b) Gráfico de Barras Não sabe Frequência Re sp os ta 0 200 400 600 800 1000 1200 1400 Opinião dos brasileiros sobre determinado técnico de futebol 625 125 450 1300 Ruim Regular Bom 3.3 Histograma O histograma é um gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura à respec�va frequência. 3.4 Polígono de frequência Um polígono de frequência é um gráfico de linha de uma distribuição de frequência, que une os pontos da parte superior de cada barra do histograma exatamente no ponto médio. No eixo horizontal são colocados os pontos médios de cada intervalo de classe e no eixo ver�cal as frequências. 7 -18 0 20 40 60 Tempo (em minutos) Distribuição de frequência para uso de internet (em minutos) Fr eq uê nc ia 18 -29 29 -40 40 -51 51 -62 Ponto médio= (limite inferior da classe) (limite superior da classe)+ 2 Tempo Distribuição de frequência para uso de internet (em minutos) Fr eq uê nc ia 1,5 0 2 4 6 8 10 12 14 12,5 23,5 34,5 45,5 56,5 67,5 Fonte: Adaptado do livro Estatística Aplicada. Larson/ Farber 3.5 Ogiva É um gráfico adequado para representar as frequências acumuladas (F ou Fr). No eixo horizontal, são colocados os intervalos de classe. No ponto médio de cada intervalo, levanta-se uma perpendicular imaginária e marca-se um ponto na altura correspondente à frequência acumulada na classe. A seguir os pontos são unidos por segmentos de reta. 3.6 Gráfico de setores Os gráficos de setores são úteis para mostrar como se divide o todo. São mais conhecidos por gráfico de pizza, em razão do seu aspecto, dividido em fa�as. Cada fa�a é uma parte do todo. Exemplo: Ilustração de um gráfico de setores, mostrando as proporções dos funcionários da Empresa, de acordo com a qualificação. Neste roteiro estudamos as distribuições de frequências e as representações gráficas. No próximo roteiro abordaremos outras maneiras de avaliar caracterís�cas de dados. Tempo (em minuto) 7 I -18 18 I -29 29 I -40 40 I -51 51 I -62 Distribuição de frequência para uso de internet (em minuto) Fr eq uê nc ia 6 16 29 37 42 Fonte: Adaptado do livro Estatística Aplicada. Larson/ Farber. 60% 30% 6% 4% Pós-graduação Fundamental Graduados Médio Proporções dos funcionários da empresa, de acordo com a quali�cação Fonte: Departamento de Recursos Humanos da Empresa Referências: CRESPO, Antonio Arnot. Esta�s�ca fácil. 19. ed., atual. São Paulo, SP: Saraiva, [2009]. 218 p. (Série fácil). ISBN 9788502081062. LARSON, Ron; FARBER, Elizabeth. Esta�s�ca aplicada. 4 ed. -. São Paulo: Pearson Educa�on do Brasil, 2010. ISBN 9788576053729. VIEIRA, Sonia. Esta�s�ca básica. São Paulo Cengage Learning 2016 1 recurso online ISBN 9788522126316. TRIOLA, Mario F. Introdução à esta�s�ca. 12. Rio de Janeiro LTC 2017 1 recurso online ISBN 9788521634256.