Baixe o app para aproveitar ainda mais
Prévia do material em texto
O uso das tecnologias como ferramenta da estatística José Tadeu de Almeida Introdução Nesta aula, você aprenderá como utilizar softwares de análise estatística para o cálculo de indi- cadores e suas representações gráficas. Dentre esses programas, daremos ênfase ao Microsoft Excel (versão 2007). Por meio dele, você irá aprender a efetuar cálculos e demonstrá-los por análise gráfica. Objetivos de aprendizagem Ao final desta aula, você será capaz de: • utilizar os programas e aplicativos para calcular estatísticas e construir tabelas e gráficos. 1 Planilhas digitais: como calcular média, variância, desvio padrão, separatrizes etc. Você já deve ter percebido que, em Estatística, o aluno aprende a conceituar diferentes indicado- res e medidas que definem o comportamento de uma população, bem como a calculá-los. A resolução de exemplos é viável quando o conjunto de dados a se manipular é razoavelmente pequeno. Mas como calcular manualmente a média de idade da população brasileira, com 200 milhões de habitantes? Saiba que para realizar essas operações, contamos com softwares de análise de dados, os quais auxiliam o pesquisador na obtenção das informações desejadas. FIQUE ATENTO! Desde a década de 1980, com a difusão dos chamados computadores pessoais (PCs), surgiram softwares de cálculo como o MatLab, o gretl, o EVIEWS, o STATA, e, em destaque, o SAS (Statistical Analysis System) e o SPSS (Statistical Package for Social Sciences). O SPSS é bastante utilizado nas disciplinas de Economia, como Metodologia de Análise Econômica. Tenha em mente que o Microsoft Excel (ou apenas “Excel”) é um programa de análise de dados bastante comum e utilizado por empresas e pesquisadores (RIBEIRO JÚNIOR, 2005). Quando um pesquisador coleta uma série de dados, torna-se necessário obter informações a res- peito deles. Para isso, algumas medidas são muito utilizadas, tais como as de posição e de dispersão. O Excel separa os dados coletados em células, sendo que cada célula comporta um dado ou uma operação de análise estatística. Para efetuar esses cálculos, primeiramente você irá inserir o operador matemático de igual (‘=’), o nome da função estatística e, fechado entre parênteses, o intervalo de dados necessários à sua análise (RIBEIRO JÚNIOR, 2005). A média (com notação ⨱ ) é uma medida de posição que indica uma tendência central, ou seja, o valor em torno do qual está distribuída uma série de dados com n elementos de uma variá- vel x, cujas observações vão de x1 a xn. Ela é dada por: ( )∑ n ii=1 x X = n No Excel, você obterá a média por meio do comando “=MÉDIA(conjunto de dados; clique e arraste para selecionar todos os que deseja)”. FIQUE ATENTO! Sempre que você tiver alguma dúvida em relação às funções do Excel, aperte a tecla F1 e abra o menu de ajuda. Insira uma palavra-chave relacionada à sua dúvida para encontrar referências que ajudarão na resolução de seu problema. Lembre-se de que a mediana é uma medida de posição que determina o valor que divide uma distribuição de dados em duas partes iguais. Caso a distribuição tenha n valores, e n seja um número ímpar, o valor central será a mediana (em 7 elementos, o elemento 4 é a mediana). Se n for par, a mediana será a média aritmética entre os dois elementos centrais (em oito elementos, a média entre os números 4 e 5). No Excel, você obterá a mediana por meio da operação “=MED (limite inferior; limite superior)”. Já a moda é o elemento que mais se repete em uma distribuição. Você poderá obtê-lo rapi- damente com a operação “=MODO(limite inferior; limite superior)”. Separatrizes também são medi- das de posição. Elas são (n – 1) valores que dividem um conjunto de dados em n partes iguais. Por exemplo, se desejamos dividir um conjunto em quatro partes iguais, utilizaremos os quartis, denominados Q1, Q2 (a própria mediana) e Q3 (RIBEIRO JÚNIOR, 2005). SAIBA MAIS! Outras separatrizes muito utilizadas são os tercis (dois valores que dividem um conjunto de dados em três partes iguais), os quintis (quatro valores para cinco partes), decis (dez partes iguais) e percentis (cem partes iguais). A operação para obtenção de um quartil é dada por “= QUARTIL (limite inferior: limite supe- rior; quarto)”, sendo que o indicador ‘quarto’ representa o quartil (primeiro, segundo ou terceiro) que se deseja obter. EXEMPLO Considere o conjunto A = {2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22). A média é dada por “=MÉDIA(conjunto de dados)” = 12. O primeiro quartil divide a primeira metade dos dados em duas partes iguais. No caso, será a média entre o terceiro e o quarto ele- mento. Use “=QUARTIL(conjunto de dados;1)” e você terá Q1 = 7. O segundo quartil é a mediana, igual a 12. O terceiro quartil é igual a 17. Podemos ainda analisar a variabilidade dos dados, a fi m de que seja possível saber se uma distribuição é homogênea em relação à média. Saiba que os indicadores de dispersão mais utiliza- dos são a variância e o desvio padrão (RIBEIRO JÚNIOR, 2005). A variância demonstra a dispersão total de um conjunto de dados. Ela é calculada a partir da soma dos quadrados dos desvios. A distância entre os dados de uma distribuição e sua média, de acordo com a fórmula: ( )∑ 2n ii=12 x –Xix –Xis =2s =2 n O desvio padrão, por sua vez, é a raiz quadrada da variância: ( )∑ 2n i2 i=12 i=1∑2 i=1∑2 2 x –Xix –Xis = s =s = s =s = s =2s = s =2 2s = s =2 n Como regra geral, para que a amostra seja homogênea é importante que o desvio padrão tenha um valor baixo. Este valor, entretanto, depende da variável de estudo e de outros indicadores, como a média. Se a média de um conjunto é 1.250 e o desvio padrão é igual a 8, a dispersão é pequena. Porém se o desvio padrão for igual a 8 em uma distribuição de média igual a 10, os dados estão muito dispersos. Para resolver esse problema, utilizamos o coefi ciente de variação, que demonstra o grau de homogeneidade de uma distribuição de dados, de acordo com a fórmula: ( ) ( ) ∑ ∑ 2n i2 i=1 n ii=1 x –Xix –Xi snCV = =CV = =CV = =CV = =CV = =nCV = =n Xx n Entenda que quando o coefi ciente está próximo de zero, a amostra é homogênea, perdendo esta característica à medida que o coefi ciente aumenta. Calculamos a variância de uma população por meio do comando “=VAR(série de dados)”, enquanto o desvio padrão de uma população é dado por “DESVPADP(série de dados)”. Você pode confirmar a validade de seu indicador calculando a variância e depois retirando sua raiz quadrada, com o comando “=(valor da variância)^0,5”. Por fim, o coeficiente de variação é dado pelo comando “=(valor do desvio padrão)/(Valor da média)” (RIBEIRO JÚNIOR, 2005). EXEMPLO Utilizando o mesmo conjunto do exemplo anterior, a variância é calculada pelo comando “=VAR(conjunto de dados)”, sendo igual a 44. O desvio-padrão é dado por “=DESVPAD(conjunto)”, sendo igual a 6,63. O coeficiente de variação é igual a 0,5525, demonstrando que a dispersão é alta em relação à média. A seguir, estudaremos a construção de tabelas e gráficos! 2 Como formatar tabelas Dados com uma ou mais variáveis (como por exemplo, os dados de um grupo de soldados separados por peso, altura e nota em teste de tiro) podem ser organizados em tabelas, para sua melhor visualização. Podemos formatar tabelas pelo método manual ou por comandos. O método manual consiste em agrupar os dados de interesse ou exibi-los individualmente, conforme o tamanho do conjunto sob análise. Você pode tornar a tabela esteticamente mais agra- dável aplicando bordas (com o comando “Borda superior ou inferior”), e centralizando os dados. Centralize também o título e a legenda relativa à fonte (com os comandos “quebrar texto automa- ticamente” e “mesclar e centralizar”). Observe: Tabela 1 – Distribuição de soldados por altura, peso e nota em teste de tiro Soldado Altura(cm) Peso (kg) Nota A 180 83 78 B 172 72 95 C 187 71 75 D 178 76 81 E 180 63 91 F 169 79 93 G 188 80 95 H 177 75 95 I 184 69 100 J 181 64 77 Fonte: elaborada pelo autor, 2017. Você pode, ainda, utilizar o comando “Formatar como Tabela”. Com ele, serão abertos vários layouts de tabelas para facilitar a sua visualização. Além disso, ele permite que você possa mani- pular os dados dentro da tabela, reordenando-os rapidamente. Imagine que você deseja obter uma ordem crescente dos soldados por nota no exame de tiro. Tabela 2 – Distribuição dos soldados Fonte: elaborada pelo autor, 2017. Nesse caso, você irá clicar na opção “Nota” e selecionar “classificar do maior para o menor” (RIBEIRO JÚNIOR, 2005). 3 Como formatar gráficos Gráficos são úteis para demonstrar o comportamento de um conjunto de dados. Podemos, com eles, visualizar tendências de uma ou mais variáveis. FIQUE ATENTO! Nas Ciências Econômicas e na Administração, gráficos são muito utilizados para verifi- car o comportamento dos custos de produção, a taxa de crescimento da economia etc. Gráficos dinamizam a compreensão de um conjunto de dados. Na maior parte das vezes, os gráficos do Excel são moldados a partir de dados inseridos pelo pesquisador e dispostos em tabelas (RIBEIRO JÚNIOR, 2005). SAIBA MAIS! Você pode realizar gráficos de maior nível de dificuldade, como distribuições de probabilidade e distribuições normais, por meio do software Geogebra, disponível em: <https://www.geogebra.org/?lang=pt_BR>. O processo de criação de gráficos envolve duas etapas. Vamos selecionar uma variável de estudo, como a nota do exame de tiro vista no tópico anterior. Você irá criar um gráfico selecio- nando o conjunto de dados que pretende analisar (com os títulos) e clicando na aba “Inserir”, na barra de menus, e depois em “Gráfico”. A primeira etapa é selecionar o tipo de gráfico desejado. Há gráficos para cada tipo de dados: para uma variável, você pode utilizar um gráfico em que as notas ficam dispostas em colunas. Assim, será exibido um modelo básico do gráfico. A segunda etapa é a formatação do gráfico. Você irá ajustá-lo para tornar a apresentação mais didática. Altere o título clicando nele, e depois aloque a caixa de legenda abaixo do gráfico, ou a exclua. Por fim, insira informações a respeito de cada um dos eixos, clicando na aba “ferramen- tas de gráfico”, e depois em layout e “títulos dos eixos”. 4 Construindo histogramas e diagramas Histogramas são apresentações gráficas em um conjunto de retângulos dispostos em um gráfico de colunas, de modo que a altura de cada retângulo corresponde à frequência de um intervalo de dados, ou seja, ao número de vezes em que são observados elementos que pertençam a um determinado intervalo (RIBEIRO JÚNIOR, 2005). Vamos utilizar o modelo dos soldados, porém adicionando mais dados para visualizarmos melhor o histograma. Primeiramente, separemos as notas obtidas por intervalos, a saber, ‘60 ⊢ 65’ (o operador ⊢ demonstra o intervalo entre 75 até 80, excluído o número natural 80), ‘65 ⊢ 70’, ‘70 ⊢ 75’, 75 ⊢ 80’, ‘80 ⊢ 85’, ‘85 ⊢ 90’, ‘90 ⊢ 95’, ‘95 ⊢ 100’. Acompanhe: Figura 1 – Histograma 0 2 4 6 8 10 12 2 3 5 6 7 8 10 60 65 65 70 70 75 75 80 80 85 85 90 90 95 95 100 Fonte: elaborada pelo autor, 2017. Adicionamos rótulos, que são os valores associados a cada coluna (clique sobre o gráfico com o botão direito e selecione a opção “adicionar rótulos de dados”). Para unir as colunas, clique com o botão direito sobre a coluna, selecione “formatar série de dados”, “opções de série”, e em “largura do espaçamento”, coloque o cursor em zero, “sem intervalo”. Diagramas são apresentações que demonstram fluxos de decisão que se relacionam entre si. Você pode criar diagramas a partir dos comandos “Inserir” SmartArt e selecionar o modelo mais conveniente. Observe! Figura 2 – Fluxos de decisão em uma empresa Presidência Diretoria de Planejamento Diretoria de Logística Contabilidade Operações Fonte: elaborada pelo autor, 2017. Assim, você pode utilizar apresentações gráficas para demonstrar dados e ações! Fechamento Nesta aula, você teve oportunidade de: • conhecer os principais mecanismos de cálculo no software Excel; • efetuar cálculos, tabelas e apresentações gráficas. Referências RIBEIRO JÚNIOR, José Ivo. Análises Estatísticas no Excel - Guia prático. Viçosa: Editora UFV, 2005. GEOGEBRA. Disponível em: <https://www.geogebra.org/?lang=pt_BR>. Acesso em: 17 mar. 2017.
Compartilhar