Buscar

UCA001_Estatistica_Tema19

Prévia do material em texto

O uso das tecnologias como 
ferramenta da estatística
José Tadeu de Almeida
Introdução
Nesta aula, você aprenderá como utilizar softwares de análise estatística para o cálculo de indi-
cadores e suas representações gráficas. Dentre esses programas, daremos ênfase ao Microsoft Excel 
(versão 2007). Por meio dele, você irá aprender a efetuar cálculos e demonstrá-los por análise gráfica.
Objetivos de aprendizagem
Ao final desta aula, você será capaz de:
 • utilizar os programas e aplicativos para calcular estatísticas e construir tabelas e gráficos.
1 Planilhas digitais: como calcular média, variância, 
desvio padrão, separatrizes etc.
Você já deve ter percebido que, em Estatística, o aluno aprende a conceituar diferentes indicado-
res e medidas que definem o comportamento de uma população, bem como a calculá-los. A resolução 
de exemplos é viável quando o conjunto de dados a se manipular é razoavelmente pequeno. Mas como 
calcular manualmente a média de idade da população brasileira, com 200 milhões de habitantes?
Saiba que para realizar essas operações, contamos com softwares de análise de dados, os 
quais auxiliam o pesquisador na obtenção das informações desejadas. 
FIQUE ATENTO!
Desde a década de 1980, com a difusão dos chamados computadores pessoais 
(PCs), surgiram softwares de cálculo como o MatLab, o gretl, o EVIEWS, o STATA, e, 
em destaque, o SAS (Statistical Analysis System) e o SPSS (Statistical Package for 
Social Sciences). O SPSS é bastante utilizado nas disciplinas de Economia, como 
Metodologia de Análise Econômica.
Tenha em mente que o Microsoft Excel (ou apenas “Excel”) é um programa de análise de 
dados bastante comum e utilizado por empresas e pesquisadores (RIBEIRO JÚNIOR, 2005).
Quando um pesquisador coleta uma série de dados, torna-se necessário obter informações a res-
peito deles. Para isso, algumas medidas são muito utilizadas, tais como as de posição e de dispersão.
O Excel separa os dados coletados em células, sendo que cada célula comporta um dado ou 
uma operação de análise estatística. Para efetuar esses cálculos, primeiramente você irá inserir 
o operador matemático de igual (‘=’), o nome da função estatística e, fechado entre parênteses, o 
intervalo de dados necessários à sua análise (RIBEIRO JÚNIOR, 2005).
A média (com notação ⨱ ) é uma medida de posição que indica uma tendência central, ou 
seja, o valor em torno do qual está distribuída uma série de dados com n elementos de uma variá-
vel x, cujas observações vão de x1 a xn. Ela é dada por:
( )∑
n
ii=1
x
X =
n 
No Excel, você obterá a média por meio do comando “=MÉDIA(conjunto de dados; clique e 
arraste para selecionar todos os que deseja)”.
FIQUE ATENTO!
Sempre que você tiver alguma dúvida em relação às funções do Excel, aperte a 
tecla F1 e abra o menu de ajuda. Insira uma palavra-chave relacionada à sua dúvida 
para encontrar referências que ajudarão na resolução de seu problema.
Lembre-se de que a mediana é uma medida de posição que determina o valor que divide 
uma distribuição de dados em duas partes iguais. Caso a distribuição tenha n valores, e n seja um 
número ímpar, o valor central será a mediana (em 7 elementos, o elemento 4 é a mediana). Se n 
for par, a mediana será a média aritmética entre os dois elementos centrais (em oito elementos, 
a média entre os números 4 e 5). No Excel, você obterá a mediana por meio da operação “=MED
(limite inferior; limite superior)”.
Já a moda é o elemento que mais se repete em uma distribuição. Você poderá obtê-lo rapi-
damente com a operação “=MODO(limite inferior; limite superior)”. Separatrizes também são medi-
das de posição. Elas são (n – 1) valores que dividem um conjunto de dados em n partes iguais. 
Por exemplo, se desejamos dividir um conjunto em quatro partes iguais, utilizaremos os quartis, 
denominados Q1, Q2 (a própria mediana) e Q3 (RIBEIRO JÚNIOR, 2005). 
SAIBA MAIS!
Outras separatrizes muito utilizadas são os tercis (dois valores que dividem um 
conjunto de dados em três partes iguais), os quintis (quatro valores para cinco 
partes), decis (dez partes iguais) e percentis (cem partes iguais).
A operação para obtenção de um quartil é dada por “= QUARTIL (limite inferior: limite supe-
rior; quarto)”, sendo que o indicador ‘quarto’ representa o quartil (primeiro, segundo ou terceiro) 
que se deseja obter. 
EXEMPLO
Considere o conjunto A = {2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22). A média é dada por 
“=MÉDIA(conjunto de dados)” = 12. O primeiro quartil divide a primeira metade dos 
dados em duas partes iguais. No caso, será a média entre o terceiro e o quarto ele-
mento. Use “=QUARTIL(conjunto de dados;1)” e você terá Q1 = 7. O segundo quartil 
é a mediana, igual a 12. O terceiro quartil é igual a 17.
Podemos ainda analisar a variabilidade dos dados, a fi m de que seja possível saber se uma 
distribuição é homogênea em relação à média. Saiba que os indicadores de dispersão mais utiliza-
dos são a variância e o desvio padrão (RIBEIRO JÚNIOR, 2005). A variância demonstra a dispersão 
total de um conjunto de dados. Ela é calculada a partir da soma dos quadrados dos desvios. A 
distância entre os dados de uma distribuição e sua média, de acordo com a fórmula:
( )∑
2n
ii=12
x –Xix –Xis =2s =2
n 
O desvio padrão, por sua vez, é a raiz quadrada da variância: 
( )∑
2n
i2 i=12 i=1∑2 i=1∑2 2 x –Xix –Xis = s =s = s =s = s =2s = s =2 2s = s =2
n 
Como regra geral, para que a amostra seja homogênea é importante que o desvio padrão 
tenha um valor baixo. Este valor, entretanto, depende da variável de estudo e de outros indicadores, 
como a média. Se a média de um conjunto é 1.250 e o desvio padrão é igual a 8, a dispersão é 
pequena. Porém se o desvio padrão for igual a 8 em uma distribuição de média igual a 10, os dados 
estão muito dispersos.
Para resolver esse problema, utilizamos o coefi ciente de variação, que demonstra o grau de 
homogeneidade de uma distribuição de dados, de acordo com a fórmula:
( )
( )
∑
∑
2n
i2 i=1
n
ii=1
x –Xix –Xi
snCV = =CV = =CV = =CV = =CV = =nCV = =n
Xx
n
Entenda que quando o coefi ciente está próximo de zero, a amostra é homogênea, perdendo 
esta característica à medida que o coefi ciente aumenta.
Calculamos a variância de uma população por meio do comando “=VAR(série de dados)”, 
enquanto o desvio padrão de uma população é dado por “DESVPADP(série de dados)”. Você pode 
confirmar a validade de seu indicador calculando a variância e depois retirando sua raiz quadrada, 
com o comando “=(valor da variância)^0,5”. Por fim, o coeficiente de variação é dado pelo comando 
“=(valor do desvio padrão)/(Valor da média)” (RIBEIRO JÚNIOR, 2005).
EXEMPLO
Utilizando o mesmo conjunto do exemplo anterior, a variância é calculada pelo 
comando “=VAR(conjunto de dados)”, sendo igual a 44. O desvio-padrão é dado 
por “=DESVPAD(conjunto)”, sendo igual a 6,63. O coeficiente de variação é igual a 
0,5525, demonstrando que a dispersão é alta em relação à média. 
A seguir, estudaremos a construção de tabelas e gráficos!
2 Como formatar tabelas
Dados com uma ou mais variáveis (como por exemplo, os dados de um grupo de soldados 
separados por peso, altura e nota em teste de tiro) podem ser organizados em tabelas, para sua 
melhor visualização. Podemos formatar tabelas pelo método manual ou por comandos.
O método manual consiste em agrupar os dados de interesse ou exibi-los individualmente, 
conforme o tamanho do conjunto sob análise. Você pode tornar a tabela esteticamente mais agra-
dável aplicando bordas (com o comando “Borda superior ou inferior”), e centralizando os dados. 
Centralize também o título e a legenda relativa à fonte (com os comandos “quebrar texto automa-
ticamente” e “mesclar e centralizar”). Observe:
Tabela 1 – Distribuição de soldados por altura, peso e nota em teste de tiro
Soldado Altura(cm) Peso (kg) Nota
A 180 83 78
B 172 72 95
C 187 71 75
D 178 76 81
E 180 63 91
F 169 79 93
G 188 80 95
H 177 75 95
I 184 69 100
J 181 64 77
Fonte: elaborada pelo autor, 2017.
Você pode, ainda, utilizar o comando “Formatar como Tabela”. Com ele, serão abertos vários 
layouts de tabelas para facilitar a sua visualização. Além disso, ele permite que você possa mani-
pular os dados dentro da tabela, reordenando-os rapidamente. Imagine que você deseja obter uma 
ordem crescente dos soldados por nota no exame de tiro. 
Tabela 2 – Distribuição dos soldados
Fonte: elaborada pelo autor, 2017.
Nesse caso, você irá clicar na opção “Nota” e selecionar “classificar do maior para o menor” 
(RIBEIRO JÚNIOR, 2005).
3 Como formatar gráficos
Gráficos são úteis para demonstrar o comportamento de um conjunto de dados. Podemos, 
com eles, visualizar tendências de uma ou mais variáveis.
FIQUE ATENTO!
Nas Ciências Econômicas e na Administração, gráficos são muito utilizados para verifi-
car o comportamento dos custos de produção, a taxa de crescimento da economia etc.
Gráficos dinamizam a compreensão de um conjunto de dados. Na maior parte das vezes, 
os gráficos do Excel são moldados a partir de dados inseridos pelo pesquisador e dispostos em 
tabelas (RIBEIRO JÚNIOR, 2005).
SAIBA MAIS!
Você pode realizar gráficos de maior nível de dificuldade, como distribuições de 
probabilidade e distribuições normais, por meio do software Geogebra, disponível 
em: <https://www.geogebra.org/?lang=pt_BR>.
O processo de criação de gráficos envolve duas etapas. Vamos selecionar uma variável de 
estudo, como a nota do exame de tiro vista no tópico anterior. Você irá criar um gráfico selecio-
nando o conjunto de dados que pretende analisar (com os títulos) e clicando na aba “Inserir”, na 
barra de menus, e depois em “Gráfico”.
A primeira etapa é selecionar o tipo de gráfico desejado. Há gráficos para cada tipo de dados: 
para uma variável, você pode utilizar um gráfico em que as notas ficam dispostas em colunas. 
Assim, será exibido um modelo básico do gráfico.
A segunda etapa é a formatação do gráfico. Você irá ajustá-lo para tornar a apresentação 
mais didática. Altere o título clicando nele, e depois aloque a caixa de legenda abaixo do gráfico, ou 
a exclua. Por fim, insira informações a respeito de cada um dos eixos, clicando na aba “ferramen-
tas de gráfico”, e depois em layout e “títulos dos eixos”.
4 Construindo histogramas e diagramas
Histogramas são apresentações gráficas em um conjunto de retângulos dispostos em um 
gráfico de colunas, de modo que a altura de cada retângulo corresponde à frequência de um 
intervalo de dados, ou seja, ao número de vezes em que são observados elementos que pertençam 
a um determinado intervalo (RIBEIRO JÚNIOR, 2005). 
Vamos utilizar o modelo dos soldados, porém adicionando mais dados para visualizarmos melhor 
o histograma. Primeiramente, separemos as notas obtidas por intervalos, a saber, ‘60 ⊢ 65’ (o operador 
⊢ demonstra o intervalo entre 75 até 80, excluído o número natural 80), ‘65 ⊢ 70’, ‘70 ⊢ 75’, 75 ⊢ 80’, 
‘80 ⊢ 85’, ‘85 ⊢ 90’, ‘90 ⊢ 95’, ‘95 ⊢ 100’. Acompanhe:
Figura 1 – Histograma
0
2
4
6
8
10
12
2
3
5
6
7
8
10
60 65 65 70 70 75 75 80 80 85 85 90 90 95 95 100
Fonte: elaborada pelo autor, 2017.
Adicionamos rótulos, que são os valores associados a cada coluna (clique sobre o gráfico 
com o botão direito e selecione a opção “adicionar rótulos de dados”). Para unir as colunas, clique 
com o botão direito sobre a coluna, selecione “formatar série de dados”, “opções de série”, e em 
“largura do espaçamento”, coloque o cursor em zero, “sem intervalo”.
Diagramas são apresentações que demonstram fluxos de decisão que se relacionam entre 
si. Você pode criar diagramas a partir dos comandos “Inserir” SmartArt e selecionar o modelo mais 
conveniente. Observe!
Figura 2 – Fluxos de decisão em uma empresa
Presidência
Diretoria de
Planejamento
Diretoria de
Logística
Contabilidade Operações
Fonte: elaborada pelo autor, 2017.
Assim, você pode utilizar apresentações gráficas para demonstrar dados e ações!
Fechamento
Nesta aula, você teve oportunidade de:
 • conhecer os principais mecanismos de cálculo no software Excel;
 • efetuar cálculos, tabelas e apresentações gráficas.
Referências
RIBEIRO JÚNIOR, José Ivo. Análises Estatísticas no Excel - Guia prático. Viçosa: Editora UFV, 2005.
GEOGEBRA. Disponível em: <https://www.geogebra.org/?lang=pt_BR>. Acesso em: 17 mar. 2017.

Continue navegando