Buscar

psicologia atual apostila

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 43 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 43 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 43 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

�PAGE �
�PAGE �43�
CENTRO UNIVERSITÁRIO DA GRANDE DOURADOS – UNIGRAN
CURSO DE PSICOLOGIA – MATUTINO E NOTURNO 
DISCIPLINA: ESTATÍSTICA
Profª. M.Sc. Solange Tieko Sakaguti		
e-mail: � HYPERLINK "mailto:solangesakaguti@hotmail.com" �solangesakaguti@hotmail.com� ou � HYPERLINK "mailto:solange@unigran.br" ��solange@unigran.br� 
CONHECENDO A ESTATÍSTICA: 
O que é Estatística?
Segundo Crespo� (2002) Estatística é o ramo da matemática aplicada que estuda os dados. 
Para que estudar estatística?
Segundo Rao� (1999):
a Estatística é uma ciência que estuda e pesquisa sobre: o levantamento de dados com a máxima quantidade de informação possível para um dado custo; o processamento de dados para a quantificação da quantidade de incerteza existente na resposta para um determinado problema; a tomada de decisões sob condições de incerteza, sob o menor risco possível. De fato, a estatística tem sido utilizada na pesquisa científica para a otimização de recursos econômicos, para o aumento da qualidade e produtividade, na otimização em análise de decisões, em questões judiciais, previsões e em muitas outras áreas (RAO, 1999).
Segundo Crespo (2002), população é o conjunto de entre portadores de, pelo menos, uma característica comum.
Segundo Crespo (2002), amostra é um subconjunto finito de uma população.
Segundo Crespo (2002), método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja.
Para chegar à apuração dos dados é necessário que se adotem métodos. Na estatística temos os Métodos Científicos que são: Método Experimental e Método Estatístico.
Método Experimental: é importante na descoberta de conhecimentos científicos. Como o próprio nome diz, chega-se a um determinado resultado através de experimentos com estudos da física, química, matemática, entre outros. Matemáticos como Arquimedes (287 a.C. – 212 a.C.) e Galileu Galilei (1564-1642).
O Método Experimental divide-se em quatro etapas. Para melhor explicá-las utilizaremos como base um exemplo do cotidiano...
identificação e análise do problema ou situação – nessa etapa definimos que assunto iremos discutir, por exemplo: o índice de evasão escolar nas escolas públicas no período noturno;
formulação de uma hipótese explicativa – será uma possível dedução do que possa acontecer, por exemplo: os alunos estão saindo devido à necessidade de trabalhar o dia inteiro e no período noturno não conseguem acompanhar as explicações, desestimulando o aluno;
experimentação-manipulação e controle das variáveis no grupo em observação – nessa etapa coletamos os dados e tabulamos os mesmos, por exemplo: os dados podem ser coletados através de um questionário envolvendo perguntas que abordam todas as possíveis questões de evasão. Em seguida esses dados são tabulados; e 
Segundo Crespo (2002), variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno.
conclusão, ou seja, a confirmação da hipótese – nessa última fase, após os dados tabulados, verificamos se nossa hipótese é verdadeira.
Palavra grega que significa base, fundamento, princípio de algo, proposição. 
Hipótese: proposição que se admite, independentemente do fato de ser verdadeira ou falsa, mas unicamente a título de um princípio a partir do qual se pode deduzir um determinado conjunto de consequências. (Dicionário Houaiss).
Podemos relacionar alguns tipos de variáveis: 
para o fenômeno “evasão escolar” a variável pode ser: frequência dos alunos.
para o fenômeno “estado civil” as variáveis são: solteiro, casado, divorciado, desquitado, viúvo.
para o fenômeno “tempo” as variáveis são: seco, quente, úmido, chuvoso, ensolarado.
para o fenômeno “estatura” as variáveis são números em quantidades infinitas, dentro de um determinado intervalo, como por exemplo: 1,73m, 1,56m, 1,25m, 1,89m, etc.
para o fenômeno “solo” as variáveis são: úmido, arenoso, árido, fértil.
Temos dois tipos de variáveis:
qualitativa é aquela quando seus valores são expressos por atributo, ou seja, sexo (masculino e feminino), cor (vermelho, amarelo, branco, azul, etc), etc.
quantitativa é quando seus valores são expressos em números como por exemplo: salário, idade, altura, temperatura, etc. Essa variável se divide em duas outras:
Contínua: quando os valores estão entre um determinado intervalo, como por exemplo: 1,5 a 3,2 cm, compreende todos os valores que existem de 1,5 cm até 3,2 cm.
Discreta: quando os valores são definidos dentro desse intervalo, como por exemplo: 1 a 5 anos, compreende 1, 2, 3, 4 e 5 anos.
Método Estatístico: é feito seguindo etapas para se chegar a um objetivo previamente definido. Iremos, agora, detalhar essas etapas:
Definição do Problema: nessa etapa define-se o que deseja pesquisar, ou seja, define-se qual o problema que será feito o levantamento dos dados.
Planejamento: definem-se as formas que se deseja trabalhar com os dados (amostragem, censo, etc.). É preciso nessa fase resolver como será feito o levantamento dos dados, fazer um cronograma das atividades, levantar custos, etc.
Segundo Crespo (2002), amostragem é uma técnica especial para recolher amostras.
Censo é uma avaliação direta de um parâmetro, utilizando-se todos os componentes da população. Extraído do site: http://www.cesec.ufpr.br/~cds/estatistica/conceitos.htm
Coleta de dados: essa fase é operacional, ou seja, onde os dados são coletados, registrados. Há dois tipos de dados: primários e secundários; e dois tipos de coleta: direta e indireta.
Dados primários: quando são publicados pela própria pessoa que fez o levantamento, como por exemplo, o levantamento do censo demográfico do IBGE – Instituto Brasileiro de Geografia e Estatística (http://www.ibge.gov.br).
Dados secundários: quando são publicados por outras pessoas que não foram as mesmas quem fizeram o levantamento, como por exemplo quando um jornal ou uma revista publica as estatísticas referentes aos dados estatísticos do MEC – Ministério da Educação (http://www.mec.gov.br). 
Coleta direta: quando os dados são obtidos diretamente da fonte, como, por exemplo, quando se quer fazer o levantamento da preferência dos consumidores por um determinado produto. Ela está dividida em outras três: a coleta direta contínua que faz o levantamento de dados de registros de nascimentos, óbitos, casamentos, etc.; a coleta direta periódica que faz o levantamento de dados do censo demográfico, censo industrial; e a coleta direta ocasional que faz o levantamento de casos de analfabetos, por exemplo.
Coleta indireta: é feita por deduções a partir dos elementos conseguidos pela coleta direta, por analogia, por avaliação, indícios ou proporção.
Apuração dos dados: é a fase onde os dados são tabulados (contados). Essa fase pode ser feita manual, eletromecânica ou mecânica.
Apresentação dos dados: há duas maneiras de se apresentar os dados tabulados: uma é a forma de tabelas onde os dados se apresentam em números disponibilizados em linhas e colunas; e outra é a forma gráfica onde os dados são colocados em gráficos de formatos variados (coluna, linha, pizza, etc.), de forma que permita uma visualização clara.
Segundo Crespo (2002), tabela é um quadro que resume um conjunto de observações.
Segundo Crespo (2002), gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e vida do fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries.
Análise e interpretação dos dados: é a última e mais importante etapa do processo, pois é ela quem descreve os problemas por meio de cálculo de medidas e coeficientes.
Todos esses dados são registrados e armazenados com a finalidade de ter uma referência por períodos. Esses dados serão mais bem compreendidos se estiverem em tabelas e/ou gráficos, pois auxilia a compreensão visual dos dados, após os devidos cálculos matemáticos.
Dessa forma,poderemos dizer que os estudantes da disciplina de Estatística, por exemplo, constituem uma população, por apresentarem ao menos uma característica em comum... estão fazendo o mesmo curso. Entretanto, poderemos restringir um pouco mais esse grupo, dizendo que selecionamos, dentro de um outro grupo os alunos da disciplina de Estatística, apenas uma parte desses alunos... Então poderemos considerar como uma Amostra. Mas, para termos uma amostra representativa àquele grupo, devemos considerar as mesmas características básicas da população, no que se refere ao que desejamos pesquisar. Para isso temos uma técnica especial na coleta dessas amostras chamada de Amostragem.
Dentro da Amostragem encontramos as não-probabilísticas e as probabilísticas. As não-probabilísticas são:
Acidental ou Conveniência: indicada para produtos exploratórios, sendo utilizada frequentemente em supermercados para testar produtos.
Intencional: onde o pesquisador dirige-se a um grupo específico para questionar e levantar opiniões. Um exemplo seria sobre o grau de escolaridade dos funcionários de uma determinada empresa.
Quotas ou Proporcional: essa amostragem é uma variação da amostragem intencional, onde é necessário ter um prévio conhecimento da população e sua proporcionalidade. Um exemplo seria entrevistar apenas grandes pesquisadores, deixando de lado os médios e pequenos. Isso representaria somente uma parte do todo.
Desproporcional: amostragem utilizada quando a escolha da amostra for desproporcional à população, ponderando-se pesos para os dados e obtendo resultados também ponderados, que são representativos para a análise.
Por meio da Amostragem, cada elemento da população passa ter a mesma chance de ser escolhido. Podemos abordar a amostragem probabilística em três tipos: Amostragem Casual (Aleatória Simples), Amostragem Proporcional Estratificada e Amostragem Sistemática. Falaremos mais detalhadamente sobre cada uma delas.
Amostragem Casual ou Aleatória Simples – essa amostragem equivale a um sorteio simples, como por exemplo, um sorteio de loteria. Vamos a um exemplo... 
Queremos obter uma amostra representativa da estatura dos alunos da disciplina de Estatística. Considerando que existam 150 alunos, enumeramos os alunos de 1 a 150, conforme a ordem que aparece na lista de chamada. Após esse procedimento, escreve-se em um papel os números de 1 a 150, em pedaços iguais, separadamente, e coloca-se numa caixa. Balança-se a caixa para que os números se misturem. Caso deseja-se retirar uma amostra de 10% da população, retira-se, um a um, 15 números da caixa, o que equivale a 10%. Supondo-se que os números retirados foram:
02 35 41 56 61 68 70 75 81 85 90 110 129 135 149
Então, mediremos as alturas dos alunos correspondentes a esses números na lista de chamada. Dessa forma obteremos uma amostragem significativa da turma.
Amostragem Proporcional Estratificada – podemos considerar estratos, subconjuntos dessas populações, como por exemplo, sexo (masculino e feminino), cor de cabelos (pretos, ruivos, loiros), estado civil (casado, solteiro, viúvo, separado), etc.
Para exemplificar esse caso, retomaremos o exemplo dado em Amostragem Casual. Considerando que dos 150 alunos, 65 são mulheres e 85 são homens, teremos dois estratos (homens e mulheres). Desses queremos 10 % da população como amostra...
	SEXO
	POPULAÇÃO
	10%
	AMOSTRA
	M
F
	85
65
	
	9
6
	Total
	150
	
	15
Observe que não existem números quebrados para pessoas, como o exemplo mostrou como resultado da estratificação de 10%. O número 8,5 foi aproximado para 9 e o número 6,5 foi aproximado para 6. Esses ajustes são feitos sempre que necessários. Note que “subimos” o número 8,5 para 9 e “descemos” o número 6,5 para 6, por uma simples questão de escolha. O importante é que no final o valor total seja correspondente a 10% do total, ou seja, 15 alunos do total de 150. Observe as regras de arredondamento... 
Mediremos, então, os nove primeiros alunos, do sexo masculino, da lista de chamada e as seis primeiras alunas, do sexo feminino, também da lista de chamada. Dessa forma, obteremos a estratificação dessa turma.
Amostragem Sistemática – é quando o sistema de seleção da população é imposta pelo pesquisador. Podemos tomar como exemplo quando é necessário fazer uma média das notas dos alunos de uma determinada turma. Considerando uma turma de 500 alunos, por exemplo, tomamos como referência a nota dos alunos pela listagem de nomes em ordem alfabética, e de cada 50 alunos, escolhemos uma nota. Nesse caso estabelecemos uma amostragem de 10% da população. 
NOÇÕES DE AMOSTRAGEM
Já vimos os conceitos e cálculos básicos necessários para o estudo de qualquer pesquisa estatística. Agora precisamos aprender um ponto essencial para qualquer pesquisa estatística. Já sabe qual o tamanho de amostra de deverá usar?
Essa sempre é a dúvida de qualquer pesquisador. Qual o tamanho ideal? O tamanho da amostra, na maioria das vezes, dependerá do pesquisador, ou seja, do seu conhecimento com relação ao público/população que será envolvida e da sua experiência em saber qual o tamanho de amostra que trará resultados mais próximos da realidade, resultados fiéis à pesquisa. 
Existem duas maneiras de se calcular o tamanho da amostra: quando se conhece o tamanho da população (população finita) e quando não se conhece (população infinita).
É necessário, também, saber qual o erro amostral que se quer utilizar. A margem de erro amostral existe em toda pesquisa porque não se está entrevistando todo o universo. Como se trabalha com amostras, ou seja, parte do todo, existe um erro amostral que pode ser calculado em função do tamanho da amostra e dos resultados obtidos na pesquisa. É importante lembrar que para um mesmo tamanho de amostra, quanto maior a homogeneidade da população pesquisada, menor será o erro amostral e vice-versa. Então conhecer a população que será pesquisada é um dos fatores essenciais para o bom andamento de qualquer pesquisa. Dessa forma, os resultados de uma pesquisa devem ser interpretados dentro de um intervalo que estabelece limites em torno da estimativa obtida: o chamado intervalo de confiança.
Intervalo de confiança da pesquisa é estabelecido de comum acordo entre orientando e pesquisador (aluno), entretanto, o mais usual é trabalhar com intervalos com 95% de confiança. Isso quer dizer que há uma possibilidade pré-fixada, de 95% de o intervalo de confiança conter o percentual que se deseja estimar.
Por exemplo:
Quando se diz que, das pessoas que têm depressão, o percentual que têm intenção de procurar um psicólogo é de 30%, significa que existe uma probabilidade de 95% de o percentual de depressivos que têm intenção de buscar ajuda em psicólogos estar compreendido no intervalo:
[30% - erro amostral; 30% + erro amostral], ou seja, 35% ou 25% das pessoas que têm depressão têm intenção de buscar ajuda em psicólogos. Veja que o erro amostral de 5% e o nível de confiança de 95% permitiram a variação de 5 pontos para mais ou para menos na proporção de 30, desta forma apresenta-se como 35% ou 25%.
Agora, considerando uma margem de erro de 3 pontos percentuais para a situação, anteriormente citada, o intervalo de confiança dela, com uma confiabilidade de 95%, seria o seguinte: 
[30% - 3%; 30% + 3%] = [27%; 33%]. Isso significa dizer que, considerando o mesmo modelo amostral, se 100 amostras forem tiradas da população, em 95 delas o índice deste candidato variará entre 27% e 33%.
IMPORTANTE: O tamanho da amostra não determina se ela é boa ou de má qualidade. Depende muito da população que está sendo envolvida na pesquisa. 
Existem erros não-amostrais que também interferem no resultado da pesquisa:
dados demográficos desatualizados usados na elaboração das amostras;
questionários mal elaborados (perguntas que induzem a determinadas respostas, falta de objetividade, ordem inadequada,vocabulário inacessível etc.);
entrevistadores mal treinados;
ocorrências inesperadas ligadas ao tema da pesquisa.
Para não comprometer o resultado de uma pesquisa é importante verificar os itens acima citados para não alterar radicalmente os resultados e, por fim ter comprometidos a interpretação e análise dos resultados.
População Infinita
Para o cálculo da amostra de uma população infinita devemos utilizar a seguinte fórmula:
, onde:
n0 = tamanho da amostra
E0 = erro amostral tolerável
Por exemplo:
Numa pesquisa para uma eleição presidencial, qual deve ser o tamanho de uma amostra aleatória simples, se deseja garantir um erro amostral não superior a 2%?
Veja que o valor utilizado para E (erro) é 2%, ou seja, 
 que resulta em 0,02.
População Finita
Para o cálculo da amostra de uma população finita devemos utilizar as seguintes fórmulas:
			
, onde:
n0 = primeira aproximação do número da amostra
n = tamanho da amostra
N = tamanho da população envolvida na pesquisa
E0 = erro amostral tolerável
Por exemplo:
Numa pesquisa para uma eleição de prefeito, qual deve ser o tamanho de uma amostra aleatória simples, considerando uma cidade com 200 eleitores, se deseja garantir um erro amostral não superior a 4%?
Veja que neste caso temos os valores:
E = 0,04, n0 = 625 e N = 200. Desta forma, disponibilizando os mesmos nas fórmulas obteremos que a amostra será 152 eleitores que deverão ser pesquisados.
SÉRIES ESTATÍSTICAS – Tabelas e Gráficos.
Tabela é um quadro que resume um conjunto de observações. Tomemos como exemplo a tabela abaixo:
	1
	ALUNOS DO CENTRO UNIVERSITÁRIO DA GRANDE DOURADOS – UNIGRAN NO PERIODO DE 2001 A 2005
	2
	ANOS
	QUANTIDADE
	3
	2001
2002
2003
2004
2005
	3.581
4.021
4.958
5.562
5.985
	4
	Fonte: dados fictícios.
Uma tabela compõe-se de:
corpo: conjunto de linhas e colunas que contém informações sobre a variável em estudo – itens 2 e 3;
cabeçalho: parte superior da tabela que especifica o conteúdo das colunas – item 2;
coluna indicadora: parte da tabela que especifica o conteúdo das linhas – nesse caso os anos (2001, 2002, 2003, 2004, 2005);
linhas: retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas;
casa ou célula: espaço destinado a um só número;
título: conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê? Quando? Onde?, localizado no topo da tabela – item 1.
Existem ainda os elementos considerados complementares que são: fonte (item 4), notas e chamadas, colocados, de preferência, no rodapé da tabela.
Segundo Crespo (2002), de acordo com a Resolução 886 da Fundação IBGE, nas casas ou células da tabela devemos colocar:
um traço horizontal ( – ) quando o valor é zero, não só quanto à natureza das coisas, como quanto ao resultado do inquérito; 
três pontos (...) quando não temos os dados; 
um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado valor; 
zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Se os valores são expressos em numerais decimais, precisamos acrescentar à parte decimal um número correspondente de zeros (0,0; 0,00; 0,000; ...). 
Depois de detalhada a tabela, estudaremos as séries estatísticas.
Crespo (2002), identifica série estatística como toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local e da espécie.
As séries estatísticas são divididas dependendo dos elementos e fatores existentes em cada tabela como é o caso de tempo, espaço e espécie. Conforme forem esses elementos poderemos classificá-las em histórica, geográfica e específica.
Série histórica, cronológica, temporal ou marcha: é aquela em que os valores existentes na tabela descrevem um determinado local, em intervalos de tempos variáveis.
Exemplo:
	ÁREA DE SOJA E MILHO NO BRASIL
2000-2004
	CULTURA DE SOJA E MILHO
	ÁREA (MILHOES DE ha)
	2000
2001
2002
2003
2004
	22,24
12,63
13,40
48,27
15,25
	Fonte: Dados fictícios.
Série geográfica, espacial, territorial ou de localização: é aquela em que os valores definem o tempo em que ocorrem.
Exemplo:
	ALUNOS DO CENTRO UNIVERSITÁRIO DA GRANDE DOURADOS – UNIGRAN NO PERIODO DE 2005
	LOCAL
	QUANTIDADE
	Dourados
Ponta Porã
Rio Brilhante
Maracaju
Outros
	3.530
153
120
90
375
	Fonte: dados fictícios.
Série específica ou categórica: é aquela que aparece a descrição de categorias.
Exemplo:
	REBANHO DE MATO GROSSO DO SUL EM 2004
	ESPÉCIES
	QUANTIDADE (1.000 cabeças)
	Bovino
Caprino
Coelhos
Ovinos
Suínos
Outros
	4.582,5
575,5
125,6
208,1
1.287,2
985,1
	Fonte: dados fictícios.
Série Conjugada – Tabela de Dupla Entrada: nesse caso aparecem mais de uma coluna na tabela, é a conjugação de mais séries, como por exemplo: série geográfica-série histórica.
Exemplo:
	VENDA DE MAQUINÁRIOS AGRÍCOLAS EM 2001-2003
	REGIÃO
	2001
	2002
	2003
	Norte
Sul
Centro-Oeste
Nordeste
Sudeste
	2.583
2.901
3.684
1.584
2.012
	2.485
2.990
3.568
1.358
2.125
	2.682
3.021
3.758
1.685
1.888
	Fonte: dados fictícios.
Entende-se por gráfico estatístico a forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e vida do fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries. (CRESPO, 2002).
O gráfico, para ser realmente útil, deverá conter:
simplicidade: deve conter somente os detalhes principais, com a finalidade de não sobrecarregar o visual;
clareza: deve possibilitar uma correta interpretação dos dados; e,
veracidade: deve expressar a verdade sobre o estudo em questão.
Há vários tipos de gráficos:
Linha ou curva: 
	Agricultura brasileira – 2003
	Grãos
	Número
	
	
	Soja
	7.521
	Milho
	4.887
	Trigo
	2.074
	Aveia
	831
	Fonte: dados fictícios
Colunas ou em barras: 
	Agricultura brasileira – 2003
	Grãos
	Número
	
	
	Soja
	7.521
	Milho
	4.887
	Trigo
	2.074
	Aveia
	831
	Fonte: dados fictícios
Colunas:
Barras:
Colunas ou barras múltiplas: 
	Balança comercial do Brasil 2000-2004
	Especificações
	valor
	
	2000
	2001
	2002
	2003
	2004
	Exportação
	34.383
	31.414
	31.620
	35.793
	38.783
	Importação
	18.263
	20.661
	21.041
	20.554
	25.711
	Fonte: dados fictícios.
Setores ou pizza: nesse item, em especial, obteremos cada parte do gráfico (setores) por meio de uma regra de três simples e direta que totaliza 360º já que se trata de um formato de circunferência.
Exemplo: Dada a série:
	Agricultura brasileira – 2003
	Grãos
	Número
	Setores
(360º)
	Soja
	7.521
	177º
	Milho
	4.887
	115º
	Trigo
	2.074
	49º
	Aveia
	831
	19º
	Total
	15.313
	360º
	Fonte: dados fictícios
	
Radar: é ideal para representar séries temporais cíclicas.
Exemplo: Dada a série:
	PRECIPITAÇÃO PLUVIOMÉTRICA
	MESES
	MILÍMETROS
	
	
	Janeiro
Fevereiro
Março
Abril
Maio
Junho
Julho
Agosto
Setembro
Outubro
Novembro
Dezembro
	49,6
93,1
63,6
135,3
214,7
277,9
183,6
161,3
49,2
40,8
28,6
33,3
	Fonte: dados fictícios
Há, ainda, outros tipos de gráficos como: cartograma – representação sobre uma carta geográfica – e pictograma – representação gráfica por meio de figuras. Em nosso caso específico, estudaremos mais profundamente o de linhas, colunas, barras e setores.
Para o manuseio de gráficos, a informática criou ferramentas que facilitam o nosso trabalho na construção de gráficos. Um programa muitoutilizado para esse tipo de atividade é o Excel, software da Microsoft, que é específico em trabalhar com planilhas de cálculo e construções de gráficos. Para maiores conhecimentos, poderiam acessar ao site: http://ci.ufpel.edu.br/spc/apostilas/excel/graficos.pdf, onde está disponibilizado um manual contendo todos os passos para a construção de gráficos no Excel.
DISTRIBUIÇÃO DE FREQUÊNCIA
Primeiramente, iremos abordar a melhor forma de descrever os dados estatísticos resultantes de variáveis quantitativas, após o levantamento, após a amostragem, de dados como altura dos alunos de uma turma, peso dos alunos, salários dos operários de uma empresa, etc.
Suponhamos que fizemos uma coleta de dados relativos às estruturas de quarenta alunos, que compõem uma amostra dos alunos da turma da disciplina de Estatística, resultando a seguinte tabela de valores:
ESTATURAS DE 40 ALUNOS
	166
	160
	161
	150
	162
	160
	165
	167
	164
	160
	162
	161
	168
	163
	156
	173
	160
	155
	164
	168
	155
	152
	163
	160
	155
	155
	169
	151
	170
	164
	154
	161
	156
	172
	153
	157
	156
	158
	158
	161
A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva.
Partindo dos dados acima, ou seja, da tabela primitiva, a averiguação dos dados fica difícil, pois os valores estão desordenados, e dessa forma averiguar em torno de que valor tendem a se concentrar as estaturas, qual a menor ou qual a maior estatura ou, ainda, quantos alunos se acham abaixo ou acima de uma dada estatura, torna-se uma tarefa morosa e trabalhosa.
Com o propósito de facilitar o trabalho, foi criada uma tabela organizada a qual damos o nome de Rol, onde os dados aparecem organizados de forma crescente ou decrescente, ficando da forma a seguir: 
TABELA
ESTATURAS DE 40 ALUNOS
	150
	154
	155
	157
	160
	161
	162
	164
	166
	169
	151
	155
	156
	158
	160
	161
	162
	164
	167
	170
	152
	155
	156
	158
	160
	161
	163
	164
	168
	172
	153
	155
	156
	160
	160
	161
	163
	165
	168
	173
Da forma, agora apresentada, poderemos verificar, com clareza e facilidade, qual a menor (150 cm) e a maior estatura (173 cm), que variação obteve entre a maior e a menor (173 – 150 = 23 cm). 
Dependendo da disponibilização desses dados na tabela, a variável altura torna-se mais visível, podendo ser melhor estudada. Observe como faremos a primeira distribuição de frequências dessas alturas. Iremos dispor os valores da altura ordenados em uma coluna e, ao lado de cada valor, o número de vezes, ou seja, a frequência em que eles aparecem.
Denominamos frequência o numero de alunos que fica relacionado a um determinado valor da variável. Obtemos assim, uma tabela que recebe o nome de distribuição de frequência:
	ALTURA DOS ALUNOS
	ESTATURA
(cm)
	FREQ.
	150
151
152
153
154
155
156
157
158
160
161
162
163
164
165
166
167
168
169
170
172
173
	1
1
1
1
1
4
3
1
2
5
4
2
2
3
1
1
1
2
1
1
1
1
	Total
	40
Bem, mas, observando melhor, poderemos agrupar essas estaturas para que a tabela seja melhor utilizada, colocando os valores em intervalos de classes, que chamamos, a cada um deles de frequência de uma classe (número de valores da variável pertencentes à classe (i)).
Segundo Crespo (2002), classes de frequência ou classes são intervalos de variável.
Observe a nova distribuição de valores:
	ALTURA DOS ALUNOS
	ESTATURA
(cm)
	FREQ.
	150 ├─ 154
154 ├─ 158
158 ├─ 162
162 ├─ 166
166 ├─ 170
170 ├─ 174
	4
9
11
8
5
3
	Total
	40
É importante observar dois pontos. Primeiramente, observa-se o símbolo ├─. Esse símbolo serve para delimitar o intervalo que estaremos trabalhando. Note que do lado esquerdo existe ├, onde essa barra inclui o valor que está a sua esquerda. No caso da tabela, os valores 150 da classe 1, 154 da classe 2, 158 da classe 3, 162 da classe 4, 166 da classe 5 e 170 da classe 6, todos eles possuem esse símbolo, que serve para dizer que esse intervalo inicia-se por esse valor. Tomamos como exemplo a classe 1, onde apresenta 150 ├─ 154. Para essa classe existirão alturas compreendidas de 150 cm a 153 cm. Como do lado direito não aparece o símbolo ┤, então a altura 154 não pertence a esse intervalo e sim ao próximo, pois aparecerá da forma 154 ├─ 158, e assim por diante. Dessa forma teremos valores compreendidos para cada classe:
i = 1 (1ª classe) – 150, 151, 152, 153
i = 2 (2ª classe) – 154, 155, 156, 157
i = 3 (3ª classe) – 158, 159, 160, 161
i = 4 (4ª classe) – 162, 163, 164, 165
i = 5 (5ª classe) – 166, 167, 168, 169
i = 6 (6ª classe) – 170, 171, 172, 173
Outro ponto que devemos observar é a segunda coluna da tabela. Para cada intervalo estipulado, contaremos a quantidade de vezes que eles aparecem. Observem... Para os valores de 150 a 153 (1ª classe), aparecerão 4 vezes, sendo uma frequência de cada valor. Já na 2ª classe, 9 vezes, sendo 1 da altura 154 cm, 4 da 155 cm, 3 da 156 cm e 1 da 157 cm, totalizando 9 vezes, e assim sucessivamente. Isso é o que chamamos de frequência simples ou absoluta (fi). O resultado total deve permanecer 40, pois foi o total de alunos que formam a amostra inicial. Há também, o que chamamos de frequência acumulada (fac), que é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe. 
	ALTURA DOS ALUNOS
	ESTATURA
(cm)
	FREQ.
	FAC
	150 ├─ 154
154 ├─ 158
158 ├─ 162
162 ├─ 166
166 ├─ 170
170 ├─ 174
	4
9
11
8
5
3
	4
13
24
32
37
40
	Total
	40
	
	
Para procedermos com os cálculos de frequência acumulada, tomou-se como referência inicial a frequência da primeira classe (4), em seguida, somou-se o valor 4 à 2ª classe e resultou em 13, para a próxima somou-se 13 à 11, resultando 24 e assim por diante...
Observando a tabela poderemos constatar outro item: os limites de classe. Temos dois limites: o inferior (li) e o superior (Li). Se tomarmos como exemplo i = 1 (1ª classe) termos como li (limite inferior) 150 e Li (limite superior) 154.
Temos, ainda, como medir o intervalo de uma classe através da Amplitude de um intervalo de classe ou intervalo de classe, por meio de 
. Se tomarmos i = 2 como exemplo, teremos h2 = 158 – 154 = 4 cm de amplitude de intervalo de classe.
Existe também como medirmos a amplitude total da distribuição (AT), que é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo) – AT = L(max) – l(min). Para a tabela da estatura dos 40 alunos teremos:
AT = 174 – 150
AT = 24 cm
Se considerarmos os valores máximo e mínimo, 173 e 150, e fizermos a diferença dos mesmos, teremos o que chamamos de Amplitude Amostral (AA), ou seja, AA = 173 – 150 = 23 cm.
Para calcularmos o ponto médio (xi) de uma classe, somamos os limites inferior e superior e depois dividimos por dois. 
Segundo Crespo (2002), ponto médio de uma classe é o ponto que divide o intervalo de classe em duas partes iguais.
MEDIDAS DE POSIÇÃO
As medidas de posição mais importantes são as medidas de tendências central, que recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de tendência central, destacamos:
a média aritmética;
a moda.
MÉDIA ARITMÉTICA (
)
	Média aritmética é o quociente da divisão da soma dos valores da variável pelo número deles:
=
sendo:
a média aritmética;
xi os valores da variável;
n o número de valores.
Emprego da média
	A média é utilizada quando:
desejamos obter a medida de posição que possui a maior estabilidade;
houver necessidade de um tratamento algébrico ulterior.
Dados não-agrupados
Quandodesejamos conhecer a média dos dados não-agrupados, determinamos a média aritmética simples.
Exemplos:
Sabendo-se que a produção leiteira diária da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, temos, para produção média da semana:
	=
	Logo:
	
	= 14 litros	
	Às vezes, a média pode ser um número diferente de todos os da série de dados que ela representa. É o que acontece quando temos os valores 2, 4, 8 e 9, para os quais a média é 5. Esse será o número representativo dessa série de valores, embora não esteja representado nos dados originais. Neste caso, costumamos dizer que a média não tem existência concreta.
Dados agrupados
Sem intervalos de classe
	Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino:
TABELA
	N° DE MENINOS
	fi
	0
1
2
3
4
	2
6
10
12
4
	
	
= 34
	Nesse caso, como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula:
	
=
	O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna correspondente aos produtos xi fi:
TABELA
	xi
	fi
	xi fi
	0
1
2
3
4
	2
6
10
12
4
	0
6
20
36
16
	
	
	
	Temos, então:
		
 e 
	Logo:
		
	
		
�� EMBED Equation.3 
		
�� EMBED Equation.3 
	isto é:
		
	= 2,3 meninos
NOTA:
	*Sendo x uma variável discreta, como interpretar o resultado obtido, 2 meninos e 3 décimos de meninos?
O valor médio 2,3 meninos sugere, neste caso, que o maior número de famílias tem 2 meninos e 2 meninas, sendo, porém, a tendência geral de uma leve superioridade numérica em relação ao número de meninos.
Com intervalos de classe
Nesse caso, primeiramente, identificaremos o ponto médio (xi) dos intervalos de cada classe, em seguida multiplicamos a coluna de frequências (fi) com a coluna de pontos médios (xi), dessa forma obteremos xi.fi.
	i
	ESTATURAS
(cm)
	fi
	xi
	xi fi
	1
2
3
4
5
6
	150 ├─ 154
154 ├─ 158
158 ├─ 162
162 ├─ 166
166 ├─ 170
170 ├─ 174
	4
9
11
8
5
3
	152
156
160
164
168
172
	608
1.404
1.760
1.312
840
516
	Total
	-
	40
	-
	6.440
Depois de fazermos estes cálculos poderemos efetuar a média por meio da seguinte fórmula:
A MODA (Mo)
	Denominamos moda o valor que ocorre com maior frequência em uma série de valores.
	
Dados não-agrupados
	Quando lidamos com valores não-agrupados, a moda é facilmente reconhecida: basta, de acordo com a definição, procurar o valor que mais se repete.
	A série de dados:
	7, 8, 9, 10, 10, 10, 11, 12, 13, 15
	tem moda igual a 10, pois é a que mais aparece.
Podemos, entretanto, encontrar séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. É o caso da série:
	3, 5, 8, 10, 12, 13
que não apresenta moda (amodal), ou seja, não existe nenhum valor que apareça mais que o outro.
	
Em outros casos, ao contrário, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Na série:
	2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9
	temos duas modas: 4 e 7 (bimodal). Nesse caso temos dois valores que aparecem em quantidades iguais.
Dados agrupados
Sem intervalos de classe
Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior frequência.
Com intervalos de classe
A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendendo entre os limites da classe modal.
O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal.
Damos a esse valor a denominação de moda bruta.
Temos, então:
	Mo = 
	onde:
	
	é o limite inferior da classe modal;
	L* é o limite superior da classe modal.
	Assim, para a distribuição:
TABELA
	i
	ESTRUTURAS (cm)
	fi
	1
2
3
4
5
6
	150 ├─ 154
154 ├─ 158
158 ├─ 162
162 ├─ 166
166 ├─ 170
170 ├─ 174
	4
9
11 
8
5
3
	
	
	
	Temos que a classe modal é i = 3, 
= 158 e L* = 162.
	Como:
			Mo = 
	vem:
			Mo = 
	Logo:
			Mo = 160 cm
NOTA:
	Há, para o calculo da moda, outros métodos mais elaborados, como, por exemplo, o que faz usa da fórmula de Czuber:
	
na qual:
é o limite inferior da classe modal;
h* é a amplitude da classe modal;
D1 = f* - f(ant);
D2 = f* - f(post),
	sendo:
	f* a frequência simples da classe modal;
	f(ant) a frequência simples da classe anterior à classe modal;
	f(post) a frequência simples da classe posterior à classe modal.
Assim, para a distribuição da Tabela 6.6, temos:
	D1 = 11 – 9 = 2		e	D2 = 11 – 8 = 3
donde:
Logo:
	Mo = 159,6 cm
Mediana
Vamos agora estudar o que é Mediana?
A MEDIANA (Md)
	A mediana é outra medida de posição definida como o número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos.
Dados não-agrupados
	Dada uma série de valores, como, por exemplo:
		5, 13, 10, 2, 18, 15, 6, 16, 9
de acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores:
		2, 5, 6, 9, 10, 13, 15, 16, 18
	
	Em seguida, tomamos aquele valor central que apresenta o mesmo número de elementos à direita e à esquerda. Em nosso exemplo, esse valor é o 10, já que, nessa série, há quatro elementos acima dele e quatro abaixo.
	Temos, então:
		Md = 10
	Se, porém, a série dada tiver um número par de termos, a mediana será, por definição, qualquer dos números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto médio.
	Assim, a série de valores:
		2, 6, 7, 10, 12, 13, 18, 21
	tem para mediana a média aritmética entre 10 e 12.
	Logo:
			Md = 
	onde:
			Md = 11
	
NOTAS:
O valor da mediana pode coincidir ou não como um elemento da série, como vimos. Quando o número de elementos da série é ímpar, há coincidência. O mesmo não acontece, porém, quando esse número é par.
A mediana e a aritmética não têm, necessariamente, o mesmo valor. Na primeira série apresentada, por exemplo, temos:
			
	= 10,4 e Md = 10
A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa é uma das diferenças marcantes entre a mediana e a média (que se deixa influenciar, e muito, pelos valores extremos). Exemplos:
				5, 7, 10, 13, 15 
= 10 
				e Md = 10
				5, 7, 10, 13, 65 
= 20 
				e Md = 10
isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influencia dos valores extremos, ao passo que a mediana permanece a mesma.
A mediana é designada, muitas vezes, por valor mediano.
Dados agrupados
	Se os dados se agrupam em uma distribuição de frequência, o cálculo da mediana se processa de modo muito semelhante àquele dos dados não-agrupados, implicando, porém, a determinação prévia das frequências acumuladas. Ainda aqui, temos que determinar um valor tal que divida a distribuição em dois grupos que contenham o mesmo número de elementos.
	Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é dada por:
	
4.2.1. Sem intervalos de classe
	Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à metade da soma das frequências.A mediana será aquele valor da variável que corresponde a tal frequência acumulada.
	Tomemos a distribuição relativa à Tabela completando-a com a coluna correspondente à frequência acumulada:
TABELA
	Nº DE MENINOS
	fi
	fac
	0
1
2
3
4
	2
6
10
12
4
	2
8
18
30
34
	
	
	
sendo:
	
	A menor frequência acumulada que supera esse valor é 18, que corresponde ao valor 2 da variável, sendo este o valor mediano. Logo:
			Md = 2 meninos
NOTAS:
	No caso de existir uma frequência acumulada (fac), tal que:
		fac = 
a mediana será dada por:
			Md = 
	Isto é, a mediana será a média aritmética entre o valor da variável correspondente a essa frequência acumulada e o seguinte.
Exemplo:
TABELA
	xi
	fi
	fac
	12
14
15
16
17
20
	1
2
1
2
1
1
	1
3
4
6
7
8
	
	
	
Temos:
			
logo:
			Md = 
donde:
			Md = 15,5
Com intervalos de classe
	Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendido a mediana.
	Para tanto, temos inicialmente que determinar a classe na qual se acha a mediana – classe mediana. Tal classe será, evidentemente, aquela correspondente à frequência acumulada imediatamente superior a 
.
	Feito isso, um problema de interpolação resolve a questão, admitindo-se, agora, que os valores se distribuam uniformemente em todo o intervalo de classe.
	Assim, considerando a distribuição da Tabela, acrescida das frequências acumuladas:
TABELA
	i
	ESTATURAS (cm)
	fi
	fac
	1
2
3
4
5
6
	150 ├─ 154
154 ├─ 158
158 ├─ 162
162 ├─ 166
166 ├─ 170
170 ├─ 174
	4
9
11
8
5
3
	4
13
24 
 classe mediana
32
37
40
	
	
	
	
temos:
			
		Como há 24 valores incluídos nas três primeiras classes da distribuição e como pretendemos determinar o valor que ocupa o 20º lugar, a partir do inicio da série, vemos que este deve estar localizado na terceira classe (i = 3), supondo que as frequências dessas classes estejam uniformemente distribuídas.
		Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar, a partir do limite inferior, a distância:
			
e a mediana será dada por:
			Md 
	Logo:
			Md = 160,5 cm
	Na prática, executamos os seguintes passos:
	1º) Determinamos as frequências acumuladas.
2º) Calculamos 
3º) Marcamos a classe correspondente à frequência acumulada imediatamente superior à 
 - classe mediana – e, em seguida, empregamos a fórmula:
na qual:
	é o limite inferior da classe mediana:
fac(ant) é a frequência acumulada da classe anterior à classe mediana;
f* é a frequência simples da classe mediana;
h* é a amplitude do intervalo da classe mediana.
	
	Tomando como exemplo a distribuição anterior, temos:
		
	Logo, a classe mediana é a de ordem 3. então:
		
 e 
		
	Substituindo esses valores na fórmula, obtemos:
		
	isto é:
		Md = 160,5 cm
MEDIDAS DE DISPERSÃO OU DE VIABILIDADE
AMPLITUDE TOTAL
Dados não agrupados
A amplitude total é a diferença entre o maior e o menor valor observado:
AT = x (max.) – x (min.)
Exemplo:
Para os valores:
40, 45, 48, 52, 54, 62 e 70
temos:
AT: 70 – 40 = 30
Logo:
AT = 30
Quando dizemos que a amplitude total dos valores é 30, estamos afirmando alguma coisa do grau de sua concentração. É evidente que, quanto maior a amplitude total, maior a dispersão ou variabilidade dos valores da variável.
Dados agrupados
Sem intervalos de classe
Exemplo:
Considerando a tabela abaixo:
	Notas
	fi
	2
3
4
5
6
7
	1
5
6
8
4
2
	Total
	26
Temos:
AT = 7 – 2 = 5
Logo: 
AT = 5
Com intervalo de classe
Exemplo:
Considerando a distribuição abaixo:
	Estaturas
	fi
	150 ├─ 154
154 ├─ 158
158 ├─ 162
162 ├─ 166
166 ├─ 170
170 ├─ 174
	4
9
11
8
5
3
	Total
	40
	
	
	
Temos:
AT = 174 – 150 = 24
Logo:
AT = 24 cm
A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série, descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade do resultado. Ela é apenas uma indicação aproximada da dispersão ou variabilidade.
Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia ou no ano, no controle de qualidade ou como uma medida de cálculo rápido, e quando a compreensão popular é mais importante que a exatidão e a estabilidade.
VARIÂNCIA E DESVIO-PADRÃO
Segundo Crespo (2002), a variância e o desvio-padrão são medidas que fogem a essa falha, pois levam em consideração a totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade bastante estáveis e, por isso mesmo, os mais geralmente empregados.
Para efetuar os cálculos de variância temos:
Ou, lembrando que 
 = n
Já o desvio-padrão é calculado pela raiz quadrada da variância:
s = 
ou
Essa última fórmula é utilizada não apenas por ser mais prática, mas também por ser mais precisa, pois quando a média não é exata e tem de ser arredondada, cada desvio fica ligeiramente do erro, devido a esse arredondamento. 
Para o cálculo do desvio-padrão, consideremos os seguintes casos:
Dados não agrupados
Tomemos, como exemplo, o conjunto de valores a da variável X:
40, 45, 48, 52, 54, 62, 70
O modo mais prático para se obter o desvio-padrão é formar uma tabela com duas colunas: uma Xi outra para Xi2. Assim:
	xi 
	xi2
	40
	1.600
	45
	2.025
	48
	2.304
	52
	2.704
	54
	2.916
	62
	3.844
	70
	4.900
	
	
Como n = 7, temos:
Dessa forma obtermos o desvio-padrão (s) como 9,49 e sua variância (s2) por 90.
Dados agrupados
Sem intervalos de classe
Como, neste caso, temos a presença de frequências, devemos levá-las em consideração, resultando a fórmula:
	Xi
	fi
	fixi
	fixi2
	0
	2
	0
	0
	1
	6
	6
	6
	2
	12
	24
	48
	3
	7
	21
	63
	4
	3
	12
	48
	
	
	
	
	Considerando a tabela a seguir, temos:
Logo: 
Dessa forma o desvio-padrão será s = 1,04 e a variância será s2 = 1,09.
Com intervalos de classe
Caso tenhamos o exemplo a seguir, teremos primeiramente que calcular os valores de ponto médio (xi), fi.xi e fi.xi2, como apresenta a tabela:
	Estaturas
	fi
	xi
	fi.xi
	fi.xi2
	150 ├─ 154
154 ├─ 158
158 ├─ 162
162 ├─ 166
166 ├─ 170
170 ├─ 174
	4
9
11
8
5
3
	152
156
160
164
168
172
	608
1.404
1.760
1.312
840
516
	92.416
219.024
281.600
215.168
141.120
88.752
	
	
	
	
	
Então passaremos ao cálculo:
Então teremos o desvio-padrão como s = 5,57 cm e a variância como s2 = 31 cm.
COEFICIENTE DE VARIAÇÃO
O coeficiente de variação serve para estimar a precisão de experimentos. É uma medida comumente empregada por pesquisadores, que representa o desvio-padrão expresso como porcentagem da média. Para esse cálculo temos a seguinte fórmula:
Voltando ao exemplo de estaturas, tomamos como resultados a tabela a seguir temos:
	
	
	S
	ESTATURAS
	175 cm
	5,0 cm
	PESOS
	68 kg
	2,0 kg
Dessa forma obteremos o coeficiente de variação das estaturas e dos pesos:
Estaturas:
Pesos:
Agora chegou a hora de praticarmos o que aprendemos..... Vamos lá?
ATIVIDADES
Para os conjuntos de valores abaixo, calcule a média e moda:
3, 5, 2, 6, 5, 9, 5, 2, 8, 6
20, 9, 7, 2, 12, 7, 20, 15, 7
15, 18, 20, 13, 10, 16, 14
Para as distribuições abaixo, calcule a média e moda:
	Notas
	Nº de alunos
	2
3
4
5
6
7
8
9
10
	1
3
6
10
13
8
5
3
1
	Total50
	xi
	fi
	3
4
5
6
7
8
	4
8
11
10
8
3
	Total
	44
Para as distribuições abaixo, calcule a média e moda:
	I
	CUSTO
(R$)
	fi
	xi
	fac
	xi.fi
	1
2
3
4
5
6
7
	450 ├─ 550
550 ├─ 650
650 ├─ 750
750 ├─ 850
850 ├─ 950
950 ├─ 1.050
1.050 ├─ 1.150
	8
10
11
16
13
5
1
	
	
	
	
	
	
	
	
	
	I
	CUSTO
(R$)
	fi
	xi
	fac
	xi.fi
	1
2
3
4
5
6
	0 ├─ 10
10 ├─ 20
20 ├─ 30
30 ├─ 40
40 ├─ 50
50 ├─ 60
	1
3
9
7
4
2
	
	
	
	
	
	
	
	
	
Para os conjuntos de dados, calcule a amplitude total e os desvios-padrões.
1, 3, 5, 9
20, 14, 15, 19, 21, 22, 20
17,9; 22,5; 13,3; 16,8; 15,4; 14,2
-10, -6, 2, 3, 7, 9, 10
Calcule a amplitude total e o desvio-padrão da distribuição:
	xi 
	fi
	2
	1
	3
	3
	4
	5
	5
	8
	6
	5
	7
	4
	8
	2
Calcule o desvio-padrão da distribuição:
	CLASSES
	fi
	2 ├─ 6
	5
	6 ├─ 10
	12
	10 ├─ 14
	21
	14 ├─ 18
	15
	18 ├─ 22
	7
Sabendo que um conjunto de dados apresenta para média (
) 18,3 e desvio-padrão 1,47, calcule o coeficiente de variação.
Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e CV = 2,9%. Calcule a média.
Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi de 7,8 e o desvio-padrão, 0,80. Em Estatística, entretanto, o grau médio final foi de 7,3 e o desvio-padrão, 0,76. Em que disciplina foi maior a dispersão (coeficiente de variação)?
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� CRESPO, Antônio Arnot. Estatística Fácil. 18. ed. São Paulo: Saraiva, 2002.
� RAO, C.R. Statistics: A technology for the millennium Internal. J. Math. & Statist. Sci, Vol. 8, No. 1, June 1999, 5-25.
_1169383652.unknown
_1173504710.unknown
_1173850834.unknown
_1173852541.unknown
_1173854200.unknown
_1252393838.unknown
_1252393858.unknown
_1272283644.unknown
_1252393839.unknown
_1252393527.unknown
_1252393683.unknown
_1173855009.unknown
_1173853233.unknown
_1173854061.unknown
_1173853072.unknown
_1173851416.unknown
_1173852184.unknown
_1173852216.unknown
_1173851660.unknown
_1173852144.unknown
_1173850981.unknown
_1173851379.unknown
_1173851401.unknown
_1173850856.unknown
_1173784471.unknown
_1173850342.unknown
_1173850452.unknown
_1173850057.unknown
_1173769606.unknown
_1173769823.unknown
_1173769845.unknown
_1173771544.unknown
_1173769732.unknown
_1173598523.unknown
_1173769282.unknown
_1173504755.unknown
_1169384995.unknown
_1169385649.unknown
_1169386093.unknown
_1169386560.unknown
_1169486966.unknown
_1173504698.unknown
_1169491123.unknown
_1169405832.unknown
_1169386289.unknown
_1169386445.unknown
_1169386158.unknown
_1169385901.unknown
_1169385954.unknown
_1169385673.unknown
_1169385275.unknown
_1169385614.unknown
_1169385080.unknown
_1169384482.unknown
_1169384612.unknown
_1169384738.unknown
_1169384509.unknown
_1169383876.unknown
_1169384209.unknown
_1169383826.unknown
_1169379678.unknown
_1169381434.unknown
_1169381763.unknown
_1169381930.unknown
_1169382951.unknown
_1169381830.unknown
_1169381605.unknown
_1169381647.unknown
_1169381566.unknown
_1169379794.unknown
_1169381156.unknown
_1169381410.unknown
_1169381100.unknown
_1169379721.unknown
_1169379761.unknown
_1169379688.unknown
_1169379287.unknown
_1169379579.unknown
_1169379629.unknown
_1169379637.unknown
_1169379606.unknown
_1169379500.unknown
_1169379513.unknown
_1169379301.unknown
_1169375986.unknown
_1169376101.unknown
_1169379120.unknown
_1169375996.unknown
_1169375637.unknown
_1169375764.unknown
_1169375373.unknown
_1169375636.unknown

Outros materiais