Buscar

Resumo Estatística Descritiva

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL
DEPARTAMENTO DE ESTATÍSTICA
_____________________________________________________________________
ESTATÍSTICA DESCRITIVA
1. INTRODUÇÃO:
		A palavra estatística é comumente associada a pesquisas de opinião pública, recenseamentos, índices governamentais. Na realidade engloba vários outros aspectos como veremos a seguir, sendo fundamental na análise de dados provenientes de processos onde exista variabilidade. Exemplos:
O número médio de filhos no Brasil é 2,6.
A população brasileira cresce a uma taxa de 1,9% ao ano.
A taxa de desemprego é de 7,5%.
O setor de Vestuário demitiu 21,9% de empregados no primeiro trimestre de 1996.
O salário médio de Assistente Administrativo, em empresas médias, é de R$ 717,00.
O número de acidentes de trânsito nas estradas gaúchas no verão foi 15.
ESTATÍSTICA é a ciência que tem por objetivo orientar a coleta, organização, apresentação, análise e interpretação dos dados para tomar decisões.
Divide-se em:
ESTATÍSTICA DESCRITIVA: está envolvida com o resumo e a apresentação dos dados.
ESTATÍSTICA INFERENCIAL: ajuda a concluir sobre conjuntos maiores de dados (populações) quando apenas partes destes conjuntos (amostras) foram estudados.
Alguns conceitos:
POPULAÇÃO: 
 É um conjunto de elementos com alguma característica comum.
Exemplos: habitantes de P. Alegre; alunos da PUCRS; sócios de um clube; pinheiros do município de Canela.
CENSO: 
É o levantamento efetuado em toda a população. Todos os sócios de um clube são pesquisados, por exemplo, e não apenas uma parte deles. Geralmente pesquisas em toda a população implicam em custo elevado e muito tempo, sendo necessário o estudo de apenas parte da população, ou amostra.
AMOSTRA: 
 É apenas uma parte da população. 
 Exemplos de pesquisas amostrais: a) pesquisas de opinião para conhecer o provável eleito em eleições; b) o IBGE faz, periodicamente, pesquisas sobre emprego, desemprego, inflação, etc.; c) redes de rádio e televisão realizam pesquisas para conhecer a popularidade dos programas; d) biólogos marcam pássaros, peixes, etc. para uma previsão sobre hábitos de migração; e) os dirigentes de uma empresa de ônibus precisam determinar o consumo de óleo diesel.; f) verificar as causas de uma doença.
AMOSTRAGEM: 
 É o processo que estabelece critérios para a seleção de uma amostra. Quando não é possível realizar um estudo sobre todos os elementos da população utiliza-se a amostragem.
PARÂMETRO: 
Descreve uma informação sobre uma população. Por exemplo: a idade média de todos os alunos de uma escola de 2o grau é 16,5 anos.
ESTATÍSTICA AMOSTRAL (ou apenas estatística):
Descreve a informação contida em uma amostra. Por exemplo: a idade média de uma amostra de alunos de uma escola de 2o grau é 17 anos.
VARIÁVEL: 
É toda característica que pode variar de um indivíduo para outro.
 Pode ser qualitativa ou quantitativa. 
	Variável qualitativa (var. categóricas ou atributos): é aquela que fornece dados de natureza não numérica. Mesmo que os dados possam ser codificados numericamente (masculino = 1; feminino = 2), os números são apenas símbolos sem valor quantitativo.
	A variável encontra-se no nível nominal quando diferencia-se uma categoria da outra somente através da denominação da categoria. Os dados são identificados pela atribuição de um “nome”, não existindo nenhuma relação de ordem entre as categorias.
Por exemplo: profissão, curso, sexo, nacionalidade. 
	Ao nível ordinal é possível além de identificar diferentes categorias, reconhecer graus de intensidade entre elas. Indivíduos podem ser classificados como mais perturbado; mais agressivo; mais imaturo.
 Outros exemplos: grau de instrução, conceitos, dias da semana.
 Variável quantitativa: é aquela em que os dados são numéricos e expressam quantidades.
A variável é denominada discreta quando assume apenas valores determinados dentro de certo intervalo. Geralmente são números inteiros.
Por exemplo: número de irmãos; número de acertos; número de acidentes.
 
 A variável é contínua quando pode assumir infinitos valores em certo intervalo.
 Por exemplo: peso, altura, temperatura, diâmetro. 
 
 
2. ORGANIZAÇÃO DOS DADOS:
	Os dados coletados através de entrevistas ou outra técnica serão transformados em informações, através da organização em tabelas estatísticas adequadas. Se um conjunto tiver aproximadamente 30 dados ou menos a análise será feita sem agrupamento, caso contrário se tiver mais de 30 dados será feito um agrupamento, conhecido como distribuição de freqüência.
TABELA PARA DADOS NÃO AGRUPADOS:
Quando o conjunto de dados for pequeno a tabela pode ser como a que segue:
TAB.1 - Número de faltas de um grupo de alunos da turma 120-Escola XYZ em março/2005
	Nome do aluno
	No de faltas
	Marcos
Daniela
Lucas
Michele
	3
2
0
3
 Fonte: Secretaria da escola. 
	b) DISTRIBUIÇÃO DE FREQUÊNCIA (TABELA PARA DADOS AGRUPADOS):
Se o caso é um grande conjunto de dados, ou seja, quando for impossível personalizá-los constrói-se uma distribuição de frequência como os exemplos abaixo, dependendo da classificação da variável entre discreta e contínua.
A distribuição de freqüência é por ponto, quando geralmente a variável é discreta, como na tabela abaixo:
 TAB. 2 - Números de faltas de um grupo de alunos da Escola XYZ em março/2005
	N.de faltas ( x )
	N.de alunos ( f )
	0
	12
	1
	13
	2
	20
	3
	11
	4
	4
	 (
	60
 Fonte: Secretaria da escola
.
O número de alunos para cada número de faltas é chamado freqüência simples ou absoluta e é representado por f. Dividindo-se f por  (f = n obtém-se a freqüência relativa simples ou proporção. Por exemplo: freqüência relativa para 0 falta é 12/60 = 0,20 (ou 20% do total de alunos).
A tabela pode fornecer também as freqüências simples acumuladas (F), que indicam o número de alunos que têm um número de faltas igual ou menor que determinado valor. Na tabela existem 45 alunos com 2 ou menos faltas. A proporção de alunos com número de faltas igual ou menor que 2 é obtida dividindo-se a freqüência simples acumulada pelo número total de alunos. Ou seja: 45/60 = 0,75 (ou 75% dos alunos) e é chamada freqüência relativa acumulada (Fr).
A distribuição é por intervalo (ou por classe), quando geralmente a variável é contínua, como abaixo:
TAB. 3 - Altura dos atletas da modalidade “A” no clube “B” – 1o sem/2005
	Altura (em cm)
	N.de atletas
	162 (( 167
	4
	167 (( 172
	9
	172 (( 177
	8
	177 (( 182
	6
	182 (( 187
	3
	( 
	30
 
 Fonte: Instrutores do clube “B”
 O sinal (( indica intervalo fechado à esquerda e aberto à direita, ou seja, o valor da esquerda está incluído neste intervalo e o da direita, excluído.
Para esta tabela com intervalos ou classes outro elemento é necessário: o ponto médio (x), que representa o valor da variável em cada classe. O ponto médio da 1a. classe é obtido pela soma de 162 e 167, dividida por 2. Portanto 164,5 cm.
A distribuição de freqüência pode ser, ainda, para uma variável qualitativa (nominal ou ordinal) como, por exemplo, na tabela abaixo que indica o número de correspondências recebidas por uma revista em certa semana:
TAB. 4 – Correspondências recebida pela revista Veja – 22/02/06 a 01/03/06
 
	Categorias
	N.de correspondências
	 E-mails
	1 567
	 Cartas
	 39
	 Fax
	 20
	(
	1 626
 Fonte: Revista Veja
3. MEDIDAS ESTATÍSTICAS:
Podem ser divididas em medidas de tendência central e medidas de dispersão.
Medidas de tendência central ou de posição:a) Média aritmética:
É a soma dos valores da variável dividida pelo número de valores. Ou seja:
 
 onde: n = é o tamanho da amostra.
Exemplo: O número médio de faltas da TAB.1 é:
 faltas.
O símbolo da média depende dos dados constituírem uma amostra ou uma população. Na população utilizam-se letras gregas, geralmente, para representar as medidas. Portanto a fórmula para a média na população será:
 onde: N = é o tamanho da população.
	 A média aritmética de uma distribuição de freqüências por pontos ou por classes é dada por:
 onde: n = ( f
Exemplo:
A média do número de faltas de um grupo de alunos da Escola XYZ da TAB.2 é:
 faltas.
b) Moda:
 A moda é o valor que mais se repete, o mais freqüente, de um conjunto de dados. A moda pode não ser única, isto é, um conjunto pode ser bimodal, trimodal, etc. ou mesmo amodal (sem moda). 
 Exemplo:
 Dado o conjunto: 1 2 2 3 3 4 4 4 7 9 15
 A moda é 4.
Se a variável for qualitativa nominal, como por exemplo, estado civil, a moda será o estado civil que mais se repetiu.
Exemplo:
A moda do número de faltas da TAB.1 é 3.
Na distribuição de freqüência, a moda é obtida da mesma maneira que no caso dos dados não agrupados, ou seja, é o valor que possui maior freqüência. A
Assim, a moda da TAB.2 é 2 faltas.
A moda de uma distribuição de frequência por classes ou intervalos pode ser obtida pelo ponto médio da classe ou intervalo que possui maior frequência. É chamada “moda bruta”.
A moda da TAB.3 é 169,5 cm. 
Na TAB.4, a moda é a categoria E-mails.
c) Mediana:
 A mediana de um conjunto ordenado de valores é definida como sendo o valor que separa o conjunto em dois subconjuntos do mesmo tamanho. Assim se “n” (número de elementos) é ímpar a mediana é o valor central do conjunto. Caso contrário a mediana é a média dos valores centrais do conjunto.
 Me = x(n+1)/2 se “n” é ímpar e Me = [x(n/2) + x(n/2) +1] / 2 se “n” é par.
 Exemplo:
 Para o conjunto: 15 18 21 32 45 46 49
 A mediana é:
 Me = x(7+1)/2 = x4 = 32
 Ou seja, a mediana é o quarto valor na seqüência ordenada de elementos.
 
 Se o conjunto fosse: 15 18 21 32 45 46
 A mediana será:
 Me = [x(n/2) + x(n/2)+1] / 2 = [x(6/2) + x(6/2)+1] / 2 = (x3 + x4) / 2 = (21 + 32) / 2 = 53/2 = 26,50 
		No caso de uma distribuição de freqüência:
1. a mediana de uma distribuição de freqüência por pontos é obtida da mesma forma que para dados não agrupados, isto é:
Exemplo:
Para os valores da TAB.2 referente ao número de faltas a mediana é:
Me = [x60/2 + x(60/2)+1] / 2 = [x30 + x31] / 2 = (2 + 2) / 2 = 2
2. a mediana para uma distribuição de freqüência por classes ou intervalos é dada pela seguinte expressão:
onde: li = limite inferior da classe mediana;
 Fa = freqüência acumulada simples da classe anterior à classe mediana;
 f = freqüência simples da classe mediana;
 h = amplitude da classe mediana.
Exemplo:
Considerando que a classe mediana da TAB.3 referente à altura dos 30 atletas é a que contém os valores x15 e x16, isto é, a segunda classe, então:
�� EMBED Equation.3 cm
Ou seja, 50% dos atletas possuem menos de 173,25 cm de altura.
Medidas de DISPERSÃO OU VARIABILIDADE:
		
		Indicam a dispersão dos valores da variável em relação a sua média.
Variância absoluta
Desvio padrão
Coeficiente de variação
 		 a) Variância absoluta:
 
		 A variância é representada por s² (para amostra) e definida como sendo “a média dos quadrados dos desvios em relação à média aritmética”. Por desvio entende-se a diferença entre um valor do conjunto e a média.
 s
 ou s
� 
Se os dados forem de uma população a variância será:
 
 ou 
No caso de distribuição de freqüência o cálculo da variância será:
s
 ou s
Na população a variância é: 
 ou 
 		 b) Desvio padrão:
 
 A variância por ser um quadrado não permite comparações com a unidade que se está trabalhando. Para se ter uma medida de variabilidade com a mesma unidade do conjunto utiliza-se a raiz quadrada da variância, que é denominada de desvio padrão. Assim a expressão para o desvio é: 
 
 
Na população será: 
Exemplo:
Calcular a variância e o desvio padrão dos seguintes dados amostrais:
 3 4 0 3 8 6
	= 24/6 = 4
(x² = 134
A variância é: 
 E o desvio padrão: s = 2,76
		 c) Coeficiente de variação:
 O coeficiente de variação é uma medida de dispersão relativa, isto é, não possui unidade de medida e é calculado por:
 
 Usando os símbolos populacionais: 
		
 Por não ter unidade de medida, o coeficiente de variação pode ser utilizado na comparação de duas ou mais séries de valores e conhecer a séria mais homogênea, uniforme. Ou seja, que tem menor variabilidade.
		
	 	OBS.: Quanto maior o C.V. mais heterogêneo será o conjunto de dados.
 
PROPRIEDADES DAS MEDIDAS:
MEDIDAS DE TENDÊNCIA CENTRAL:	
Se todos os valores de um conjunto de dados forem somados a uma constante então as medidas de tendência central aumentam desta constante. Em símbolos: dado um conjunto de dados x e somando a este conjunto uma constante “c”, então y = x + c. Tem-se:
 
	= 
 + c
O mesmo ocorre com a mediana e a moda.
Se todos os valores de um conjunto forem multiplicados a uma constante então as medidas de tendência central ficam multiplicadas por esta constante. Ou seja, y = cx. Tem-se:
 
	= c
O mesmo ocorre com a mediana e a moda.
MEDIDAS DE DISPERSÃO:	
Se todos os valores de um conjunto de dados forem somados a uma constante então as medidas de dispersão não se alteram. Em símbolos: dado um conjunto de dados x e somando a este conjunto uma constante “c” , ou seja, y = x + c. Tem-se:
sy = sx
O mesmo vale para a variância. O coeficiente de variação é exceção, pois é medida derivada que combina uma medida de tendência central, que se altera, e uma medida de dispersão que não se altera.
Se todos os valores de um conjunto de dados forem multiplicados a uma constante então as medidas de dispersão ficam multiplicadas por esta constante, sendo que a variância fica multiplicada pelo quadrado da constante. Ou seja: y = cx. Tem-se:
sy = csx
�PAGE �
�PAGE �8�
Prof. João Feliz Duarte de Moraes
_1184085293.unknown
_1184089848.unknown
_1202242192.unknown
_1207333171.unknown
_1184091995.unknown
_1184334500.unknown
_1184091946.unknown
_1184087741.unknown
_1184088006.unknown
_1184088069.unknown
_1184088512.unknown
_1184087874.unknown
_1184087713.unknown
_1143298390.unknown
_1143408655.unknown
_1184084622.unknown
_1143409375.unknown
_1143409893.unknown
_1143408713.unknown
_1143298703.unknown
_1142886885.unknown
_1143297900.unknown
_1142888458.unknown
_914004316.unknown

Outros materiais