Buscar

engenharia_ambiental___probabilidade_e_estat-tica___map_07___estat-tica_descritiva

Prévia do material em texto

Introdução à Estatística
Conceito de Estatística
	O termo Estatística provém da palavra estado e foi utilizado originalmente para denominar levantamento de dados, cuja finalidade era orientar o Estado em suas decisões.
	Neste sentido foi utilizado desde épocas remotas para determinar o valor dos impostos cobrados dos cidadãos, para determinar a estratégia de uma nova batalha em guerras, para determinar o tamanho das populações, a densidade populacional, a produção de alimentos, entre outros.
	
	Atualmente, a estatística é definida como: 
	Estatística é um conjunto de métodos e processos quantitativos que serve para 
	estudar e medir os fenômenos coletivos.
Conceitos Fundamentais
População
	População é o conjunto de todos os itens (pessoas, coisas, objetos,...) que interessam ao estudo de um fenômeno coletivo segundo alguma característica.
Amostra
	Amostra é qualquer subconjunto não vazio de uma população.
	Em aplicações efetivas o número de elementos componentes de uma amostra é bastante reduzido em relação ao número de elementos componentes da população.
	Uma característica numérica estabelecida para toda uma população é denominada parâmetro.
	Uma característica numérica estabelecida para uma amostra é denominada estimador.
Exemplo:
No fenômeno coletivo eleição para governador em determinado estado a população é o conjunto de todos os eleitores habilitados neste estado. Um parâmetro é a proporção de votos do candidato A. Uma amostra é um grupo de, por exemplo, 1000 eleitores selecionados em todo o estado. Um estimador é a proporção de votos do candidato A obtida na amostra.
Processos estatísticos de abordagem
Estimação
	É uma avaliação indireta de um parâmetro, com base em um estimador através do cálculo de probabilidades. 
Censo
	É uma avaliação direta de um parâmetro, utilizando-se todos os componentes da população.
Dados estatísticos
Estatística Descritiva
	É a parte da Estatística que tem por objetivo descrever os dados observados.
Estatística Indutiva
	É a parte da Estatística que tem por objetivo obter e generalizar conclusões para a população a partir
de uma amostra, através do cálculo de probabilidade.
	O cálculo de probabilidade viabiliza a inferência estatística.
Estatística Descritiva
	A Estatística Descritiva, na sua função de descrição dos dados, tem as seguintes atribuições:
a) obtenção ou coleta de dados estatísticos: é normalmente feita através de um questionário ou de observação direta de uma população ou amostra.
b) organização dos dados: consiste na ordenação e crítica quanto à correção dos valores observados, falhas humanas, omissões, abandono de dados duvidosos, entre outros.
c) redução dos dados: o entendimento e compreensão de grande quantidade de dados através de simples leitura de seus valores individuais é uma tarefa extremamente árdua. A Estatística Descritiva apresenta duas formas básicas para a redução do número de dados com os quais deve trabalhar chamadas variável discreta e variável contínua.
d) representação dos dados: os dados estatísticos podem ser mais facilmente compreendidos quando apresentados através de uma representação tabular ou gráfica, o que permite uma visualização rápida de todos os dados. 
e) obtenção de algumas informações que auxiliam a descrição do fenômeno coletivo: informações como médias, proporções, dispersões, tendências, índices, taxas, entre outros, facilitam a descrição dos fenômenos observados.
Variável
	É, convencionalmente, o conjunto de resultados (dados) possíveis de um fenômeno.
Variável Qualitativa
	Quando seus valores são expressos por atributos não quantificáveis como, por exemplo, sexo, cor da pele e cor dos olhos.
Variável Quantitativa
	Quando os dados são de caráter nitidamente quantitativo, e o conjunto dos resultados possui uma
estrutura numérica como, por exemplo, peso e altura. 
 
Medidas de Tendência Central
	As medidas de tendência central são valores calculados com o objetivo de representar os dados de uma forma ainda mais condensada do que se usando uma tabela. Quando o objetivo é representar, por meio de um valor único, determinado conjunto de informações que variam, parece razoável escolher um valor central, mesmo que esse valor seja uma abstração. Existem várias medidas de tendência central. As mais usadas em análise estatística são a média aritmética, a moda e a mediana.
Média Aritmética 
: ou simplesmente média, é a medida de tendência central mais utilizada pois tem uma interpretação intuitiva e propriedades estatísticas que a tornam muito útil nas comparações entre populações e outras situações que envolvem inferências..
Moda: a moda (mo ou Mo) é o valor mais freqüente de uma série de valores. Em função da incidência da moda, uma série de valores pode ser classificada como:
amodal: não possui moda (nenhum valor se repete).
modal: possui somente uma moda.
bimodal: possui duas modas.
polimodal: possui três ou mais modas.
Mediana: a mediana (me ou Me) é o valor, em uma série ordenada de dados, que divide a série em dois subgrupos de igual tamanho. Em outras palavras, é um valor tal que tenha igual quantidade de valores menores e maiores que ele.
Medidas de Dispersão
As medidas de tendência central são insuficientes para representar adequadamente conjuntos de dados já que nada revelam sobre sua dispersão, pois observando-se um conjunto de dados com média já calculada, verifica-se apenas que estes dados se distribuem em torno da média, para mais ou para menos.
	As medidas de dispersão (variabilidade) representam o modo como os valores se distribuem em torno das medidas de tendência central proporcionando uma visão mais clara da variabilidade dos dados. Estas medidas são tanto mais apropriadas para descrever a amostra quanto menor for a dispersão dos dados.
Desvio Médio: o conceito estatístico de desvio médio simples (DM) corresponde ao conceito matemático de distância. A dispersão dos dados em relação à média de uma sequência pode ser avaliada através dos desvios de cada elemento da sequência em relação à média da sequência. 
Variância 
: para levar em conta todos os valores observados na série, foi sugerido o uso dos desvios de cada valor em relação à média, reunindo-se tais informações em uma unidade denominada variância. 
	Quanto maior a variância de uma série, maior a dispersão dos valores que as a compõem.
	Quando não houver variabilidade, a variância é zero.
Desvio Padrão 
: uma dificuldade com a variância, como medida descritiva da dispersão, é o fato de não poder ser apresentada com a mesma unidade com que a variável foi medida (variável que acompanha a variância é o quadrado da unidade de mensuração da variável). A solução é extrair a raiz quadrada positiva da variância, já que, com isso, se volta à unidade original da variável. Essa nova medida de dispersão é denominada desvio padrão. È interessante observar que o desvio padrão de uma série de dados pode ter um valor numérico maior que o da média. Quando isso ocorre é uma indicação de que a distribuição é assimétrica.
	
Coeficiente de Variação: quando se analisa a mesma variável em duas amostras, pode-se comparar os desvios padrão observados e verificar onde a variação é maior. No entanto, o mesmo não pode ser feito em se tratando de variáveis diferentes. 
	Para comparar variabilidades, neste caso, deve-se usar o coeficiente de variação (CV), que é uma medida de dispersão independente da unidade de mensuração da variável.
Dados em série (pequena quantidade de dados)	
Média Aritmética: 
Moda: destacamos o(s) valor(es) que mais se repete(em). 
Mediana: 
n ímpar → 	é o valor que fica no centro dos dados ordenados (ordem crescente).
n par 	 → 	é a média aritmética dos dois valoresque ficam na posição central dos dados ordenados 
 (ordem crescente).
Desvio Médio Amostral: 
		Desvio Padrão Amostral: 
Variância Amostral: 
 	Coeficiente de Variação: 
Observação:
Em caso de trabalharmos com populações, devemos calcular o desvio médio 
 e o desvio padrão 
 usando como denominador 
.
Exercícios de fixação:
01. Tempo de vida de moscas domésticas: a série de dados representa o tempo de vida (em dias) de 8 moscas domésticas.
Seja a série: 9, 6, 8, 11, 10, 7, 11, 12.
Determine:
a) a média aritmética;	(9,25 dias)	d) o desvio médio; (2 dias)		f) a variância; (4,49 (dias)²)
b) a moda;	(11 dias) 		e) o desvio padrão; (2,12dias) 		g) o coeficiente de variação.
c) a mediana; 	(9,5 dias)									(22,91%)
02. Espessura do gelo: a série de dados representa a espessura do gelo (em centímetros) medido em 10 localidades diferentes em um lago congelado.
Seja a série:	5,8 6,4 6,9 7,2 5,1 4,9 4,3 5,8 7,0 6,8 
Determine:
a) a média aritmética; (6,02 cm)	d) o desvio médio; (0,93 cm)	f) a variância; (1 cm²)
b) a moda; (5,8 cm)			e) o desvio padrão; (1 cm)	g) o coeficiente de variação. (16,61%)
c) a mediana; (6,1 cm)
03. Índice de raios UV: a série de dados representa o índice de raio ultravioleta em determinada cidade, entre os dias 14 e 22 de junho durante um ano recente.
Seja a série:	10 6 10 5 8 7 10 9 8. 
Determine:
a) a média; (8,11)		c) a mediana; (8)			e) a variância; (3,35)			
b) a moda; (10)		d) o desvio médio; (1,64)		f) o coeficiente de variação. (22,56%)	
_1409763542.unknown
_1409763697.unknown
_1441383937.unknown
_1409763726.unknown
_1409763554.unknown
_1403024919.unknown
_1403025108.unknown
_1362140485.unknown
_1403024611.unknown
_1378731595.unknown
_1362140171.unknown

Continue navegando