Buscar

Estatística%20Descritiva[1]

Prévia do material em texto

Estatística Descritiva
Módulo 1. Estatística Descritiva. Introdução.
 
 
Conteúdo 1. Classificação. População e Amostra.
 
1. Estatística: Definição e Classificação.
 
 
2. População e Amostra.
 
População: é um conjunto de elementos que possuem, em comum, determinada característica.
 
Amostra: subconjunto da população.
 
 
 
3. Técnicas de Amostragem.
 
 
  Amostragem Casual Simples.
 
  Amostragem sistemática.
 
  Amostragem Estratificada.
 
  Amostragem por conveniência.
 
 
4. Dados
 
Os dados são as informações obtidas através de observações, medidas, respostas de pesquisas ou contagens em geral.
 
 
Os dados podem ser classificados em:
 
Dados qualitativos: classificação por tipos ou atributos.
 
Exemplo: A cor dos olhos (azuis, castanhos, verdes, etc.) das modelos de uma determinada agência.
 
 
Dados quantitativos: quando seus valores são expressos em números.
 
Exemplo: O peso líquido de cada um dos sabonetes produzidos por uma empresa.
 
Exercício Resolvido
 
Considere as afirmações a seguir e assinale a alternativa correta.
 
I. A qualidade de um produto, defeituoso ou não defeituoso, trata de um dado qualitativo.
II. A altura dos atletas do time de basquetebol da escola “Aprender”, trata de um dado qualitativo.
III. O diâmetro dos parafusos produzidos por certa máquina trata de um dado quantitativo.
 
a) Todas as afirmações estão corretas.
b) Apenas a afirmação I está correta.
c) Apenas as afirmações I e III estão corretas.
d) Todas as afirmações estão incorretas.
e) Apenas a afirmação III está correta.
 
Resposta Correta: C
Justificativa: A altura dos atletas do time de basquetebol da escola “Aprender” trata de um dado QUANTITATIVO.
 
 
 
 
 
Conteúdo 2. Representação dos dados em Tabelas e Gráficos.
 
I. Representação em Tabelas (Dados isolados).
 
 
Área das regiões do Brasil (em km2)
	Região
	Área (em km2)
	Norte
	3 851 560
	Nordeste
	1 556 001
	Sul
	575 316 
	Sudeste
	927 286 
	Centro-Oeste
	1 604 852
	Total
	55.942.047
Fonte: http://pt.wikipedia.org/wiki/Regi%C3%B5es_do_Brasil
	 
 
A tabela acima mostra a área em cada uma das regiões do Brasil, este número é denominado frequência.
 
Podemos também encontrar a frequência relativa para cada modalidade, para isso basta dividir a freqüência de cada modalidade pelo total de frequências (n).
 
 
Área das regiões do Brasil (em km2)
	Região
	Área (em km2)
	Frequência relativa
	Norte
	3.851.560
	0,45
	Nordeste
	1.556.001
	0,18
	Sul
	575.316 
	0,07
	Sudeste
	927.286 
	0,11
	Centro-Oeste
	1.604.852
	0,19
	Total
	8.515.015
	1
Fonte: http://pt.wikipedia.org/wiki/Regi%C3%B5es_do_Brasil
 
 
II. Gráfico (Dados isolados).
 
Para construção do gráfico utilizamos o sistema de eixos cartesianos. No eixo das abscissas (x) ou ordenadas (y) representamos as variáveis em estudo, no outro eixo (abscissas ou ordenadas) ainda não utilizado, representamos as frequências.
 
Exercícios Resolvidos.
 
1. A vídeo-locadora “ALUGUE JÁ” anotou as locações do dia 18/01/2011, obtendo os dados da tabela abaixo:
 
Tabela 10. Número de filmes locados na locadora “ALUGUE JÁ” por gênero, em 24/12/2007.
	Gênero de filme
	frequência
	Drama
	12
	Comédia
	10
	Ficção
	                      8
	Suspense
	6
	Outros
	4
	Total
	40
 
Para a tabela, pedem-se:
 
a) as freqüências relativas.
 
	Gênero de filme
	freqüência
	freqüência relativa
	Drama
	12
	0,30
	Comédia
	10
	0,25
	Ficção
	8
	0,20
	Suspense
	6
	0,15
	Outros
	4
	0,10
	Total
	40
	1
 
 
b) construir um gráfico com a frequência relativa.
 
 
Módulo 2. Distribuições de Frequências.
 
Conteúdo 1.  Distribuições de Frequências. Tabelas.
 
Uma distribuição de frequência é uma tabela de intervalos de classes com o número total de entradas de dados em cada classe.
 
A frequência de uma classe é o número de entrada de dados na classe.
 
Veja o exemplo.
 
A tabela a seguir ilustra os salários, em reais, de 100 funcionários de um determinado setor de uma empresa automobilística.
 
 
                                                            Classes de salários
	Classes de salários          (em reais)
	Número de funcionários
	500 |— 1000
	10
	1000|— 1500
	8
	1500 |— 2000
	12
	2000 |— 2500
	20
	2500 |— 3000
	25
	3000 |— 3500
	10
	3500 |— 4000
	15
	 
	Total = 100
 
A frequência neste caso é o número de funcionários que estão incluídos na classe de salários.
 
Usamos a notação 500 |—1000, onde o intervalo é fechado à esquerda (pertencem à classe os valores iguais ao extremo inferior) e aberto à direita (não pertencem à classe os valores iguais ao extremo superior).
 
Amplitude do intervalo de uma classe é a diferença entre o limite superior e inferior.
 
Temos no exemplo 1000-500=500, logo a amplitude do intervalo de classe é de 500 reais.
 
O Ponto médio de um intervalo de classe é a metade da soma do limite inferior e o limite superior.
Veja o exemplo:
                                     Classes de salários e pontos médios
	Classes de salários                    (em reais)
	Número de funcionários
	Ponto Médio
	500 |— 1000
	10
	750
	1000|— 1500
	8
	1250
	1500 |— 2000
	12
	1750
	2000 |— 2500
	20
	2250
	2500 |— 3000
	25
	2750
	3000 |— 3500
	10
	3250
	3500 |— 4000
	15
	3750
	 
	            Total = 100
	 
 
A frequência relativa de uma classe é a frequência desta classe dividida pelo total de elementos da amostra(n).
 
                       
                        Classes de Salários e frequências relativas.
	Classes de salários          (em reais)
	Número de funcionários
Frequências
	Freqüências Relativas
 
	500 |— 1000
	10
	0,10
	1000|— 1500
	8
	0,08
	1500 |— 2000
	12
	0,12
	2000 |— 2500
	20
	0,20
	2500 |— 3000
	25
	0,25
	3000 |— 3500
	10
	0,10
	3500 |— 4000
	15
	0,15
	Total:
	            Total = 100
	           Total=1
 
A Frequência Acumulada de uma classe é a soma da freqüência daquela classe com a de todas as classes anteriores.
Veja o exemplo:
                                       Classes de salários e frequências acumuladas.
	Classes de salários            (em reais)
	Número de funcionários
Frequências
 
	Frequências Acumuladas
 
	500 |— 1000
	10
	10
	1000|— 1500
	8
	18
	1500 |— 2000
	12
	30
	2000 |— 2500
	20
	50
	2500 |— 3000
	25
	75
	3000 |— 3500
	10
	85
	3500 |— 4000
	15
	100
	 
	Total = 100
	 
 
 
Exercício Resolvido:
 
 
1. Considere a tabela a seguir:
	 Rendimento, em reais de famílias de uma determinada comunidade.
	Classes de rendimentos                  (em reais)
	Número de famílias
	500|—1000
	6
	1000|—1500
	4
	1500|—2000
	7
	2000|—2500
	5
	2500|—3000
	3
	3000|—3500
	5
	Total
	30
 
a) Encontre os pontos médios de cada intervalo de classe.
b) Encontre as frequências relativas.
c) Encontre as frequências acumuladas.
 
 
 
 
 
 
Conteúdo 2. Histograma e Polígono de Frequências.
 
Histograma.
 
O histograma é um gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura à respectiva freqüência. No exemplo abaixo usamos o ponto médio de cada classe para constriur o histograma.
	Classes de salários         (em reais)
	Número de funcionários
	500 |— 1000
	10
	1000|— 1500
	8
	1500 |— 2000
	12
	2000 |— 2500
	20
	2500 |— 3000
	25
	3000 |— 3500
	10
	3500 |— 4000
	15
	 
	Total = 100
                                 
 
Polígono de Frequências.
 
Os dados apresentados em tabelas de distribuição de freqüências, também podem ser representados em um polígono de freqüências.
 
A construção de um polígono de frequências é bastante simples, a partir do histograma, basta ligar os pontos médios de cada classe. Parafechar o polígono unimos os extremos da figura com o eixo horizontal, no ponto médio da classe anterior a primeira e no ponto médio da posterior a ultima classe.
 
 
 
Exercício Resolvido:
 
Construir um histograma da situação ilustrada na tabela a seguir:
 
	 Rendimento, em reais de famílias de uma determinada comunidade.
	Classes de rendimentos                  (em reais)
	Número de famílias
	  500|—1000
	6
	1000|—1500
	4
	1500|—2000
	7
	2000|—2500
	5
	2500|—3000
	3
	3000|—3500
	5
	Total
	30
 
 
 
Módulo 3. Medidas de tendência central.
 
Conteúdo 1. Média Aritmética, Mediana e Moda.
 
1. Média aritmética (Dados isolados)
 
.
 
Veja o exemplo a seguir:
 
Uma amostra contendo dez preços de etanol foi extraída em diversos postos no dia 01/02/2011. Os preços em reais são:
 
                                         
	      Preço, em reais, do etanol em 10    postos de combustível (01/02/2011)
	1,75
	1,70
	1,74
	1,52
	1,56
	1,70
	1,45
	1,42
	1,70
	1,86
 
 
A média é calculada da seguinte maneira:
 
 
 
2. Mediana
 
A mediana é uma medida de tendência central. Ela divide um conjunto ordenado de dados em duas partes com igual número de elementos.
 
 
Se a amostra é constituída por um número ímpar de elementos, a mediana é o valor que fica no centro dos dados ordenados.
 
Exemplo: 12, 15, 20, 21, 32.
A mediana é 20.
 
Se a amostra é constituída por um número par de elementos, a mediana é a média aritmética dos dois valores centrais dos dados ordenados.
 
Exemplo: 12, 15, 15, 20, 21 e 32
A mediana é .
 
3. Moda
 
A moda de um conjunto de dados é o valor que ocorre com maior frequência.
 
Uma amostra contendo dez preços de etanol foi extraída em diversos postos no dia 01/02/2011. Os preços em reais são:
 
                                         
	Preço, em reais, do etanol em 10 postos de combustível (01/02/2011)
	1,75
	1,70
	1,74
	1,52
	1,56
	1,70
	1,45
	1,42
	1,70
	1,86
 
 
A moda neste caso é 1,70 reais.
 
Exercício Resolvido.
  
 
 
Conteúdo 2. Média Aritmética (Distribuição de Frequências).
 
Cálculo da média para distribuição de frequências:
Veja o exemplo a seguir: 
 
Em uma amostra de 20 parafusos produzidos por uma metalúrgica, foram medidos os diâmetros, em milímetros, conforme a tabela abaixo. Qual é a medida média do diâmetro?
 
	Diâmetro do parafuso, em milímetros.
 
	 
Nº de parafusos (fi)
	1,5
	2
	1,8
	4
	2
	3
	2,4
	6
	2,6
	5
	Total
	20
 
Neste caso utilizamos a fórmula: , pois a tabela mostra que existem 2 parafusos com diâmetro igual a 1,5 mm, 4  parafusos de
 
diâmetro 1,8 mm e assim por diante.
 
 
 
 
 
            
	Diâmetro do parafuso, em milímetros.
xi
	 
número de parafusos
	 
xi.fi
	1,5
	2
	3
	1,8
	4
	7,2
	2
	3
	6
	2,4
	6
	14,4
	2,6
	5
	13
	Total
	20
	43,6
 
 
 
 
Veja o exemplo a seguir:
 
	Classes de salários                (em reais)
	 
Ponto Médio
	Número de funcionários
	 
xi.fi
	500 |— 1000
	750
	10
	7.500
	1000|— 1500
	1250
	8
	10.000
	1500 |— 2000
	1750
	12
	21.000
	2000 |— 2500
	2250
	20
	45.000
	2500 |— 3000
	2750
	25
	68.750
	3000 |— 3500
	3250
	10
	32.500
	3500 |— 4000
	3750
	15
	56.250
	 
	 
	Total = 100
	Total=241.000
 
 
 
 
Exercício Resolvido
 
 
Módulo 4. Medidas de Dispersão.
 
Conteúdo 1. Medidas de Dispersão (Dados Isolados).
 
Quando descrevemos nossos dados através das medidas de tendência central, necessitamos muitas vezes de complementos que são denominadas de medidas de dispersão. As medidas de dispersão utilizadas são a amplitude, a variância, o desvio-padrão e o coeficiente de variação.
 
As medidas de dispersão indicam o quanto os dados variam em torno da região central.
 
1. Amplitude.
 
A amplitude é a diferença entre o maior e o menor dado observado.
Por utilizar apenas os extremos, a amplitude não é uma boa medida de dispersão.
 
 
2.   Variância.
 
A variância é definida como a soma dos quadrados dos desvios dividida pelo tamanho da amostra menos 1.
 
 
O desvio em relação à média é a diferença entre cada dado e a média do conjunto.
 
 
Veja o exemplo a seguir:
                                           
	Preço, em reais, do etanol em 10 postos de combustível (01/02/2011)
	1,75
	1,70
	1,74
	1,52
	1,56
	1,70
	1,45
	1,42
	1,70
	1,86
 
 
 
A variância é calculada da seguinte maneira:
 
 
 
 
4. Coeficiente de Variação (CV).
 
 
O coeficiente de variação é o quociente entre o desvio padrão e a média.
 
.
 
Podemos expressar o coeficiente de variação na forma de porcentagem.
 
 
 
Exercício Resolvido.
 
 
Conteúdo 2. Medidas de Dispersão (Distribuição de frequências).
 
No caso de uma distribuição de frequências usamos a fórmula:
 
, onde xi é o ponto médio do intervalo de classe e fi é a frequência de cada classe.
                   
	Diâmetro do parafuso, em milímetros.
 
	 
Número de parafusos (fi)
	 
	1,5
	2
	0,9248
	1,8
	4
	0,5776
	2
	3
	0,0972
	2,4
	6
	0,2904
	2,6
	5
	0,882
	Total
	20
	2,772
 
 
 
 
 
Para o calculo da variância, desvio-padrão e coeficiente de variação para classes de frequências, temos:
 
 Exercício Resolvido
 
 
 
 
 Módulo 5. Probabilidades.
 
Conteúdo 1. Espaço amostral e Evento.
 
Em um experimento aleatório, temos:
 
Espaço Amostral (S) é o conjunto de todos os resultados possíveis.
 
Exemplo: No lançamento de um dado honesto de 6 faces temos: S1= {1, 2, 3, 4, 5, 6}
O número de elementos do espaço amostral é dado por n(S). No exemplo, temos n(S) =6
 
Evento (E) é qualquer subconjunto de um espaço amostral.
 
Exemplos: No lançamento de um dado honesto de 6 faces, podem ocorrer os eventos:
 
E: sair ponto ímpar.
E= {1, 3, 5}                       n(E) =3
 
F: sair ponto maior ou igual a 3.
F= {3, 4, 5, 6}                    n(F) =4
 
Dentre os eventos, devemos considerar os seguintes: S, considerado evento certo, pois sempre ocorre e Φ, considerado evento impossível, pois nunca ocorre.
 
Exercício Resolvido
 
No lançamento de um dado honesto de seis faces, determinar:
 
a) o espaço amostral.
 
S={1, 2, 3, 4, 5, 6}
 
b) sair número par.
 
E= {2, 4, 6}
 
c) sair número maior que 3.
F= {4, 5, 6}
 
d) sair número par e maior que 3.
 
G= {4, 6}
 
 
 
Conceito de Probabilidade.
 
A probabilidade P(E) de ocorrer um evento E é o quociente entre o número de elementos de E e o número de elementos de S, ondeS é difrente do conjunto vazio.
 
 
Exemplos:
 
 
a) No lançamento de um dado honesto de 6 faces, qual a probabilidade de ocorrer ponto ímpar?
 
 
S= {1, 2, 3, 4, 5,6} n(S) =6
 
E= {1, 3, 5}     n(E) =3
 
 
P(E)=3/6=0,5.
 
 
 b) Em um baralho comum de 52 cartas, qual a probabilidade de se retirar uma carta de copas?
Em um baralho comum de 52 cartas temos 13 cartas de copas. Considerando F como sendo o evento sair carta de copas, então: n(S) =52 e n(F) =13
 
P(F)=13/52=1/4
 
 
 
 
 
 
 
Exercício Resolvido.
 
No lançamento de um dado honesto de 6 faces, qual a probabilidade de ocorrer ponto maior que 5?
 
S= {1, 2, 3, 4, 5,6} n(S) =6
E= {6}     n(E) =1
 
 
P(E)=1/6
 
Distribuição Binomial:
 
Problemas que envolvem situações onde um experimento aleatório com dois resultados possíveis é repetido independentemente várias vezes.
 
Suponha que n repetições independentes sejam realizadas e que a probabilidade de sucesso em qualquer repetição seja p. Seja x o número total de sucessos dentre as n repetições. Então a distribuição de probabilidade da variável x é dada pela fórmula:
p: probabilidade do sucesso
q = 1- p: probabilidade do fracasso.
 
Exemplo: Se 18% das peças produzidas por uma máquina são defeituosas, qual é a probabilidade de que, entre 10 peças escolhidas ao acaso,
 
a) duas peças sejam defeituosas?n=10
 
p: probabilidade do sucesso (ser defeituosa) = 18%=0,18.
 
q: probabilidade do fracasso (não ser defeituosa) = 1 – 0,18=0,82.
b) no máximo 2 serem defeituosas?
 
No máximo 2 serem defeituosas significa que poderá haver nenhuma (zero), uma ou duas peças defeituosas.
 
P(máximo duas peças defeituosas) =P(0) + P(1) + P(2).
c) no mínimo 2 peças defeituosas?
 
No mínimo 2 serem defeituosas significa 2, 3, 4,...10 peças defeituosas.
 
P(mínimo 2 peças defeituosas)=P(2)+P(3)+P(4)+P(5)+...+P(10) ou
 
Distribuição de Poisson
 
A distribuição de Poisson é uma distribuição de probabilidades para eventos que ocorrem em um intervalo de tempo ou de espaço.
Distribuição Normal
 
Características da Distribuição Normal.
 
(1) A variável aleatória pode assumir qualquer valor real.
 
(2) O gráfico é uma curva em forma de sino. A curva é simétrica em relação a média ( μ).
                                                                        
(3) A área sob a curva normal é igual a 1. Essa área corresponde a probabilidade de a variável aleatória assumir qualquer valor real.
 
Exercício Resolvido
 
A vida média da bateria tipo I da empresa “Dura Mais” é distribuída normalmente com uma média de 600 dias e desvio padrão de 75 dias. Qual a probabilidade de uma bateria retirada ao acaso da produção desta empresa durar:
a) menos de 450 dias?

Continue navegando