Buscar

Aula_de_Estatistica

Prévia do material em texto

Módulo 1 
 
 
Estatística 
Básica 
Pesquisa Científica 
 
Busca entender o mundo. 
Desenvolve ideias e 
percepções. 
Move-se através de hipóteses. 
 
 
Descreve a frequência de 
ocorrência de um evento. 
Avalia a relação entre 2 
variáveis 
 
 
Procura esclarecer relações do 
tipo causa- efeito entre duas 
variáveis 
 
Conceito de Estatística 
•Estatística – 
Conjunto de técnicas destinadas ao estudo quantitativo 
de fenômenos coletivos e empiricamente observáveis. 
• Dado Estatístico 
Número que mede a intensidade ou a característica do 
fenômeno coletivo que está sendo estudado. 
• Finalidade da Estatística 
▪ Desenvolver métodos e técnicas p/ coleta, organização, 
análise e interpretação de dados; 
▪ Fornecer métodos para inferir conclusões sobre um 
universo maior a partir das observações de um 
fenômeno particular. 
Conceito de Estatística 
• Inferência 
Método para tirar conclusão sobre um fenômeno 
através de repetidas observações, mantendo sempre 
as mesmas condições. Processo mental para chegar a 
uma conclusão a partir de premissas(suposições). 
 
• Incerteza 
Como não é possível controlar todos os fatores que 
influem na observação de um fenômeno estatístico há 
sempre um grau de incerteza sobre a veracidade dos 
resultados. 
Teoria da Probabilidade 
A estatística é uma ciência sobre a incerteza. Se 
baseia inteiramente na Teoria da Probabilidade 
( d e o c o r r ê n c i a d e u m f e n ô m e n o ) . 
Probabilidade Estatística 
É a afirmação sobre a possibi l idade ou 
probabilidade de um fenômeno ocorrer, desde que 
satisfeitas um conjunto de condições teóricas. 
Fenômenos aleatórios 
São o objeto de estudo da estatística, e se referem 
a todos fenômenos observáveis na natureza. 
 
Conceito de Estatística 
Probabilidade 
Baralho 
56 
Cartas 
Qual a 
probabilidade 
de tirar 
1 Az? 
Fenômenos Aleatórios 
Características Básicas 
▪ Se repetem. 
▪ Variabilidade. 
▪ Não há previsibilidade sobre a variação futura. 
 
Frequência de um Fenômeno Aleatório 
Quando um determinado fenômeno ocorre repetidas vezes, 
diz-se que existe uma regularidade ocorrências ou 
frequência. 
Fenômenos Aleatórios 
População e Amostra 
População e Amostra Estatística 
 
População de uma Variável 
É o universo de todas as ocorrências 
possíveis de um fenômeno aleatório. A 
população é o conjunto total de dados de 
uma realidade. 
 
 
Amostra 
É um subconjunto da população. 
Representa uma parte dos dados da 
população. 
 
 
População e Amostra Estatística 
População e Amostra Estatística 
 
Levantamento de dados 
São as observações de uma amostra da população. Como 
é impossível levantar todos os dados de uma população, 
coletamos parte desta informação: amostra. 
 
Objetivo da Estatística 
Levantar dados amostrais para concluir (inferir ou 
generalizar) sobre as características da realidade mais 
ampla: população. 
 
Indução Estatística 
Processo pelo qual assumimos que os dados da amostra 
são iguais ao de toda população. Essa generalização é 
feita através do cálculo das probabilidades. 
População e Amostra Estatística 
Amostra 
Amostragem 
Amostragem 
 
Seleção da Amostra 
As amostras devem ser escolhidas de modo a permitir calcular a 
probabilidade de ocorrência de um evento. 
Amostra Representativa 
É aquela que tem as mesmas características da população de 
onde foi retirada 
Amostra Probabilística 
É aquela cujo processo de amostragem permite atribuir a cada 
elemento da amostra uma probabilidade semelhante à da 
população. 
Amostragem Aleatória 
É aquela em que cada um dos elementos da população tem a 
mesma chance de ser selecionado no levantamento dos dados. 
Amostragem 
 
Tipos de Amostragem probabilística: 
Amostragem casual simples com reposição 
Os elementos da população entram mais de uma vez na amostra. 
Amostragem casual simples sem reposição 
Os elementos da população só podem entrar uma vez na amostra 
Amostragem sistemática: 
 Seleção da amostra com base num critério: Um em cada dez. 
Amostragem por conglomerados: 
 A amostra é selecionada por sorteio da área a ser pesquisada 
Amostra estratificada ou em estágios múltiplos: 
 A amostra é dividida em grupos e selecionada por etapas dentro de 
cada grupo: cidade/bairro/quadra 
 
Amostragem 
Amostragem 
Experimentação 
Experimento e Variável 
 
• Experimento – É a observação sistemática de um 
fenômeno (evento aleatório) qualquer da população. 
• Variável – É o valor que o fenômeno assume, em 
um experimento qualquer. 
• Domínio da Variável – São todos os valores 
possíveis que um fenômeno pode assumir em um 
experimento. 
 Experimento Variável Domínio da Variável 
 
 
 Lançar 1 dado 
 
 
 Lançar 1 moeda 
Experimento e Variável 
Cara 
Coroa 
1,2,3,4,5,6 
Experimento e Variável 
• Variável Qualitativa (Atributo) 
 – a qualidade assumida pelo evento (fenômeno). 
• Ex: O que Vc acha do transporte público em SP 
 bom, ruim, regular 
Experimento e Variável 
• Variável Quantitativa 
– a medida da variação de um evento (fenômeno) 
•Ex: Qual é a idade média dos alunos da FAU 
23, 24, 25 
Experimento e Variável 
• Variável Contínua – aquela que pode assumir qualquer 
valor numa escala de valores (teoricamente infinitos 
valores): Altura das pessoas. 
• Variável Discreta – aquela cujos valores possíveis são 
números inteiros (contagem): No. de alunos numa sala. 
• Variável Dependente – aquela cujos valores depende 
dos valores de outra variável: em matemática se expressa 
por uma relação funcional (função) 
 y = f (x) 
• y = variável dependente 
• x = variável independente 
Variáveis contínuas e discretas 
ESTATÍSTICA DESCRITIVA 
Amostra : Classificação e Caracterização 
 
• Distribuição das Freqüências 
 
• Medidas de Tendência Central 
 
• Medidas de Variabilidade 
 
• Medidas de Proporcionalidade ou Relativas 
Distribuição de Frequência 
• Frequência de uma variável – é a quantidade de vezes 
que a variável ocorre (evento). Em outras palavras, é a 
frequência em que a variável assume um certo valor. 
• Frequência de variáveis contínuas: É obtida 
dividindo o conjunto de valores em intervalos de classe e 
indicando a frequência dos valores observados para cada 
intervalo. 
• Intervalo de Classe – É o intervalo entre o valor máximo e 
mínimo de uma variável. A cada intervalo de classe estão 
associados os limites de classe (valores extremos) e o ponto 
médio. 
 
Frequência de uma Variável 
Pesquisa realizada com os 200 alunos de uma universidade buscava 
identificar as preferências por esportes. Foram fornecidas as seguintes de 
opções esportivas: futebol, vôlei, basquete, natação, tênis e ciclismo. Observe 
os resultados: 
Distribuição de Frequência 
 
• Amplitude Total de uma série – É a extensão de variação 
total da variável: A diferença entre valor maior da última classe e o 
menor valor da primeira classe. 
• Amplitude de Classe – É a diferença entre o valor máximo e 
mínimo da variável dentro da classe. 
• Ponto Médio de Intervalo de Classe = valor médio 
 limite inferior + limite superior 
 2 
 
Distribuição de Frequência 
Intervalo Limites Variáveis Freqüência 
A 
Inferior 10 
6 
Superior 20 
B 
Inferior 30 
15 
Superior 40 
C 
Inferior 50 
25 
Superior 60 
D 
Inferior 70 
26 
Superior 80 
E 
Inferior 90 
16 
Superior 100 
D 
Inferior 200 
7 
Superior 500 
Variável Frequência 
10 2 
20 4 
30 7 
40 8 
50 9 
60 16 
70 16 
80 10 
90 9 
100 7 
200 4 
500 3 
Variável: Quantidade de $ no bolso 
Distribuição de Frequência 
 
• Frequência Absoluta – Valor total das observações 
• Frequência Relativa – Valor porcentual das observações 
• Frequência Acumulada – Somatória das frequências de todos intervalos 
 
 Modalidade 
Esportiva 
Frequencia 
Relativa 
Frequência 
Absoluta 
Frequência 
Acumulada 
FrequênciaAcumulada 
Futebol 35% 70 70 35% 
Vôlei 25% 50 120 60% 
Basquete 20% 40 160 80% 
Natação 10% 20 180 90% 
Tênis 8% 15 195 98% 
Ciclismo 2% 5 200 100% 
 100% 200 200 100% 
 Histograma 
• Histograma: Gráfico das distribuições das frequências de 
uma variável. 
 
• Gráfico de Barras (Histograma) – Gráfico de 
retângulos, diagrama de colunas; gráfico de áreas. 
 
• Histograma – As frequências dos fenômenos são 
proporcionais à superfície de cada retângulo que as 
representam. Para intervalos de mesma amplitude as 
frequências serão proporcionais às alturas 
 
Processo de Elaboração do Histograma 
 
• Organizar os dados em ordem crescente; 
• Determinar a amplitude total; 
• Dividir a amplitude total em um nº adequado de intervalos 
de preferência com a mesma amplitude; 
• O número mínimo de intervalos é 5, número máximo 20; 
• Quando possível os pontos médios dos intervalos devem 
coincidir com os valores realmente observados 
Distribuição de Frequência 
Histograma 
• Distribuições Simétricas e Assimétricas - Os 
histogramas podem apresentar distribuição simétricas ou 
assimétricas. Indicadas nos slides a seguir, 
 
• Polígono de Frequências – Unindo-se os valores 
médios dos intervalos de classe, o histograma se 
transforma num polígono de frequências. Pode-se então 
comparar este polígono com uma curva teórica (Normal). 
 
Distribuição de Frequência 
 
Histograma 
Variaveis Frequência
1 4
2 6
3 16
4 8
5 7
6 2
GRÁFICO DE FREQUÊNCIAS: Histograma
0
2
4
6
8
10
12
14
16
18
1 2 3 4 5 6
Categorias
F
re
q
u
ê
n
c
ia
s
40-45 10
45-50 15
50-55 18
55-60 22
60-65 35
65-70 42
70-75 32
75-80 18
89-85 10
85-90 6
Total 208
Pesos 
(x1)
Nº alunos 
(f1)
HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
10
15
18
22
35
42
32
18
10
6
0
5
10
15
20
25
30
35
40
45
40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90
simétrico 
40-45 35
45-50 42
50-55 32
55-60 24
60-65 20
65-70 17
70-75 15
75-80 10
89-85 10
85-90 6
Total 208
Pesos 
(x1)
Nº alunos 
(f1)
HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
Assimétrico à esquerda
0
5
10
15
20
25
30
35
40
45
40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90
assimétrico 
40-45 5
45-50 8
50-55 12
55-60 15
60-65 17
65-70 21
70-75 24
75-80 29
89-85 42
85-90 35
Total 173
Pesos 
(x1)
Nº alunos 
(f1)
HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
Assimétrico à direita
0
5
10
15
20
25
30
35
40
45
40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90
assimétrico 
 
 
 
 
 
Medidas de Ordenamento ou Posição 
Medidas de Tendência Central 
• Valores Centrais ou Médias de uma Amostra – Valores 
que indicam posição de centralidade, ou o ponto central da 
distribuição. 
 
• Média Aritmética Simples – Quociente da soma dos valores 
observados, pelo número total de valores. 
 
 
n
X
X


Medida de Tendência Central 
Levantamento 
do peso 
dos alunos 
da classe 
Observações Evento Observações Frequência 
48 1 
55 2 48 2 
51 3 51 3 
58 4 55 5 
55 5 58 4 
48 6 60 1 
51 7 
55 8 Média 54,4 
58 9 
51 10 
55 11 
58 12 
60 13 
55 14 
58 15 
Medidas de Tendência Central 
• Média Aritmética Ponderada - Quando há valores que 
se repetem mais que outros. 
 
• 
 
 
• Ex: = 48.2 + 51.3 + 55.5 + 58.4 + 60.1 = 54,4 
 15 
• Utilização: média de cálculo mais fácil. Valor médio 
significativo por incluir todos os valores observados. Usada em 
estatística para o cálculo do desvio padrão. Em probabilidade 
esta média é chamada Esperança Matemática. 
 
n
fX
X
ii

X
Medidas de Tendência Central 
• Mediana – Medida de posição central. A mediana é o valor 
que ocupa a posição central (meio) da distribuição. 
• Série de valores com nº impar de termos 
– Mediana = n + 1 /2 
– Nº de termos 7 
– Md = 7+1 = 8 / 2 = 4 (mediana é o 4º termo) 
– Ex: 5, 7, 8, 11, 12, 13, 14 (7 termos) → Md = 11 
 
• Série de valores com nº par de termos 
– Mediana = n /2 + 1 e 
– Mediana = n /2 
– Nº de termos 8 
– Md = 8/2 = 4 (mediana entre o 4º e 5 º termo) 
– Md = 8/2+1 = 5 
– Ex: 5, 7, 8, 11, 12; 13, 14, 15; (8 termos) → Md = 11+12 / 2 = 11,5 
 
• Utilização: |A mediana é usada quando a distribuição apresenta resultados 
extremos muito discrepantes. A mediana não sofre a influência de valores 
extremos 
 
Medidas de Tendência Central 
• Moda – Valor dominante de uma distribuição. Aquele que 
numa série de valores se apresenta com a maior freqüência. 
Um conjunto de valores pode apresentar mais de uma moda: 
plurimodal. 
 
 Ex: 48, 49, 50, 50 50, 55, 58, 59, 60 → M = 50 
 
 Ex: 4, 5, 6, 4, 5, 7, 4, 8, 5, 10 → M = 4 e 5 (plurimodal) 
 
 
 
 
 
 
Medidas de Dispersão 
 
Mediadas de Variabilidade 
• Índices que indicam o grau de concentração ou dispersão de 
uma distribuição em torno da média. 
• Principais índices de variabilidade: 
 
– Amplitude total 
– Desvio médio 
– Variância 
– Desvio padrão 
• Amplitude Total (Intervalo Total) - É a diferença entre o 
maior e o menor valor de uma série. 
• Ex: 48, 48 49,49,49,55,55,55,55,55,58,58,58,58,59,60 
• → A = 60 - 48 = 12 
Medidas de Variabilidade 
 
• Desvio Médio – Média aritmética dos afastamentos (ou 
desvios), tomados em valor absoluto, entre cada valor e a 
média aritmética. 
 
• DM = Σ │di . fi │ sendo di = │xi - α │ 
 Σ fi sendo α = média aritmética 
 
Ex: dm = (48 – 54,4).2 + (51-54,4).3 + (55-54,4).5 + (58-54,4).4 + (60-54,4).1 
 15 
 
 dm = 12,8 + 10,2 + 3,0 + 14,4 + 5,6 
 15 
 
 dm = 3,07 
 
Utilização: Indica o quanto, em média, os valores se afastam do ponto central (média) 
 numa distribuição do tipo Curva de Gaus 
 
Medidas de Variabilidade 
• Variância – Considerando-se uma amostra de dados, cada 
dado isolado pode ter um desvio (dispersão) em relação à 
média da amostra. Essa dispersão é a diferença entre o valor 
individual e a média da amostra de dados. Para se avaliar o 
grau de dispersão de toda a amostra de dados utiliza-se a 
variância que é a somatória dos desvios elevada ao quadrado 
dividida pelo tamanho da amostra. 
 
• 
 
 
• Exemplo: 
 
n
fXX
S
ii .
2
2  
46,13
87,201
15
36,3184,5180,168,3492,81
2
2




S
S
Medidas de Variabilidade 
• Desvio padrão – afastamento quadrático médio ou 
afastamento padrão. É a raiz quadrada da variância. 
 
• Desvio padrão dos dados: 
• 
 
 
• Exemplo: 
 
• Utilização: é a estatística mais usada com medida de variabilidade, 
principalmente quando a distribuição for normal 
2SS 
67,346,13 S
O histograma de Densidades
3 0 4 0 5 0 6 0 7 0 8 0 9 0 1 0 0
0 .0 0
0 .0 1
0 .0 2
0 .0 3
0 .0 4
P e s o
D
e
n
s
id
a
d
e
Peso, em kg, de 1000 pessoas adultas selecionadas ao acaso em uma população
30 40 50 60 70 80 90 100
0.000
0.015
0.030
P eso
D
e
n
si
d
a
d
e
 
Distribuição dos valores da variável aleatória X. 
Distribuição de probabilidades de X 
X: peso, em kg, de uma pessoa adulta escolhida ao acaso da população. 
A curva contínua da figura denomina-se Curva Normal 
Curva de Gauss 
Distribuição Normal 
• 
 
 
Curva de Gauss 
Distribuição Normal 
-1s → 1s 
68, 27 % dos casos estão incluídos entre M–1s e M+1s 
-2s → 2s 
95,45 % dos casos estão incluídos entre M–2s e M+2s 
-3s → 3s 
99,73 % dos casos estão incluídos entre M–3s e M+3s 
 
Curva de Gauss 
Distribuição Normal 
n
X
X

  
n
fXX
S
ii .2  
2SS 
67,346,13 S
̂
̂
%21,94
708
6672 R

Continue navegando