Buscar

Est_Apl_Psico_2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 68 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 68 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 68 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL 
FACULDADE DE MATEMÁTICA 
DEPARTAMENTO DE ESTATÍSTICA 
 
ESTATÍSTICA APLICADA À PSICOLOGIA 
 
Prof. Hélio Radke Bittencourt 
 
1. CONCEITOS BÁSICOS DE ESTATÍSTICA 
1.1 Conjuntos de dados. População e Amostra 02 
1.2 Tipos de variáveis 02 
1.3 Escalas de mensuração 03 
1.4 Estatística descritiva e inferencial 04 
 
2. ESTATÍSTICA DESCRITIVA 
2.1 Tabelas de freqüência simples e cruzadas 05 
2.2 Análise gráfica 08 
2.3 Medidas de Tendência Central 14 
2.4 Separatrizes 17 
2.5 Medidas de Variabilidade 18 
 
3. PROBABILIDADE 
3.1 Principais conceitos 23 
3.2 Variáveis aleatórias discretas 28 
3.3 Variáveis aleatórias contínuas 29 
 
4. AMOSTRAGEM 
4.1 Conceitos básicos 34 
4.2 Técnicas de amostragem probabilísticas 34 
4.3 Técnicas de amostragem não-probabilística 37 
 
5. DISTRIBUIÇOES AMOSTRAIS E ESTIMAÇÃO 
5.1 Parâmetros e Estimadores 38 
5.2 Distribuição amostral da média 38 
5.3 Estimação por ponto e por intervalo de confiança 40 
 
6. TESTES DE HIPÓTESES 
6.1 Teste t de S udent para uma média t
t
t
45 
6.2 Testes t de S udent - duas amostras independentes 48 
6.3 Testes t de S udent - duas amostras pareadas 50 
6.4 Teste Qui-quadrado 52 
 
7. CORRELAÇÃO E REGRESSÃO 
7.1 Coeficiente de correlação de Pearson 54 
7.2 Regressão Linear Simples 56 
 
LISTA DE EXERCÍCIOS 58 
 
TABELAS 66 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 2
Cap. 1. CONCEITOS BÁSICOS DE ESTATÍSTICA 
 
 
1.1 Conjunto de dados. População e amostra 
 
A Estatística pode ser definida como o conjunto de ferramentas para coleta, 
organização, análise e interpretação de dados experimentais. O objeto de estudo em 
Estatística é um conjunto de dados que pode constituir uma população ou uma 
amostra. 
 
População é um conjunto finito ou infinito de elementos. 
 
Amostra é um subconjunto da população. Geralmente buscamos amostras 
representativas. Uma amostra representativa é aquela que mantém as 
características da população. 
 
 
1.2 Tipos de Variáveis 
 
Em estatística não trabalhamos diretamente com os elementos que formam o conjunto 
de dados, mas sim com suas características. Variáveis são características dos 
elementos que formam o conjunto de dados. 
 
As variáveis podem ser classificadas em qualitativas ou quantitativas: as variáveis 
qualitativas expressam uma classificação em categorias e, por isso, também são 
chamadas de categóricas. As variáveis quantitativas expressam quantidades numéricas 
e se dividem em discretas e contínuas. As variáveis discretas assumem apenas 
determinados valores num dado conjunto enumerável, enquanto as variáveis contínuas 
podem assumir, ao menos teoricamente, qualquer valor num dado intervalo numérico. 
 
Exemplo – Listar variáveis qualitativas e quantitativas para um aluno da sala 
 
 
 
 
 
 
 
 
 
 
 
Na prática todas as variáveis são discretas, devido à limitação dos instrumentos de 
mensuração. 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 3
1.3 Escalas de Mensuração 
 
As variáveis ainda podem ser classificadas de acordo com o nível ou escala de 
mensuração: Nominal, Ordinal ou Intervalar/Razão. 
 
O nível nominal de mensuração é caracterizado por números que apenas 
diferenciam ou rotulam as categorias. 
 
Exemplos: 
 
 
 
O nível ordinal de mensuração envolve números que, além de diferenciar, 
hierarquizam as categorias. Também são chamadas de escalas Likert em homenagem 
ao americano Rensis Likert que publicou o artigo "A Technique For The Measurement of 
Attitudes" em 1932, onde sugeriu escalas de 5 pontos com uma categoria neutra ao 
centro. 
 
Exemplos: 
 
 
 
O nível intervalar ou de razão apresenta números que expressam diretamente uma 
quantidade seguindo uma métrica. Podemos tranqüilamente realizar operações 
matemáticas com variáveis deste tipo. 
 
Exemplos: 
 
 
 
Figura – Resumo dos tipos de variáveis e escalas de mensuração 
 
 - Nominais
 Qualitativas 
 - Ordinais 
 
Variáveis 
 - Discretas a 
 Quantitativas 
 - Contínuasa 
a Todas var. quantitativas apresentam nível de mensuração intervalar ou de razão 
 
 
 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 4
 
1.4 Estatística Descritiva e Inferencial 
 
A estatística é um conjunto de ferramentas utilizadas para a coleta, tabulação, análise e 
interpretação de um conjunto de dados experimentais. A Estatística pode ser dividida 
em duas grandes áreas: Descritiva e Inferencial. 
 
A estatística descritiva é aquela que costumamos encontrar com maior freqüência 
em jornais, revistas, relatórios, etc. Essa parte da estatística utiliza números para 
descrever fatos. Seu foco é a representação gráfica e o resumo e organização de um 
conjunto de dados, com a finalidade de simplificar informações. Nessa categoria se 
enquadram as médias salariais, taxas de inflação, índice de desemprego, etc. 
 
A estatística inferencial consiste na obtenção de resultados que possam ser 
projetados para toda população a partir de uma amostra da mesma. Ela fundamenta-se 
na teoria da amostragem e no cálculo de Probabilidades. Essa é a área mais importante 
da Estatística. 
 
 
Figura - Esquema geral de um curso de Estatística 
 
 
 Descritiva 
 
Estatística 
 
 
 
 Inferencial 
 
 
 
 Probabilidade Amostragem 
 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 5
Cap. 2 ESTATÍSTICA DESCRITIVA 
 
 
2.1 Tabelas de freqüência simples e cruzadas 
 
Vamos introduzir o tema de tabelas de freqüência simples construindo tabelas para o 
banco de dados construído a partir de informações da turma 
 
Exemplo 1 – Gênero 
 Semestre 
 Número de irmãos 
 Altura (cm) 
 
 
Criar uma tabela de freqüências para cada uma das variáveis. Estes exemplos serão 
construídos com dados coletados na sala de aula. 
 
Tabelas de freqüência são encontradas em jornais informativos (Zero Hora, Correio do 
Povo, etc.), relatórios técnicos, monografias, dissertações, teses e revistas científicas. 
As tabelas de freqüência simples apresentam de forma concisa o número de 
ocorrências (absoluta e relativa) dos valores de uma variável. 
 
Uma tabela de freqüência genérica tem a seguinte configuração: 
 
 
Tabela 1 – Tabela de freqüências genérica 
i xi fi fri Fi Fri 
1 x1 f1 fr1 F1 Fr1
2 x2 f2 fr2 F2 Fr2
M M M M M M 
k xk fk frk Fk 100,0% 
 Σ n 100,0% - - 
 
 
A notação utilizada é a seguinte: 
 
X é uma variável qualquer 
x é um particular valor da variável X 
i é um índice útil para enunciar as expressões matemáticas 
k é o número de linhas da tabela 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 6
Os componentes da tabela de freqüências são: 
 
Freqüência absoluta (fi): número de ocorrências do valor xi. 
 
Freqüência relativa (fri): percentual de ocorrências do valor xi
 
Freqüência absoluta acumulada (Fi): número de ocorrências até o valor xi. 
 
Freqüência relativa acumulada (Fri): percentual de ocorrências até o valor xi
 
 
 
 
 
 
 
 
As Tabelas cruzadas apresentam a distribuição de freqüências de duas variáveis 
simultaneamente. As tabelas cruzadas são abundantes em jornais e revistas 
especializadas. 
 
Exemplo 2 – Gênero X Sintomas de ansiedade 
 
Preencher a tabela abaixo e calcular os percentuais em relação aos totais das linhas. 
 
 
Tabela 2 – Distribuição da turma por grupo sangüíneo e fator Rh. 
 Sintomas de ansiedade 
Gênero Sim Não Totais 
Masculino 
 
 
Feminino 
 
 
Totais 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 7
Exemplo 2b – Grupo sangüíneo X Fator Rh 
 
Preenchea tabela abaixo com os dados da turma. Calcular o percentual em relação ao 
TOTAL. 
 
Fator Rh
Grupo 
Rh+ Rh- Totais 
A 
B 
AB 
O 
Totais 
 
 
 
CURIOSIDADE: Distribuição populacional por tipo sangüíneo e Fator Rh 
 
Fator Rh
Grupo 
Rh+ Rh- Totais 
A 35,7% 6,3% 42% 
B 7,7% 1,3% 9% 
AB 2,5% 0,5% 3% 
O 39,1% 6,9% 46% 
Totais 85% 15% 100% 
Fonte: Livro Fisiologia do Sangue, Vol I, Pág 145 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 8
2.2 Análise Gráfica 
 
 
O tipo de gráfico adequado para cada variável depende do tipo de variável. Segue uma 
relação de exemplos de variáveis e tipos de gráficos adequados. 
 
 
 
Variável Qualitativa Nominal (com poucas categorias) 
 
 
GRÁFICO DE SETORES (Pizza ou Torta) 
 
Figura – Distribuição da população por grupo sangüíneo 
A
42,0%
B
9,0%
AB
3,0%
O
46,0%
 
 
Base: População em geral 
Fonte: Livro Fisiologia do Sangue, Vol I, Pág 145 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 9
Variável Qualitativa Nominal (com muitas categorias): 
 
 
 
GRÁFICO DE BARRAS (em ordem decrescente) 
 
 
Figura – Principais causas de morte - EUA 
5,7%
1,9%
2,4%
2,8%
3,3%
8,5%
9,4%
28,3%
37,7%
0% 20% 40% 60% 80% 100%
Outras
Drogas
Acidente de carro
Doenças venéreas
Armas de fogo
Doenças infecciosas
Ãlcool
Obesidade
Cigarro
 
Base: ??? 
Fonte: Fonte: Livro Fisiologia do Sangue, Vol I, Pág 145 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 10
 
Variável Qualitativa Ordinal 
Atenção: Este é o tipo de variáveis mais importante na Psicologia 
 
 
GRÁFICO DE BARRAS (respeitando a ordem das categorias) 
 
Figura – Auto classificação da qualidade de vida (Questão 1 do WHOQOL) 
0,0
5,0
15,0
10,0
40,0
30,0
0 20 40 60 80 100
Muito Ruim
Ruim
Nem Ruim, Nem
Boa
Boa
Muito Boa
Percentual (%)
 
Base: ??? indivíduos 
Fonte: Dados fictícios. 
 
 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 11
Variável Quantitativa Discreta 
 
 
GRÁFICO DE COLUNAS 
 
Figura – Número de pessoas por domicílio 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
0%
10%
20%
30%
40%
50%
1 2 3 4 5 6 7 8 9 10 ou
+Número de pessoas por domicílio
Pe
rc
en
tu
al
 (%
)
Base: ??? domicílios 
Fonte: Dados fictícios 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 12
Variável Quantitativa Contínua 
 
HISTOGRAMA 
 
Figura – Distribuição de uma turma por altura 
 
Altura (cm)
200,0190,0180,0170,0160,0150,0
Fr
eq
üê
nc
ia
10
8
6
4
2
0
 
 
Base: 20 observações 
Fonte: Alunos de uma turma de Estatística I. Gráfico construído no software SPSS. 
 
 
Figura – Distribuição da população gaúcha por faixa etária 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Fonte: IBGE, PNAD 2004 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 13
Séries Temporais 
 
GRÁFICO DE LINHAS 
 
 
Figura - Evolução das matrículas na Educação Superior no RS - 1988 a 2003 
Fonte: MEC/INEP (extraído do Atlas Sócio Econômico do RS 
 
 
 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 14
2.3 Medidas de Tendência Central 
 
São valores que trazem informação sobre a região em torno da qual os dados estão 
posicionados. As medidas de tendência central mais utilizadas são: Média, Mediana e 
Moda. 
 
 
2.3.1 – Média Aritmética (µ , X ) 
 
A média aritmética é definida como a soma de todas observações da variável X, 
dividida pelo número de elementos do conjunto de dados. Freqüentemente a média 
aritmética é o valor que melhor representa um conjunto de dados. 
 
Quando os dados não estão organizados na forma de uma tabela de freqüências e, 
portanto, estão na forma isolada, as expressões genéricas para encontrar a média 
são: 
 
 População Amostra 
 
N
x
N
i
i∑
== 1µ 
n
x
X
n
i
i∑
== 1 
 
 
Quando os dados estão organizados na forma de uma tabela de freqüências deve-se 
ponderar os diferentes valores xi pelas respectivas freqüências fi. Procedendo desta 
forma o cálculo da média aritmética torna-se mais simples e rápido. 
 
 População Amostra 
 
N
fx
k
i
ii∑
=
×
= 1µ 
n
fx
X
k
i
ii∑
=
×
= 1 
 
 
Exemplo 3 – Número de pessoas que mora em nosso domicílio 
 
Construir uma tabela de freqüências e calcular a média aritmética para considerando 
X= número de pessoas que mora no domicílio. 
 
 
 
 
 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 15
2.3.2 – Mediana (Md) 
 
A mediana é o valor que divide o conjunto de dados ordenado em duas partes com 
igual número de observações. Para calcular a mediana iremos utilizar uma nova 
notação. Seja um conjunto de dados ordenado (ordem crescente), 
onde o valor entre colchetes representa a posição no conjunto ordenado. 
][]2[]1[ ,,, nxxx K
 
Deduzindo a posição mediana: 
 
 n ímpar n par 
n Fila Md n Fila Md 
3 
 
 
 4 
5 
 
 
 6 
7 
 
 
 8 
 
 
As expressões genéricas para encontrar a média são: 
 
 
 n ímpar n par 
 
 
 
 
 
 
 
 
Quando os dados estão organizados na forma de uma tabela de freqüências pode-se 
encontrar a posição mediana na coluna acumulada Fi. 
 
 
Exemplo 4 – Número de pessoas que mora em nosso domicílio 
 
Encontrar a Md para o exemplo do número de pessoas que mora no domicílio. 
 
 
 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 16
 
2.3.3 – Moda (Mo) 
 
A moda é definida como o valor mais freqüente de um conjunto de dados. É possível 
que o conjunto seja bimodal (duas modas) ou até mesmo multimodal (três os mais 
modas). 
 
 { } ii fxMo maior com = 
 
 
 
Exemplo 5 – Número de pessoas que mora em nosso domicílio 
 
Encontrar a Mo para o exemplo do número de pessoas que mora no domicílio. 
 
 
 
 
 
Considerações IMPORTANTES sobre as MTC 
 
1. A média é a MTC mais influenciada por valores extremos, entretanto é a medida 
mais “rica”, porque considera todos valores do conjunto de dados. 
 
2. A mediana não é afetada por valores extremos. 
 
3. A moda é a MTC mais “pobre”, porque considera apenas os valores mais freqüentes. 
 
4. Existem outros tipos de média usadas em ocasiões especiais. A média harmônica é 
muito utilizada em concursos públicos e a geométrica pode ser usada em situações de 
alta variabilidade, visto que ela é mais estável. Discutiremos isto em aula. 
 
Média harmônica Média geométrica 
 
∑
=
= n
i i
h
x
nX
1
1
 n nG xxxX ×××= K21 
 
Pode-se estabelecer a seguinte relação entre as médias: 
 
XXX Gh ≤≤ 
 
 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 17
2.4 Separatrizes 
 
São valores que separam o conjunto de dados ordenado em partes com igual número 
de observações. 
 
A Mediana é, portanto, uma separatriz porque divide o conjunto de dados em duas 
partes iguais. 
 
 
Min |------------------------|------------------------| Máx 
 Md 
 
 
Os Quartis (Qi) dividem o conjunto de dados em 4 partes iguais. 
 
Min |------------------------|------------------------| Máx 
 
 
 
Os Percentis (Pi) dividem o conjunto de dados em 4 partes iguais. 
 
Min |------------------------|------------------------| Máx 
 
 
Exemplo 6 – Boletim de Desempenho do Provão do MEC 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Exemplo 7 – Distribuição de Renda no RioGrande do Sul 
 
A régua de percentis a seguir apresenta a distribuição de salários para a população 
urbana em idade economicamente ativa no ano de 1999. 
 
 R$ 238,00 R$ 400,00 R$800,00 R$ 1500,00 
|-------------|-------------|-------------|---------|---| 
 P25 P50 P75 P90 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 18
2.5 Medidas de Variabilidade 
 
São medidas que complementam as MTC trazendo informação sobre a dispersão 
existente no conjunto de dados. Para introduzi-las vamos recorrer a um exemplo onde 
temos três pacientes onde a pressão arterial sistólica foi verificada em seis períodos do 
dia. 
 
Exemplo 8 – Entendendo as Medidas de Variabilidade 
 
Tabela – Medições de pressão arterial sistólica (mmHg) em três pacientes 
 Paciente A Paciente B Paciente C
 120 118 120 
 120 121 100 
 120 124 135 
 120 117 155 
 120 120 120 
 120 120 90 
Média ( X ) 
Moda (Mo) 
Mediana (Md) 
 
 
 
 
 
 
Questões 
 
1 – O que aconteceu com as MTC na tabela acima? 
 
 
2 – Os três pacientes são iguais em relação a distribuição das PA Sistólica? 
 
 
3 – O que diferencia um paciente do outro? 
 
 
A partir de agora aprenderemos a calcular medidas capazes de quantificar a 
variabilidade existente num conjunto de dados 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 19
 
2.5.1 – Amplitude (R, do termo Range) 
 
É a diferença entre o maior e o menor valor de um conjunto de dados. 
 { } { }ii xmínxmáxR −= 
 
Calcular R nos três pacientes do Exemplo 8. 
 
 
 
2.5.2 – Variância (σ2 , s 2) 
 
A variância é uma medida da variação em torno da média. Por definição, 
variância é a média dos quadrados dos desvios em torno da média. 
 
População Amostra 
( )
N
x
N
i
i∑
=
−
= 1
2
2
µ
σ 
( )
1
1
2
2
−
−
=
∑
=
n
Xx
s
n
i
i
 
 
A variância, ao contrário da Amplitude, considera todos elementos do conjunto de 
dados no seu cálculo. Quanto maior for a variação dos valores do conjunto de dados, 
maior será a variância. 
 
Quando os dados estão organizados na forma de uma tabela de freqüências, deve-
se ponderar os quadrados dos desvios pela freqüência. Esse procedimento facilita o 
cálculo. 
 
População Amostra 
( )
N
fx i
k
i
i ×−
=
∑
=1
2
2
µ
σ 
( )
1
1
2
2
−
×−
=
∑
=
n
fXx
s
k
i
ii
 
 
 
Calcular s2 nos três pacientes do Exemplo 8. 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 20
 
2.5.3 – Desvio-padrão (σ, s) 
 
O desvio-padrão é a raiz quadrada positiva da variância. Essa medida corrige o 
problema de unidade que surge na variância. O desvio-padrão também é uma 
medida da variação em torno da média. 
 
 
População Amostra 
2σσ = 2ss = 
 
 
 
O desvio-padrão expressa a variação média do conjunto de dados em torno da média, 
para mais ou para menos. 
 
 
 
Calcular s nos três pacientes do Exemplo 8. 
 
 
2.5.4 – Coeficiente de Variação (CV) 
 
O CV é a razão entre o desvio-padrão e a média de um conjunto de dados. Ele expressa 
a variação relativa (%) presente no conjunto de dados em relação à média. 
 
 
 População Amostra 
%100×= µ
σCV %100×=
X
sCV 
 
 
Quanto maior o CV, mais heterogêneos serão os dados. 
 
 
Calcular o CV nos três pacientes do Exemplo 8. 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 21
 
Considerações sobre as Medidas de Variabilidade (MV) 
 
1. A Amplitude á a MV mais “pobre”, porque considera apenas os dois valores 
extremos do conjunto de dados. 
 
2. A Variância não é interpretada na prática devido ao problema da unidade, que está 
ao quadrado. 
 
3. O Desvio-padrão é a MV mais conhecida, sendo amplamente utilizada. 
 
4. Dentre as MV estudadas, sugere-se que o CV seja utilizado para comparação da 
variabilidade entre diferentes conjuntos de dados. Por não ter unidade, o CV pode ser 
utilizado até mesmo para comparar a variabilidade entre variáveis expressas em 
diferentes unidades. 
 
 
CURIOSIDADE – Consenso Brasileiro de Pressão Arterial – Adultos 
 
A pressão arterial para adultos pode ser categorizada de acordo com a seguinte tabela. 
Portanto, a medida quantitativa contínua pode ser transformada em qualitativa ordinal. 
 
ADULTOS (MAIORES DE 18 ANOS) 
Pressão Arterial (mmHg) 
Sistólica Diastólica Categoria 
 
< 130 
130-139 
140-159 
160-179 
> 180 
> ou= 210 
> 140 
 
< 85 
85-89 
90-99 
100-109 
> 110 
> ou=120 
< 90 
 
Normal 
Normal Limítrofe 
Hipertensão Leve (estágio 1) 
Hipertensão Moderada (estágio 2) 
Hipertensão Severa (estágio 3) 
Hipertensão Muito Severa (4) 
Hipertensão Sistólica Isolada 
 Fonte: http://www.cdof.com.br/avalia4.htm 
 
 
Exemplo 9a – Atendimentos diários no Serviço de Atendimento Psicológico 
de uma escola particular 
 
X = número de alunos atendidos por dia 
n = 20 dias 
 
2 3 4 2 3 2 1 0 2 2
2 2 3 1 1 1 0 2 3 4
 
 
a) Encontrar e interpretar as Medidas de Tendência Central 
b) Encontrar as medidas de variabilidade. Interpretar todas medidas exceto a 
Variância. 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 22
Exemplo 9b – QI de adolescentes 
 
O coeficiente de inteligência, popularmente conhecido como QI, varia normalmente 
entre 80 e 160 pontos. Suponha que, numa amostra de 15 alunos de Engenharia, os 
resultados tenham sido os seguintes: 
 
95 110 110
90 120 115
90 90 110
85 90 90
105 100 100
 
a) Encontrar as medidas de tendência central para o QI. 
b) Encontrar as medidas de variabilidade para o QI. 
 
 
Exemplo 10 – Escore BDI (Beck Depression Inventory) 
 
O escore BDI de Beck procura mensurar o nível de depressão numa escala que varia de 
0 (ausência de depressão) até 63 (depressão máxima). Suponha que estamos 
interessados a comparar o nível de depressão em dois grupos de recém-fomados: um 
formado por egressos do sexo masculino e outro formado por egressos do sexo 
feminino. 
4 
Homens Mulheres 
12 13 
10 14 
8 13 
9 12 
12 8 
15 14 
4 10 
 
a) Compare os dois grupos em relação às medidas de tendência central e de 
variabilidade. 
 
 
TRABALHO 1 (duplas) 
 
Realizar no EXCEL uma análise descritiva completa do banco de dados 
fornecido pelo professor. Construa tabelas de freqüência, gráficos, medidas 
de tendência central e de variabilidade. 
 
 
 
Mais exercícios sobre o Capítulo 2 na LISTA DE EXERCÍCIOS. 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 23
 
Cap. 3 – Probabilidade 
 
 
3.1 Principais conceitos 
 
Probabilidade é o ramo da matemática que trata de fenômenos aleatórios. A 
observação de um fenômeno aleatório por parte do homem é chamada de 
experimento aleatório. 
 
Características de um experimento aleatório: 
 
1ª) Não se conhece um particular valor do experimento antes dele ser executado, 
porém podemos descrever todos os possíveis resultados - as possibilidades; 
 
2ª) Quando o experimento é repetido algumas vezes, os resultados ocorrem de uma 
forma aparentemente acidental. Mas quando o número de repetições aumenta, uma 
regularidade aparecerá. E esta regularidade que torna possível construir um modelo 
matemático útil para análise do experimento. 
 
Exemplos de fenômenos aleatórios: 
 
1) Condições meteorológicas 
2) Produção de arroz anual numa cidade 
3) Resultado de uma cirurgia 
4) Lançamento de uma moeda 
5) Resultados de loterias 
 
Exemplos de experimentosaleatórios: 
 
E1: Jogue um dado e observe o n.º na face de cima. 
E2: Jogue uma moeda 3 vezes e observe o número de caras obtido. 
E3: Jogue uma moeda 3 vezes e observe a seqüência de caras e coroas obtida. 
E4: Uma mulher está grávida de gêmeos. O sexo dos bebês será verificado. 
E5: O número de alunos matriculados na turma de “Est Apl à Psicologia” é verificado 
E6: A temperatura de um paciente é verificada pela enfermeira. 
 
Nos seis exemplos anteriores não somos capazes de precisar o resultado, entretanto 
conseguimos listar os possíveis resultados. 
 
 
Espaço amostral de um experimento aleatório é o conjunto de todos os resultados 
possíveis do experimento. É denotado por S ou Ω. 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 24
Exemplos de espaços amostrais relacionados aos experimentos anteriores. 
 
S1 = 
 
S2 = 
 
S3 = 
 
S4 = 
 
S5 = 
 
S6 = 
 
 
Um evento é um subconjunto de S. Em particular, S e ∅ (conjunto vazio) são eventos; 
S é dito o evento certo e ∅ o evento impossível. 
 
 
Exemplo de eventos no lançamento de um dado 
 
S = {1,2,3,4,5,6} 
 
A: ocorre um n.º par A = {2,4,6} 
B: ocorre a face 6 B = {6} 
C: ocorre um n.º maior que 6 C = ∅ 
D: ocorre nº 6 ou nº par D = {2,4,6} 
E: ocorre nº par ou nº ímpar E = {1,2,3,4,5,6} = S 
 
 
É possível realizar operações com eventos que nada são do que operações com 
conjuntos já estudadas no Ensino Fundamental. 
 
 
Operações com eventos 
 
Sejam A e B dois eventos associados a um espaço amostral S. 
 
1) União: A∪B → A ocorre ou B ocorre ou ambos ocorrem 
 
2) Interseção: A∩B → A ocorre e B ocorre 
 
3) Complementar: Ac ou A → não ocorre A 
 
 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 25
Duas definições importantes: 
 
1) Dois eventos A e B são excludentes ou mutuamente exclusivos se a ocorrência 
de um impedir a ocorrência de outro. Em outras palavras, não podem ocorrer 
simultaneamente. 
 
2) Eventos ou resultados equiprováveis têm a mesma probabilidade de ocorrência. 
 
 
Exemplo – Lançamento de um dado e uma moeda, ambos honestos 
 
Escreva o espaço amostral. Os resultados são todos equiprováveis? Qual a 
probabilidade de um particular par (x,y) ser selecionado. Assinale os seguintes eventos: 
 
 
 
 
3.1.1 Conceitos de probabilidade 
 
⇒ Conceito Axiomático 
 
Seja A um evento de S. A probabilidade de ocorrência de A, denotada por P(A), deverá 
satisfazer os seguintes axiomas (propriedades fundamentais): 
 
Axioma 1: 0 ≤ P(A) ≤ 1 
Axioma 2: P(S) = 1 
 
⇒ Conceito clássico 
 
Esse conceito só é válido se todos resultados de S forem equiprováveis. Para casos 
assim a probabilidade de ocorrência do evento A é obtida por: 
 
 
)(
)()(
STotal
AnAP = n(A) é o número de resultados favoráveis ao evento A 
Total (s) é o número total de resultados em S 
 
Exemplos – Conceito clássico 
 
1) Mega-sena, Lançamento de moedas e dados honestos. 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 26
 
⇒ Conceito freqüentista 
 
Esse conceito só é válido se todos resultados de S forem equiprováveis. Para casos 
assim a probabilidade de ocorrência do evento A é obtida por: 
 
1º) O experimento é repetido n vezes. 
 
2º) Observa-se a freqüência relativa de ocorrência de um certo resultado A: 
 
fr(A) = ,
)(
n
An onde n(A) é o nº de vezes em que ocorre o resultado A em n realizações 
do experimento. 
 
3º) Probabilidade como limite. A medida que n aumenta, a fr(A) converge para a real 
probabilidade P(A). 
 
 
Exemplos – Conceito freqüentista 
 
1) Verificando se um dado é honesto. 
 
2) Encontrando a probabilidade de ocorrência de um acidente aéreo. 
 
3) Qual a probabilidade de uma criança nascer com Síndrome de Down? 
 
 
3.1.2 Probabilidade Condicional 
 
A probabilidade de ocorrência de um evento pode ser influenciada pela ocorrência de 
um evento paralelo. Considere que A e B são eventos de um mesmo espaço amostral S. 
Chamaremos de P(A|B) a probabilidade de ocorrência do evento A dado que o evento 
B já ocorreu. 
 
Graficamente: 
 
 
 
 
 
 
 
 
Olhando para o desenho podemos estabelecer as seguintes relações: 
 
 
P(A|B) = P(B|A) = 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 27
 
Exemplo – Escolhendo alguém na sala de aula 
 
Suponha que um aluno da turma será sorteado. Após saber o resultado o professor faz 
algumas perguntas utilizando probabilidade condicional. 
 
 
Exemplo – Terapia familiar X Resultado 
 
 Resultado 
Terapia 
familiar 
Sucesso Fracasso Total 
Sim 60 25 85 
Não 40 65 105 
Total 100 90 190 
 
 
Resolver as seguintes probabilidades: 
 
 
 
 
 
 
3.1.3 Independência 
 
Dois eventos A e B são considerados independentes se a ocorrência de um não 
interfere na probabilidade de ocorrência do outro: 
 
P(A|B) = P(A) e P(B|A) = P(B) 
 
Isolando a intersecção na expressão de probabilidade condicional obtemos: 
 
P(A∩B) = P(A) x P(B) 
 
Esse conceito é fundamental para aplicações em Estatística. 
 
 
Exemplo - Uma mulher decide ter dois filhos numa localidade onde a probabilidade de 
ser menino é estimada em 51%. Escreva o espaço amostral e calcule as probabilidades 
para todos possíveis resultados. 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 28
Exemplo – Tendo “certeza” de uma gravidez 
 
Uma jovem suspeita que está grávida e decide comprar três diferentes testes de 
gravidez em farmácias. As marcas escolhidas foram A, B e C. As probabilidades dos 
exames indicarem “falso-positivo” são de 3%, 5% e 6%, respectivamente, enquanto as 
probabilidades de “falso-negativo” são de 1%, 2% e 4%, respectivamente. 
 
a) Se a jovem realmente está grávida, qual a probabilidade dos três exames 
confirmarem a gravidez? 
b) Se a jovem não estiver grávida, qual a probabilidade dela levar um susto com 
pelo menos um dos exame resultando positivo. 
 
 
 
Exemplo – Prole de SEIS filhos 
 
É fácil construir o espaço amostral e calcular as probabilidades de se ter ZERO, UM, 
DOIS, TRÊS, QUATRO, CINCO ou SEIS filhas meninas numa prole de seis filhos? 
Assume que a probabilidade de ser menino seja de 51%. 
 
 
 
 
 
 
 
 
 
 
3.2 – Variáveis aleatórias discretas – Distribuição Binomial 
 
O exercício acima pode ser resolvido pela Distribuição Binomial. Sempre que um 
experimento que assume apenas dois possíveis resultados em cada repetição for 
repetido n vezes e que a probabilidade de sucesso é constante em cada repetição 
podemos modelar o número de sucessos pela distribuição Binomial. 
 
X = número de sucessos, variando de 1 até n 
p = probabilidade de sucesso em cada repetição 
1-p = probabilidade de fracasso em cada repetição 
n = número de repetições 
 
Expressão genérica da Binomial 
 
( ) xnx ppxnx
nxXP −−××−== )1(!!
!)(
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 29
O número esperado ou esperança de sucessos na distribuição Binomial é facilmente 
encontrado. Intuitivamente, responda as perguntas a seguir: 
 
1) Se lançarmos uma moeda honesta 100 vezes, qual o número esperado de caras? 
 
2) Se lançarmos um dado 600 vezes, qual o número esperado de faces “5”. 
 
3) No exemplo da prole de 6 filhos, qual o número esperado de meninos? 
 
 
pnXE ×=)( 
 
 
 
 
 
 
3.3 Variáveis aleatórias contínuas 
 
3.3.1 Conceitos 
 
As variáveis contínuas podem, ao menos teoricamente, assumir qualquer valor num 
intervalo numérico. Sendo assim fica impossível representarmos variáveis contínuas da 
mesma forma que as variáveis discretas. 
 
Importante 
 
As variáveis contínuas são representadas por curvas, chamadas de função 
densidade de probabilidade, e a área sob essa função representa a probabilidade de 
ocorrência. Nas variáveis contínuas nãoexiste a probabilidade de ocorrência de um 
valor exato, mas sim de intervalos. 
 
 
A função densidade de probabilidade, denotada por fx(x), é a função que indica o 
comportamento probabilístico da variável aleatória contínua X. A função densidade de 
probabilidade deverá satisfazer as seguintes condições: 
 
a) f(x) ≥ 0, para todo x ∈ R. 
 
b) Área total sob a curva deve ser igual a 1. 
 
 
A área sob a curva fx(x) nos informa a probabilidade de ocorrência de valores da 
variável X. 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 30
 
Supondo que o gráfico acima represente a função de probabilidade de uma variável 
aleatória X. Como sabermos a probabilidade de ocorrência de valores entre a e b ? 
 
 
Exemplo – IMC (Distribuição Uniforme) 
 
Suponha que o IMC (kg/m2) em crianças seja igualmente provável de ocorrer entre 15 
e 20. 
 
a) Esboce graficamente a função densidade de probabilidade para X = IMC (kg/m2) 
 
 
 
 
 
 
 
b) Calcular a probabilidade de uma criança ter mais de 18kg/m2. 
 
 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 31
 
3.3.2 A Distribuição Normal ou Curva de Gauss 
 
A distribuição Normal ou Gaussiana é, sem dúvida, o modelo probabilístico mais 
conhecido. Várias técnicas estatísticas necessitam da suposição de que os dados se 
distribuam normalmente para serem utilizadas. Na natureza uma grande quantidade de 
variáveis apresentam tal distribuição. 
 
Uma v.a.c. X tem distribuição normal com parâmetros µ e σ se sua função densidade 
de probabilidade é dada por: 
 
 
( )
0 ; +<<-
 ,parâmetros são onde
 , , 
2
1 2
2
2
)(
 
>∞∞
ℜ∈=
−−
σµ
σµ
πσ
σ
µ
e
xexf
x
 
 
 
 
Notação 
 
X ∼ N(µ,σ) 
 
X tem distribuição Normal com média µ e desvio-padrão σ. 
 
 
Os parâmetros da Normal são a média e o desvio-padrão, que permitem infinitas curvas 
normais com diferentes formatos (mas sempre simétricas). O gráfico da fX é 
apresentado a seguir: 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 32
A distribuição Normal, independentemente dos valores dos parâmetros, apresenta 
sempre a seguinte relação: 
 
 
 
 
Entendendo os parâmetros da Normal: 
 
A média µ informa o centro da distribuição. É um parâmetro de locação. 
 
O desvio-padrão σ informa o formato da curva. 
-10 -5 0 5 10
Valores de X
f(x
)
-10 0 10
Valores de X
f(x
)
-10 -5 0 5 10
Valores de X
f(x
)
 
 
Os cálculos integrais envolvendo a distribuição Normal são bastante complicados. 
Felizmente, veremos a seguir uma relação que facilita muito nossa vida. 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 33
 
Exemplo – Aplicação prática 
 
A altura de mulheres adultas no RS segue uma distribuição Normal com média de 
165cm e desvio-padrão de 6cm. 
 
a) Qual a probabilidade de uma mulher ter entre 159 e 171cm? 
 
 
b) Qual a probabilidade de uma mulher ter entre 153 e 177cm? 
 
 
c) Qual a probabilidade de uma mulher ter mais de 177cm? 
 
 
d) Qual a probabilidade de uma mulher ter menos de 180cm? 
 
 
 
Distribuição Normal-padrão ou Normal reduzida 
 
Seja X uma variável aleatória normalmente distribuída com quaisquer parâmetros média 
µ e desvio-padrão σ. Se realizarmos a seguinte transformação obteremos uma nova 
variável Z com média 0 e desvio-padrão 1: 
 
X ∼ N(µ,σ) → σ
µ−= XZ → Z (0,1) 
 
Qualquer variável com distribuição Normal pode ser padronizada para a 
Normal. A distribuição Normal padronizada (Z) é tabelada. 
 
 
O valor de Z indica quantos desvios acima ou abaixo nós estamos em relação à média. 
 
 
 
Exemplo – Aprendendo a usar a tabela 
 
1) Calcule: 
 
a) P(Z < 1,24) = 
b) P(Z < 1,67) = 
c) P (Z > 2,12) = 
d) P( -1,96 < Z < 1,96) = 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 34
 
Cap. 4. - Amostragem 
 
4.1 Conceitos Básicos 
 
Amostragem é o nome dado ao conjunto de procedimentos e técnicas para extração 
de elementos da população para compor a amostra. O objetivo da amostragem é obter 
amostras representativas das populações em estudo. Um Censo seria a investigação da 
população completa. 
 
Por que trabalhar por amostragem? 
 
________________________________________ 
 
________________________________________ 
 
________________________________________ 
 
________________________________________ 
 
A fração de amostragem é a razão entre o tamanho amostral e o tamanho 
populacional. Não existem regras fixas para tamanho de amostra, ou seja cada caso 
merece um cuidado especial. Frases como “20% da população é ideal”, quase sempre 
não são verdadeiras. 
 
As técnicas de amostragem se dividem em: probabilísticas e não-probabilísticas. 
As técnicas probabilísticas são aquelas onde todos elementos da população têm uma 
probabilidade não nula de seleção. Nas técnicas não-probabilísticas não podemos 
garantir que todos elementos têm probabilidade de serem selecionados para a amostra. 
 
 
4.2 Principais técnicas de amostragem probabilística 
 
Geralmente as técnicas probabilísticas produzem melhores resultados do que as não 
probabilísticas. A seleção dos elementos envolve obrigatoriamente a utilização de algum 
dispositivo aleatório para seleção das unidades amostrais. 
 
Exemplo de dispositivos aleatórios: 
 
 
 
 
 
 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 35
4.2.1 Amostragem Aleatória Simples (AAS) 
 
Apesar de ser uma forma extremamente simples de seleção de elementos da 
população, é considerada uma das melhores técnicas de amostragem. 
 
Na AAS cada elemento da população tem igual probabilidade de seleção e o 
pesquisador não introduz nenhum vício no processo. 
 
Etapas: 
 
1) Enumerar a população de 1 até N. 
2) Sortear n números no intervalo de 1 até N. Caso haja números repetidos, sortear 
novamente mais alguns valores. 
 
 
Probabilidade de seleção de um elemento na AAS: 
 
 
 
Número de amostras possíveis SEM reposição: 
 
 
 
 
Número de amostras possíveis COM reposição: 
 
 
 
 
Exemplo 23 – Amostra n=2 da população N=5 
 
Verificar quantas amostras são possíveis COM e SEM reposição da população de 
tamanho 5 verificando também as probabilidades de seleção de cada unidade. 
 
A B C D E 
 
 
 
 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 36
4.2.2 Amostragem Estratificada 
 
Na Amostragem estratificada a população é dividida em subpopulações ou estratos de 
forma que N1 + N2 + ... + NK = N. 
 
Um tamanho amostral n é repartido proporcionalmente entre os estratos, respeitando 
as frações Ni / N. Depois de estabelecidos o valor de ni, procede-se uma seleção 
aleatória dentro de cada estrato. 
 
 
Exemplo 24 – Amostra estratificada na região sul 
 
Dividir proporcionalmente uma amostra de 1300 pessoas em três estratos, 
correspondentes aos três estados da região sul. 
 
i Estado Pop. % Amostra 
1 Rio Grande do Sul 9.637.682 
2 Santa Catarina 4.875.244 
3 Paraná 9.003.804 
 Total 23.516.730 
 
4.2.3 Amostragem Sistemática 
 
A amostragem sistemática inicia com o cálculo do intervalo de amostragem f=N/n. 
Depois, selecionamos um número entre 1 e f e vamos indo sistematicamente de f em f 
elementos, até o final. 
 
A amostragem sistemática é útil quando temos cadastros impressos que estão 
ordenados segundo algum critério que nada tem a ver com os interesses da pesquisa. 
 
 
Exemplo 25 – Seleção de n=5 professores em um cadastro 
 
 
1 – André 11 – Gustavo 21 – Luciano 31 – Paula 
2 – Betina 12 – Hélio 22 – Luciana 32 – Pedro 
3 – Bruna 13 – Heloísa 23 – Marlene 33 – Rafael 
4 – Carlos 14 – Iara 24 – Maurício 34 – Rafaela 
5 – Cleide 15 – Irno 25 – Mônica 35 – Sandro 
6 – Débora16 – Jaqueline 26 – Nair 36 – Simone 
7 – Denise 17 – Juliana 27 – Neide 37 – Suzette 
8 – Douglas 18 – Juliano 28 – Omar 38 – Telmo 
9 – Ernani 19 – Kleber 29 – Osmar 39 – Ubirajara 
10 - Gabriela 20 – Lisiane 30 – Paulo 40 - Zuleica 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 37
4.3 Principais técnicas de amostragem não-probabilística 
 
A falta de cadastros, inacessibilidade à toda população, pressa ou ainda muitos outros 
fatores, levam os pesquisadores a utilizar técnicas não-probabilísticas. Veremos 
rapidamente algumas técnicas encontradas na literatura. 
 
4.3.1 Amostragem por quotas 
 
Um dos procedimentos mais comuns onde o pesquisador estabelece quotas de acordo 
com a distribuição populacional, distribui os pesquisadores de forma geograficamente 
estruturada e cumpre as quotas de forma intencional. 
 
Exemplo 26 – Pesquisa eleitoral 
 
Estabelecer as quotas de amostragem (n=800) a partir da distribuição populacional 
abaixo. 
 
 Sexo 
Classe Social Masculino Feminino Total 
A-B 1.082.538 1.122.223 2.204.761 
C 1.257.140 1.303.227 2.560.367 
D-E 1.152.379 1.194.625 2.347.004 
Total 3.492.057 3.620.075 7.112.132 
Dados estabelecidos a partir dos dados TRE-2000 (No de eleitores) 
Classificação da classe social segundo critérios da ABIPEME-1996 
 
 
4.3.2 Amostragem por correspondência 
 
 
 
 
4.3.3 Amostragem por tráfego 
 
 
 
 
4.3.4 Amostragem intencional 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 38
Cap. 5. - Distribuições Amostrais e Estimação 
 
 
5.1 – Parâmetros e Estimadores 
 
O que é inferência estatística ? 
 
Inferir consiste na retirada de informações para TODA população baseando-se numa 
amostra da mesma. Chamamos de parâmetros as quantidades populacionais e de 
estimadores as funções de dados amostrais que irão gerar as estimativas para os 
parâmetros populacionais. 
 
Tabela - Exemplos de parâmetros e seus respectivos estimadores 
Parâmetros Estimadores 
Média populacional 
µ 
Média amostral 
X 
Desvio-padrão populacional 
σ 
Desvio-padrão amostral 
s 
Proporção populacional 
p 
Proporção amostral 
pˆ 
 
 
Há dois tipos de estimação de parâmetros: a estimação por ponto e por intervalo. 
Também existe uma outra forma de inferência estatística muito utilizada em situações 
práticas: os testes de hipóteses. 
 
 
5.2 Distribuição Amostral das Médias 
 
A base da estatística inferencial é o TEOREMA DO LIMITE CENTRAL. 
 
O teorema diz que se extrairmos TODAS as possíveis amostras de tamanho n de uma 
população de tamanho N a distribuição das médias amostrais X tende a se distribuir 
como uma curva Normal com média igual ao parâmetro µ e desvio-padrão nσ . 
 
Exemplo – População de tamanho N = 5 
 
Considere a seguinte população de cinco elementos e X = Idade (anos) 
 
20 30 40 50 60 70 
A B C D E F 
 
a) Quais são os parâmetros populacionais? 
b) Quantas amostras diferentes de tamanho n=2 podemos extrair da população? 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 39
Exemplo – Selecionando uma amostra na sala de aula 
 
Suponha que seja necessário selecionar uma amostra de n=5 alunos da turma para 
representar a nossa turma numa reunião na reitoria. Qual o número de amostras 
possíveis de serem selecionadas? 
 
 
 
 
 
Exemplo – População com média 0,5 
 
Considere uma população infinitamente grande com média 50,=µ . Vamos avaliar as 
distribuições amostrais da média amostral X com n = 30 e 300. 
 
-
0,5
1,0
1,5
2,0
0 0,2 0,4 0,6 0,8 1
Médias amostrais
 
-
0,5
1,0
1,5
2,0
2,5
3,0
3,5
0 0,2 0,4 0,6 0,8 1
Médias amostrais
 
 n = 30 n = 300 
 
Percebemos claramente que com o aumento do tamanho amostral a distribuição de X 
fica cada vez mais concentrada em torno do parâmetro µ. Isso quer dizer que, quanto 
maior amostra maior a possibilidade de acerto. 
 
 
RESULTADO 
 
X tem distribuição Normal com Média = µ e Desvio-padrão =
n
σ
 
 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 40
 
5.3 – Estimação por ponto e por intervalos de confiança 
 
5.3.1 – Estimação por ponto 
 
Visa estimar o valor do parâmetro através de estimativas pontuais (únicas). A vantagem 
é ser de fácil interpretação e rápida, mas a probabilidade de acerto “na mosca” é 
praticamente nula, pois os estimadores podem ser encarados como variáveis aleatórias 
contínuas. 
 
 
Exemplo – Proporção de pessoas que tem animal doméstico 
 
Numa amostra de 3000 domicílios da Capital gaúcha, 600 tinham pelo menos um 
animal doméstico (cão ou gato). Estime pontualmente a proporção de domicílios que 
tem pelo menos um cão ou gato. 
 
 
 
5.3.2 – ESTIMAÇÃO POR INTERVALO DE CONFIANÇA 
 
Consiste em cercar o valor da estimativa pontual por uma região cuja probabilidade de 
conter o verdadeiro parâmetro seja conhecida. 
 
 
NOTAÇÕES que serão utilizadas a partir de agora 
 
α (alfa) = nível de significância 1 - α = nível de confiança 
 
2
1 α− ;n
t = valor da distribuição t de Student com n-1 graus de liberdade e área 
2
α
 à 
direita. 
 
2
αz = valor da distribuição normal padrão com área 2
α
 à direita. 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 41
1o ) Intervalo de Confiança para µ (teórico) 
 
Conhecendo o teorema do limite central podemos construir intervalos de confiança para 
a média populacional. Para isso basta cercarmos a estimativa pontual X por um 
intervalo cuja probabilidade de conter o parâmetro seja conhecida. 
 
I.C. para µ com 1-α de confiança = ⎥⎦
⎤⎢⎣
⎡ ×±
n
zX σα
2
 
 
 
Na fórmula de IC acima percebemos a presença de um parâmetro (σ). Se estamos 
procurando um intervalo de confiança para µ é porque NÃO conhecemos µ. É 
praticamente impossível conhecermos σ e não conhecermos µ. Por isso esse resultado 
acaba sendo INÚTIL na prática. 
 
 
2o ) Intervalo de Confiança para µ (prático) 
 
Ao substituirmos o parâmetro σ por seu estimador s , a distribuição amostral de X 
deixa de ter uma distribuição Normal e passa a ter uma distribuição t de Student. Desta 
forma os Intervalos de confiança podem ser utilizados em situações práticas. 
 
I.C. para µ com 1-α de confiança = ⎥⎦
⎤⎢⎣
⎡ ×±
− n
stX
n
2
,1
α pop. infinita 
 
 
I.C. para µ com 1-α de confiança = 
⎥⎥⎦
⎤
⎢⎢⎣
⎡
−
−××± α− 121 N
nN
n
stX
n ,
 pop. finita 
 
 
Obs: O fator de correção 
1−
−
N
nN
 é omitido em caso de populações infinitas. O EXCEL 
simplesmente ignora esse fator de correção. 
 
Exemplo: 
 
Numa amostra de 121 paciente hígidos, a taxa média de glicemia foi de 135mg/dl com 
um desvio-padrão de 13,69mg/dl. 
 
Construir um IC 95% para a verdadeira taxa de glicemia desta população. Ignore o 
fator de correção. 
 
I.C. 95% para µ = ⎥⎦
⎤⎢⎣
⎡ ×±
− n
stX
n
2
,1
α 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 42
O EXCEL constrói Intervalos de Confiança sem o fator de correção com o comando 
Estatísticas Descritivas que fica dentro da opção “Análise de Dados” no Menu 
“Ferramentas”. Para incluir essa opção deve-se ir até “Ferramentas” → “Suplementos” e 
assinalar a opção “Ferramentas de Análise”. 
 
ATENÇÃO: é necessário ter o banco de dados digitado em EXCEL para fazer 
isso. 
 
Figura – Tela do Excel: Ferramentas > Análise de dados > Estatística Descritiva 
 
 
Tabela - Saída do EXCEL: 
Glicemia 
Média 135,00
Erro padrão 1,24
Mediana 135,00
Modo 146,00
Desvio padrão 13,69
Variância da amostra 187,32
Intervalo 70,00
Mínimo 110,00
Máximo 180,00
Soma 16335,00
Contagem 121
Nível de confiança(95,0%) 2,46
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 43
3o) Intervalo deConfiança para uma proporção populacional p 
 
A estimativa pontual para uma proporção é dada diretamente pela proporção amostral. 
É muito útil construirmos um intervalo em torno da estimativa pontual que possua uma 
probabilidade conhecida de conter a verdadeira proporção populacional. 
 
 
I.C. para p com 1-α de confiança = 
⎥⎥⎦
⎤
⎢⎢⎣
⎡
−
−×−××± α 1
1
2 N
nN
n
ppzp )
ˆ(ˆ) 
 
onde =1,645 (90%) 050,z
 (95%) 9610250 ,, =z
 (99%) 57620050 ,, =z
 
Obs: O fator de correção 
1−
−
N
nN
 é omitido em caso de populações infinitas. 
 
 
O EXCEL NÃO faz intervalos de confiança para proporções. 
 
 
Exemplo – Ansiedade e Vestibular 
 
O jovem médico Daniel Guzinski Rodrigues realizou um levantamento com 1046 
vestibulandos dos 10 cursos mais procurados, descobrindo que 338 sofrem de um grau 
elevado de ansiedade. 
(Universia Brasil em 22/06/2005: http://www.universia.com.br/html/noticia/noticia_clipping_cdedc.html) 
 
a) Construa um IC 95% para a verdadeira proporção de vestibulandos com grau 
elevado de ansiedade. O vestibular contou com 42mil participantes. 
 
 
Exemplo – Proporção de canhotos da PUCRS 
 
Numa amostra de n=_______ alunos de uma população de N=30.000 de toda PUCRS, 
verificamos que _______ são canhotos. 
 
a) Qual a estimativa pontual de canhotos? 
 
 
 
b) Construa intervalos de confiança 95% e 99% para a proporção de canhotos. Agora 
use o fator de correção. 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 44
Cap. 6 Testes de Hipóteses 
 
Os testes de hipótese constituem outra forma de inferência estatística. Hipóteses são 
afirmações sobre parâmetros populacionais. Agora iremos testar se essas 
hipóteses podem ser consideradas verdadeiras ou não. Os testes de hipótese são 
muito objetivos, pois o resultado final é a ACEITAÇÃO ou REJEIÇÃO da hipótese 
formulada. 
 
Etapas de um teste de hipóteses: 
1.Formular as hipóteses 
2.Definir qual o nível de significância será utilizado (alfa) 
3.Verificar qual o teste adequado e calcular a estatística de teste 
4.Decidir pela aceitação ou rejeição da hipótese de nulidade com base no p-value. 
5.Conclusão experimental 
 
A hipótese nula (Ho) é a hipótese sob a qual a teste é realizado. Essa hipótese será 
ACEITA ou REJEITADA. Se os dados amostrais estiverem de acordo com a hipótese 
nula formulada, a estatística de teste nos levará a uma aceitação. Por outro lado, se os 
dados amostrais não estiverem em sintonia com a hipótese formulada, o teste nos 
levará a uma rejeição da hipótese nula. 
 
A hipótese alternativa (H1 ou Ha) é uma hipótese complementar a Ho. Por isso se 
rejeitamos Ho, conseqüentemente aceitamos H1. 
 
O nível de significância do teste (α) é definido pelo pesquisador. Ele significa a 
probabilidade de cometermos erro tipo I, ou seja, rejeitarmos Ho sendo a mesma 
verdadeira. 
 
A decisão estatística é a REJEIÇÃO ou ACEITAÇÃO de Ho. Essa decisão está sujeita 
aos seguintes erros: 
 
Tabela – Tipos de Erros 
Realidade 
Decisão 
 
Ho Verdadeira 
 
Ho Falsa 
Aceito Ho 
 
OK Erro tipo II 
β 
Rejeito Ho 
 
Erro tipo I 
α 
OK 
 
O erro do tipo I ou nível de significância (α) é controlado pelo pesquisador. O erro do 
tipo II (β) é geralmente esquecido. Por esse motivo vamos sempre preferir uma 
REJEIÇÃO do que uma ACEITAÇÃO. No caso de uma REJEIÇÃO ou tomamos a decisão 
correta ou cometemos o erro com probabilidade α. Os valores de α mais utilizados são 
5%, 1% e eventualmente 10%. 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 45
A conclusão experimental consiste em explicar com palavras simples o resultado de 
um teste de hipóteses. 
 
Os testes que iremos estudar são os mais famosos e encontrados em praticamente 
todos os livros de Estatística. 
 
• Teste t de Student para uma média 
• Teste t de Student para comparação de duas médias (amostras independentes) 
• Teste t de Student para comparação de duas médias (amostras emparelhadas) 
• Teste Qui-Quadrado (para variáveis organizadas na forma de uma tabela cruzada) 
 
 
6.1 - Teste t de Student para uma média 
 
É uma técnica que permite testarmos a hipótese de que a média populacional pode ser 
considerada igual a um valor de referência, digamos µo. 
 
Apresentação das hipóteses: 
⎩⎨
⎧
≠
=
o
o
:Ha
:Ho
µµ
µµ
⎩⎨
⎧
>
=
o
o
:Ha
:Ho
µµ
µµ
⎩⎨
⎧
<
=
o
o
:Ha
:Ho
µµ
µµ
 
 ↑↑ 
Iremos estudar apenas os testes bilaterais, ou seja, onde as hipóteses não são 
direcionadas para um único sentido. As regiões de rejeição ficam nos dois lados da 
curva. 
 
A estatística de teste é dada por: 
ns/
-xt oµ=
 
Apesar de ser um procedimento simples, o EXCEL não realiza esse tipo de teste. Já, o 
programa estatístico SPSS, por exemplo, faz. 
 
As regiões de rejeição e aceitação do teste t são estabelecidas pelos valores de t, 
conforme mostra o desenho a seguir de uma curva t com n-1 graus de liberade. 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 46
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Os valores de t são encontrados na tabela t entregue em sala de aula. Comparando o 
valor da estatística de teste t calculado com os valores de t obtidos na tabela chegamos 
a decisão estatística e podemos enunciar a conclusão experimental. 
 
Apesar do EXCEL não fazer isso podemos Utiliza-lo para calcular a média amostral e o 
desvio-padrão. 
 
 
Exercício: 
 
A dissertação de mestrado da Medicina da Unesp entitulada “Valores de referência de 
cortisol salivar para a avaliação adrenal em crianças menores de três anos, sem 
patologias” de Margarete Silva mostrou que o valor de 160ng/dl pode ser utilizado 
como referência para o cortisol salivar. 
 
Numa amostra de 15 crianças, a média encontrada foi de 170ng/dl com um desvio-
padrão de 10,5ng/dl. 
 
 
Crianças Cortisol (ng/dl) Crianças Cortisol (ng/dl) 
Criança 01 169 Criança 09 165 
Criança 02 165 Criança 10 170 
Criança 03 160 Criança 11 168 
Criança 04 175 Criança 12 166 
Criança 05 196 Criança 13 157 
Criança 06 175 Criança 14 160 
Criança 07 187 Criança 15 162 
Criança 08 175 
 
 
a) Ao nível de significância bilateral de 5%, há diferença significativa entre a média 
encontrada nestas crianças e o trabalho de Margarete Silva? 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 47
 
Exemplo – Saída do SPSS para o exercício do Cortisol 
 
One-Sample Statistics
15 170,0000 10,50170 2,71153Cortisol (ng/dl)
N Mean Std. Deviation
Std. Error
Mean
 
 
One-Sample Test
3,688 14 ,002 10,0000 4,1844 15,8156Cortisol (ng/dl)
t df Sig. (2-tailed)
Mean
Difference Lower Upper
95% Confidence
Interval of the
Difference
Test Value = 160
 
 
 
 
Exemplo – Alterando o valor de teste para 165ng/dl. 
 
Suponha a mesma amostra, mas altere o valor de referência para 165ng/dl. 
 
One-Sample Statistics
15 170,0000 10,50170 2,71153Cortisol (ng/dl)
N Mean Std. Deviation
Std. Error
Mean
 
 
One-Sample Test
1,844 14 ,086 5,0000 -,8156 10,8156Cortisol (ng/dl)
t df Sig. (2-tailed)
Mean
Difference Lower Upper
95% Confidence
Interval of the
Difference
Test Value = 165
 
 
 
Sobre o p-value, valor de p ou Significância (Sig.) 
O p-value, valor de p ou significância da estatística é o valor informado na saída 
dos softwares estatísticos. Esse número é uma probabilidade que deve ser comparada 
ao nível de significância adotado. 
 
Se p-value > nível de significância adotado, então ACEITAMOS Ho. 
Se p-value < nível de significância adotado, então REJEITAMOS Ho. 
 
Em aula serão feitas ilustrações para melhor entendimento. 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 48
6.2 Teste t de Student - duas amostras independentesÉ uma técnica estatística que permite testarmos a hipótese de que duas médias 
populacionais são idênticas. É extremamente utilizada para comparação de dois grupos 
independentes. 
 
Apresentação das hipóteses (caso bilateral): 
⎩⎨
⎧
≠
=
21
21
:Ha
:Ho
µµ
µµ
 
 
A estatística de teste tem uma forma um tanto “amigável”: 
 
( )
( ) ⎟⎟⎠
⎞
⎜⎜⎝
⎛ +×−+
−×+×
=
21
11
nn2nn
1)(ns1)-(ns
x-xt
21
2
2
21
2
1
21
 
 
 
que deve ser comparado com uma distribuição t de Student com (n1+n2-2) graus de 
liberdade 
 
As regiões de rejeição e aceitação seguem a mesma lógica do teste anterior. 
 
 
No EXCEL: Ferramentas → Análise de Dados → Teste t: duas amostras presumindo 
variâncias equivalentes 
ATENÇÃO: Esse teste só pode ser utilizado se a variância (ou desvios-padrão) das 
duas populações em questão não forem muito diferentes. 
 
Exercício: 
 
Dois grupos de promotores de vendas estão sendo comparados em relação ao seus 
desempenhos. Considere que o valor 0 corresponda a produtividade nula e o valor 100 
corresponda a produtividade máxima. O Grupo 1 recebeu a palestra de um Psicólogo e 
participação dos resultados (comissões). O Grupo 2 recebeu apenas as comissões 
 
Resultados do levantamento realizado pelos pesquisadores: 
 
Grupo 1 
Psico + $$$ 65 58 78 60 68 69 66 70 53 71 63 63 Média = 65,33 Desvio = 6,61 
Grupo 2 
$$$ 62 63 36 34 56 50 42 57 46 68 48 42 52 43 43 Média = 49,47 Desvio = 10,07 
 
a) Ao nível de 5%, há diferença significativa entre os dois grupos? 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 49
 
Exemplo – Tela e saída do EXCEL para o exemplo da Altura das plantas 
 
 
 
 
 
 
Teste-t: duas amostras presumindo variâncias equivalentes 
 Grupo 1 Grupo 2 
Média 65,333 49,467 
Variância 43,697 101,410 
Observações 12,000 15,000 
Variância agrupada 76,016 
Hipótese da diferença de média 0,000 
gl 25,000 
Stat t 4,699 
P(T<=t) uni-caudal 0,000 
t crítico uni-caudal 1,708 
P(T<=t) bi-caudal (p-value) 0,000 
t crítico bi-caudal 2,060 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 50
6.3 Teste t de Student - duas amostras pareadas 
 
Utilizado para testarmos a hipótese de que a média populacional ANTES e DEPOIS de 
algum determinado “tratamento” ou “situação” sofreu alteração significativa. 
 
⎪⎩
⎪⎨⎧ ≠
=
DepoisAntes
DepoisAntes
µµ
µµ
:Ha
:Ho
Hipóteses: 
 
A estatística de teste baseia-se nas diferenças DEPOIS – ANTES para cada elemento da 
amostra. 
 
 Estatística de teste: 
n/s
dt
d
=
 
onde d é a média das diferenças e sd é o desvio-padrão das diferenças. 
 
As regiões de rejeição e aceitação do teste t são estabelecidas pelos valores de t. 
 
 
 
No EXCEL: Ferramentas → Análise de Dados → Teste t: duas amostras em par 
 
 
Exercício: 
 
Deseja-se investigar o efeito do álcool sobre o reflexo na direção. Uma amostra de 10 
motoristas foi convidada a utilizar um simulador de direção antes e depois de ingerir 
bebida e o tempo até uma reação (pisar no freio) foi verificado. 
 
Motorista Antes Depois
1 10 20 
2 80 70 
3 45 50 
4 60 80 
5 45 90 
6 100 120 
7 45 55 
8 80 90 
9 25 50 
10 50 60 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 51
Exemplo – Tela e saída do Microsoft EXCEL 
 
 
 
 
 
Teste-t: duas amostras em par para médias 
 
 Antes Depois 
Média 54,000 68,500
Variância 726,667 778,056
Observações 10,000 10,000
Correlação de Pearson 0,862 
Hipótese da diferença de média 0,000 
gl 9,000 
Stat t -3,179 
P(T<=t) uni-caudal 0,006 
t crítico uni-caudal 1,833 
P(T<=t) bi-caudal (p-value) 0,011 
t crítico bi-caudal 2,262 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 52
6.4 TESTE DO QUI-QUADRADO (χ2) 
 
O teste do qui-quadrado é uma importante prova para verificar associação entre duas 
variáveis qualitativas (categóricas). A técnica verifica se há ou não associação entre as 
variáveis linha e coluna de uma tabela cruzada. 
 
Hipóteses do teste: 
 
Ho: As variáveis linha e coluna da tabela são INDEPENDENTES. 
 
Ha: Existe uma relação de dependência entre as variáveis linha e coluna da tabela 
 
 
Para exemplificar o cálculo das estatística de teste nada melhor do que um exemplo. A 
estatística de teste Qui-quadrado baseia-se na diferença entre os valores observados e 
esperados em cada célula da tabela cruzada. Os valores esperados são calculados sob a 
hipótese de independência. 
 
Estatística de teste: 
( )∑ −=χ −− . ..))(( EspEspObscl
2
2
11 que deve ser comparado com o valor 
tabelado da qui-quadrado com (l-1)(c-1) graus de liberade. 
 
 
Exemplo – Uso de drogas e situação conjugal dos pais 
 
Deseja-se investigar se a situação conjugal dos pais está relacionada ao uso de drogas. 
Um estudo publicado da Revista de Saúde Pública em 2004 entitulado “Fatores 
associados ao uso de drogas entre adolescentes escolares” de autoria de Beatriz 
Tavares et al. mostrou os dados que estão na tabela a seguir: 
 
a) Complete a tabela e realize um teste Qui-quadrado para verificar se a prevalência de 
uso de drogas depende ou independe da situação conjugal dos pais. Use 5%. 
 
Tabela – Situação conjugal dos pais X Uso de drogas 
Drogas 
Situação 
Sim Não Total 
Vivem juntos 
 
 
257 1680 
Separados 
 
 
112 472 
Total 
 
 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 53
 
Exemplo – Estilo Parental e Uso de Drogas 
 
Verifique se o estilo parental da mãe está relacionado ou não ao uso de drogas. Os 
dados foram obtidos no mesmo estudo da Revista de Saúde Pública em 2004 entitulado 
“Fatores associados ao uso de drogas entre adolescentes escolares” de autoria de 
Beatriz Tavares et al. 
 
Tabela – Estilo parental da mãe X Uso de drogas 
Drogas 
Estilo 
Sim Não Total 
Autoritária 
 
 
144 897 
Moderada 
 
 
124 815 
Total 
 
 
 
 
 
 
O EXCEL não faz o teste qui-quadrado. O SPSS e o MINITAB fazem. 
 
 
Exemplo – Tabela e saída do SPSS 
 
Estilo * Drogas Crosstabulation
144 753 897
16,1% 83,9% 100,0%
124 691 815
15,2% 84,8% 100,0%
268 1444 1712
15,7% 84,3% 100,0%
Count
% within Estilo
Count
% within Estilo
Count
% within Estilo
Autoritária
Moderada
Estilo
Total
Sim Não
Drogas
Total
 
 
Chi-Square Tests
,228b 1 ,633
,168 1 ,681
,228 1 ,633
,642 ,341
,227 1 ,633
1712
Pearson Chi-Square
Continuity Correctiona
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
Value df
Asymp. Sig.
(2-sided)
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
Computed only for a 2x2 tablea. 
0 cells (,0%) have expected count less than 5. The minimum expected count is
127,58.
b. 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 54
Cap. 7. CORRELAÇÃO E REGRESSÃO 
 
7.1 O COEFICIENTE DE CORRELAÇÃO DE PEARSON 
 
O coeficiente de correlação de Peason ( R ) é uma medida que varia no intervalo de –1 
até +1 que visa quantificar o grau de relacionamento linear entre variáveis 
quantitativas. 
 
Valores próximos de +1 indicam forte correlação direta entre as variáveis enquanto que 
valores próximos de –1 indicam forte correlação inversa. Valores em torno de zero 
indicam ausência de correlação. Não vamos nos deter no cálculo do coeficiente de 
correlação de Pearson, mas sim no seu funcionamento. 
 
Vejamos na forma de gráficos de dispersão os possíveis tipos de correlação entre as 
variáveis: 
 
 
 
 
 
 
 
 
 
Correlação Direta Correlação Inversa Ausência de Correlação 
 
 
 
Vamos verificar a correlação existente entre as variáveis no arquivo exemplo a seguir: 
 
Indivíduo 
Número de 
erros (X) 
Horas de 
Sono(Y) 
 
1 8 12 
2 7 13 
3 9 9 
4 12 6 
5 14 5 
Média 10,00 9,00 
Desvio 2,92 3,54 
 
No EXCEL podemos utilizar o comando CORREL. 
 
 
 
 
 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 55
Exemplo – Correlação usando o EXCEL 
 
 
 
Quando temos mais de duas variáveis podemos construir uma matriz de correlação. O 
EXCEL possui o comando “Correlação” dentro da opção Análise de Dados. 
 
Exemplo – Matriz de correlação entre algumas características 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 56
7.2 – Regressão Linear Simples 
 
A técnica de Regressão Linear Simples estabelece uma relação de dependência entre 
uma variável dependente Y e uma única variável independente X, supondo que o 
relacionamento seja da forma linear: 
 
Y = bo + b1X (clássica equação da reta) 
 
Os termos bo e b1 são os parâmetros do modelo. Eles são estimados de forma a 
maximizar a habilidade preditiva do modelo, conforme será mostrado no exemplo a 
seguir. 
 
 
Exemplo – Peso X Altura de indivíduos adultos 
 
 
 
A regressão também pode ser realizada no módulo “Análise de Dados” > “Regressão”, 
fornecendo uma saída bem mais completa. 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 57
Figura – Tela do Excel para a Regressão Completa 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 58
Lista de Exercícios 
 
Cap. 2 – Estatística Descritiva 
 
1. Os dados a seguir referem-se ao número de alunos que procuraram atendimento 
psicológico na primeira quinzena de Agosto. 
 
2 1 2 3 2 2 0 2 1 2 0 1 2 1 0 
 
a) Organize os dados na forma de uma tabelas de freqüências. 
b) Encontre as MTC's e interprete-as. 
c) Encontre as Medidas de Variabilidade e interprete-as. 
 
2. Os dados a seguir indicam a taxa média de calorias diárias ingeridas pela população 
de países da América Central. 
País Calorias País Calorias 
Costa Rica 2760 Haiti 1965 
Domincan Republic 2310 Honduras 2200 
El Salvador 2270 Nicaragua 2215 
Guatemala 2190 Panama 2490 
Fonte: OMS, 1995. (dados arredondados) 
 
a) Encontrar as MTC´s e as Medidas de Variabilidade. 
b) Suponha que, subitamente, todos os países passem a consumir 100 calorias a mais 
na sua dieta diária. Quais seriam os novos valores das MTC's e das MV? 
c) Suponha que, subitamente, todos os países aumentem a sua dieta calórica em 10%. 
Quais seriam os novos valores das MTC's e das MV? 
 
3. O índice de massa corporal (IMC) é o resultado da divisão entre o peso (em kg) e o 
quadrado da altura (em m). A OMS classifica o IMC da seguinte forma: magro, normal, 
sobrepeso e obesidade. O gráfico a seguir apresenta a distribuição do peso de 200 
bailarinas gaúchas. Os dados são inspirados em um TCC do curso de Psicologia. 
Categorias do IMC
SobrepesoNormalMagro
Fr
eq
üê
nc
ia
 R
el
at
iva
 (
fri
)
60
50
40
30
20
10
0
6
56
38
 
a) Construa uma tabela de freqüências completa a partir do gráfico. 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 59
4. A tabela a seguir informa as estatísticas descritivas para a estatura (em cm) de 
adolescentes na faixa dos 10-11 anos, separadamente para o sexo masculino e 
feminino. Os dados fazem parte de um banco de dados real. 
 
 Masculino
(n=97) 
Feminino
(n=79) 
Mean (Média) 155,17 146,41 
Median (Mediana) 160,30 151,00 
Range (Amplitude) 72,30 55,70 
Variance 282,55 205,71 
Std. Deviation (Desvio-padrão) 16,81 14,34 
Minimum 112,30 111,80 
Maximum 184,60 167,50 
 
a) Comente os resultados. Qual sexo apresenta maior variação na altura? 
 
b) Interprete os percentis apresentados na tabela abaixo. 
 
Sexo P25 P50 P75 P90 
Masculino 143.9 160.3 167.3 173.6 
Feminino 136.0 151.0 155.5 162.1 
 
 
5. O número de amigos que faz parte do “primeiro anel” da rede de amizades de uma 
amostra de 20 adolescentes foi verificado 
 
4 4 5 0 2 1 2 3 3 4
0 3 1 2 2 2 3 3 3 3
 
 
a) Organize os dados numa tabela de freqüências. 
b) Encontre as MTC´s e interprete-as. 
c) Encontre as Medidas de Variabilidade e interprete. 
d) Qual gráfico seria apropriado para esse tipo de variável? 
 
 
6. O instrumento de qualidade de vida WHOQOL- versão abreviada procura mensurar a 
qualidade de vida numa escala de 0 (QV mínima) até 100 (QV máxima) 
(http://www.ufrgs.br/psiq/whoqol.html) Considere o resultado obtido numa amostra 
de 9 pacientes de um hospital. 
 
45 52 62 50 72 80 84 52 88 
 
a) Encontre as MTC´s. 
b) Encontre as Medidas de Variabilidade 
c) Aumente todos os valores em 10 unidades. O acontece com as MTC e as MV. 
d) Aumente todos os valores em 10%. O que acontece com as MTC e as MV. 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 60
Cap. 3 - Probabilidade 
 
7. (Probabilidade) Numa determinada população existem 200 pessoas, sendo 120 do 
sexo feminino e o restante do sexo masculino. Sabe-se que existe nessa população 40 
fumantes, dos quais 25 são homens. Se eu escolher uma pessoa dessa população ao 
acaso, encontre: 
a) A probabilidade de ser não-fumante. 
b) Se a pessoa que eu sortear for do sexo feminino, qual a probabilidade dela ser 
fumante? 
 
8. (Probabilidade) A probabilidade de um exame resultar num falso-negativo em casos 
de AIDS é de 10%. Se uma pessoa com AIDS faz exame em três diferentes 
laboratórios, qual a probabilidade de que os três exames resultem negativos? 
 
9. Uma caixa (caixa A) contém três ratos brancos e 1 preto. Outra caixa (caixa B) 
contém 4 ratos pretos e 1 branco. Você retira aleatoriamente um rato de cada caixa: 
a) Escreva o espaço amostral S. 
b) Calcule as probabilidades de cada resultado possível. 
 
10. (Binomial) A probabilidade de nascer um cão labrador cor chocolate no cruzamento 
de um labrador amarelo com um preto é de 1 em 8. Admita que uma fêmea amarela 
ficou prenha de um labrador preto e teve 8 filhotes: 
a) Defina o que será considerado um sucesso para calcular via binomial. 
b) Defina a variável X e os parâmetros "n" e "p". 
c) Qual a probabilidade que não nasça labrador chocolate? 
d) Qual a probabilidade de nascer no máximo dois labradores chocolate? 
e) Qual o número esperado de labradores chocolate. Utilize o seguinte resultado para 
facilitar os cálculos: na binomial E(X) = n . p 
 
10b. A probabilidade nascer um filho hiperativo é estimada em 1%. Se você tem 3 
filhos. 
a) Qual a probabilidade de TODOS serem hiperativos? 
b) Qual a probabilidade ao menos um ser hiperativo? 
c) Qual o número esperado de filhos hiperativos numa prole de tamanho 3? 
 
11. (Normal) A altura de meninos americanos adolescentes segue uma distribuição 
normal com média de 1,70m e desvio-padrão de 12,2m. Você sabe tem um amigo 
americano, com o qual se comunica pela Internet, e que é adolescente. Qual a 
probabilidade desse rapaz ter mais de 1,80m? 
 
 
12. (Normal) A expectativa de vida na Índia é de 58 anos e em Bangladesh é de 53 
anos, segundo dados da ONU (1995). Admita que a expectativa de vida siga uma 
distribuição aproximadamente normal e que o desvio-padrão na Índia seja de 12 anos e 
em Bangladesh seja de 7 anos. 
a) Em qual país é mais provável de encontrarmos um habitante com mais de 65 anos? 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 61
 
13. O que é mais provável: acertar na Mega-Sena jogando um único cartão ou acertar 
todas as questões da prova de Biologia do vestibular da UFRGS (30 questões, 5 
alternativas cada) chutando todas as respostas aleatoriamente e não permitindo que a 
resposta dada a uma questão influencie na outra... 
 
Cap 5 – Estimação por Ponto e por Intervalo 
 
14. Suponha que você conduzirá um estudo sobre o tempo que professores 
universitários do curso de Psicologiaficam em frente ao computador diariamente. A 
população em estudo é de apenas 10 professores. 
 
Professor 1 2 3 4 5 6 7 8 9 10 
Tempo 5,00 4,00 3,50 1,20 0,00 8,00 3,50 5,00 6,00 11,00
 
a) Quais são os parâmetros média e desvio-padrão dessa população? 
b) Você só tem tempo de analisar 4 professores para estimar a média de tempo 
nessa população. Quantas possíveis amostras de 4 professores você pode obter 
a partir dessa população (amostragem sem reposição)? 
c) Como ficaria a distribuição das médias amostrais? 
 
 
15. O FBI quer investigar a verdadeira proporção de casos de ANTRAZ dentre os 450 
funcionários que trabalham no prédio dos Correios de Washington. Como o 
procedimento de análise é caro e demorado, eles decidem trabalhar por amostragem. 
 
a) Quantas amostras de 30 funcionários poderiam ser obtidas nessa população 
(sem reposição)? 
b) Qual o comportamento probabilístico esperado das proporções amostrais ? pˆ
 
16. O Inventário de Ansiedade de Beck (BAI) procura traduzir a ansiedade de um 
indivíduo numa escala de 0 até 63 pontos. Os resultados mostram o nível de ansiedade 
de uma amostra de 10 formandos em Psicologia. 
 
12 15 32 14 25 28 25 12 14 16 
 
a) Estime por ponto a concentração média de coliformes fecais nessa lagoa. 
b) Estime por intervalo de confiança de 95% a concentração média (...) 
c) Interprete o intervalo 
 
 
17. Dizem que a proporção de homens fumantes é semelhante a proporção de 
mulheres fumantes. Numa amostra de 240 mulheres, 35 se declararam fumantes, 
enquanto que dentre os 300 homens investigados, 54 eram fumantes. 
a) Calcule um IC de 95% para a proporção de homens fumantes. 
b) Calcule um IC de 95% para a proporção de mulheres fumantes. 
c) Interprete os resultados. Há chance das duas proporções de fumantes serem iguais? 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 62
 
18. No exercício 14 retire uma amostra de tamanho 4 e construa um I.C. 95% para o 
verdadeiro tempo médio de utilização do computador. 
 
19. Suponha que no exercício 15, uma amostra de n=30 funcionários levou a estimativa 
de 26,67% de casos positivos. 
a) Construa um I.C. 95% para a proporção de casos positivos. 
b) Qual o tamanho amostral necessário para estimarmos essa proporção com 5% e 
3% de margem de erro, mantendo o nível de confiança em 95%. 
 
20. 
 
Cap. 6 – Testes de Hipóteses 
 
21. Teste a hipótese de que no exercício 16 nós temos um escore de ansiedade BAI 
médio de 20 pontos. Use 5%. 
 
 
22. A tabela a seguir informa as estatísticas descritivas para a estatura (em cm) de 
adolescentes na faixa dos 12 a 13 anos, separadamente para o sexo masculino e 
feminino. Os dados fazem parte de um banco de dados real. 
 
 Masculino 
(n=97) 
Feminino 
(n=79) 
Mean (Média) 155,17 146,41 
Std. Deviation (Desvio-padrão) 16,81 14,34 
 
a) Faça um teste para comparação da altura média por sexo, utilizando um nível de 
significância de 10%. 
 
 
23. (Teste t para amostras emparelhadas) Foi realizado um experimento com 5 atletas 
onde foi solicitado que eles fizessem uma corrida de 100m sem a utilização de 
anabolizantes e numa outra ocasião com a utilização dos estimulantes. Compare os 
resultados pelo teste t ao nível de 5%. 
 
Atleta 1 2 3 4 5 
Sem anabol. 12,1 12,6 13,0 14,1 12,9 
Com anabol. 10,8 12,5 12,7 13,8 12,4 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 63
24. O EAT-26 é um teste para atitudes alimentares que indica padrão anormal de 
alimentação quando o escore ultrapassa 20 pontos. O Dr. Barros na revista Aletheia 
(1999) mostrou que, dentre os 367 adolescentes do sexo feminino, 92 apresentaram 
transtornos alimentares, enquanto que dentre os 439 do sexo masculino, 24 
apresentaram. 
a) Realize um teste qui-quadrado ao nível de 1% e indique se existe diferença 
significativa entre os dois sexos. 
b) Você achou o tamanho amostral suficiente para fazer esse teste? 
 
 
25. Uma escala de auto-estima bastante utilizada em Psicologia é composta de 10 itens, 
cuja soma da pontuação obtida nesses itens indica nível de auto-estima da pessoa 
numa escala que vai de 10 (mínimo) até 50 (máximo). 
 
Uma Monografia do curso de Psicologia de um aluna chamada Suzana (Ulbra, 1999) 
mostrou um comparativo entre dois grupos de pessoas com problemas de alcoolismo: 
 
Tempo de Abstinência n Média D.P. 
Até 6 meses 44 23,86 5,07 
Mais de 6 meses 39 30,36 3,38 
 
a) Compare os grupos pelo teste t adotando um nível de significância de 1%. 
 
 
26. Para os dados da tabela abaixo, composta de 100 fumantes, realize um teste qui-
quadrado. Os dados foram extraídos de Everitt (1992). 
 
Quantidade diária de
cigarros 
 
 Idade
 
Até 
40 anos 
Mais de 40 
anos Total 
Menos de 20 cigarros 50 15 65 
 
20 cigarros ou mais 10 25 35 
 
Total 60 40 100 
 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 64
27. Estudantes de Psicologia estão estudando a evolução da coesão familiar com a 
realização de terapia de grupo 
 
Família 1 2 3 4 5 6 7 
Coesão – Antes 25 50 40 42 60 55 47 
Coesão – Depois 52 70 60 52 65 63 57 
Obs.: Quanto maior, maior a coesão. 
 
a) O Tratamento é eficiente para aumento da coesão? Realize um teste t apropriado. 
 
 
28. Um teste de QI realizado em dois grupos de alunos da área exata mostrou os 
seguintes resultados 
 
 
Grupo 1 
Alunos do 2º 
semestre 
(n=20) 
Grupo 2 
Alunos do 8º 
semestre 
(n=10) 
Média 110 118 
Desvio-padrão 14 19 
Obs.: Dados fictícios 
 
a) Compare os dois grupos ao nível de significância de 5%. 
 
 
29. Suspeita-se que a idade de alunos de Psicologia nos turnos diurno e noturno difira 
significativamente. Uma amostra de 31 estudantes de cada turno mostrou o seguinte: 
 
Grupo 
 
n Média 
Desvio- 
padrão 
Diurno 31 22 4,2 
Noturno 31 27 4,0 
 
a) Os grupos diferem de acordo com o teste t ao nível de significância de 5%? 
 
 
30. O medicamento FULCIN 500mg diz ter essa quantidade da substância ativa 
Griseofulvina. Numa amostra de 100 comprimidos de FULCIN chegamos a uma média 
de 470mg com um desvio-padrão de 45mg. 
 
a) Realize um teste t contra o valor de referência e tire a sua conclusão. 
 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 65
Cap. 7 - Correlação e Regressão (?) 
 
31. Suspeita-se que a idade ao primeiro parto tende a se repetir nas filhas mulheres. 
Um estudo-piloto realizado com 5 mães mostrou que: 
 
 Média Desvio
Idade que a mãe teve o 1º filho 20 26 28 30 31 27 4,36 
Idade que a filha teve o 1º filho 22 26 28 33 36 29 5,57 
 
32. Será que é possível prever o escore no vestibular a partir do conhecimento da nota 
média no 3º ano do Ensino Médio? 
 
y = 36,092x + 250,21
R2 = 0,8176
0
100
200
300
400
500
600
700
0,0 2,0 4,0 6,0 8,0 10,0
E
sc
or
e 
ve
st
ib
ul
ar
Média no EM 
 
a) Qual o modelo estimado? 
b) Interprete o coeficiente de determinação. 
c) Qual o escore esperado no vestibular de um aluno que passou com média 5,5? 
 
RESUMO DOS RESULTADOS 
 
Estatística de regressão 
R múltiplo 0,90421644 
R-Quadrado 0,817607371 
R-quadrado ajustado 0,794808292 
Erro padrão 31,73457394 
Observações 10 
ANOVA 
 gl SQ MQ F Valor de p 
Regressão 1 36115,43 36115,43 35,86 0,000
Resíduo 8 8056,67 1007,08 
Total 9 44172,10 
 
 Coeficientes Erro padrão Stat t valor-P 
Interseção 250,21 46,60 5,37 0,00 
Média em Matemática EM 36,09 6,03 5,99 0,00 
Est Apl à Psicologia – Prof. Hélio Radke Bittencourt Pág. 66
TABELA Z 
 
 
Tabela: Probabilidades acumuladas associadas aos valores críticos (z) da distribuição normal 
reduzida 
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 
0,0 0,5000 0,5040 0,5080 0,5120 0,5160

Outros materiais