Buscar

Introdução à Estatística

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 70 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 70 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 70 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
 
 
 
 
2 
 
 
SUMÁRIO 
1 O QUE É A ESTATÍSTICA ...................................................................... 5 
1.1 Definição de Estatística .................................................................... 5 
2 ESTATÍSTICA DESCRITIVA .................................................................. 6 
2.1 O que são as Medidas de Centralidade na estatística descritiva? ... 6 
2.2 O que é uma Média Aritmética na estatística descritiva? ................. 6 
2.3 O que é a Mediana na estatística descritiva? ................................... 7 
2.4 O que é Moda na estatística descritiva? ........................................... 8 
2.5 O que são os Percentis (ou quartis)? ............................................... 9 
2.6 Como calcular o primeiro quartil? ................................................... 10 
3 PROBABILIDADE ................................................................................. 10 
3.1 Experimento aleatório e ponto amostral ......................................... 10 
3.2 Espaço amostral ............................................................................. 12 
3.3 Evento ............................................................................................ 12 
3.4 Cálculo da probabilidade ................................................................ 13 
4 VARIÁVEIS ALEATÓRIAS DISCRETAS .............................................. 15 
4.1 Distribuição de probabilidade ......................................................... 16 
4.2 Função de densidade de probabilidade ......................................... 17 
4.3 Esperança matemática, variância e desvio padrão: propriedades . 17 
5 DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS DISCRETAS ........... 18 
5.1 Distribuição de Bernoulli ................................................................. 18 
5.2 Distribuição Binomial ...................................................................... 19 
5.3 Distribuição de Poisson .................................................................. 20 
 
3 
 
5.4 Distribuição Geométrica ................................................................. 21 
5.5 Distribuição Uniforme ..................................................................... 22 
5.6 Distribuição Hipergeométrica ......................................................... 22 
6 VARIÁVEIS ALEATÓRIAS CONTÍNUAS.............................................. 23 
6.1 Distribuição de variáveis aleatórias discretas: ................................ 24 
6.2 Distribuição Uniforme: .................................................................... 25 
6.3 A média de X é dada por: ............................................................... 26 
6.4 Distribuição Exponencial ................................................................ 26 
6.5 Distribuição Normal ........................................................................ 27 
6.6 Distribuição do tipo Gama .............................................................. 31 
6.7 Distribuição do tipo Qui-Quadrado ................................................. 35 
7 DISTRIBUIÇÕES DE PROBABILIDADES CONTÍNUAS E DISCRETAS
 36 
7.1 O que é a distribuição contínua? .................................................... 36 
7.2 Exemplo da distribuição de pesos .................................................. 37 
7.3 O que é a distribuição discreta? ..................................................... 38 
7.4 Exemplo do número de reclamações de clientes ........................... 38 
8 REGRESSÃO E CORRELAÇÃO .......................................................... 40 
8.1 Correlação ...................................................................................... 40 
8.2 Correlação linear ............................................................................ 41 
8.3 Medidas de correlação ................................................................... 42 
8.4 Regressão ...................................................................................... 44 
Regressão da linha reta .......................................................................... 48 
9 TEORIA DA ESTIMAÇÃO ..................................................................... 53 
9.1 Estimação por ponto....................................................................... 54 
 
4 
 
9.2 Estimação por intervalo .................................................................. 54 
9.3 Intervalo de Confiança.................................................................... 55 
9.4 Intervalo de confiança para a média quando a variância é conhecida
 56 
10 NOÇÕES DE AMOSTRAGEM .......................................................... 57 
10.1 MOTIVAÇÃO ............................................................................... 57 
10.2 Métodos de Amostragem ............................................................ 57 
10.3 Amostragem Aleatória Simples ................................................... 58 
10.4 Amostragem Sistemática ............................................................ 58 
10.5 Amostragem Estratificada ........................................................... 58 
10.6 Amostragem por Conglomerados ............................................... 59 
10.7 Amostragem Acidental (Conveniência) ....................................... 60 
10.8 Amostragem Julgamento ou intencional ..................................... 60 
10.9 Amostragem por Quotas ............................................................. 60 
11 TESTES DE HIPÓTESES ................................................................. 61 
12 ANÁLISE DA VARIÂNCIA (ANOVA) ................................................. 64 
12.1 Hipóteses do ANOVA de um critério ........................................... 65 
BIBLIOGRAFIA ........................................................................................... 69 
 
 
 
 
 
 
 
 
 
 
5 
 
1 O QUE É A ESTATÍSTICA 
Para muitos, a estatística não passa de conjuntos de tabelas de dados 
numéricos. Os estatísticos são pessoas que coletam esses dados. 
•A estatística originou-se com a coleta e construção de tabelas de dados para 
os governos 
• A situação evoluiu e está coleta de dados representa somente um dos 
aspectos da estatística. 
 
Fonte: ignisengenharia.com.br 
1.1 Definição de Estatística 
A estatística é um conjunto de técnicas que permite, de forma sistemática, 
organizar, descrever, analisar e interpretar dados oriundos de estudos ou 
experimentos, realizados em qualquer área do conhecimento. 
A estatística descritiva é a etapa inicial da análise utilizada para descrever e 
resumir os dados. A disponibilidade de uma grande quantidade de dados e de 
métodos computacionais muito eficientes revigorou está área da estatística. 
 
6 
 
2 ESTATÍSTICA DESCRITIVA 
Estatística descritiva é o ramo da estatística que visa sumarizar e descrever 
qualquer conjunto de dados. Em outras palavras, é aquela estatística que está 
preocupada em sintetizar os dados de maneira direta, se preocupando menos com 
variações e intervalos de confiança dos dados. Exemplos de estatísticas descritivas 
são a média, o desvio padrão, a mediana, etc. 
2.1 O que são as Medidas de Centralidade na estatística descritiva? 
São procedimentos gráficos que ajudam a visualizar a forma da distribuição 
das medidas (como é o caso do histograma). O próximo passo na análise é 
quantificar alguns aspectos importantes da distribuição. Duas medidas são 
amplamente utilizadas, uma para localizar a posição central e outra para quantificar 
a variabilidade ou dispersão da distribuição. 
A medida de posição central é um valor representativo da distribuição em 
torno do qual as outras medidas se distribuem. Duas medidas são as mais 
utilizadas: a média aritmética e a mediana. 
2.2 O que é uma Média Aritmética na estatística descritiva? 
A média aritmética de um conjunto de nº valores, como o próprionome 
indica, é obtida somando-se todas as medidas e dividindo-se a soma por n. 
Representamos cada valor individual por uma letra (x, y, z, etc.) seguida por um sub 
índice, ou seja, representamos os nº valores da amostra por x1, x2, x3, …, xn, onde 
x1 é a primeira observação, x2 é a segunda e assim por diante. Então escrevemos: 
 
Onde  é um símbolo matemático que se lê “somatório” de xi, para i variando 
de 1 a n, que é equivalente a x1 + x2 + x3 +…+xn. 
http://www.fm2s.com.br/histograma
http://www.fm2s.com.br/6-sigma-variabilidade/
 
7 
 
Exemplo: O número médio de filhos por família, usando os dados do exemplo 
acima, é dado por: 
 
2.3 O que é a Mediana na estatística descritiva? 
A mediana é uma medida alternativa à média aritmética para representar o 
centro da distribuição, muito usada em estatística descritiva. A mediana de um 
conjunto de medidas (x1, x2, x3, …, xn) é um valor M tal que pelo menos 50% das 
medidas são menores ou iguais a M e pelo menos 50% das medidas são maiores 
ou iguais a M. Em outras palavras, 50% das medidas ficam abaixo da mediana e 
50% acima. 
Exemplo: Uma mulher, durante seu período reprodutivo, deu à luz a 5 
crianças. Os pesos dos recém-nascidos foram: 9.2, 6.4, 10.5, 8.1 e 7.8. Calcule a 
mediana dos pesos. 
Os valores ordenados são: 6.4 7.8 8.1 9.2 10.5. 
Portanto a mediana é 8.1. 
Exemplo: Os dados abaixo são tempos de vida (em dias) de 8 lâmpadas: 
500 550 550 550 600 700 750 2000 
Note que temos dois valores que satisfazem a condição de ser mediana, o 
quarto (550) e o quinto (600) valor na lista ordenada. Nesse caso, definimos a 
mediana como sendo a média dos dois valores centrais: 
 
Observe que se a lâmpada que sobreviveu 2000 dias tivesse sobrevivido 
3950 dias o valor da mediana não se alteraria, mas a média aritmética aumentaria. 
Não ser afetada por valores extremos é uma vantagem da mediana em relação à 
média. Quando a distribuição dos dados é simétrica os valores da média e da 
 
8 
 
mediana praticamente coincidem. Quando a distribuição é assimétrica a média é 
“puxada” na direção da assimetria. 
 
Fonte: educare.pt 
Quase sempre quando olhamos uma média fazemos algum julgamento de 
valor. Se lemos no jornal qual é a renda média de uma determinada comunidade 
somos tentados a avaliar como é a situação econômica dessa comunidade. O valor 
pode ser alto e mesmo assim a situação social ser muito ruim. Basta que poucos 
ganhem muito e muitos ganhem pouco. A mediana não é influenciada por esses 
valores extremos e nesse caso refletirá melhor a condição econômica da 
comunidade. 
Em qualquer estudo, é interessante reportar as duas medidas de 
centralidade. 
2.4 O que é Moda na estatística descritiva? 
A moda de uma distribuição é o valor que ocorre mais frequentemente, ou o 
valor que corresponde ao intervalo de classe com a maior frequência. A moda, da 
mesma forma que a mediana, não é afetada por valores extremos. 
Uma distribuição de frequência que apresenta apenas uma moda é chamada 
de uni modal. Se a distribuição apresenta dois pontos de alta concentração ela é 
 
9 
 
chamada de bimodal. Distribuições bimodais ou multimodais podem indicar que na 
realidade a distribuição de frequência se refere a duas populações cujas medidas 
foram misturadas. 
Por exemplo, suponha que um lote de caixas de leite longa vida é amostrado 
e em cada caixa da amostra é medido o volume envasado. Se o lote é formado pela 
produção de duas máquinas de envase que estão calibradas em valores diferentes, 
é possível que o dihistograma apresente duas modas, uma para cada valor de 
calibração. 
2.5 O que são os Percentis (ou quartis)? 
Se o número de observações é grande, é interessante calcular algumas 
outras medidas de posição. Essas medidas são uma extensão do conceito de 
mediana. 
Suponha que estamos conduzindo um experimento com animais. Eles 
recebem uma droga e medimos o tempo de vida (em dias) após a ingestão dessa 
droga. Poderíamos fazer a seguinte pergunta: Qual é o tempo em que 50% dos 
animais ainda estão vivos? Obviamente esse valor será a mediana. Poderíamos 
estar interessados em saber qual é o tempo em que 75% dos animais estão vivos. 
Ou 25%. Esses valores são chamados de Quartis da distribuição (dividem a 
distribuição em quartas partes) e são representados por Q1 (1º quartil – 25%) e Q3 
(3º quartil – 75%). O segundo quartil, Q2, que corresponde a 50%, é a mediana. 
Esse conceito pode ser estendido um pouco mais, e em lugar de 25%, 50% 
e 75%, podemos querer calcular percentis (5%,10%, 90%, Tc). 
Seja p um número qualquer entre 0 e 1. O 1100×p-ésimo percentil é um valor 
tal que depois das medidas terem sido ordenadas, pelo menos 100×p% das 
medidas são menores ou iguais a esse valor, e pelo menos 100×(1-p)% das 
medidas são maiores ou iguais a esse valor. 
Exemplo: O ganho em peso de 9 ratos submetidos a uma dieta são dados a 
seguir: 
93.9 105.8 106.5 116.6 125.0 128.3 132.1 136.7 152.4 
 
10 
 
2.6 Como calcular o primeiro quartil? 
Cálculo de Q1: Q1 corresponde a 25%. Então p=0.25. 
O número de observações menores ou iguais a Q1 é 0.25×9=2.25. 
O número de observações maiores ou iguais a Q1 é (1-0.25)×9=6.75 
Em outras palavras, pelo menos 3 observações têm que ser menores ou 
iguais a Q1, e pelo menos 7 observações têm que ser maiores ou iguais a Q1. A 
medida 106.5 satisfaz esses requerimentos e, portanto, Q1 = 106.5. 
Cálculo de Q3: Argumentos semelhantes mostram que Q3 = 132.1. 
Temos também que Q2 = 125.0, que é a mediana. 
Exemplo: Calcular os quartis e os percentis 5%, 10%, 90% e 95% para a 
amostra de valor de venda de um produto em 95 pontos de venda amostrados 
apresentado acima. 
75% Q3 45.3 5% 35.2 
50% Q2 42.2 10% 37.0 
25% Q1 39.5 90% 47.0 
Média 42.4 95% 50.21 
 
3 PROBABILIDADE 
Probabilidade é o estudo das chances de obtenção de cada resultado de 
um experimento aleatório. A essas chances são atribuídos os números reais do 
intervalo entre 0 e 1. Resultados mais próximos de 1 têm mais chances de ocorrer. 
Além disso, a probabilidade também pode ser apresentada na forma percentual. 
3.1 Experimento aleatório e ponto amostral 
Um experimento aleatório pode ser repetido inúmeras vezes e nas mesmas 
condições e, mesmo assim, apresenta resultados diferentes. Cada um desses 
 
1 Texto de: Virgilio F.M. Dos Santos. Extraído: www.fm2s.com.br 
https://mundoeducacao.bol.uol.com.br/matematica/chances-um-evento-acontecer.htm
https://mundoeducacao.bol.uol.com.br/matematica/experimento-aleatorio-espaco-amostral.htm
https://mundoeducacao.bol.uol.com.br/matematica/conjunto-dos-numeros-reais.htm
https://mundoeducacao.bol.uol.com.br/matematica/porcentagem.htm
 
11 
 
resultados possíveis é chamado de ponto amostral. São exemplos de experimentos 
aleatórios: 
A) Cara ou coroa 
Lançar uma moeda e observar se a face voltada para cima é cara ou coroa 
é um exemplo de experimento aleatório. Se a moeda não for viciada e for lançada 
sempre nas mesmas condições, poderemos ter como resultado tanto cara quanto 
coroa. 
 
Fonte: professorloureiro.com 
B) Lançamento de um dado 
Lançar um dado e observar qual é o número da face superior também é 
um experimento aleatório. Esse número pode ser 1, 2, 3, 4, 5 ou 6 e cada um desses 
resultados apresenta a mesma chance de ocorrer. Em cada lançamento, o 
resultado pode ser igual ao anterior ou diferente dele. 
Observe que, no lançamento da moeda, as chances de repetir o resultado 
anterior são muito maiores. 
C). Retirar uma carta aleatória de um baralho 
Cada carta tem a mesma chance de ocorrência cada vez que o experimentoé realizado, por isso, esse é também um experimento aleatório. 
 
12 
 
3.2 Espaço amostral 
O espaço amostral (Ω) é o conjunto formado por todos os resultados 
possíveis de um experimento aleatório. Em outras palavras, é o conjunto formado 
por todos os pontos amostrais de um experimento. Veja exemplos: 
a) O espaço amostral do experimento “cara ou coroa” é o conjunto S = {Cara, 
Coroa}. Os pontos amostrais desse experimento são os mesmos elementos desse 
conjunto. 
b) O espaço amostral do experimento “lançamento de um dado” é o conjunto 
S = {1, 2, 3, 4, 5, 6}. Os pontos amostrais desse experimento são 1, 2, 3, 4, 5 e 6. 
O espaço amostral também é chamado de Universo e pode ser 
representado pelas outras notações usadas nos conjuntos. Além disso, todas 
as operações entre conjuntos valem também para espaços amostrais. 
O número de elementos do espaço amostral, número de pontos amostrais 
do espaço amostral ou número de casos possíveis em um espaço amostral é 
representado da seguinte maneira: n (Ω). 
3.3 Evento 
Um evento é qualquer subconjunto de um espaço amostral. Ele pode conter 
nenhum elemento (conjunto vazio) ou todos os elementos de um espaço amostral. 
O número de elementos do evento é representado da seguinte maneira: n (E), 
sendo E o evento em questão. 
São exemplos de eventos: 
A). Sair cara em um lançamento de uma moeda 
O evento é sair cara e possui um único elemento. A representação dos 
eventos também é feita com notações de conjuntos: 
 E = {cara} 
O seu número de elementos é n (E) = 1. 
B). Sair um número par no lançamento de um dado. 
O evento é sair um número par: 
https://mundoeducacao.bol.uol.com.br/matematica/operacoes-entre-conjuntos.htm
https://mundoeducacao.bol.uol.com.br/matematica/operacoes-entre-conjuntos.htm
 
13 
 
E = {2, 4, 6} 
O seu número de elementos é n (E) = 3. 
Os eventos que possuem apenas um elemento (ponto amostral) são 
chamados de simples. Quando o evento é igual ao espaço amostral, ele é chamado 
de evento certo e sua probabilidade de ocorrência é de 100%. Quando um evento 
é igual ao conjunto vazio, ele é chamado de evento impossível e possui 0% de 
chances de ocorrência. 
3.4 Cálculo da probabilidade 
Seja E um evento qualquer no espaço amostral Ω. A probabilidade do evento 
A ocorrer é a razão entre o número de resultados favoráveis e o número de 
resultados possíveis. Em outras palavras, é o número de elementos 
do evento dividido pelo número de elementos do espaço amostral a que ele 
pertence. 
P(E) = n(E) 
 n(Ω) 
Observações: 
O número de elementos do evento sempre é menor ou igual ao número de 
elementos do espaço amostral e maior ou igual a zero. Por isso, o resultado dessa 
divisão sempre está no intervalo 0 ≤ P (A) ≤ 1; 
Quando é necessário usar porcentagem, devemos multiplicar o resultado 
dessa divisão por 100 ou usar regra de três; 
A probabilidade de um evento não acontecer é determinada por: 
P (A-1) = 1 – P (A) 
Exemplos: 
→. Qual é a probabilidade de, no lançamento de uma moeda, o resultado ser 
cara? 
Solução: 
Observe que o espaço amostral só possui dois elementos e que o evento 
é sair cara e, por isso, possui apenas um elemento. 
 
 
14 
 
P(E) = n(E) 
 n(Ω) 
P(E) = 1 
 2 
P(E) = 0,5 = 50% 
 
Fonte: pensevestibular.com.br 
→. Qual é a probabilidade de, no lançamento de duas moedas, obtermos 
resultados iguais? 
Solução: 
Representando cara por C e coroa por K, teremos os seguintes resultados 
possíveis: 
 (C, K); (C, C); (K, C); (K, K) 
O evento obter resultados iguais possui os seguintes casos favoráveis: 
(C, C); (K, K) 
Há quatro casos possíveis (número de elementos do espaço amostral) e 
dois casos favoráveis (número de elementos do evento), logo: 
P(E) = n(E) 
 n(Ω) 
P(E) = 2 
 4 
P(E) = 0,5 = 50% 
 
15 
 
→. No lançamento de um dado, qual é a probabilidade de sair um resultado 
menor que 3? 
Solução: 
Observe que os números do dado menores do que 3 são 1 e 2, por isso, 
o evento possui apenas dois elementos. O espaço amostral possui seis elementos: 
1, 2, 3, 4, 5 e 6. 
P(E) = n(E) 
 n(Ω) 
P(E) = 2 
 6 
P(E) = 0,33... = 33,3% 
→. Qual é a chance de não sair o número 1 no lançamento de um dado? 
Solução: 
Temos duas maneiras de resolver esse problema. Note que não sair o 
número 1 é o mesmo que sair qualquer outro número. Faremos o mesmo cálculo 
de probabilidade considerando que o evento possui cinco elementos. 
A outra maneira é usar a fórmula para a probabilidade de um evento não 
ocorrer: 
P (A-1) = 1 – P (E) 
O evento que não pode ocorrer possui apenas um elemento, logo: 
P (A-1) = 1 – P (E) 
P(A-1) = 1 – n(E) 
 n(Ω) 
P(A-1) = 1 – 1 
 6 
P (A-1) = 1 – 0,166. 
P (A-1) = 0,8333… = 83,3% 
4 VARIÁVEIS ALEATÓRIAS DISCRETAS 
Muitos experimentos aleatórios produzem resultados não - numéricos. Antes 
de analisá-los, é conveniente transformar seus resultados em números, o que é feito 
através da variável aleatória, que é uma regra de associação de um valor numérico 
a cada ponto do espaço amostral. 
Portanto, variáveis aleatórias são variáveis numéricas às quais iremos 
associar modelos probabilísticos. Veremos que uma variável aleatória tem um 
 
16 
 
número para cada resultado de um experimento e que uma distribuição de 
probabilidades associa uma probabilidade a cada resultado numérico de um 
experimento. 
Seja E um experimento e S o espaço associado ao experimento. Uma função 
X, que associe a cada elemento s pertence S um número real X (s), é denominado 
variável aleatória. 
 
Exemplo: 
E: lançamento de duas moedas; 
X: número de caras obtidas nas duas moedas; 
S= {(c,c),(c,r),(r,c),(r,r)} 
X=0 > corresponde ao evento (r,r) com probabilidade ¼; 
X=1 > corresponde ao evento (r,c), (x,r) com probabilidade 2/4; 
X=2 > corresponde ao evento (c,c) com probabilidade ¼; 
Empregamos a termo variável aleatória para descrever o valor que 
corresponde ao resultado de determinado experimento. As variáveis aleatórias 
também podem ser discretas ou continuas e temos as seguintes definições: 
Variáveis aleatórias discretas – Admite um número finito de valores ou tem 
uma quantidade enumerável de valores. 
Variáveis aleatórias contínuas – Pode tomar um número infinito de valores, e 
esses valores podem ser associados a mensurações em uma escala contínua. 
4.1 Distribuição de probabilidade 
Uma vez definida a variável aleatória, existe interesse no cálculo dos valores 
das probabilidades correspondentes. O conjunto das variáveis e das probabilidades 
correspondentes é denominado distribuição de probabilidades, isto é: 
 
17 
 
 
4.2 Função de densidade de probabilidade 
É a função que associa a cada valor assumido pela variável aleatória a 
probabilidade do evento correspondente, isto é: 
 
4.3 Esperança matemática, variância e desvio padrão: propriedades 
Existem características numéricas que são muito importantes em uma 
distribuição de probabilidades de uma variável aleatória discreta. São os parâmetros 
das distribuições, a saber: 
> Esperança matemática (ou simplesmente média) – E (x) – é um número 
real, é também uma média aritmética; 
> Variância – VAR (x) – é à medida que dá o grau de dispersão (ou de 
concentração) de probabilidade em torno da média. O fato de conhecermos a média 
de uma distribuição de probabilidades já nos ajuda bastante, porém, precisamos de 
uma medida que nos dê o grau de dispersão de probabilidade em torno dessa 
média. 
 
Fonte: antoniolima.web.br.com 
 
18 
 
5 DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS DISCRETAS 
Será feita uma discussão sobre algumas distribuições de probabilidades 
discretas. Tais distribuições partem da pressuposição de certas hipóteses bem 
definidas. Como diversas situações reais muitas vezes se aproximam dessas 
hipóteses, esses modelos são úteis no estudo de tais situações, daí a sua 
importância.Um cuidado muito grande deve ser tomado ao se escolher uma distribuição 
de probabilidade que descreve corretamente as observações geradas por um 
experimento. Primeiramente analisaremos as distribuições discretas de 
probabilidades mais importantes e que descrevem as variáveis aleatórias 
comumente encontradas na prática. Por último analisaremos algumas distribuições 
de v.a. contínuas de importância similar. 
5.1 Distribuição de Bernoulli 
Seja um exemplo aleatório E realizado repetidas vezes, sempre nas mesmas 
condições, de tal forma que o resultado pode ser um Sucesso (s) (se acontecer o 
evento que nos interessa) ou um Fracasso (f) (se o evento não se realizar). Seja X 
a variável aleatória: Sucesso ou Fracasso 
 
Essas condições caracterizam um conjunto de Provas de Bernoulli ou um 
experimento de Bernoulli, e sua função probabilidade é dada por: 
 
> Média: 
 
> Variância: 
 
19 
 
 
5.2 Distribuição Binomial 
Uma variável aleatória tem distribuição binomial quando o experimento ao 
qual está relacionada apresenta apenas dois resultados (sucesso ou fracasso). Este 
modelo fundamenta-se nas seguintes hipóteses: 
 N provas independentes e do mesmo tipo são realizadas; 
 Cada prova admite dois resultados – Sucesso ou Fracasso; 
 A probabilidade de sucesso em cada prova é p e de fracasso 1-p = p; 
Define-se a Variável X que conta o número de sucessos nas n realizações 
do experimento. (X pode assumir os valores 0, 1, 2, 3, ..., n.). 
Fazendo sucesso corresponder a 1 fracasso, a 0, temos: 
Para X = 0, uma sequência de n zeros: 00000...000 
 
1. Para X = 1, uma sequência do tipo: 1000...0; 01000...0; 001000...0; será n 
sequência, cada uma com um único sucesso e n sequência, cada uma com 
um único sucesso e n-1 fracassos: 
 
2. Para X = x, tem-se x sucessos e (n-x) fracassos, correspondendo às 
sequências com x algarismos 1 e n-x zeros. Cada sequência terá 
probabilidade e como há sequências distintas, tem-se: 
 
Média: 
 
20 
 
 
Variância: 
 
5.3 Distribuição de Poisson 
Consideremos a probabilidade de ocorrência de sucessos em um 
determinado intervalo. A probabilidade da ocorrência de um sucesso no intervalo é 
proporcional ao intervalo. A probabilidade de mais de um sucesso nesse intervalo é 
bastante pequena em relação à probabilidade de um sucesso. Seja X o número de 
sucessos no intervalo; temos, então: 
 
 
A distribuição de Poisson é muito usada na distribuição do número de: 
• Carros que passam por um cruzamento por minuto, durante certa hora do 
dia; 
• Erros tipográficos por página, em um material impresso; 
• Defeitos por unidade (m³, m², m, etc.) por peça fabricada; 
• Problemas de filas de espera em geral, e outros. 
Média: 
 
Variância: 
 
OBS: Muitas vezes, no uso da binomial, acontece que n é muito grande e p é 
muito pequeno. Podemos, então, fazer uma aproximação de binomial pela 
distribuição de 
 
21 
 
Poisson, da seguinte forma: 
 
 
Fonte:.abril.com.br 
5.4 Distribuição Geométrica 
Consideremos tentativas sucessivas e independentes de uma mesmo 
experimento aleatório. Cada tentativa admite sucesso com probabilidade p e 
fracasso com probabilidade q; p + q = 1. 
Seja X: número de tentativas necessárias ao aparecimento do primeiro 
sucesso. Logo, X assumem os valores: 
X = 1, que corresponde ao sucesso (S) e P (X = 1) = p; 
X = 2, que corresponde ao fracasso (F) na 1ª tentativa e sucesso na segunda, 
(FS) e 
P (X = 2) = P (F ∩ S) = q∙p; 
X = 3, que corresponde a (FFS) e P (X = 3) = P (F ∩ F ∩ S) = q ∙ q ∙ p = 
; 
X = 4, que corresponde a (FFFS) e P (X = 4) = 
E assim sucessivamente. 
 
22 
 
X = x, que corresponde a FF ... FS = x, com função de probabilidade: 
 
A variável X tem então distribuição geométrica. 
Média: 
 
Variância: 
 
5.5 Distribuição Uniforme 
É a mais simples de todas as distribuições discretas de probabilidade. É 
aquela na qual a v.a. assume todos os seus valores com a mesma probabilidade. 
Tal distribuição é chamada distribuição uniforme. A distribuição discreta uniforme é 
dada por: 
P (x,k) = 1/k = P(X = x) 
Onde x é um dos possíveis valores da v.a. X. Utilizamos aqui P (x,k) ao invés 
de p(x) para indicar que a distribuição uniforme depende do parâmetro k. Este é o 
caso mais simples de v.a. discreta, onde cada possível valor ocorre com a mesma 
probabilidade. 
 Definição: A variável aleatória discreta X, assumindo os valores x1,x2, 
..., xn , tem distribuição uniforme , se e somente se, 
, para todo i = 1, 2, ..., n. 
5.6 Distribuição Hipergeométrica 
Consideremos uma população com N elementos, dos quais r tem uma 
determinada característica (a retirada de um desses elementos corresponde ao 
sucesso). Retiramos dessa população, sem reposição, uma amostra de tamanho n. 
Seja X: número de sucessos na amostra (saída do elemento com a 
característica). 
 
23 
 
Para sabermos a função de probabilidade, consideramos que podemos 
tirar amostras sem reposição. Os sucessos na amostra podem ocorrer 
com maneiras e fracassos de modos. Logo: 
, . 
A variável X assim definida tem distribuição hipergeométrica. 
Média: 
E (X) = np 
Variância: 
Var (X) = Np (1 – p) , onde . 
6 VARIÁVEIS ALEATÓRIAS CONTÍNUAS 
Definição: 
Variável aleatória contínua é uma variável aleatória X é contínua em R se 
existir uma função f(x), tal que: 
f(x) ≥ 0 (não negativa); 
. 
A função f(x) é chamada função densidade de probabilidade (f.d.p.). 
Observamos que: 
 
(Corresponde à área delimitada pela função f (x), eixo dos X e pelas retas X 
= a e X = b). Podemos estender todas as definições de variáveis aleatórias discretas 
para variáveis contínuas. Se X é uma variável aleatória contínua, então temos a 
média e a variância sendo: 
 
A média pode ser entendida como um “centro de distribuição de 
probabilidades”. E sua variância é dada por: 
 
24 
 
, onde 
 
 
Fonte: gpp.pt 
6.1 Distribuição de variáveis aleatórias discretas: 
Distribuições contínuas são muito distintas das distribuições discretas. Nas 
distribuições discretas, as massas de probabilidade estão concentradas nos pontos 
de um conjunto enumerável. Assim, seja o experimento aleatório E com espaço 
amostral S e y uma variável aleatória com domínio S e imagem Sy. A distribuição 
de probabilidade de y é uma distribuição contínua se: 
P (y = w) = 0 para cada w ∈ Sy 
Ademais, se cada ponto tem probabilidade 0 então P (A) =0 sendo A qualquer 
subconjunto enumerável de Sy. A definição pode parecer paradoxal, mas, 
conceitualmente, é o mesmo que considerar, por exemplo, um intervalo não 
degenerado de números reais e cada ponto desse intervalo. O intervalo 
tem medida (comprimento) positiva enquanto que cada ponto tem medida 
(comprimento) nula. Como já enfatizado, as distribuições contínuas estão em total 
contraste com as distribuições discretas. Nas distribuições contínuas, a massa de 
probabilidade se dispersa continuamente sobre Sy enquanto que nas discretas ela 
 
25 
 
se concentra nos pontos de massa. A figura abaixo ilustra a continuidade do espaço 
amostral e um evento desse espaço. 
 
6.2 Distribuição Uniforme: 
Uma variável aleatória contínua X tem distribuição uniforme de 
probabilidades no intervalo [a,b] se sua f.d.p é dada por: 
 
 
Onde o valor de k é: 
 
 
Logo: 
A função de distribuição de X é dada por: 
 
Logo: 
 
26 
 
f(x) = 
E seu gráfico é: 
 
6.3 A média de X é dada por: 
E (X) = 
A Variância de X é dada por: 
VAR (X) = 
6.4 Distribuição Exponencial 
A distribuição exponencial é aplicada a dados com forte assimetria. Também 
é um caso especial da distribuição gama com λ= 1. Uma variável aleatória contínua 
X tem distribuição exponencial de probabilidade se sua f.d.p é dada por: 
 
O gráfico da f.d.p de X é: 
 
 
27 
 
A função de distribuição de X é: 
 
Logo: 
 
E o gráfico é: 
 
A média da distribuição de X é dada por: 
E (x) = 
A Variância de X é dada por: 
VAR(X) = 
6.5 Distribuição Normal 
É uma distribuição de probabilidade contínua, que é simétrica e a curva de 
frequência em a forma de um sino, a média fica no centro da distribuição e o desvio 
padrão representa a forma da curva, mais pontiaguda ou mais achatada. Uma 
variável aleatória contínua X tem distribuição normal de probabilidade se a sua f.d.p 
é dada por: 
 
O gráfico de f(x) é: 
 
28 
 
 
As principais características dessa função são: 
 O ponto máximo de f(x) é o ponto X = . 
 Os pontos de inflexão da função são X = . 
 A curva é simétrica com relação a 
 E (X) = e VAR (X) = 
Demonstra-se que 
 
Se quisermos calcular a probabilidade indicada na figura, devemos fazer: 
, que representa um grau relativo de 
dificuldade. Usaremos a seguinte notação: 
X: N( 
X tem distribuição normal com média e variância 
Seja X: N( , definimos: 
Z= 
Demonstra-se que Z também tem distribuição normal. Z é chamada de 
Variável Normal Reduzida, Normal Padronizada ou Variável Normalizada. 
Mostraremos que E (Z) = 0 e VAR (Z) = 1 
E (Z) = E = E(X- ) = = 0 
 
29 
 
VAR (Z) = VAR = VAR(X- ) = = 1 
Logo, se: 
X: N( , teremos Z : N(0,1) 
A f.d.p de Z é 
Essa curva é também simétrica com relação à . 
Verificaremos agora a correspondência entre X e Z por meio de exemplo: 
Seja X: N (20,4). Achar os valores reduzidos correspondentes a = 14, = 
16, = 18, = 20, = 22, = 24 e = 26. 
Se X: N(20,4) Z = = 
 = 14 
 = -3 
 = 16 
 = -2 
 = 18 
 = -1 
 = 20 
 = 0 
 = 22 
 = 1 
 = 24 
 = 2 
 = 26 
 = 3 
 
30 
 
Graficamente: 
 
 
Concluímos que a variável Z indica quantos desvios padrões a variável X está 
afastada da média. Como as curvas são simétricas em relação às médias. 
 
 
 
 
Também concluímos que se X: N( , então : 
 
31 
 
 
 
 
Pois: 
 = 
E 
= 
Onde 
= e = 
6.6 Distribuição do tipo Gama 
Por ser um caso geral da distribuição exponencial e da distribuição qui-
quadrado, a distribuição gama, à semelhança da distribuição normal, tem grande 
importância tanto na teoria estatística (como distribuição de 
probabilidade de estatísticas) quanto nas aplicações da metodologia estatística 
(como distribuição associada a populações estatísticas), fornecendo uma 
representação útil para muitas situações físicas. 
Como a soma de variáveis exponenciais independentes tem distribuição 
gama, torna-se adequada para a teoria dos contadores aleatórios e 
outros processos estocásticos associados com o tempo, em particular, aqueles 
 
32 
 
relativos às precipitações meteorológicas e aos estudos envolvendo tempos de vida 
de componentes. 
 
Fonte: gti.projetointegrador.com.br 
A distribuição gama é apropriada para modelar o tempo requerido para o 
acontecimento de exatamente α eventos independentes que ocorrem a uma taxa 
constante λ. Por exemplo, o tempo para falha de um sistema é uma variável gama 
se essa falha ocorre após exatamente α falhas menores, ocorrem 
independentemente a uma taxa constante λ. Essa característica torna a distribuição 
gama importante na modelagem estatística de problemas de fila, que trata com 
tempos em linhas de espera e tempos de serviço. Observa-se também que α e λ 
são parâmetros importantes no contexto. 
A distribuição gama é o caso geral de distribuições importantes, mas, ela 
própria, é um caso particular de outras famílias de distribuições. Mais 
especificamente, ela pertence à família exponencial ao tipo III da família 
personiana de distribuições e é também denominado como distribuição de Pearson 
tipo III. Em estudos hidrológicos é prática comum a utilização dessa distribuição 
para modelar o logaritmo da variável. Nesse caso, recebe o nome log-Pearson tipo 
III. 
 
33 
 
A distribuição gama, na sua forma mais geral, possui três parâmetros: 
um parâmetro de deslocamento θ, um parâmetro de dispersão β e um parâmetro de 
formato β, todos positivos. Nesse caso, a indicação é: 
y ~ Gama (θ, β, α) 
A figura abaixo ilustra a distribuição para α = 2, β = 1 e θ = (0, 2, 4). 
 
A distribuição é nula no parâmetro de deslocamento e tem um único ponto 
de máximo em w = θ + β(α - 1). No caso de um parâmetro a moda ocorre em w = α 
- 1, com α ≥ 1. A distribuição gama pertence à família localização-dispersão. Desse 
modo, fazendo x = y - θβ , então: 
x ~ Gama (α) 
é a forma padrão da distribuição gama e resta apenas o parâmetro de 
formato. Se α ≤ 1 a distribuição tem o formato de um J invertido, ou seja, cresce 
indefinidamente quando w→0 e decresce mono tonicamente quando w → ∞. A 
figura que segue ilustra a forma padrão (θ = 0 e β = 1) para α = 1/3, 1/2, 1, 2, 4, 6. 
 
34 
 
 
Outra forma comum inclui os parâmetros de dispersão e formato, ou seja, 
θ=0. Nesse caso, a distribuição é representada como: 
y ~ Gama (α , β) 
A figura que segue ilustra a distribuição gama com α = 2 e β = 2, 4, 6. 
 
Em algumas situações, ao invés do parâmetro de dispersão β, é utilizado o 
parâmetro de taxa λ=1/β. 
Função de probabilidade: 
 
Média: 
 
 
35 
 
Variância: 
 
6.7 Distribuição do tipo Qui-Quadrado 
A distribuição qui-quadrado é uma distribuição contínua de grande 
importância para a inferência estatística. É uma distribuição que surge no contexto 
de somas de quadrados de variáveis aleatórias com distribuição normal. Uma 
variável qui-quadrado aparece em numerosas situações da inferência estatística: 
 
Fonte: www.ime.unicamp.br 
- Análise de tabelas de contingência. 
- Verificação da qualidade de ajustamento de modelos 
estatísticos e modelos probabilísticos aos dados estatísticos. 
- Serve como base para obtenção de outras distribuições relevantes 
da estatística clássica, como a distribuição F e a distribuição t. 
- Aproximação para muitos procedimentos de inferência na estatística não 
paramétrica. 
Uma variável qui-quadrado é a soma das variáveis aleatórias 
independentes com a distribuição normal padrão. Assim, a função de densidade da 
distribuição qui-quadrado pode ser obtida considerando-se a distribuição de q = z2, 
quando z ~ N (0,1), ou seja, quando z tem distribuição normal padrão. 
Posteriormente, pode-se considerar a distribuição de q = 
z12+z22 quando , j∈1:2 e, finalmente, quando 
 
36 
 
 quando N(0,1), j∈1: ν 
Nesse caso, diz-se que q tem distribuição qui-quadrado com ν graus de 
liberdade e representa-se como: 
q ~ χ2(ν) 
Função probabilidade quando α = υ/2 e β = 2, com v > 0 inteiro: 
 
Média: 
E (q) = ν 
Variância:2 
 
7 DISTRIBUIÇÕES DE PROBABILIDADES CONTÍNUAS E DISCRETAS 
As distribuições de probabilidade podem ser distribuições de probabilidades 
contínuas ou distribuições de probabilidade discretas, dependendo se eles definem 
probabilidades para variáveis contínuas ou discretas. 
7.1 O que é a distribuição contínua? 
A distribuição contínua descreve as probabilidades dos possíveis valores de 
uma variável aleatória contínua. Uma variável aleatória contínua é uma variável 
aleatória com um conjunto de valores possíveis (conhecidos como a intervalos) que 
é infinito e incontável. 
As probabilidades de variáveis aleatórias contínuas (X) são definidas como a 
área sob a curva da sua distribuição. Assim, apenas as faixas de valores podem ter 
 
2 Texto de: Max Vinnicius Medeiros Dias. Extraído: www.ebah.com.br 
 
37 
 
uma probabilidade diferente de zero. A probabilidade de que uma variável aleatória 
contínua seja igual a algum valor é sempre zero. 
7.2 Exemplo da distribuição de pesos 
A distribuição normal contínua pode descrever a distribuição de peso de 
indivíduos do sexo masculino adultos. Por exemplo, você pode calcular a 
probabilidade de que um homem pesa entre 160 e 170 libras. 
 
Gráfico da distribuição do peso de adultos do sexo masculino 
A região sombreada sob a curva, neste exemplo, representa o intervalo entre 
160 e 170 libras. A área deste intervalo é 0,136; por conseguinte,a probabilidade 
de um homem selecionado aleatoriamente pesar entre 160 e 170 libras é de 13,6%. 
Toda a área sob a curva equivale a 1,0. 
No entanto, a probabilidade de que X seja exatamente igual a algum valor é 
sempre zero porque a área sob a curva em um único ponto, que não tem nenhuma 
largura, é zero. Por exemplo, a probabilidade de um homem pesar exatamente 190 
libras para a precisão infinita é zero. 
É possível calcular uma probabilidade não nula de que um homem pese mais 
do que 190 libras, ou menos do que 190 libras, ou entre 189,9 e 190,1 libras, mas 
a probabilidade de que ele pesa exatamente 190 libras é zero. 
 
38 
 
7.3 O que é a distribuição discreta? 
Uma distribuição discreta descreve a probabilidade de ocorrência de cada 
valor de uma variável aleatória discreta. Uma variável aleatória discreta é uma 
variável aleatória que tem valores contáveis, como uma lista de inteiros não 
negativos. 
Com uma distribuição de probabilidade discreta, cada valor possível da 
variável aleatória discreta pode ser associado a uma probabilidade diferente de 
zero. Deste modo, uma distribuição de probabilidade discreta é, por vezes, 
apresentada em forma de tabela. 
 
Fonte: engproducaoconceitual.blogspot.com 
7.4 Exemplo do número de reclamações de clientes 
Com uma distribuição discreta, ao contrário de uma distribuição contínua, é 
possível calcular a probabilidade de que X é exatamente igual a algum valor. Por 
exemplo, você pode usar a distribuição discreta de Poisson para descrever o 
número de reclamações de clientes em um dia. Suponha que o número médio de 
reclamações por dia seja de 10 e você queira saber a probabilidade de receber 5, 
10 e 15 reclamações de clientes em um dia. 
 
39 
 
x P (X = x) 
5 0,037833 
10 0,12511 
15 0,034718 
 
Também é possível visualizar uma distribuição discreta em um gráfico de 
distribuição para ver as probabilidades entre intervalos. 
 
 
 
Gráfico de distribuição enredo do número de reclamações de clientes 
A barra sombreada neste exemplo representa o número de ocorrências 
quando as reclamações de clientes diárias forem 15 ou mais. As alturas das barras 
somam 0,08346; por conseguinte, a probabilidade de que o número de chamadas 
por dia seja de 15 ou mais é 8,35%.3 
 
3 Texto extraído: www.support.minitab.com 
 
40 
 
8 REGRESSÃO E CORRELAÇÃO 
8.1 Correlação 
É o estudo do grau de associação entre variáveis. Na correlação interessa 
observar se duas ou mais variáveis são independentes ou variam juntas. 
- Tamanho do braço ou tamanho da perna em uma população de mamíferos. 
- Conteúdo de colesterol no sangue e peso de pessoas de mesma idade e 
sexo. 
- Estatura dos pais e estatura dos filhos de pessoas de mesma raça. 
- Renda e consumo por faixa de salário. 
- Preço e Demanda. 
- Produção agrícola e fertilizante, etc., 
Como o objetivo da análise de correlação é medir a intensidade de relação 
entre as variáveis, devemos estar atentos aos princípios desta relação. Nas 
correlações supostamente lógicas, as relações causais se compreendem 
claramente. 
Nas chamadas correlações ilusórias não se encontra nenhuma conexão 
razoável entre as variáveis. Assim o tamanho de uma população de insetos pode 
estar correlacionado com a altura de algum tipo de erva ou, pode ser simplesmente 
uma função do tempo. 
Pode não haver relação ecológica entre as plantas e os insetos. A população 
de insetos pode depender de outras variáveis que não necessariamente a altura 
das ervas. 
Tipos de Correlação: 
Correlação Simples – quando se estuda o grau de relação entre duas 
variáveis, sendo uma dependente (Yi) e outra independente (Xi). 
Correlação Múltipla – quando se estuda o grau de relação simultânea entre 
a variável dependente e duas ou mais variáveis independentes. 
 
41 
 
Correlação Parcial – no caso de uma relação múltipla, quando se estuda a 
relação pura entre duas variáveis, depois de eliminada estatisticamente a influência 
de outras variáveis independentes. 
8.2 Correlação linear 
Investiga a existência de associação entre duas variáveis, isto é, o grau de 
inter-relacionamento entre a variável dependente e a independente. Porém 
devemos ficar atentos que a correlação linear simplesmente comprova uma 
variação concomitante entre duas variáveis, não significando, a priori, que uma é 
causa da outra, visto que muitas outras variáveis, não consideradas no estudo, 
podem afetar o comportamento da variável dependente. 
De acordo com a relação entre as variáveis esta correlação pode ser: 
Direta ou Positiva – quando a variável dependente está diretamente 
relacionada com a variável independente. Ex.: Renda e Consumo. 
Indireta ou Negativa – quando a variável dependente tem relação 
inversamente proporcionalmente com a variável independente. Ex.: Preço e 
Demanda. 
 Nula – quando não há inter-relação entre as variáveis. 
 
O diagrama de dispersão indica a forma da relação entre as variáveis 
estudadas e proporciona uma ideia sobre as funções de regressão a serem 
utilizadas. A depender da relação entre as variáveis, os pontos observados, às 
vezes, se encontram, relativamente, próximos da linha de regressão e em outras 
situações bastante disseminados em torno dela. 
 
42 
 
Para melhor quantificar está “aproximação” é necessário determinar um 
coeficiente de correlação entre as variáveis. 
Porém não devemos interpretar a palavra “correlação” como a que quantifica 
uma relação de causa (Ex: emissão do Banco Central) e efeito (Ex: índice de preços 
ao consumidor). O valor obtido assinala unicamente uma relação funcional em 
determinado conjunto de dados. 
8.3 Medidas de correlação 
Coeficiente de Correlação (r) é a medida estatística que dimensiona o grau 
de relação entre duas ou mais variáveis. 
 
O coeficiente de correlação, também, pode ser calculado através do estudo 
das variâncias. A variância total (σt 2) é a soma da variância explicada (σe 2) mais a 
variância residual (σr 2), isto é: σt 2 = σe 2 + σr 2. 
Dividindo ambos os membros da equação pela variância total temos: 
1 = σe 2 /σt 2 + σr 2 /σt 2. A razão σr 2 /σt 2 corresponde ao coeficiente de 
alienação (k2) e mede o grau de afastamento entre as variáveis, enquanto que σe 
2 /σt 2 mede o grau de aproximação existente entre as variáveis, sendo conhecido 
por coeficiente de determinação (r2). 
Neste caso podemos encontrar o coeficiente de correlação a partir do 
coeficiente de determinação, isto é: 1 = r2 +K2 ⇒ r2 = 1 – k2 ⇒ r = √1 – k2. 
Existindo uma perfeita relação entre as variáveis o coeficiente de 
determinação (r2) é igual a um (1), enquanto o de alienação é zero. O coeficiente 
de correlação pode, no máximo, ser igual a ± 1. Isto é: √1 – k2 ⇒ r = √1 – 0 ⇒ r = ± 
1, compreendendo valores no intervalo: – 1 ≤ r ≤ 1. 
Para: r =1 ou r = –1 ⇒ perfeita correlação positiva ou negativa. 
 
43 
 
Para: r = 0,5 ou r = – 0,5 ⇒ regular correlação positiva ou negativa. 
A medida que o valor de r se aproxima de 1 ou de –1 a correlação entre as 
variáveis vai se tornando forte. Quando r tende para “zero” a correlação passa a ser 
fraca. Quando r = 0 não existe a correlação procurada (correlação nula), podendo, 
no entanto, existir outro tipo de correlação, razão pela qual devemos ser bastante 
cautelosos quando afirmarmos da inexistência de correlação entre variáveis. 
Equação de Regressão da variável dependente (função linear). 
 
Exemplo: calcular o coeficiente de correlação entre altura (Xi ) e peso (Yi ) de 
uma amostra de 10 estudantes universitários. Estimar o peso de um estudante com 
196 cm de altura. 
 
 
44 
 
 
Coeficientes de Correlação 
 
Equação de Regressão 
 
Peso esperado para um estudante com 196 cm de altura. 
Ýi = – 69,4 + 0,88 (196) ⇒ Ýi ≅ 90kg 
Avaliação da Estimativa 
Variância Total: st 2 =18,9333 
Variância Residual: sr 2= 4,4733 
Variância Explicada:se 2= 14,4600 
Coeficiente de Variação Residual: Cr = 3,05% 
Coeficiente de Determinação: r2 ≅ 0,7744 ≅ 77,44 
8.4 Regressão 
É o estudo do comportamento de uma variável dependente (Yi) em função 
da variação de uma ou mais variáveis independentes (Xi, Zi, Wi, ...) supondo que 
estas variáveis estão numa relação de causa e efeito. Regressão Linear: A relação 
funcional entre as variáveis implica na possibilidade de estimar o valor de uma 
 
45 
 
variável, dado o valor da outra, de acordo a função matemática que apresente 
melhor aderência aos dados observados. 
Convém, porém, observar que em algumas situações, as relações entre as 
variáveis podem não estar sujeita a uma relação de causa e efeito. Por uma simples 
relação acidental ambas podem ser função de uma causa comum que as afeta. Isto, 
porém, não tira a importância que tem a regressão no estudo do relacionamento 
entre variáveis. 
 
Fonte: mazeberry.com 
 É preciso apenas cuidado e nos casos mais difíceis de identificação da 
relação, pode-se optar por uma regressão múltipla, para maior segurança de análise 
e das projeções a serem efetuadas. 
Na regressão a variável independente (Xi) se mede sem erro. Ela não varia 
ao acaso, está sempre ao controle do investigador. Somente a variável dependente 
(Yi) é que é aleatória, e está sujeita a pequenas variações (afastamentos) a 
depender do grau de relação entre as variáveis e do modelo de regressão utilizado. 
Assim a dosagem de certo tipo de droga (Xi) aplicada em pacientes, está 
sobre o controle do pesquisador, porém a pressão sanguínea (Yi) é aleatória, 
dependendo, portanto, da relação causa-efeito entre as variáveis. 
A determinação de uma equação de ajuste depende do comportamento dos 
dados, inicialmente observados pelo diagrama de dispersão entre as variáveis, com 
conclusão assegurada pelo “critério dos mínimos quadrados” que indica como 
 
46 
 
melhor função ajustaste aquela que minimiza a soma dos quadrados das diferenças 
entre os valores observados (Yi) e os estimados (Ýi) pelas respectivas funções: ∑ 
(Yi – Ýi) 2 = mínimo. Isto é, quanto menor a variância residual, melhor a equação 
ajustaste. 
Na regressão ente duas variáveis as principais relações a serem estudadas 
são: 
Yi = a + bXi; Yi ⇒ a. bXi; Yi ⇒ a + bXi + c Xi 2; Yi ⇒ a. Xi b etc. 
Uma vez especificada a forma de relação entre as variáveis, deve-se estimar 
os coeficientes da função, obtendo assim a equação de Regressão. Para isto é 
preciso ter informações acumuladas (mínimo de 10 itens) das variáveis estudadas 
para se descobrir a tendência de seu comportamento (regularidade); e, dessa 
forma, escolher qual dos modelos existentes de regressão é o mais apropriado. 
Algumas funções ajustastes podem ser identificadas pelas diferenças entre 
os valores observados da variável dependente. Se as primeiras diferenças: (Y2 – Y1 
); (Y3 – Y2 ); ... ;(Yn – Yn-1) forem mais ou menos constantes, dizemos que a variável 
se ajusta a uma reta. No caso das segundas diferenças se apresentarem mais ou 
menos constantes, a variável se ajusta a uma parábola do segundo grau. 
O diagrama de dispersão também nos fornece boa orientação do tipo de 
função que melhor se ajusta aos dados. Porém, a decisão final, quanto à melhor 
função ajustaste depende do coeficiente de variação residual e/ou do coeficiente de 
determinação, visto que a medida de aderência é representada pela minimização 
dos resíduos entre os valores observados e os estimados pela função de regressão. 
Conhecida a equação ajustaste e reconhecida a sua máxima aderência, isto 
é: menor variância residual podemos fazer previsões do comportamento da variável 
dependente para os próximos períodos da série estudada. Mesmo assim é preciso 
muita cautela, tendo em vista a multiplicidade de fatores que podem influir nos 
resultados obtidos pela regressão. 
Por exemplo: a produção agrícola não depende apenas da pluviometria, 
outros fatores como: qualidade das sementes, esgotamento do solo, fertilizantes, 
etc., podem influir decisivamente no volume de produção, fatos que na realidade 
desprezamos quando aplicamos a regressão linear. 
 
47 
 
Tais advertências, no entanto, não invalidam as relações de dependência 
entre duas variáveis, mas simplesmente chamam nossa atenção para os cuidados 
que devemos ter com as estimativas. 
Consideremos a representação gráfica do diagrama de dispersão. 
 
Como os desvios di podem ser positivos ou negativos caso estejam os pontos 
observados, respectivamente, acima ou abaixo da função ajustaste consideram-se 
então os quadrados de di para cálculo do afastamento médio, neste caso 
representado pelo desvio padrão residual. 
Note-se que a função ajustaste quase nunca contém os dados observados, 
mas deve representar com grande aproximação, o conjunto desses pontos, isto é, 
deve representar o comportamento da série observada. Para termos uma boa 
regressão é importante levarmos em conta as seguintes considerações: 
1. Quanto maior o número de observações, tanto melhor será a estimativa 
obtida. 
2. Os métodos de ajustamento são válidos para dados isentos de 
tendenciosidade. 
3. Escolher sempre a melhor função ajustaste de acordo com os critérios já 
estabelecidos, pelo método dos mínimos quadrados, onde: ∑ (Yi – Ýi) 2 é mínimo. 
 
48 
 
Regressão da linha reta ⇒ Yi = α + β Xi 
É indicada quando a representação dos pontos observados em um diagrama 
de dispersão apresenta uma seqüência retilínea. 
Para determinar os coeficientes “a” e “b” recorre-se ao método dos mínimos 
quadrados ∑ (Yi – Ýi) 2 = mínimo. Sendo: Yi = valor observado; Ýi = valor estimado 
pela equação de regressão. 
Substituindo Ýi (por a + bXi) na equação ∑ (Yi – Ýi) 2 = mínimo e derivando 
parcialmente a equação em relação aos coeficientes “a” e “b” encontramos um 
sistema de equações, que nos permite estimar os coeficientes da equação de 
regressão. 
 
Para que Z seja mínimo as derivadas parciais devem ser iguais a zero. 
 
Exemplo: consideremos os dados relativos a quantidade de fertilizante 
utilizada (Xi) e a produção obtida (Yi) de soja em determinado município, conforme 
tabela a seguir: 
Para termos uma ideia inicial do modelo de regressão a ser utilizado, 
elaboramos o diagrama de dispersão das variáveis. Pela tendência apresentada 
vamos trabalhar uma função linear, cujos coeficientes podem ser obtidos pelas 
equações normais ou pelos desvios reduzidos das respectivas variáveis. 
 
49 
 
 
 
 
 
50 
 
 
A função linear Ýi = 32,86 + 0,068Xi - fornece a relação entre a produção 
obtida (Yi) e a quantidade de fertilizante empregada (Xi). Este modelo pode ser 
utilizado para estimar a variável dependente de acordo com o comportamento da 
variável independente. Isto é, admitindo a utilização de 800 kg de fertilizante por ha 
a produção esperada de soja é de 87 toneladas. 
Para melhor avaliar se as equações ajustam-te encontrada é a opção mais 
adequada, devemos calcular a o erro de estimativa por intermédio do desvio padrão 
residual e comparar com a de outros modelos de regressão. A função que 
apresentar menor erro de estimativa, isto é: menor Coeficiente de Variação Residual 
é a melhor opção. 
Variância residual: é calculada entre os valores observados e estimados da 
variável dependente, para um mesmo período. A raiz quadrada deste valor 
representa o Erro Padrão de estimativa ou Desvio Padrão Residual. 
 
Coeficiente de Variação Residual Cr = sr / Y 
Variância Explicada – é calculada entre os valores estimados da variável 
dependente e a média dos valores observados: 
 
Variância Total – é calculada entre os valores observados da variável 
dependente e sua respectiva média. A variância total é igual à variância explicada 
mais a variância residual. 
 
51 
 
 
Estas duas últimas variâncias fornecem condições para cálculo do 
coeficiente de determinação (r2) que pode comprovar a existência ou não deboa 
correlação e regressão entre as variáveis observadas. O coeficiente de 
determinação indica quantos por cento a variação explicada pela regressão 
representa da variação total. Isto é, este coeficiente indica o grau de explicação do 
modelo proposto, onde: 0 ≤ r2 ≤ 1. 
No caso em que r2 = 1, todos os pontos observados se situam “exatamente” 
sobre a reta de regressão. Diremos então que o ajuste é perfeito, isto é, as variações 
de Yi são 100% explicadas pelas variações de Xi, não havendo, portanto desvios 
em torno da função estimada. 
Por outro lado, se r2 = 0, concluiremos que as variações de Yi são 
exclusivamente aleatórias, isto é: a variável Xi não tem nenhuma participação sobre 
as variações de Yi. 
Exemplo: Ajustar a Função Linear ao consumo residencial de energia elétrica 
no Estado de Sergipe (1987 – 96) e projetar este consumo para 1997, 1998 e 1999. 
 
52 
 
 
 
Coeficientes da Reta 
 
Estimativa do consumo residual de energia elétrica. 
Ý97 = 463 (1000 Mwh); Ý98 = 488 (1000 Mwh) e Ý99 = 512 (1000Mwh). 
Uma característica a ser observada nas estimativas é que a soma dos valores 
ajustados sempre é igual à soma dos valores observados: ∑Ýi = ∑Yi. 
Avaliação das Estimativas 
- Variância Residual: sr 2 = ∑ (Yi – Ýi) 2 / (n – 1) = 5652/9 = 628,00 
- Desvio Padrão Residual: = sr = 25,0599 
 
53 
 
 - Coeficiente de Variação Residual (erro de estimativa): Cr = sr / Y Cr = 
25,0599/9 = 7,64% 
- Variância Total: st 2= ∑ (Yi – Yi) 2 / (n – 1) = 55215,60/9 ⇒ st 2 = 6135,07 
- Variância Explicada: se 2 = 5.507,07 
 - Coeficiente de Determinação: r2 = se 2 /st 2 ⇒ r2 = 0,8976 = 89,76%4 
 
 
Fonte: luteranos.com.br 
9 TEORIA DA ESTIMAÇÃO 
Um dos métodos para realizar inferências a respeito dos parâmetros é a 
estimação, que determina estimativas dos parâmetros populacionais. Consiste em 
utilizar dados amostrais para estimar (ou prever) os valores de parâmetros 
populacionais desconhecidos, tais como média, desvio padrão, proporções, etc. 
Existem dois tipos de estimação de um parâmetro populacional: estimação 
por ponto e a estimação por intervalo. 
 
4 Texto extraído: www.cesadufs.com.br 
http://www.luteranos.com.br/
 
54 
 
9.1 Estimação por ponto 
É a estimativa de um parâmetro populacional dada por um único número. A 
partir das observações, usando o estimador, procura-se encontrar um valor 
numérico único (estimativa) que esteja bastante próximo do verdadeiro valor do 
parâmetro. 
Este procedimento não permite julgar a magnitude do erro que podemos 
estar cometendo, mas a distribuição por amostragem dos estimadores torna 
possível o estudo das qualidades do estimador. 
Na estimativa pontual, raramente os estimadores estatísticos coincidem com 
os valores populacionais. Assim, é importante delimitar a faixa de valores onde o 
parâmetro populacional deve ser procurado. Isso ocorre através das estimativas 
intervalares. 
Estimadores pontuais dos principais parâmetros populacionais: 
 
 
9.2 Estimação por intervalo 
Essa estimativa consiste em uma amplitude (ou um intervalo) de valores, no 
qual se admite esteja o parâmetro populacional. 
 
55 
 
Procura determinar um intervalo que contenha o valor do parâmetro 
populacional, com certa margem de segurança. Este procedimento permite julgar a 
magnitude do erro que podemos estar cometendo. 
9.3 Intervalo de Confiança 
Quando se constrói um intervalo de confiança são determinados dois limites 
entre os quais se espera estar o parâmetro da população, de acordo com um risco 
conhecido de erro (ou nível de confiança). 
As informações sobre a precisão de uma estimativa de intervalo são 
transmitidas pela sua extensão. Se o nível de confiança for alto e o intervalo 
resultante, bastante restrito, o conhecimento do valor do parâmetro será 
razoavelmente preciso. Um intervalo de confiança muito amplo passa a ideia de que 
há muita incerteza com relação ao valor que estamos estimando. 
Com base na amostra, uma maneira de expressar a precisão da estimação 
é calcular os limites de um intervalo, o Intervalo de Confiança (IC), tais que (1 – α) 
seja a probabilidade de que o verdadeiro valor do parâmetro esteja contido nele. 
Portanto: 
α = grau de desconfiança, nível de incerteza ou nível de significância. 
1-α = coeficiente de confiança ou nível de confiabilidade; 
Os valores de α mais utilizados são: 
α = 0,10 →(1 – α) = 0,90 ou 90% 
α = 0,05 →(1 – α) = 0,95 ou 95% 
α = 0,01 →(1 – α) = 0,99 ou 99% 
Estima-se que o verdadeiro valor do parâmetro estará contido em (1 – α). 
Algumas estimativas intervalares incluem e outras não incluem o verdadeiro valor 
do parâmetro da população. Ao se retirar uma amostra e calcular um intervalo de 
confiança não se sabe, na verdade, se o parâmetro da população se encontra 
naquele intervalo calculado. O importante é saber que se está utilizando um método 
com (1 – α) de probabilidade de sucesso. 
 
56 
 
9.4 Intervalo de confiança para a média quando a variância é conhecida 
Utiliza-se quando por quantidade de medidas ou por conhecimento histórico 
do processo de medida, o valor do desvio padrão está perfeitamente estabelecido 
de modo que o mesmo pode ser considerado como desvio padrão da população. 
Para grandes amostras, utiliza-se a seguinte fórmula: 
 
Para populações finitas, utiliza-se a seguinte fórmula: 
 
Intervalo de confiança para a proporção (grandes amostras) 
 
 
Para populações finitas o IC será:5 
 
 
5 Texto de: Professor Alexandre. Extraído: www.alexandreprofessor.blogspot.com 
 
57 
 
10 NOÇÕES DE AMOSTRAGEM 
10.1 MOTIVAÇÃO 
Raramente se consegue obter a distribuição exata de alguma variável, ou 
porque isso é muito dispendioso, ou muito demorado ou às vezes porque consiste 
num processo destrutivo. 
Conceitos preliminares 
● População: Conjunto dos elementos a serem estudados 
● Amostra: Subconjunto da população 
● Amostragem: Processos de obtenção de uma amostra a partir de uma 
população 
10.2 Métodos de Amostragem 
A amostragem será probabilística se todos os elementos da população 
tiverem probabilidade conhecida, e diferente de zero, de pertencer à amostra. Caso 
contrário, a amostragem será não-probabilística 
Métodos Probabilísticos 
● Aleatória Simples; 
● Sistemática; 
●. Estratificada; 
● Áreas 
● Conglomerados; 
 A grande vantagem deste método é que os resultados obtidos na pesquisa 
podem ser projetados para a população total. 
Amostragem Aleatória Simples 
Dado um conjunto, enumeramos seus elementos e realizamos um sorteio, os 
elementos sorteados constituirão nossa amostra. Podem ser com ou sem repetição 
dos elementos. 
 
58 
 
10.3 Amostragem Aleatória Simples 
Procedimentos: 
1. Enumerar os N elementos da população; 
2. Sortear, sem reposição, n números compreendidos entre 1 a N; 
3. Os elementos correspondentes aos números escolhidos formarão a 
amostra de n elementos. 
10.4 Amostragem Sistemática 
 
Dado um conjunto de elementos ordenados retiramos periodicamente um 
elemento para a amostra. (Não recomendada para eventos sazonais) Ex.: Linhas 
de montagem. 
1. Definir a quantidade de elementos da amostra 
2. Obter um intervalo de amostragem K 
3. Sortear um número r inteiro entre 1 e K. 
4. A amostra será composta pelos elementos na ordem: (r, r + k, r + 2k …) 
10.5 Amostragem Estratificada 
Quando uma população pode ser dividida em subgrupos (estratos) que são 
mais ou menos homogêneos. Após a determinação dos estratos, seleciona-se uma 
amostra aleatória simples de cada estrato. 
 
59 
 
1. Amostragem Estratificada Proporcional: A proporcionalidade do tamanho 
de cada estrato da população é mantida na amostra. 
2. Amostragem Estratificada Uniforme: Selecionamos o mesmo número de 
elementos em cada estrato. É o processo usual quando se deseja comparar os 
diversos estratos. 
Procedimentos:1. Dividir a população em L subpopulações chamadas estratos. 
2. Calcular a fração f da amostragem dada por f = n/N 
3. Calcular o número de elementos a serem sorteados em cada estrato n1 = 
N1. f 
4. Realizar a amostragem aleatória simples dentro de cada estrato 
Amostragem por Áreas 
A população é dividida em áreas, a partir das áreas coletaremos as amostras. 
10.6 Amostragem por Conglomerados 
A população é dividida em conglomerados, onde cada conglomerado é 
representativo da população. Selecionamos aleatoriamente um conjunto de 
conglomerados e a amostra é constituída por todos os elementos dos 
conglomerados selecionados. Quanto mais heterogeneidade melhor. 
 
Suponha que se pretende estudar o nível de satisfação dos trabalhadores 
têxteis, das empresas do Norte do País. Método AAS nos conglomerados. 
Procedimentos: 
1. Há vários estágios de seleção até atingirmos a população desejada para 
o estudo; 
 
60 
 
2. Em cada estágio utiliza-se um tipo de seleção probabilística. (Normalmente 
AAS); 
Conglomerados v.s Estratificada 
A principal diferença entre a amostragem de conglomerados e a amostragem 
estratificada é a unidade de amostragem. 
● Conglomerados: Todos os conglomerados existentes; (Todas as cidades, 
empresas, etc.) 
●. Estratificada: Os elementos da população; 
Métodos não-probabilísticos 
●. Acidental; 
● Julgamento ou Intencional; 
● Quotas; Generalização é cercada de cuidados! 
10.7 Amostragem Acidental (Conveniência) 
Os elementos da amostra são escolhidos por serem os mais acessíveis ou 
fáceis de serem avaliados. Ex.: Pesquisas de opinião entre amigos 
10.8 Amostragem Julgamento ou intencional 
Consiste na escolha dos elementos da amostra por um especialista no 
assunto, que seleciona os elementos que julga os mais apropriados e 
representativos para o estudo em questão.6 
10.9 Amostragem por Quotas 
Análogo ao método de amostragem estratificada, porém sem a aleatoriedade 
das amostras. Normalmente escolhidos por conveniência. Ex.: Pesquisas de 
intenção de voto. 
 
6 Texto extraído: www.nbcgib.uesc.br 
 
61 
 
1. Classificação da população em termos de propriedades que se sabe, ou 
presume, serem relevantes para a característica a ser estudada; 
2. Determinação da proporção da população para cada característica, com 
base na constituição conhecida, presumida ou estimada, da população; 
3. Fixação de cotas para cada entrevistador a quem tocará a 
responsabilidade de selecionar entrevistados, de modo que a amostra total 
observada ou entrevistada contenha a proporção de cada classe tal como 
determinada no segundo passo. 
 
 
Fonte: datalyzer.com.br 
11 TESTES DE HIPÓTESES 
Em geral, intervalos de confiança são a forma mais informativa de apresentar 
os achados principais de um estudo. 
Contudo, algumas vezes existe um particular interesse em decidir sobre a 
verdade ou não de uma hipótese específica (se dois grupos têm a mesma média ou 
não, ou se o parâmetro populacional tem um valor em particular ou não). 
Os Testes de hipóteses fornecem-nos uma estrutura para que façamos isto. 
Veremos que intervalos de confiança e testes de hipóteses estão intimamente 
relacionados. 
http://www.datalyzer.com.br/
 
62 
 
Exemplo: 
Um pesquisador deseja responder a seguinte pergunta: 
Os pássaros migratórios engordam antes de migrar? 
Considere os dados coletados por um ornitologista sobre o uso de um 
determinado lugar para engorda por pássaros de uma certa espécie. 
Pode-se perguntar se em média estes pássaros engordam entre agosto e 
setembro. 
Somente 10 pássaros foram capturados e seu peso médio nas duas ocasiões 
foram 11.47 e 12.35 então o peso médio aumentou para esta amostra em particular. 
(Note que o mesmo conjunto de pássaros foram medidos ambas as vezes.) 
Podemos generalizar para o resto dos pássaros que não foram capturados? 
Será que esta diferença poderia ser devida simplesmente ao acaso? 
Em termos estatísticos queremos testar a hipótese nula ou de nulidade (H ) 
de que, em média, não existe mudança no peso dos pássaros. 
Assumiremos que os 10 pássaros foram uma amostra aleatória de todos os 
pássaros migradores daquela espécie e usaremos primeiramente o que 
aprendemos sobre intervalos de confiança para responder nossas perguntas. 
Primeiro vamos calcular as mudanças de peso (setembro-agosto): 
 
Seja a mudança média de peso na população. Então nossa hipótese nula 
H e a hipótese alternativa H podem ser escritas como segue: 
 
Um procedimento útil é calcular um intervalo de confiança para a média 
populacional , e verificar se o intervalo inclui 0 como um valor plausível. 
Alternativamente, pode-se proceder da seguinte forma: 
Denotando pôr as diferenças de peso e tem-se 
que e , então o erro padrão da diferença de peso média é 
 
 
63 
 
e um valor- de 2.262 é obtido da coluna e linha . 
Um intervalo de confiança de 95% para é portanto 
 
O intervalo não conte o valor 0, fornecendo evidências contra a hipótese nula. 
Podemos dizer que existem evidências significativas ( ) de que, em 
média, os pássaros da espécie estudada mudam de peso de Agosto para Setembro; 
ou que estamos 95% confiantes de que em média os pesos aumentam por um 
montante entre 0.12 e 1.64 gramas. 
Mas e o intervalo de 99%? Será que ele conteria o valor 0? Este intervalo 
seria mais amplo e então é mais provável que ele contenha 0. Se ele não incluir 0, 
isto indicaria uma evidência ainda mais forte contra . 
Calculando o intervalo de confiança exatamente da mesma forma, exceto 
que desta vez precisamos olhar na coluna para obter : 
 
Como esperado, este é mais amplo, e agora inclui o valor 0. 
Podemos agora dizer: “não existem evidências significativas ao nível de 1% 
de que, em média, os pássaros da espécie estudada mudam de peso de agosto 
para setembro. ” 
O que nós acabamos de fazer foi conduzir um teste perfeitamente válido para 
a hipótese nula usando intervalos de confiança. Podemos fazer o teste mais 
rapidamente e obter exatamente as mesmas conclusões pelo seguinte 
procedimento: 
 Calcule (o número de erros 
padrão que dista de 0). 
 Compare este valor de com aqueles na linha da 
tabela. 
 
64 
 
 Para este exemplo, está entre os valores nas 
colunas e . Então nosso valor deve corresponder 
a um entre estes e portanto devemos ter . 
O valor de é interpretado como a probabilidade de observar um valor 
de mais extremo do que o observado quando . É uma medida análoga à 
proporção de pessoas sadias que são erroneamente diagnosticadas como doentes 
num exame de laboratório, ou seja, uma medida de falsos positivos.7 
12 ANÁLISE DA VARIÂNCIA (ANOVA) 
Análise da Variância (ANOVA) é um método para testar a igualdade de três 
ou mais médias populacionais, baseado na análise das variâncias amostrais. Os 
dados amostrais são separados em grupos segundo uma característica (fator). 
Fator (ou tratamento): é uma característica que permite distinguir diferentes 
populações umas das outras. Cada fator contém dois ou mais grupos 
(classificações). 
Exemplos: 
(1) amostras do consumo de combustível para 3 tipos de carros, de fábricas 
(marcas) diferentes. 
 Neste caso temos amostras de 3 populações de carros. 
Temos um único fator: A marca. Este fator se separa em 3 tratamentos, cada 
uma das marcas. 
(2) Amostras do consumo de combustível para 3 tamanhos de motor (1,5 L, 
2,2 L e 2,5 L) e tipo de transmissão (manual ou automática). 
Temos dois fatores: 
- O fator tamanho do motor, que contém três categorias: 1,5 L, 2,2 L e 2,5 L. 
 
7 Texto extraído: www.leg.ufpr.br 
 
65 
 
- O fator tipo de transmissão, que contém duas categorias: manual e 
automática. 
ANOVA de um critério (um fator) 
Suposições: 
 Populações normalmente distribuída 
 Populações tem mesma variância (ou mesmo desvio padrão). 
 Amostrassão aleatórias e mutuamente independentes. 
 As diferentes amostras são obtidas de populações classificadas em 
apenas uma categoria. 
O estatístico George E. P. Box mostrou que os resultados são confiáveis 
desde que os tamanhos das amostras são iguais (ou quase iguais), as diferenças 
entre as variâncias podem ser de tal ordem que a maior seja nove vezes a menor. 
Se a distribuições são fortemente não normais devemos utilizar outros 
métodos, por exemplo, o teste de Kruskal-Wallis. 
12.1 Hipóteses do ANOVA de um critério 
Hipótese nula: a média de todas as populações são iguais, ou seja, o 
tratamento (fator) não tem efeito (nenhuma variação em média entre os grupos). 
 Hipótese alternativa: nem todas a médias populacionais são iguais, ou seja: 
Pelo menos uma média é diferente, isto é, existe efeito do tratamento. Não quer 
dizer que todas as médias são diferentes (alguns pares podem ser iguais).8 
 
 
8 Texto extraído: www.edisciplinas.usp.br 
 
66 
 
 
 
 
67 
 
 
 
 
68 
 
 
Fonte: edisciplinas.usp.br 
 
 
 
 
 
 
 
 
http://www.edisciplinas.usp.br/
 
69 
 
BIBLIOGRAFIA 
BONAFINI, F. C. (Org.). Estatística. 1ª ed. São Paulo SP.: Pearson, 2012. 
CASTANHEIRA, N. P. Estatística aplicada a todos os níveis. 1ª ed. Curitiba PR: 
Intersaberes, 2012. 
DAVILA, V. H. L. Estatística Descritiva. Disponível em 
http://www.ime.unicamp.br/~hlachos/estdescr1.pdf. Acesso em: 30 julho de 2018. 
SANTOS, V. F. M. Estatística descritiva básica e centralidade. Blog análise de 
dados. 
SILVA, L. P. M. Definições básicas de probabilidade. Mundo Educação. 
Distribuições de probabilidades contínuas e discretas. Disponível em 
<support.minitab.com/pt-br/minitab/18/help-and-how-to/probability-distributions-
and-random-data/supporting-topics/basics/continuous-and-discrete-probability-
distributions>. Acesso em: 30 julho de 2018. 
RODRIGUES, PEDRO CARVALHO. Bioestatística. Universidade Federal 
Fluminense. 
FONSECA, JAIRO DA. Curso de Estatística. Editora Atlas. 
OLIVEIRA, FRANCISCO ESTEVAM MARTINS DE. Estatística e Probabilidade. 
Editora Atlas. 
TANAKA. Elementos de Estatística. Editora McGraw.Hill. 
BARBETTA, PEDRO A. Estatística aplicada às Ciências Sociais. Editora da 
UFSC. 
GÓES, LUIZ A. C. Estatística I e II. Editora Saraiva. 
DÍAZ, FRANCISCA; LOPES, FRANCISCO JAVIER. Bioestatística. Editora 
Thomson. 
 
70 
 
FRAGOSO, Gustavo. Noções de Amostragem. Disponível em < 
http://nbcgib.uesc.br/lec/download/faria/cet756/apresentacoes/nocoes_amostrage
m.pdf>. Acesso em: 30 de julho de 2018. 
MORETTIN, L. G. Estatística Básica: Probabilidade e Interferência. 1ª ed. São 
Paulo SP.: Pearson, 2010. 
Testes de Hipóteses. Disponível em: < http://leg.ufpr.br/~silvia/CE701/node51.html 
> Acesso em: 30 de julho de 2018. 
http://leg.ufpr.br/~silvia/CE701/node51.html

Outros materiais