Buscar

3

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

ESTATÍSTICA
Juliane Silveira Freire da Silva
Distribuições contínuas 
de probabilidade
Objetivos de aprendizagem
Ao final deste texto, você deve apresentar os seguintes aprendizados:
 � Comparar as principais distribuições contínuas de probabilidade.
 � Identificar as características das distribuições contínuas.
 � Usar a tabela da distribuição normal para encontrar probabilidade 
desejada.
Introdução
Neste capítulo, você identificará quando uma variável em estudo segue um 
modelo de distribuição contínua de probabilidade, conhecerá as principais 
distribuições contínuas de probabilidade e aprenderá a utilizar a mais 
importante de todas as distribuições em estatística: a distribuição normal.
Distribuições contínuas de probabilidade
Existem distribuições discretas e contínuas de probabilidade. No primeiro caso, 
temos variáveis aleatórias discretas, ou seja, valores resultantes de contagens. 
Então, no caso das distribuições discretas de probabilidade, podemos calcular 
probabilidade do valor da variável que se quer investigar. Temos funções 
matemáticas que fornecem essas probabilidades.
Porém, nas distribuições contínuas de probabilidade, estamos lidando com 
variáveis aleatórias contínuas, ou seja, que resultam de uma medição. Nesses 
casos, não temos valores únicos em uma escala, mas, sim, em intervalos, pois, 
na variável aleatória contínua, podemos ter qualquer valor na reta dos reais.
Dessa forma, a função densidade de probabilidade (FDP), que terá uma 
função matemática associada, necessitará uma integral para a resolução do 
cálculo de probabilidade. Nesse caso, estamos calculando intervalos abaixo 
de uma curva, como mostrado na Figura 1.
Figura 1. Curva de distribuição contínua.
Fonte: Freund (2006, p. 215).
Conforme podemos observar na Figura 1, para obtermos a probabilidade, 
no caso da distribuição contínua, não podemos obtê-la em um ponto único, 
mas apenas em intervalos, como em um intervalo entre os pontos e quaisquer 
abaixo de uma curva. Concluímos, então, que, na distribuição contínua de 
probabilidade, não existe probabilidade no ponto.
Matematicamente, a resolução dessas probabilidades se dá com a integração 
da função da distribuição em estudo. Isso nem sempre é simples, pois nem 
todas as integrações de funções de probabilidade são de fácil resolução. Para 
isso, funções comumente utilizadas contêm tabelas para auxiliar no cálculo 
de probabilidade.
Esse é o caso da distribuição normal, a mais importante distribuição de 
probabilidade em estatística. É do pressuposto de normalidade dos dados que 
muitas inferências são possíveis.
Mas, independentemente de estarmos estudando distribuições discretas 
ou distribuições contínuas de probabilidade, alguns axiomas continuam va-
lendo, como: 0 ≤ f(x) ≤ 1 e a área total abaixo da curva sempre somarão 1 na 
distribuição acumulada.
Características das distribuições contínuas
Veremos, aqui, as características de algumas distribuições de probabilidade 
contínuas além da distribuição normal. Mais adiante, trataremos da distri-
buição de Gauss (normal), à qual, por ser a mais importante, daremos um 
maior destaque.
Distribuições contínuas de probabilidade98
Para o caso da distribuição de probabilidade exponencial, segundo Doane 
e Seward (2014), no modelo exponencial, o foco está no tempo de espera até o 
evento subsequente: uma variável contínua. A função densidade de probabi-
lidade exponencial aproxima-se de zero à medida que o valor de x aumenta. 
Isso é útil para calcular tempo de vida de alguns componentes.
f(x) = λe
–λx se x ≥ 0
0 se x < 0
onde:
λ é a taxa média pelo tempo ou espaço;
x é o valor da variável aleatória que se quer obter a probabilidade.
Representamos a distribuição exponencial por x~Exp(λ), ou seja, a variável 
x aproxima-se de uma distribuição exponencial de parâmetro λ, conforme 
gráfico da Figura 2.
Figura 2. Distribuição exponencial.
Fonte: Adaptada de Portal Action (2017, documento on-line).
1.7
1.6
1.5
1.4
1.3
1.2
1.1
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0.0 0.5 1.0 1.5 2.0 3.0 4.0 5.0 6.02.5 3.5 4.5 5.5
x
λ = 1/2
λ = 1
λ = 3/2
Fu
nç
ão
 d
en
sid
ad
e 
de
 p
ro
ba
bi
lid
ad
e
99Distribuições contínuas de probabilidade
Temos, também, a distribuição de probabilidade de Laplace, também cha-
mada de exponencial dupla, pois, algumas vezes, é como se tivéssemos uma 
exponencial positiva junto a uma exponencial negativa. Pode ser utilizada para 
dados de modelagem em biologia e finanças. Tem por função a distribuição 
de probabilidade:
f(x) = 12σ e , –∞ < x < ∞, –∞ < μ < ∞, –∞ < σ < ∞
|x – µ|
σ( )
onde:
𝜎 é o desvio-padrão;
μ é a média;
x é o valor da variável aleatória que se quer obter a probabilidade.
Representamos a distribuição Laplace por x~Laplace(μ, 𝜎), ou seja, a 
variável x aproxima-se de uma distribuição Laplace de parâmetros μ e 𝜎. A 
forma da distribuição de Laplace é semelhante à normal, porém com um pico 
bem mais fino e acentuado, como na Figura 3.
Figura 3. Distribuição Laplace comparada à distribuição 
normal.
Fonte: Suporte ao Minitab (c2017a, documento on-line).
Outra distribuição de probabilidade contínua de grande utilização é a 
distribuição logística, utilizada mais largamente para dados demográficos e 
de vendas, quando se investiga o crescimento. A função é definida por:
Distribuições contínuas de probabilidade100
f(x) = , –∞ < x < ∞, –∞ < μ < ∞, –∞ < σ < ∞
e
(x – µ)
σ–
( )(x – µ)σ–σ 1 + e 
2
𝜎 é o desvio-padrão;
μ é a média;
x é o valor da variável aleatória que se quer obter a probabilidade.
Representamos a distribuição logística por x~Logist(μ, 𝜎), ou seja, a variável 
x aproxima-se de uma distribuição logística de parâmetros μ e 𝜎. A forma da 
distribuição logística é semelhante à normal, porém com caudas mais longas, 
como na Figura 4.
Figura 4. Distribuição logística.
Fonte: Suporte ao Minitab (c2017b, documento on-line).
Grá�co de distribuição
logística; Loc = 1
0,25
0,20
0,15
0,10
0,05
0,00
D
en
sid
ad
e
–50 50 75–25 250
x
Escala
1
5
10
Ainda temos a distribuição de pareto, utilizada para modelar fenômenos 
sociais, físicos e econômicos. O princípio de pareto diz que aproximadamente 
80% dos efeitos provêm de 20% das causas. 
Além dessas distribuições citadas, ainda há outras tantas, como a distri-
buição beta, de Cauchy, de Maxwell, etc.
101Distribuições contínuas de probabilidade
Distribuição normal 
Como já mencionado, esta é a distribuição de probabilidade contínua mais 
importante e utilizada dentro da estatística. Muito da inferência estatística 
parte do pressuposto da normalidade dos dados, além, é claro, de grande parte 
das variáveis encontradas seguir esse modelo de distribuição.
Essa distribuição tem como parâmetros a média que é uma medida de 
posição e o desvio-padrão que é a medida de variabilidade. Então, o formato 
dessa distribuição depende da variabilidade — quanto mais achatada for a 
distribuição, maior será a variabilidade dos dados e, ao contrário, quanto mais 
estreita for a distribuição, menor será a variabilidade. Já a média situa no eixo 
em que os dados se concentram.
É com base na teoria da distribuição de probabilidade normal que podemos 
estruturar testes de hipótese, estabelecer intervalos de confiança e calcular 
tamanhos de amostra.
A função matemática que descreve a distribuição de probabilidade normal 
é dada por:
f(x) = , –∞ < x < ∞, –∞ < μ < ∞, –∞ < σ < ∞
(x – µ)2
2σ2–1
√2�σ
e
Representamos a distribuição normal por x~N(μ, 𝜎), ou seja, a variável 
x aproxima-se de uma distribuição normal de parâmetros μ (média) e 𝜎 
(desvio-padrão).
O formato da distribuição normal é parecido com um sino. Por esse motivo, 
alguns a chamam de distribuição em forma de sino, ou distribuição de Gauss 
(Figura 5).
Veja, a seguir, as propriedades da distribuição normal.
 � A distribuição normal é simétrica em torno da média (μ).
 � A média, a moda e a mediana são iguais e localizam-se no pico mais 
alto da distribuição.� Quanto maior for o desvio-padrão, mais achatado será o gráfico da 
distribuição normal.
 � A área total abaixo da curva soma 1 (1 corresponde a 100%).
 � Os parâmetros são a média (μ) e o desvio-padrão (𝜎).
 � Não existe probabilidade menor do que zero, nem maior do que 1.
Distribuições contínuas de probabilidade102
Figura 5. Distribuição normal.
Fonte: Doane e Seward (2014, p. 254).
0,09
0,08
0,07
0,06
0,05
0,04
0,03
0,02
0,01
0,00
f(x
)
60 70 80 9065 75 85
FDP normal
Velocidade (milhas por hora)
Como se pode perceber, a resolução de uma integral para a FDP da normal 
é bastante elaborada. Por esse motivo, fazemos uso de uma tabela para nos 
auxiliar no cálculo de probabilidade.
Como a média e o desvio-padrão variam de variável para variável e só 
temos uma tabela, estabeleceu-se, para fins de cálculo da tabela, que a média 
seria igual a zero, e o desvio-padrão igual a 1. Claramente, na vida real, as 
médias das variáveis não são iguais a 1, e o desvio-padrão também não é igual 
a 0. Precisamos, então, antes de usarmos a tabela, padronizar a nossa variável 
com a seguinte fórmula:
Z = 
x – µ
σ
Padronizamos a variável x com sua média e seu desvio-padrão específicos 
e transformamos na variável z com média 1 e desvio-padrão 0, para podemos 
fazer uso da tabela da normal padrão.
Existe apenas uma tabela, porém existem apresentações distintas dela. 
Em uma delas, é apresentada a área total abaixo da curva, sendo acumulada 
de – ∞ até + ∞. A outra forma de apresentação é apenas com metade da curva 
normal de 0 até + ∞. Veja o Quadro 1, a seguir.
103Distribuições contínuas de probabilidade
Quadro 1. Distribuição normal
Vamos utilizar um exemplo para aprendermos como encontrar as pro-
babilidades nessa tabela. Suponha uma financeira que empresta, em média, 
R$ 2.000,00 para seus clientes com um desvio-padrão de R$ 900,00. Calcu-
laremos a probabilidade de a financeira emprestar menos de R$ 2.200,00 a 
um cliente.
P(X < 2200) = P z < = P(z < 0,22)2200 – 2000900( )
Observem que, até aqui, apenas fizemos a padronização da variável com 
média de 2.000 e desvio-padrão de 900 em uma variável z com média 1 e 
Distribuições contínuas de probabilidade104
desvio-padrão 0. Depois da padronização, precisamos observar a tabela para 
encontrarmos a probabilidade.
Procuramos, na tabela, o cruzamento da linha com o 0,2 até a coluna do 
0,02, que é a nossa segunda casa decimal. Nesse cruzamento, encontramos o 
valor de 0,08706. Estamos trabalhando em uma tabela que tem apenas metade 
da distribuição. Nesse caso, precisamos adicionar a outra metade que não 
está na tabela a esse valor de probabilidade encontrado. A área de cálculo é 
mostrada na Figura 6. 
Figura 6. Área de cálculo da tabela apresentada.
Fonte: Freund (2006, p. 492).
0 z
P(X < 2200) = 0,08706 + 0,5 = 0,58706 = 58,71%
Agora queremos calcular a probabilidade de a financeira emprestar mais 
de R$ 2.100,00. Primeiramente, vamos calcular a probabilidade de emprestar 
menos de R$ 2.100,00.
( )P(X < 2100) = P z < = P(z < 0,11)2100 – 2000900
Olhamos na linha do 0,1 até a coluna do 0,01 da tabela e encontramos o 
valor de 0,04380. Para encontrar (P > 0,11) temos que fazer a subtração, pois 
a tabela forneceu o valor de P(z < 0,11). Assim:
P(X > 2100) = 0,5 – 0,04380 = 0,45620
Se quisermos calcular a probabilidade de a financeira emprestar entre 
R$ 2.100,00 e R$ 2.200,00, este seria o cálculo:
105Distribuições contínuas de probabilidade
P(2100 < X < 2200) =
P z < = 0,222200 – 2000
900( )
( )P z < = 0,112100 – 2000900
Olhamos, na tabela, os valores referentes a essas duas padronizações e 
encontramos, respectivamente, 0,08706 e 0,04380.
P(2.000 < X < 2.200) = 0,08706 – 0,0438 = 0,04326 = 4,33%
Vale ressaltar que, com a tabela normal com a área total abaixo da curva, 
a utilização é diferente para encontrarmos a probabilidade.
Ainda como exemplo de distribuições contínuas de probabilidade, temos a 
distribuição t-student (Figura 7). Ela tem uma curva muito semelhante à nor-
mal, também tem parâmetros de média e desvio-padrão, porém é influenciada 
pelo tamanho da amostra. Quando n tende a infinito, a distribuição normal 
e a distribuição t são equivalentes. A distribuição t-student é utilizada nos 
casos em que temos amostras de tamanho inferior a 30 ou não conhecemos 
o desvio-padrão populacional, quando a população tem distribuição aproxi-
madamente normal.
Figura 7. Distribuição t com 2 graus de liberdade.
Fonte: Suporte ao Minitab (c2017c, documento on-line).
Grá�co de distribuição
T; gl–2
0,4
0,3
0,2
0,1
0,0
–5,0 5,0 7,5–2,5 2,50,0
x
D
en
sid
ad
e
Distribuições contínuas de probabilidade106
DOANE, D. P.; SEWARD, L. E. Estatística aplicada à administração e economia. 4. ed. Porto 
Alegre: AMGH, 2014.
FREUND, J. E. Estatística aplicada: economia, administração e contabilidade. 11. ed. 
Porto Alegre: Bookman, 2006.
PORTAL ACTION. Distribuição exponencial. 2017. Disponível em: <http://www.porta-
laction.com.br/probabilidades/612-distribuicao-exponencial>. Acesso em: 3 jan. 2018.
SUPORTE AO MINITAB. Distribuição de Laplace. c2017a. Disponível em: <https://sup-
port.minitab.com/pt-br/minitab/18/help-and-how-to/probability-distributions-and- 
random-data/supporting-topics/distributions/laplace-distribution/>. Acesso em: 
3 jan. 2019.
SUPORTE AO MINITAB. Distribuição logística. c2017b. Disponível em: <https://support.mi-
nitab.com/pt-br/minitab/18/help-and-how-to/probability-distributions-and-random- 
data/supporting-topics/distributions/logistic-distribution/>. Acesso em: 3 jan. 2019.
SUPORTE AO MINITAB. Selecione a distribuição e os parâmetros. c2017c. Disponível em: 
<https://support.minitab.com/pt-br/minitab/18/help-and-how-to/graphs/how-to/pro-
bability-distribution-plot/create-the-graph/select-the-distribution-and-parameters/#t>. 
Acesso em: 3 jan. 2019.
107Distribuições contínuas de probabilidade
ESTATÍSTICA
Juliane Silveira 
Freire da Silva
Estimação de parâmetros
Objetivos de aprendizagem
Ao final deste texto, você deve apresentar os seguintes aprendizados:
 � Expressar parâmetros populacionais.
 � Diferenciar estimativas tendenciosas de não tendenciosas.
 � Identificar as consequências dos estimadores.
Introdução
Neste capítulo, você identificará o que são parâmetros e estimadores. 
Além disso, aprenderá a identificar o que são estimadores tendenciosos e 
estimadores eficientes. Também, desenvolverá estratégias para identificar 
quais deles utilizar.
Como aplicação da teoria de probabilidade aos estimadores, você 
aprenderá a calcular intervalos de confiança para a média e a proporção 
que possibilitam estimar um intervalo de valores em que esteja contido 
o verdadeiro parâmetro populacional, com base em uma amostra. 
Parâmetros populacionais
Parâmetros são medidas numéricas calculadas com base nos dados de uma 
população. Podemos calcular alguns parâmetros, como a média populacional 
(μ), o desvio-padrão populacional (𝜎) e a proporção populacional (π). Observe 
que os parâmetros são representados por letras gregas.
μ =
∑ Xi
N média populacional
onde: 
Xi: cada um dos N elementos da população;
N: tamanho da população.
σ =
∑(Xi – μ)
2
N
 desvio-padrão populacional
onde: 
Xi: cada um dos N elementos da população;
μ: média populacional;
N: tamanho da população.
Parâmetros nem sempre são fáceis de serem calculados — seja porque nem 
sempre temos acesso a todos os elementos de uma população, seja porque 
pode ser muito oneroso coletar dados de uma população inteira, ou, ainda, 
porque não temos tempo para investigar todos os dados de uma população. 
Por esses e outros motivos, acabamos, muitas vezes, optando por coletar 
dados relativos às amostras derivadas de uma população de interesse. Quando 
calculamos as medidas numéricas de uma amostra, teremos estimativas, 
também chamadas de estatísticas, para os parâmetros populacionais. Na 
Figura 1, a seguir, há umarepresentação desses estimadores amostrais de 
parâmetros populacionais.
Figura 1. Estimadores amostrais de parâmetros populacionais.
Fonte: Doane e Seward (2014, p. 293).
Amostra
Inferência
Parâmetros
populacionais
μ
σ
π
Estimadores
amostrais
x–
s
p
Estimação de parâmetros2
Cada estimativa será o valor particular daquela amostra para estimar o 
verdadeiro valor do parâmetro. Se coletarmos amostras diferentes de uma 
mesma população, os valores do estimador poderão mudar aleatoriamente a 
cada amostra coletada. Então, a distribuição dessa variável (estimador amostral) 
é o que chamamos de distribuição de probabilidades amostral. 
O valor da estimativa da média, por exemplo, será específico para cada 
amostra, mas a distribuição de probabilidade que descreve essa aleatoriedade 
com os resultados das diferentes amostras é a distribuição amostral da média 
da amostra. Nessa distribuição, teremos todos os resultados prováveis da 
estimativa da média em um intervalo de valores que a estimativa ocorre e 
onde estará o verdadeiro parâmetro populacional. A distribuição amostral 
seguirá a mesma distribuição dos dados populacionais. Se estes seguem uma 
distribuição normal, consequentemente, os dados amostrais provenientes dessa 
população também seguirão uma distribuição de probabilidades normais.
A partir dessa distribuição de probabilidades amostrais (podendo ser 
diferente para cada um dos parâmetros) é que podermos tomar decisões sobre 
os parâmetros populacionais com base em estimativas amostrais.
Segundo Doane e Seward (2014), um estimador é uma estatística derivada 
de uma amostra para inferir o valor de um parâmetro populacional. Já uma 
estimativa é o valor do estimador em uma amostra particular.
Quando calculamos o valor de apenas uma amostra e estimamos os valores 
dos parâmetros por essa medida amostral, teremos uma estimativa por ponto. 
Claramente, nem sempre o valor calculado para a média dessa determi-
nada amostra (ou qualquer outro estimador) acertará no alvo o valor real da 
população. Sendo assim, para estimativas de parâmetros, podemos calcular 
intervalos com alta probabilidade de conter o verdadeiro valor do parâmetro 
populacional.
Podemos, também, calcular o erro cometido com esse estimador e, ainda, 
o tamanho mínimo para a amostra dessa estimativa.
Vale lembrar que o erro e a confiança fixados no cálculo para o tamanho de amostra 
só serão válidos se a amostra for probabilística. 
Qualquer amostra só poderá resultar em um bom estimador caso ela seja coletada 
de forma aleatória. Jamais podemos fazer uso de amostras não probabilísticas e ten-
denciosas para estimarmos parâmetros.
3Estimação de parâmetros
Estimativas tendenciosas e não tendenciosas
Mas o que é uma estimativa tendenciosa? Chamamos uma estimativa de ten-
denciosa, ou estimador viciado e estimador enviesado, quando esta subestimar 
ou superestimar o valor do parâmetro. 
Vício é a diferença entre a média da estatística (estimador) e o verdadeiro 
valor do parâmetro populacional. A Figura 2 ilustra a diferença entre um 
estimador tendencioso e não tendencioso.
Figura 2. Ilustração de estimadores tendenciosos e não tendenciosos.
Estimador não tendencioso Estimador tendencioso
Segundo Doane e Seward (2014), a média amostral (x–) e a proporção 
amostral (p) são estimadores não viciados da μ e da π, respectivamente. Mas 
podemos encontrar estimadores viciados quando consideramos o desvio-padrão 
amostral e o desvio-padrão populacional.
μ =
∑Xi
N média populacional
x– =
∑xi
n média amostral
� = XN proporção populacional
p = xn proporção amostral
Estimação de parâmetros4
σ =
∑(Xi – μ)
2
N
desvio-padrão populacional
s =
∑(xi – x
–)2
n – 1
desvio-padrão amostral
Estimativas eficientes
Um estimador é dito eficiente frente aos demais possíveis dentre as amostras 
oriundas da mesma população. Será aquele que tiver a menor variabilidade. 
Ou seja, se dois estimadores tiverem a mesma média, o estimador mais efi-
ciente será aquele com a menor variância. O outro estimador será 
considerado ineficiente, conforme ilustrado na Figura 3.
Figura 3. Ilustração de estimadores eficientes e não eficientes, ambos não viciados.
Estimador e�ciente Estimador não e�ciente
Como existe essa variabilidade, podemos, então, estimar o erro que estamos 
cometendo com essa estimativa. Quando estamos estimando a média popula-
cional (μ) pela média amostral (x–), cometemos o erro amostral: a probabilidade 
é de 1 – α de que a estimativa vá diferir para mais ou para menos do valor 
populacional por, no máximo, um erro de:
E = zα/2 ∙ 
σ
√n
5Estimação de parâmetros
onde:
E: erro máximo de estimativa;
𝜎: desvio-padrão populacional;
n: tamanho da amostra;
zα/2: valor da tabela normal padrão.
Na Figura 4, pode ser visualizada a distribuição amostral da média.
Figura 4. Distribuição amostral da média.
Fonte: Freund (2006, p. 272).
1 – α
α/2 α/2
x–
μ zα/2 ∙ 
σ
√n
No Quadro 1, a seguir, apresentamos os valores para os principais níveis de significância.
1 – α α/2 zα/2
1 – 0,1 = 0,90 = 90% 0,05 1,645
1 – 0,05 = 0,95 = 95% 0,025 1,960
1 – 0,01 = 0,99 = 99% 0,005 2,575
Quadro 1. Valores da tabela normal para os principais níveis de significância
Estimação de parâmetros6
Uma financeira coletou uma amostra aleatória de 100 pessoas para estimar o valor 
médio de endividamento de seus clientes. Com base em pesquisas anteriores, sabe-se 
que o desvio-padrão populacional é de R$ 630,00 (σ = 630,00). Com uma probabilidade 
de 95%, qual seria o erro máximo para a estimativa?
E = 1,960 · = 123,48630
√100
Com uma confiança de 95%, podemos afirmar que o erro máximo dessa estimativa 
é de 123,48.
Precisamos observar que nem sempre sabemos o verdadeiro valor do desvio-padrão 
populacional. Aliás, muito raramente teremos esse valor, pois, se tivéssemos facilmente 
o desvio-padrão populacional, já saberíamos o valor da média populacional.
Assim sendo, é admissível utilizarmos o desvio-padrão amostral como estimativa 
do desvio-padrão populacional, sempre que tivermos um tamanho da amostra igual 
ou superior a 30.
Consequências dos estimadores
Como consequências das propriedades dos estimadores, quando temos uma 
distribuição de probabilidades para os possíveis resultados de amostras alea-
tórias, podemos calcular intervalos de confiança que contenham o verdadeiro 
valor do parâmetro populacional e uma confiança associada a esse intervalo. 
Podemos, também, calcular tamanhos mínimos de amostras para que os dados 
amostrais sejam representativos de toda uma população.
A distribuição de probabilidades associada aos dados da nossa população 
é que nos dará a confiança necessária tanto para os intervalos de confiança 
quanto para o tamanho mínimo de amostras. Leva-se em consideração o 
teorema do limite central.
Intervalos de confiança 
Podemos calcular um intervalo de variação para a média amostral, que terá uma 
probabilidade definida de conter o verdadeiro valor do parâmetro populacional.
Isso é possível porque temos uma distribuição associada aos dados po-
pulacionais e amostrais. Utilizaremos a distribuição normal para esses in-
tervalos e teremos uma confiança fixada de acordo com essa distribuição de 
probabilidades.
7Estimação de parâmetros
Existem valores que são mais comuns para o cálculo dos intervalos de 
confiança: 90%, 95% e 99%. Os valores das probabilidades associadas a esses 
níveis de confiança são os seguintes:
90% de confiança → z0,05 = 1,645
95% de confiança → z0,025 = 1,960
99% de confiança → z0,005 = 2,575
O intervalo de confiança para estimar uma média é descrito a seguir:
x– ± zα/2 ∙ 
σ
√n
 com o desvio-padrão populacional conhecido
x– ± tα/2; n – 1 ∙ 
s
√n
 com o desvio-padrão populacional desconhecido
Observe que, ao invés de utilizarmos a distribuição normal para o intervalo 
de confiança com o desvio-padrão desconhecido, tomamos a distribuição t-stu-
dent, observando o α/2 e n–1 graus de liberdade. Vale ressaltar que, para n ≥ 30, 
os valores da distribuiçãot e da distribuição normal igualam-se. Observe a 
Figura 5, a seguir.
Figura 5. Comparação distribuição t e distribuição normal.
Fonte: Doane e Seward (2014, p. 306).
A distribuição t tem o mesmo formato da distribuição normal, mas, para n 
menor do que 30, existe uma pequena diferença no formato, ocasionada pelo 
tamanho da amostra. Veja a tabela da Figura 6.
Estimação de parâmetros8
Figura 6. Distribuição t-student.
Para encontrar o valor tabelado, cruzamos a coluna de alfa escolhido com 
a linha dos graus de liberdade. Nesse caso do número de graus de liberdade, 
precisamos fazer n–1. 
9Estimação de parâmetros
Suponha que a financeira coletou uma amostra de 100 clientes e questionou sobre o 
valor de endividamento deles, obtendo como resultado uma média amostral de R$ 
2.350,00 e um desvio-padrão amostral de R$ 590,00. Obtenha o intervalo de confiança 
de 95% para a média.
x– = 2350,00
s = 590,00
n = 100
t0,025;99 = 1,960
x– ± tα/2
;n – 1 · = 2350 ± 1,960 ·
2350 ± 115,64
[2234,36; 2465,64]
s
√n
590
√100
Com 95% de confiança, a verdadeira média populacional para o valor médio de 
endividamento estará entre R$ 2.234,36 e R$ 2.465,64.
De acordo com o intervalo, podemos calcular o tamanho mínimo de amostra 
para quando queremos estimar a média populacional, isolando o n na equação 
do erro máximo amostral. Esse valor nos fornecerá um tamanho de amostra 
mínimo para que a amostra seja representativa da população, caso coletada 
de forma aleatória.
n =
zα/2 ∙ σ
E( )
2
Por exemplo, qual seria o tamanho mínimo de amostra com uma confiança 
de 95%, no caso de uma pesquisa com consumidores para investigar o valor 
gasto com presentes no dia dos namorados. Sabe-se que o desvio-padrão 
populacional da pesquisa no ano anterior foi de R$ 65,00. Os pesquisadores 
querem errar, no máximo, em R$ 10,00.
Estimação de parâmetros10
z0,025 = 1,96
σ = 65,00
E = 10,00
n =
zα/2 ∙ σ
E( ) ( )
2 2
= = 162,3 = 1631,96 · 6510
Vale ressaltar que, no caso do tamanho mínimo de amostra, sempre se 
arredonda para cima, independentemente de regras de arredondamento.
Podemos calcular, também, um intervalo de variação para a proporção 
amostral. A teoria é semelhante à empregada no intervalo de confiança para 
a média. Os cálculos são realizados de acordo com a equação a seguir.
p ± zα/2 ·
p ∙ (1 – p)
n
onde:
p: proporção amostral
n: tamanho da amostra
Zα/2
: valor tabela normal padrão
Assim como podemos calcular o tamanho mínimo de amostra para estimar 
uma média, também podemos calcular o tamanho mínimo de amostra para 
estimar uma proporção. A fórmula do tamanho mínimo de amostra também 
é derivada da fórmula do erro máximo amostral para a proporção.
Ainda temos o intervalo de variação para o desvio-padrão de uma amostra 
retirada de uma população que segue uma distribuição normal.
n =
zα/2
2 ∙ p(1 – p)
E2
Quando não conhecemos o verdadeiro valor da proporção populacional, 
utilizamos o p = 0,5. Assim, podemos superestimar o tamanho da amostra, 
já que a proporção não é conhecida.
11Estimação de parâmetros
Suponha que você deseja estimar a proporção de clientes satisfeitos com determinado 
produto da sua empresa. Deseja-se cometer um erro máximo de estimação de 3%, 
com uma confiança de 90%. Qual seria o tamanho mínimo de amostra para estimar 
essa proporção?
zα
/2
 = 1,645
p = 0,5 pois o p é desconhecido
E = 0,03 precisamos tirar do percentual
n =
zα/2
2 · p(1 – p)
E2
=
1,6452 · 0,5 · (1 – 0,5)
0,032
= 752
 
DOANE, D. P.; SEWARD, L. E. Estatística aplicada à administração e economia. 4. ed. Porto 
Alegre: AMGH; Bookman, 2014. 840 p.
FREUND, J. E. Estatística aplicada: economia, administração e contabilidade. 11. ed. 
Porto Alegre: Bookman, 2006. 536 p.
Leitura recomendada
SPIEGEL, M. R.; STEPHENS, L. J. Estatística. 4. ed. Porto Alegre: Bookman, 2009. 600 p. 
(Coleção Schaum).
Estimação de parâmetros12
Conteúdo:

Outros materiais