Estimação de parâmetros

•

ESTÁCIO

0

Greg Ferraz

13/04/2024

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Métodos Quantitativos Matemáticos

1.112 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

ESTATÍSTICA
Juliane Silveira
Freire da Silva
Estimação de parâmetros
Objetivos de aprendizagem
Ao final deste texto, você deve apresentar os seguintes aprendizados:
� Expressar parâmetros populacionais.
� Diferenciar estimativas tendenciosas de não tendenciosas.
� Identificar as consequências dos estimadores.
Introdução
Neste capítulo, você identificará o que são parâmetros e estimadores.
Além disso, aprenderá a identificar o que são estimadores tendenciosos e
estimadores eficientes. Também, desenvolverá estratégias para identificar
quais deles utilizar.
Como aplicação da teoria de probabilidade aos estimadores, você
aprenderá a calcular intervalos de confiança para a média e a proporção
que possibilitam estimar um intervalo de valores em que esteja contido
o verdadeiro parâmetro populacional, com base em uma amostra.
Parâmetros populacionais
Parâmetros são medidas numéricas calculadas com base nos dados de uma
população. Podemos calcular alguns parâmetros, como a média populacional
(μ), o desvio-padrão populacional (𝜎) e a proporção populacional (π). Observe
que os parâmetros são representados por letras gregas.
μ =
∑ Xi
N média populacional
onde:
Xi: cada um dos N elementos da população;
N: tamanho da população.
σ =
∑(Xi – μ)2
N
desvio-padrão populacional
onde:
Xi: cada um dos N elementos da população;
μ: média populacional;
N: tamanho da população.
Parâmetros nem sempre são fáceis de serem calculados — seja porque nem
sempre temos acesso a todos os elementos de uma população, seja porque
pode ser muito oneroso coletar dados de uma população inteira, ou, ainda,
porque não temos tempo para investigar todos os dados de uma população.
Por esses e outros motivos, acabamos, muitas vezes, optando por coletar
dados relativos às amostras derivadas de uma população de interesse. Quando
calculamos as medidas numéricas de uma amostra, teremos estimativas,
também chamadas de estatísticas, para os parâmetros populacionais. Na
Figura 1, a seguir, há uma representação desses estimadores amostrais de
parâmetros populacionais.
Figura 1. Estimadores amostrais de parâmetros populacionais.
Fonte: Doane e Seward (2014, p. 293).
Amostra
Inferência
Parâmetros
populacionais
μ
σ
π
Estimadores
amostrais
x–
s
p
Estimação de parâmetros2
Cada estimativa será o valor particular daquela amostra para estimar o
verdadeiro valor do parâmetro. Se coletarmos amostras diferentes de uma
mesma população, os valores do estimador poderão mudar aleatoriamente a
cada amostra coletada. Então, a distribuição dessa variável (estimador amostral)
é o que chamamos de distribuição de probabilidades amostral.
O valor da estimativa da média, por exemplo, será específico para cada
amostra, mas a distribuição de probabilidade que descreve essa aleatoriedade
com os resultados das diferentes amostras é a distribuição amostral da média
da amostra. Nessa distribuição, teremos todos os resultados prováveis da
estimativa da média em um intervalo de valores que a estimativa ocorre e
onde estará o verdadeiro parâmetro populacional. A distribuição amostral
seguirá a mesma distribuição dos dados populacionais. Se estes seguem uma
distribuição normal, consequentemente, os dados amostrais provenientes dessa
população também seguirão uma distribuição de probabilidades normais.
A partir dessa distribuição de probabilidades amostrais (podendo ser
diferente para cada um dos parâmetros) é que podermos tomar decisões sobre
os parâmetros populacionais com base em estimativas amostrais.
Segundo Doane e Seward (2014), um estimador é uma estatística derivada
de uma amostra para inferir o valor de um parâmetro populacional. Já uma
estimativa é o valor do estimador em uma amostra particular.
Quando calculamos o valor de apenas uma amostra e estimamos os valores
dos parâmetros por essa medida amostral, teremos uma estimativa por ponto.
Claramente, nem sempre o valor calculado para a média dessa determi-
nada amostra (ou qualquer outro estimador) acertará no alvo o valor real da
população. Sendo assim, para estimativas de parâmetros, podemos calcular
intervalos com alta probabilidade de conter o verdadeiro valor do parâmetro
populacional.
Podemos, também, calcular o erro cometido com esse estimador e, ainda,
o tamanho mínimo para a amostra dessa estimativa.
Vale lembrar que o erro e a confiança fixados no cálculo para o tamanho de amostra
só serão válidos se a amostra for probabilística.
Qualquer amostra só poderá resultar em um bom estimador caso ela seja coletada
de forma aleatória. Jamais podemos fazer uso de amostras não probabilísticas e ten-
denciosas para estimarmos parâmetros.
3Estimação de parâmetros
Estimativas tendenciosas e não tendenciosas
Mas o que é uma estimativa tendenciosa? Chamamos uma estimativa de ten-
denciosa, ou estimador viciado e estimador enviesado, quando esta subestimar
ou superestimar o valor do parâmetro.
Vício é a diferença entre a média da estatística (estimador) e o verdadeiro
valor do parâmetro populacional. A Figura 2 ilustra a diferença entre um
estimador tendencioso e não tendencioso.
Figura 2. Ilustração de estimadores tendenciosos e não tendenciosos.
Estimador não tendencioso Estimador tendencioso
Segundo Doane e Seward (2014), a média amostral (x–) e a proporção
amostral (p) são estimadores não viciados da μ e da π, respectivamente. Mas
podemos encontrar estimadores viciados quando consideramos o desvio-padrão
amostral e o desvio-padrão populacional.
μ =
∑Xi
N média populacional
x– =
∑xi
n média amostral
� = X
N proporção populacional
p = x
n proporção amostral
Estimação de parâmetros4
σ =
∑(Xi – μ)2
N
desvio-padrão populacional
s =
∑(xi – x–)2
n – 1
desvio-padrão amostral
Estimativas eficientes
Um estimador é dito eficiente frente aos demais possíveis dentre as amostras
oriundas da mesma população. Será aquele que tiver a menor variabilidade.
Ou seja, se dois estimadores tiverem a mesma média, o estimador mais efi-
ciente será aquele com a menor variância. O outro estimador será
considerado ineficiente, conforme ilustrado na Figura 3.
Figura 3. Ilustração de estimadores eficientes e não eficientes, ambos não viciados.
Estimador e�ciente Estimador não e�ciente
Como existe essa variabilidade, podemos, então, estimar o erro que estamos
cometendo com essa estimativa. Quando estamos estimando a média popula-
cional (μ) pela média amostral (x–), cometemos o erro amostral: a probabilidade
é de 1 – α de que a estimativa vá diferir para mais ou para menos do valor
populacional por, no máximo, um erro de:
E = zα/2 ∙
σ
√n
5Estimação de parâmetros
onde:
E: erro máximo de estimativa;
𝜎: desvio-padrão populacional;
n: tamanho da amostra;
zα/2: valor da tabela normal padrão.
Na Figura 4, pode ser visualizada a distribuição amostral da média.
Figura 4. Distribuição amostral da média.
Fonte: Freund (2006, p. 272).
1 – α
α/2 α/2
x–
μ zα/2 ∙
σ
√n
No Quadro 1, a seguir, apresentamos os valores para os principais níveis de significância.
1 – α α/2 zα/2
1 – 0,1 = 0,90 = 90% 0,05 1,645
1 – 0,05 = 0,95 = 95% 0,025 1,960
1 – 0,01 = 0,99 = 99% 0,005 2,575
Quadro 1. Valores da tabela normal para os principais níveis de significância
Estimação de parâmetros6
Uma financeira coletou uma amostra aleatória de 100 pessoas para estimar o valor
médio de endividamento de seus clientes. Com base em pesquisas anteriores, sabe-se
que o desvio-padrão populacional é de R$ 630,00 (σ = 630,00). Com uma probabilidade
de 95%, qual seria o erro máximo para a estimativa?
E = 1,960 · = 123,48630
√100
Com uma confiança de 95%, podemos afirmar que o erro máximo dessa estimativa
é de 123,48.
Precisamos observar que nem sempre sabemos o verdadeiro valor do desvio-padrão
populacional. Aliás, muito raramente teremos esse valor, pois, se tivéssemos facilmente
o desvio-padrão populacional, já saberíamos o valor da média populacional.
Assim sendo, é admissível utilizarmos o desvio-padrão amostral comoestimativa
do desvio-padrão populacional, sempre que tivermos um tamanho da amostra igual
ou superior a 30.
Consequências dos estimadores
Como consequências das propriedades dos estimadores, quando temos uma
distribuição de probabilidades para os possíveis resultados de amostras alea-
tórias, podemos calcular intervalos de confiança que contenham o verdadeiro
valor do parâmetro populacional e uma confiança associada a esse intervalo.
Podemos, também, calcular tamanhos mínimos de amostras para que os dados
amostrais sejam representativos de toda uma população.
A distribuição de probabilidades associada aos dados da nossa população
é que nos dará a confiança necessária tanto para os intervalos de confiança
quanto para o tamanho mínimo de amostras. Leva-se em consideração o
teorema do limite central.
Intervalos de confiança
Podemos calcular um intervalo de variação para a média amostral, que terá uma
probabilidade definida de conter o verdadeiro valor do parâmetro populacional.
Isso é possível porque temos uma distribuição associada aos dados po-
pulacionais e amostrais. Utilizaremos a distribuição normal para esses in-
tervalos e teremos uma confiança fixada de acordo com essa distribuição de
probabilidades.
7Estimação de parâmetros
Existem valores que são mais comuns para o cálculo dos intervalos de
confiança: 90%, 95% e 99%. Os valores das probabilidades associadas a esses
níveis de confiança são os seguintes:
90% de confiança → z0,05 = 1,645
95% de confiança → z0,025 = 1,960
99% de confiança → z0,005 = 2,575
O intervalo de confiança para estimar uma média é descrito a seguir:
x– ± zα/2 ∙
σ
√n
com o desvio-padrão populacional conhecido
x– ± tα/2; n – 1 ∙
s
√n
com o desvio-padrão populacional desconhecido
Observe que, ao invés de utilizarmos a distribuição normal para o intervalo
de confiança com o desvio-padrão desconhecido, tomamos a distribuição t-stu-
dent, observando o α/2 e n–1 graus de liberdade. Vale ressaltar que, para n ≥ 30,
os valores da distribuição t e da distribuição normal igualam-se. Observe a
Figura 5, a seguir.
Figura 5. Comparação distribuição t e distribuição normal.
Fonte: Doane e Seward (2014, p. 306).
A distribuição t tem o mesmo formato da distribuição normal, mas, para n
menor do que 30, existe uma pequena diferença no formato, ocasionada pelo
tamanho da amostra. Veja a tabela da Figura 6.
Estimação de parâmetros8
Figura 6. Distribuição t-student.
Para encontrar o valor tabelado, cruzamos a coluna de alfa escolhido com
a linha dos graus de liberdade. Nesse caso do número de graus de liberdade,
precisamos fazer n–1.
9Estimação de parâmetros
Suponha que a financeira coletou uma amostra de 100 clientes e questionou sobre o
valor de endividamento deles, obtendo como resultado uma média amostral de R$
2.350,00 e um desvio-padrão amostral de R$ 590,00. Obtenha o intervalo de confiança
de 95% para a média.
x– = 2350,00
s = 590,00
n = 100
t0,025;99 = 1,960
x– ± tα/2
;n – 1 · = 2350 ± 1,960 ·
2350 ± 115,64
[2234,36; 2465,64]
s
√n
590
√100
Com 95% de confiança, a verdadeira média populacional para o valor médio de
endividamento estará entre R$ 2.234,36 e R$ 2.465,64.
De acordo com o intervalo, podemos calcular o tamanho mínimo de amostra
para quando queremos estimar a média populacional, isolando o n na equação
do erro máximo amostral. Esse valor nos fornecerá um tamanho de amostra
mínimo para que a amostra seja representativa da população, caso coletada
de forma aleatória.
n =
zα/2 ∙ σ
E( )2
Por exemplo, qual seria o tamanho mínimo de amostra com uma confiança
de 95%, no caso de uma pesquisa com consumidores para investigar o valor
gasto com presentes no dia dos namorados. Sabe-se que o desvio-padrão
populacional da pesquisa no ano anterior foi de R$ 65,00. Os pesquisadores
querem errar, no máximo, em R$ 10,00.
Estimação de parâmetros10
z0,025 = 1,96
σ = 65,00
E = 10,00
n =
zα/2 ∙ σ
E( ) ( )2 2
= = 162,3 = 1631,96 · 65
10
Vale ressaltar que, no caso do tamanho mínimo de amostra, sempre se
arredonda para cima, independentemente de regras de arredondamento.
Podemos calcular, também, um intervalo de variação para a proporção
amostral. A teoria é semelhante à empregada no intervalo de confiança para
a média. Os cálculos são realizados de acordo com a equação a seguir.
p ± zα/2 ·
p ∙ (1 – p)
n
onde:
p: proporção amostral
n: tamanho da amostra
Zα/2
: valor tabela normal padrão
Assim como podemos calcular o tamanho mínimo de amostra para estimar
uma média, também podemos calcular o tamanho mínimo de amostra para
estimar uma proporção. A fórmula do tamanho mínimo de amostra também
é derivada da fórmula do erro máximo amostral para a proporção.
Ainda temos o intervalo de variação para o desvio-padrão de uma amostra
retirada de uma população que segue uma distribuição normal.
n =
zα/2
2 ∙ p(1 – p)
E2
Quando não conhecemos o verdadeiro valor da proporção populacional,
utilizamos o p = 0,5. Assim, podemos superestimar o tamanho da amostra,
já que a proporção não é conhecida.
11Estimação de parâmetros
Suponha que você deseja estimar a proporção de clientes satisfeitos com determinado
produto da sua empresa. Deseja-se cometer um erro máximo de estimação de 3%,
com uma confiança de 90%. Qual seria o tamanho mínimo de amostra para estimar
essa proporção?
zα
/2
= 1,645
p = 0,5 pois o p é desconhecido
E = 0,03 precisamos tirar do percentual
n =
zα/2
2 · p(1 – p)
E2 =
1,6452 · 0,5 · (1 – 0,5)
0,032
= 752

DOANE, D. P.; SEWARD, L. E. Estatística aplicada à administração e economia. 4. ed. Porto
Alegre: AMGH; Bookman, 2014. 840 p.
FREUND, J. E. Estatística aplicada: economia, administração e contabilidade. 11. ed.
Porto Alegre: Bookman, 2006. 536 p.
Leitura recomendada
SPIEGEL, M. R.; STEPHENS, L. J. Estatística. 4. ed. Porto Alegre: Bookman, 2009. 600 p.
(Coleção Schaum).
Estimação de parâmetros12
Conteúdo: