A maior rede de estudos do Brasil

Grátis
26 pág.
aula_04

Pré-visualização | Página 2 de 2

e´ pelo menos
1−
αm + αm + ...+ αm︸ ︷︷ ︸
m termos
 = 1− α.
16
Portanto, com um coeficiente de confianc¸a glo-
bal de pelo menos 1 − α, podemos construir
os seguintes m = p intervalos para os compo-
nentes do vetor µ:
IC(µi,1−α) : X¯i±tn−1
(
1− α
2p
)√
sii
n
, i = 1,2, ..., p.
Esses intervalos, podem enta˜o, de forma mais
apropriada, ser comparados aos intervalos T2.
Exemplo: Usando novamente os dados sobre
radiac¸a˜o em fornos de microondas, pede-se
comparar os intervalos T2 para os componentes
do vetor de me´dia com os intervalos via Bon-
ferroni.
17
linf1t=0.5212495, lsup1t=0.6072655
linf2t=0.5596819, lsup2t=0.6462806
18
A tabela a seguir ilustra uma comparac¸a˜o en-
tre os comprimentos dos intervalos via Bon-
ferroni e T2 para alguns valores selecionados
de p, m = p, n e α = 0,05. As entradas nas
treˆs colunas referentes aos diferentes valores
de p selecionados representam a raza˜o entre o
comprimento do intervalo via Bonferroni e o
comprimento do intervalo T2.
n p = 2 4 10
15 0,88 0,69 0,29
25 0,90 0,75 0,48
50 0,91 0,78 0,58
100 0,91 0,80 0,62
∞ 0,91 0,81 0,66
Podemos ver desta tabela que os intervalos
via Bonferroni produzem intervalos mais es-
treitos quando m = p. Devido a` facilidade de
aplicac¸a˜o e aos resultados mais eficientes em
termos de estimac¸a˜o, geralmente e´ prefer´ıvel
usar os intervalos simultaˆneos via Bonferroni.
19
Infereˆncias sobre um vetor de me´dia para grandes
amostras
Quando o tamanho da amostra e´ grande, testes
de hipo´teses e regio˜es de confianc¸a para µ po-
dem ser constru´ıdos mesmo que a populac¸a˜o
subjacente na˜o seja normal. Veja os exerc´ıcios
5.15, 5.16 e 5.17. Neles, para n grande, so-
mos capazes de fazer infereˆncias sobre o vetor
de me´dia da populac¸a˜o apesar da distribuic¸a˜o
populacional ser discreta.
De fato, desvios fortes de uma populac¸a˜o nor-
mal podem ser superados para tamanhos amos-
trais grandes.
Ambos, testes de hipo´teses e intervalos de con-
fianc¸a simultaˆneos, tera˜o n´ıveis nominais apro-
ximados.
20
As vantagens associadas com grandes amostras
podem ser parcialmente compensadas por uma
perda de informac¸a˜o amostral causada pelo
uso somente das estat´ısticas suma´rio X¯ e S.
Por outro lado, como (X¯, S) e´ uma estat´ıstica
suficiente para populac¸o˜es normais, quanto mais
pro´ximas da normal multivariada forem as dis-
tribuic¸o˜es das populac¸o˜es, mais eficientemente
a informac¸a˜o amostral sera´ utilizada ao fazer
infereˆncias.
Todas as infereˆncias sobre µ quando se tem
grandes amostras sa˜o baseadas na distribuic¸a˜o
de qui-quadrado.
21
Proposic¸a˜o 1: Seja X1, X2,...,Xnuma amostra
aleato´ria de uma populac¸a˜o com me´dia µ e ma-
triz de variaˆncia positiva definida Σ. Quando
n − p e´ grande, a hipo´tese H0 : µ = µ0 e´ re-
jeitada em favor de H1 : µ 6= µ0, ao n´ıvel de
significaˆncia α, se
n(x¯− µ0)TS−1(x¯− µ0) > χ2p(1− α)
Comparando este teste com o obtido via teoria
normal, no in´ıcio destas notas, vemos que a
estat´ıstica de teste e´ a mesma, o que muda
e´ o valor cr´ıtico. Um exame mais minucioso
revela, pore´m, que ambos os testes produzira˜o
os mesmos resultados em situac¸o˜es nas quais
o teste χ2 e´ apropriado.
De fato, (n−1)pn−p Fp,n−p(1 − α) e χ2p(1 − α) sa˜o
aproximadamente iguais para n >> p.
22
Proposic¸a˜o 2: Seja X1, X2,...,Xnuma amostra
aleato´ria de uma populac¸a˜o com me´dia µ e
matriz de variaˆncia positiva definida Σ. Se n−p
e´ grande,
aT X¯ ±
√
χ2p(1− α)
√
aTSa
n
compreedera´ aTµ, para todo a com probabil-
idade aproximadamente 1 − α. Consequente-
mente, podemos fazer afirmac¸o˜es simultaˆneas
para os p componentes do vetor de me´dias
dadas por
x¯i ±
√
χ2p(1− α)
√
sii
n
, i = 1,2, ..., p
Observac¸a˜o: Elipses de confianc¸a para pares
de componentes tambe´m podem ser facilmente
constru´ıdas.
23
A questa˜o de qua˜o grande deve ser o tamanho
da amostra na˜o e´ simples de ser respondida.
Em uma ou duas dimenso˜es, tamanhos amos-
trais em torno de 30 a 50 podem geralmente
ser considerados grandes. A medida que o
nu´mero de caracter´ısticas torna-se maior, cer-
tamente tamanhos amostrais maiores sera˜o exi-
gidos para que as distribuic¸o˜es assinto´ticas for-
nec¸am boas aproximac¸o˜es das verdadeiras dis-
tribuic¸o˜es das va´rias estat´ısticas de teste.
Na falta de estudos definitivos os autores sim-
plesmente propo˜em que n− p deve ser grande,
reconhecendo que o caso real pode ser mais
complicado do que isso. Uma aplicac¸a˜o com
p = 2 e n = 50 e´ muito diferente de uma
aplicac¸a˜o com p = 52 e n = 100 apesar de
ambas apresentarem n− p = 48.
24
Deve-se realizar as mesmas verificac¸o˜es exigi-
das para os me´todos baseados na normal. Ape-
sar de pequenos desvios da normalidade na˜o
causarem quaisquer dificuldades para n grande,
desvios extremos podem causar problemas. Es-
pecificamente, a taxa de erro verdadeira pode
estar bem afastada do n´ıvel nominal α. Se,
com base nos Q-Q plots e outros esquemas de
investigac¸a˜o outliers e outras formas de desvios
extremos aparecem, ac¸o˜es corretivas apropri-
adas, incluindo transformac¸o˜es, sa˜o deseja´veis.
25
Exerc´ıcios recomendados do cap´ıtulo 5:
1 a 11, 15, 16 e 17, 18 a 24.
26

Crie agora seu perfil grátis para visualizar sem restrições.