Lívro Noções de Probabilidade e Estatística - Magalhães parte 2 (1)
97 pág.

Lívro Noções de Probabilidade e Estatística - Magalhães parte 2 (1)


DisciplinaProbabilidade e Estatística12.930 materiais121.660 seguidores
Pré-visualização39 páginas
definimos as quantidades soma de
quadrados dentro (SQD) e soma de quadrados total (SQT), da seguinte forma:
Knì KmI(
#,pin,:o
SQD:
SQT :
K,M\\(uti:t i:t
Krnf !(u:i.:t j:L
- i,n)' : t Dru, -Yn)' : t D",3 - *\1 ;i,:t j:t i.:1 j:r i.:t
K nì.
- ì)' :! !(ri - 7)= D,Dv,i - mKTzi:L j:l i:t j:r
É importante ressaltar que as expressões resultantes fornecem uma maneira mais
conveniente de se calcular, via computador ou manualmente, cada uma dessas
somas de quadrados.
A diferença entre SQT e SQD representa a somo de quadrados entre e
será denotada por SQE, isto é,
SQE: SQT _ SQD.
Das expressões para a soma de quadrados total e de dentro, segue que:
I{ I{
seE : *ltZu 
-Y)' : ^(DY? - NY').à:t i.:t
Cada uma das somas de quadrados envolve um certo número do
quantidades que estão sendo estimadas. Por exemplo, SQT contém 7 e SQD
contém Yi,i:1,...,1(. Levando este fato em considera!ão e o número dê
observações nas amostras, definimos os correspondentes quadrados médios:
QMT:
QMD:
SQT
Km-I
SQD
Km- K
: quadrado médio total;
: 
=j.g\:quadrado médio denrro;h\m- r)
SOEQME: È, quadrado médio entre.
T
9.4 Anólise de Variância 325
Note que, nesse caso, é preciso calcular as três quantidades anteriores
pois QMT não é igual à soma de QMD com QME.
O teste estatístico pataa hipótese.I/o envolve os quadrados médios. Se a
hipótese Ho náo for verdadeira, então, o Modelo 1 deve ser mais adequado aos
dados do que o Modelo 0. Em outras palavras, os resíduos produzidos pelo
Modelo 1 serão menores que os do Modelo 0. Analisando sob este ângulo,
podemos interpretar QME como sendo, em termos quantitativos, a informação
contida nos dados que ó captada pelo Modelo 1, enquanto que o QMD represento
a informação não explicada pelo Modelo 1. Portanto, se QME for grande
comparado à QMD, a parte sistemática do Modelo 1 estará captando grande parte
da informação dos dados e a hipótese Ho deverâ ser rejeitada. Definimos, então, a
quantidade
QMEH-_
'-eMD
Quanto maior for o valor de -F, maior será QME comparado a QMD e, assim,
maiores as evidências contra Ho.Para caracterizarmos o valor crítico a partir do
qual rejeitamos Ho, precisamos encontrar a distribuição de probabilidade para F,
Supondo as seguintes condições:
. Yi sáo variáveis aleatórias independentes;
. Todas as K populações têm variâncias iguais a o2;
'Yj - N(Po,o2),'i : L,..., K e j : !,.'.,m,
pode ser mostrado que
F-F(K-L,K(m-I))
isto é, a quantidade I' tem distribuição de Fisher-Snedecor com K 
- 
1 e
K(* 
- 
1-) graus de liberdade. Temos, agora, condições de encontrar o valor
crítico /, e determinar a região críticado teste, que será da forma
RC:{/ere*:f>fl}.
Das três suposições feitas, a mais impdrtante é a segunda , V ar(f;i) : o2 ,
para'i: L,...,K e j:1,...,Tn) que tem o nome técnico de homocedasticidade'
A suposição de normalidade é importante em termos teóricos, mas, muitas vezes,
na prática, o teste pode ainda ser utilizado quando ela não for válidn,
principalmente, se as amostras forem grandes. Nesses casos, o Teorema Central
do Limite pode ser utilizado para justificar o uso da distribuição de Fisher-
Snedecor. Caso a suposiçâto de hornocedasticidade não seja verdadeira, técnicas
J26 Capítulo 9: Tópicos Especials
alternativas podem ser utilizadas. Algumas delas envolvem aplicar urna
transformação logarítmica ou quadrática aos dados. Esse assunto envolve técnicat
mais avançadas e não será abordado nesse livro.
A discussão sobre o comportamento dos erros e das somas de quadrados é
resumida na Tabela 9.2 a seguir.
Tabela 9.2: Tabela de Análise de Variância (ANOVA).
A tabela ANovA fornece como subproduto um estimador para a
variância populacional o2, baseado na suposiçãã de homocedasticidade. Nessg
caso, a variância amostral para o z-ésimo grupo,
s?:J.Ë(Y1-To7z,
" rn-If,
pode ser usada para construir um estimador da variância populacional. Isto é feito
combinandoessesvaloresatravésdamédiaponderadaa"if,...,S?,
Knt
"z - 
(m 
- 
r)sÏ+ "' + (rn 
- 
t)sfu D D&i - v-o)'
""-@:__Nç*_g.
A expressão obtida para s! é a mesma que encontramos para eMD.Note aindaque a expressão de QMT também é um estimador para o2,uma vez que
QMT: 
=rtQt ' S S-rrr" -Y\2 - q2Km-I Km-ILí?r''" ') -r'
ou seja, QMT nada mais é do que a variância amostral s2 para uma amostrê
corïposta pelo conjunto de todas ai observações dos K grupos combinados,
E
9.4 Aruilise de Variância
Exemplo 9.77: Para os dados apresentados no Exemplo 9.16, temos K : 4
grupos e nt:7 observações por grupo. Além disso, obtemos Yt:22rïi
Tz:27,9; Ts:40,L e Ta:24,6. A média geral é Y:28,9' Cálculos
intermediários podem ser, facilmente, feitos em uma planilha eletrônica ou
calculadora fornecendo:
474
t t Yli : 24.672,42 " DT?: 3.b13,80.i:I j:r i:L
Usando as fórmulas de cálculo apresentadas anteriormente, obtemos
Ktnl(
sQD : DLUS - *:Dfi : 24.672,42 - 7 x 3.513,80 : 75,82;i:r j:L
i27
i.:t
K
sQE: *(DT? 
- 
KY'):7 x (3.513,80-4 x 28,86') =r.275,4U
i:l
It In
SQT: D,DU\-*KYz :24.672,42-T x 4x 28,862:1.351,23.i:r j:l
Uma vez calculadas duas das somas de quadrados acima, obtemos, sem
dificuldade, a terceira. A tabela ANOVA é apresentada a seguir.
Fonte de Graus de
Variação Liberdade
Soma de
Quadrados
Quadrado
Médio F
L.275,4L lgy : 452,,L4 W : L94,54
75,82 ff :3,,L6
Total 27 1.351,23
Através da distribuição de Fisher-Snedecor, com 3 e 24 graus de
liberdade e, considerando a :\Vo, obtemos 
"f":3,009. Logo, como calculamos
.f,,t,":L34r54 > /,, concluímos que, ao nível de significância de 5Vo, as médias
de peso dos grupos são diferentes, confirmando as observações descritivas feitas
Entre
Dentro
3
24
trrnteriormente.
328
Grupos de tamanhos diferentes
No desenvolvimento anterior, supomos que os 1( grupos têm todos o
mesmo tamanho. Podemos considerar uma situação mais geral em que isto não
acontece. Vamos denotar pot na o número de elementos do grupo e. Neste caso, o
total de indivíduos nos K grupos será igual a
n:nL*...1nx.
Todos os resultados anteriores permanecem válidos, mas modificações algé
são necessárias nas expressões que agora serão escritas da seguinte forma:
Kni
seD: It(0,,, - ro)r:i:t j:r
K
SQE : D"n(To -i':L
Kni
sQr : !!(ui -v),i:t j:r
Fonte de Graus de
Variação Liberdade
Soma de Quadrado
Quadrados Médio
Entre
Dentro
K_T
n- K
SQE
SQD
Total n 
- 
I
comF 
- 
F(K 
-I,n- K).
i:r
Kn;
: I D,ul -,Y'.à:t j:l
Note que, nesse caso, as médias geral e dos grupos são dadas por:
por
.I(niv::tDu"
'o i:l 
.i:7
o,: 
*,,\yi, i:r,...,K.
A Tabela de Análise de Variância sofre poucas modificações, sendo dada
SQT
-"tt
ncas
9.4 AnáIise de Variância 329
Exemplo 9.18: O volume de vendas, no ramo de vestuário, tem se mantido estóVOl
de ano para ano, mas açredita-se que sofra mudança de um quadrimestre pere
outro, dintro de um mesmo ano. Através de uma metodologia adequada, fOl
criado um índice que reflete a quantidade vendida. Em cada um dos quadrimestre8
do ano, foram escolhidas aleatoriamente algumas empresas de mesmo porte e $ÇUS
índices de venda foram calculados (ver abaixo)'
Quadl Quad2 Quada3
114,7 L44,7 153,1
L44,7 173,4 L92,5
119,1 L54,2 745,5
r!3,7 L54,7 168,8
108,9 125,9 L4L,5
96,7 119,5 1.4r,2
87,6 155,7 189,6
L32,4 213,9 178,4
L56,2 208,6
159,0
O comportamento das vendas pode ser visualizado na próxima figura'
RUI<tt ufi -1&quot;;Y'z1;i:t j:L i.:L
F
QME QME/QMD
QMD
.tJ0 Capítulo 9: Tópicos Especiais
uma rápida avaliação dos box-prol mostra o primeiro quadrimestre com
iï,T:ï::::índices. Os outros dois quadrimesrres apresenram vaÌores u,,, Oou&quot;omais próximos.
O modelo de análise.. de variância pode ser aplicado parasignificância estatística_das diferenças obs&quot;ruaà^ oì.;&quot;&quot;. a#;
,-, : Lr, --8.,:r: L0 e ns 
-g. Faz&quot;d; 
&quot;r;;[;ì;r;;tï;H_^It