AULA DE ESTATISTICA APLICADA
313 pág.

AULA DE ESTATISTICA APLICADA


DisciplinaEstatística Aplicada8.946 materiais79.954 seguidores
Pré-visualização50 páginas
ao acaso, para a experiência.
Vários exemplos de quadrados latinos são apresentados no Apêndice B.
Modelo populacional
O modelo populacional simplificado deste tipo de planeamento é,
142 CAPÍTULO 7. TESTES ÀS MÉDIAS DAS DISTRIBUIÇÕES
yij(k) = µ + \u3b1i + \u3b2j + \u3b3k + eij(k)
com i = 1, ..., s, j = 1, ..., s, s é o número de níveis dos factores e k é determinado de
acordo com o i, j e o quadrado escolhido para a experiência que será do tipo s×s. Só serão
necessárias s2 observações. Cada observação é o resultado da combinação de um nível de
cada um dos três factores, que corresponde a uma célula da tabela de duas entradas do
tipo quadrado latino s× s.
A análise dos resultados obtidos na experiência pode ser feita do seguinte modo.
A tabela dos resultados passa a ter a forma:
factor em coluna
factor em linha 1 2 3 4 ... s média da linha
1 y11 y12 y13 y14 ... y1s y1.
2 y21 y22 y23 y24 ... y2s y2.
... ...
s ys1 ys2 . . yss ys.
média da coluna y.1 y.2 . . y.s Y
A variação de cada observação em relação à grande média, decompõe-se em
yij(k) \u2212 Y = (yi. \u2212 Y ) + (y.j \u2212 Y ) + (y(k) \u2212 Y ) + (yij(k) \u2212 yi. \u2212 y.j \u2212 y(k) + 2Y ) .
em que y(k) é a média de todas as entradas da tabela que pertencem ao nível k do 3ofactor
(letras).
As variações totais devidas aos diversos factores são:
- A soma dos quadrados das variações do factor em linha (1ofactor)
SQL = s
s\u2211
i=1
(yi. \u2212 Y )2 ; (7.40)
- a soma dos quadrados das variações do factor em coluna (2ofactor)
SQC = s
s\u2211
j=1
(y.j \u2212 Y )2 ; (7.41)
- a soma dos quadrados das variações do factor representado pelas letras
(3ofactor)
SQl = s
s\u2211
k=1
(y(k) \u2212 Y )2 , (7.42)
7.4. TESTE ÀS MÉDIAS DE K DISTRIBUIÇÕES 143
- a soma dos quadrados dos resíduos
SQR =
s\u2211
i=1
s\u2211
j=1
(yij(k) \u2212 yi. \u2212 y.j \u2212 y(k) + 2Y )2 ; (7.43)
- e a soma total dos quadrados
STQ =
s\u2211
i=1
s\u2211
j=1
(yij(k) \u2212 Y )2 . (7.44)
Assumindo, como nos casos anteriores, um modelo normal com variância comum \u3c32,
desconhecida, as variáveis SQL
\u3c32
, SQC
\u3c32
e SQl
\u3c32
são \u3c72(s\u2212 1), SQR
\u3c32
é \u3c72((s\u2212 2)(s\u2212 1)) e STQ
\u3c32
é
\u3c72(s2 \u2212 1).
A tabela ANOVA é então,
fonte soma dos graus de média dos v.a. F.
quadrados liberdade quadrados
factor em linha SQL s\u2212 1 MQL = SQLs\u22121 F1 = MQLMQR
factor em coluna SQC s\u2212 1 MQC = SQCs\u22121 F2 = MQCMQR
factor letras SQl s\u2212 1 MQl = SQls\u22121 F3 = MQlMQR
erro SQR (s\u2212 2)(s \u2212 1) MQR = SQR(s\u22122)(s\u22121)
TOTAL STQ s2 \u2212 1
em que F1, F2 e F3 são variáveis distribuídas segundo F-Fisher com (s\u2212 1) e (s\u2212 2)(s\u2212 1)
graus de liberdade.
Teste de hipóteses
. Rejeitar a hipótese nula,
H03 : \u3b3(1) = \u3b3(2) = ... = \u3b3(s) = 0
(de que não existem diferenças significativas nos efeitos do factor letras), contra a
hipótese alternativa H13: de que existem diferenças significativas devidas aos efeitos
do 3o factor,
se F3 \u2265 c .
Considere agora, outro exemplo, onde serão analisados 4 factores. Estes factores podem
ser analisados simultaneamente (um em presença dos outros três) usando um quadrado
greco-latino, no qual, os diferentes níveis de dois dos factores, vêm representados sobre
as linhas e as colunas de um quadrado; os níveis do 3ofactor representam-se com letras
\u2019latinas\u2019 e para representar os níveis do 4ofactor usam-se as letras gregas.
Propriedades do quadrado greco-latino:
144 CAPÍTULO 7. TESTES ÀS MÉDIAS DAS DISTRIBUIÇÕES
\u2022 todos os factores em estudo apresentam-se com o mesmo número de níveis;
\u2022 cada nível de cada factor deve combinar uma só vez com cada um dos
níveis dos outros factores.
Assim, um quadrado greco-latino do tipo 3 × 3, que corresponde a cada factor se
apresentar com 3 níveis, tem a forma:
Factor
em coluna
1 2 3
factor 1 A\u3b1 B\u3b2 C\u3b3
em 2 B\u3b3 C\u3b1 A\u3b2
linha 3 C\u3b2 A\u3b3 B\u3b1
Um exemplo de um quadrado greco-latino com factores de 5 níveis cada, do tipo 5× 5,
é
Factor em coluna
1 2 3 4 5
factor I A\u3b1 B\u3b3 C\u3be D\u3b2 E\u3b7
em II B\u3b2 C\u3b7 D\u3b1 E\u3b3 A\u3be
linha III C\u3b3 D\u3be E\u3b2 A\u3b7 B\u3b1
IV D\u3b7 E\u3b1 A\u3b3 B\u3be C\u3b2
V F\u3be A\u3b2 B\u3b7 C\u3b1 D\u3b3
As somas dos quadrados das variações devidas aos factores em linha, em coluna, aos que
usam letras latinas e aos que usam letras gregas são obtidas de modo idêntico ao referido
nos quadrados latinos. Para um quadrado do tipo s × s a variável SQR
\u3c32
(\u3c32 é a variância
da distribuição) é \u3c72((s\u2212 3)(s\u2212 1)) graus de liberdade.
7.4.8 Inferência não-paramétrica. Dados ordinais. Graduação das
observações.
Muitos dos processos de inferência já mencionados utilizam modelos populacionais com
uma estrutura específica baseada na distribuição da população.
Por exemplo, os testes de inferência sobre a média da população e a análise da variância
com a utilização de \u2019estatísticas\u2019 F-Fisher, baseiam-se na hipótese de que os resultados da
experiência constituem amostras aleatórias retiradas de uma população com distribuição normal.
A estatística não paramétrica baseia-se num conjunto de processos de inferência, que
são válidos para um grupo mais vasto e diversificado de distribuições. O termo inferência
não paramétrica deriva do facto de não ser necessário desenvolver um modelo populacional
em termos de uma curva densidade de probabilidade, dependente dos parâmetros, como é
o caso da distribuição normal.
7.4. TESTE ÀS MÉDIAS DE K DISTRIBUIÇÕES 145
Assim, a distribuição de uma \u2019estatística\u2019 para um teste não paramétrico, segundo a
hipótese nula, pode ser calculada sem ter em conta a forma da distribuição da população.
Por esta razão, são chamados testes livres de distribuição.
Nos teste paramétricos, os resultados da experiência eram registados, considerando uma
escala de medições e usando certos aspectos numéricos dos dados, tais como a média da
amostra, o desvio padrão, as somas dos quadrados dos desvios, etc.
No entanto, por vezes a atribuição de valores numéricos às observações pode tornar-se
um pouco arbitrária. Para estes casos, pode ser possível a atribuição de um conjunto de
valores ordenados. A este tipo de dados, é costume dar o nome de dados ordinais.
Com este tipo de observações, cuja informação vem unicamente ordenada ou graduada,
devemos utilizar processos não paramétricos na sua análise estatística.
Em testes de hipóteses, as \u2019estatísticas\u2019 dos testes não paramétricos utilizam outros as-
pectos tirados da amostra, tais como: sinais das medições, relação de ordem e graduação
das observações. Estes aspectos não necessitam do conhecimento prévio de uma escala
numérica utilizada para medir as observações.Os testes não paramétricos mais usados são
os:
\u2022 baseados em graduações;
\u2022 baseados na distância máxima entre duas funções de distribuição.
Começaremos por dar alguns exemplos de testes não paramétricos baseados nas gra-
duações das observações. Estes, calculam a \u2019estatística\u2019 do teste como uma função das
graduações.
Graduação das observações
A graduação de observações segue as seguintes regras, consoante as observações registem
valores repetidos ou não:
\u2022 Se as observações não registam valores repetidos,
i) Colocam-se as observações por ordem crescente de grandeza
ii) A partir da menor para a maior das observações, atribuem-se graduações, que
são os números inteiros 1, 2, 3, ..., até n, sendo n o número de observações na
amostra;
\u2022 Se as observações registam valores repetidos,
i) Quando se verificam observações, yij, repetidas, calcula-se a média das gra-
duações que seriam atribuidas caso essas observações não fossem repetidas, e
atribui-se essa graduação média a todas as observações desse conjunto de valores
repetidos.
ii) Em conjuntos de observações não repetidas a atribuição das graduações é feita
como já se referiu.
146 CAPÍTULO 7. TESTES ÀS MÉDIAS DAS DISTRIBUIÇÕES
7.4.9 Amostras independentes. Teste de Kruskal-Wallis.
No planeamento completamente aleatório, para comparar simultaneamente os efeitos de k
tratamentos, foi dividido aleatóriamente um conjunto de n unidades (n = n1 + n2 + ...nk)
em grupos de n1,
kaethe
kaethe fez um comentário
preciso das formulas do exercicio 31
1 aprovações
ines
ines fez um comentário
onde eu acho as formulas das resposta dos exercicios
0 aprovações
Carregar mais