Baixe o app para aproveitar ainda mais
Prévia do material em texto
INTRODUÇÃO À ESTATÍSTICA FORMULÁRIO AMILTON BRAIO ARA ANA VILLARES MUSETTI SÃO CAETANO DO SUL 2005 1 Estatística descritiva 1. Dados não agrupados n x x n i i∑ = = 1 ( ) ( ) 11 2 2 2 12 − − = − − = ∑ ∑∑ = n n x x n xx s i i n i i 2. Dados agrupados n fx x k i ii∑ = = 1 ( ) − − = ∑ ∑ n fxfx n s ii ii 2 22 1 1 3. Coeficiente de variação x sCV = 4. Coeficiente de assimetria de Pearson ( ) s Mdx s MoxA −≅−= 3 Probabilidade 1. Fórmulas básicas ( ) n nAP A= ( ) ( ) ( ) ( )BAPBPAPBAP ∩−+=∪ ( ) ( )( )AP BAPABP ∩= Se A e B são independentes, então: ( ) ( ) ( )BPAPBAP ⋅=∩ 2 Se nAAA K,, 21 é uma partição de S, com 0)( >iAP , para todo i e B um evento de S com 0)( >BP , então: n1,2i , )()( )()()( 1 K= ⋅ ⋅ = ∑ − n i ii ii i APABP APABP BAP 2. Distribuições de Probabilidades 2.1 Média de uma variável aleatória X: a) X discreta: ∑== i ii xPxXE )()(µ b) X contínua: ∫ ∞ ∞− == dxxxfXE )()(µ 2.2 Variância de uma variável aleatória X: ( ) ( ) 222)( µµ −=−= XEXEXVar a) X discreta: ∑ −= i ii xPxXVar 22 )()( µ b) X contínua: 22 )()( µ−= ∫ ∞ ∞− dxxfxXVar . 2.3 Distribuição Binomial ( ) nkppkXP knknk K2,1,0,)1()( =−== − , onde ( ) ( ) !! ! , kkn nC kn n k − == )1()()( pnpXVarnpXE −== , 2.4 Distribuição de Poisson t k ekXP k λµµ µ === − , ! )( µµ == )()( XVarXE 3 2.5 Distribuição Exponencial < ≥ = − 0,0 0,)( t te tf tλλ , 2 1)(,1)( λλ == TVarTE 0,)( >=> − kekTP kλ 2.6 Distribuição Normal Se X é uma v.a. com distribuição normal com média µ e desvio padrãoσ , então σ µ− = XZ tem distribuição normal padrão. Intervalos de confiança 1. Para a média n zx n zx σµσ +≤≤− , ou n s tx n s tx +≤≤− µ ( t com 1−= nφ graus de liberdade) 2. Para a proporção n pp zpp n pp zp )1()1( ′−′ +′≤≤ ′ − ′ − ′ 3. Para a variância 2 2 1 2 2 2 2 2 )1()1( αα χ σ χ − −≤≤− snsn ( 2χ com 1−= nφ graus de liberdade) 4 Testes de hipóteses 1. Para uma média 00 : µµ =H n s x n x z 00 tou µ σ µ − = − = 2. Para uma proporção 00 : ppH = n pp pp z )1( ' 00 0 − − = 3. Para uma variância 20 2 0 : σσ =H 2 0 2 2 )1( σ χ sn −= 4. Para comparação de duas médias ∆=− 210 : µµH ( 0 teremos, de testeo Para:. 21 =∆= µµObs ) 4.1 dados emparelhados: n s x t ∆− = 4.2 Amostras independentes com desvios padrões conhecidos 2 2 2 1 2 1 21 nn )xx( z σσ + ∆−− = 5 4.3 Amostras independentes com desvios padrões desconhecidos, mas supostos iguais: 2nn s)1n(s)1n( s 21 2 22 2 112 p −+ −+− = 21 p 21 n 1 n 1 s )xx( t + ∆−− = 4.4 Amostras independentes com desvios padrões desconhecidos e diferentes 2 2 2 1 2 1 21 n s n s )xx( t + ∆−− = 5. Para comparação de duas proporções: θ=− 210 : ppH ( 0 teremos, de testeo Para:. 21 == θppObs ) 2 22 1 11 21 n )p(1p n )p(1p θ)pp( ′ − ′ + ′ − ′ − ′ − ′ =z ou, no caso de 210 : ppH = : 21 2211 nn pnpn ' + ′+′ =p e ) n 1 n 1)(p(1p pp 21 21 +′−′ ′ − ′ =z 6. Para comparação de duas variâncias: )s,mín(s )s,máx(s 2 2 2 1 2 2 2 1 =F 7. Para comparação de k variâncias, k>2: ∑∑ ∑ ∑ = − − −− += −− − − −= i i 2 ii 2 ii2 nn e kn 1 1n 1 1)3(k 11C onde 1)lns(n kn 1)s(n k)ln(n C 1χ 6 8. Para comparação de k médias, k>2: n x xSQT k i n j ijk i n j ij i i 2 1 1 1 1 2 −= ∑∑ ∑∑ = = = = n x n x SQE k i n j ijk i i n j ij ii 2 1 1 1 2 1 − = ∑∑ ∑ ∑ = = = = , onde n = Σni Tabela de Análise de Variância (ANOVA) Fonte de variação FV Graus de liberdade GL Soma de quadrados SQ Quadrados médios QM Valor de F Fcal Probabilidade P Entre amostras k − 1 SQE QME= 1k SQE − Residual n − k SQR QMR= kn SQR − Fcal= QMR QME P=P(F>Fcal) Total n − 1 SQT 9. Testes não paramétricos 9.1 Teste de aderência: ∑ − = i ii E EO 22 )(χ com (k-1-m) graus de liberdade, onde k = número de valores considerados no cálculo da estatística 2χ m = número de parâmetros do modelo de Ho que precisam ser estimados a partir da amostra ii npE = 7 9.2 Teste de independência: ∑∑ − = ij ijij E EO 22 )(χ com (r-1)(s-1) graus de liberdade, onde r = número de linhas da tabela s = número de colunas da tabela n jcolunadatotalilinhadatotal npE ijij )()( × == 10. Correlação e regressão linear 10.1 Coeficiente de correlação linear de Pearson yyxx xy SS S r = ,onde: ( ) ( ) n yx yxyyxxS n i i n i in i ii n i iixy −=−−= ∑∑ ∑∑ −= == 11 11 ( ) n x xxxS n i in i i n i ixx 2 1 1 2 1 2 −=−= ∑ ∑∑ = == ( ) n y yyyS n i in i i n i iyy 2 1 1 2 1 2 −=−= ∑ ∑∑ = == 10.2 Teste para o coeficiente de correlação linear de Pearson H0: 0=ρ 2 1 2 2 − − = − n r r tn 8 10.3 Regressão linear simples: Estimação do modelo. eXY ++= βα bxay +=) , xbya −= e xx xy n i in i i n i i n i in i ii S S n x x n yx yx b = − − = ∑ ∑ ∑∑ ∑ = = == = 2 1 1 2 11 1 onde n y y n x x n i i n i i ∑∑ == == 11 e yy xy S bS SQT SQE r == 2 10.4 Teste para o parâmetro 00 :: βββ =H xx R S s b t 2 0β− = 10.5 Teste para o parâmetro 00 :: ααα =H xx R nS xs a t∑ − = 22 0α 9 10.6 Intervalos de confiança a) para o valor esperado: xx Rn S xx n stxy 2 0 ;20 )(1)(ˆ 2 − +± − α onde: 00 )(ˆ bxaxy += 2 Rs é a estimativa da variância residual dada por 2 2 − − = n bSS s xyyy R , Rs é o respectivo desvio padrão. b) para o valor individual: xx Rn S xx n stxy 2 0 ;20 )(11)(ˆ 2 − ++± − α 10.7 Análise de variância Fonte de variação Graus de liberdade Somas de quadrados Quadrados médios Estatística F Regressão 1 xybSSQE = xybS 2 R xy s bS F = Resíduo 2−n xyyy bSSSQR −= 2 2 − − = n bSS s xyyy R Total 1−n yySSQT = 10.8 Regressão linear múltipla: Estimação do modelo. eXXXY kk ++++= βββα K2211 kk xbxbxbay L+++= 2211ˆ kk xbxbxbya L−−−= 2211 10 ++= ++= ++= kkkkkky kky kky SbSbSbS SbSbSbS SbSbSbS L M L L 2211 22222112 11221111 onde ( ) ( ) ( )( ) ( )( ) ( )( ) ( )( ) ki n yx yxyyxxSS jikji n xx xxxxxxSS ki n x xxxSS i iiiyxiy ji jijjiixxij i iiixxii i ji ii L L L 2,1 ,2,1, 2,1 2 22 =−=−−== ≠=−=−−== =−=−== ∑ ∑∑ ∑ ∑ ∑∑ ∑ ∑ ∑ ∑ onde os somatórios indicam os totais dos n valores de cada uma das variáveis. 10.9 Análise de variância Fonte de variação Graus de liberdade Somas dos quadrados Quadrados médios Estatística F Regressão k ∑= iyi SbSQE kSQEsE =2 2 2 R E s s F = Resíduo 1−− kn ∑−= iyiyy SbSSQR )1(2 −−= knSQRsR Total n-1 yySSQT = 10.10 Análise de melhoria ' 1 ' 1 ' 1 ' )1( eXXY kkk +++= −− ββα K eXXXY kkkkk ++++= −− βββα 1111)( K 11 Fonte de variação Graus de liberdade Soma de quadrados Quadrados médios Estatística F Devida à melhoria de ajuste 1 SQM SQM 2 ks SQMF = Residual para o modelo com k variáveis 1−− kn SQR(k) 1 )(2 −− = kn kSQR sk Residual para o modelo com (k-1) variáveis kn − )1( −kSQR Observemos que: )1()1( )()( )1( ' 12 ' 21 ' 1 2211 −−=−−−−=− −=−−−−= −− kSQESSbSbSbSkSQR kSQESSbSbSbSkSQR yyykkyyyy yykykyyyy K K logo: )1()()()1( −−=−−= kSQEkSQEkSQRkSQRSQM .
Compartilhar