Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Descritiva e Inferencial CE081 Prof. Dr. Jomar Camarinha CONTEÚDO • Estatística Descritiva e Exploratória • Teoria dos Conjuntos • Análise Combinatória • Noções de Probabilidade • Noções de Amostragem • Noções de Estimação de Parâmetros • Introdução aos Testes de Hipóteses • Introdução à Regressão e Correlação Estatística Descritiva e Inferencial Introdução Alguns Conceitos Distribuição Amostral Função de Probabilidade P-valor Tomada de Decisões Exemplos Processo Científico 1. Introdução Conhecimento Suposição Hipótese IdeiaIdeia Planejamento Experimental Delineamentos ExperimentosAnAnáálise de Dadoslise de Dados Estatística Descritiva e Inferencial Conclusões Alguns Conceitos – Experimento Aleatório (“provocar”↔ Condições) – População e Amostra – Variável – Variável (Resposta) = Var. Independente + Var. Residual – Tipos de Variável: 1. Qualitativa: Nominal (N) e Ordinal (O) 2. Quantitativa: Discreta (D) e Contínua (C) – Exemplos: • Raça (N); Produtividade de Leite (?); Dose Medicamento • Grau de Infestação (?); Escolaridade (?); Cor Olhos (?); • Número de Indivíduos Infectados (?); Quantidade de ... – Fator (Variável Independente) – Níveis do Fator – Tratamento – Parcela Exemplo: Colesterol; Medicamento; Dose – Testemunha (Grupo Controle, Placebo) – Bordadura – Delineamento Alguns Conceitos ExperimentaExperimentaExperimentaExperimentaçççção ão ão ão • Distribuição Amostral • Função de Probabilidade (Parâmetros de um Modelo) • P-valor • Tomada de Decisões Distribuição de Frequências ESTATURAS DE 40 ALUNOS DA FACULDADE A 166 160 161 150 162 160 165 167 164 160 162 168 161 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 Tabela 1 - Primitiva: Classe Estaturas (cm) �� ��� �� ��� 1 150|—154 4 0,1 4 0,1 2 154 |—158 9 0,225 13 0,325 3 158 |—162 11 0,275 24 0,6 4 162 |—166 8 0,2 32 0,8 5 166 |—170 5 0,125 37 0,925 6 170 |—174 3 0,075 40 1 ∑ = 40 ∑ = 1,00 Tabela 5 – Distribuição de Frequências dos dados de Estatura: Aspectos da mortalidade atribuível ao tabaco: revisão sistemática 186 artigos: ⇒⇒⇒⇒ 30 selecionados: Risco atribuível na população (SAM). Amostra final: 41 artigos Comparações de medidas de qualidade de vida entre mulheres e homens em hemodiálise Escores: - PCS: entre 14,6 e 60,7 (média=39,7±10,3; mediana=40,8) - MCS entre 14,2 e 75,0 (média=47,7±12,4; mediana=48,6) - Sintomas/problemas entre 12,5 e 100 (média=76,4±17,8; mediana=81,2). Conclusões: - Significantemente menores em mulheres - As diferenças entre mulheres e homens foram: de 2,4 pontos para PCS (P=0,005); de 3,0 pontos para MCS (P=0,005); de 6,6 pontos para sintomas/problemas (P<0,001). Exemplo 1 175 > 173? (DEPENDE!!!) • n • Variabilidade • Comportamento dos Dados (Função de Probabilidade) Exemplo 2 • Experimento: 16 bolas n = 2 (s/ rep.) 45 40 20 6 8 1 120 Função de Probabilidade 0,00 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 AA VV VA BA BV BB Tomada de Decisões Situações Ocorrência Implicação Decisão A Afirmação Falsa Mentiu B Afirmação Possível C Afirmação Possível Exemplo 1 180 > 173? Depende!!! X Θ N n n n n . . . . . . 1θ̂ 2θ̂ 3θ̂ Kθ̂ 3210-1-2-3 θ̂ 2 1 02 0 01 9 01 8 01 7 01 6 01 5 01 4 01 3 0 0 ,0 3 5 0 ,0 3 0 0 ,0 2 5 0 ,0 2 0 0 ,0 1 5 0 ,0 1 0 0 ,0 0 5 0 ,0 0 0 X D e n s it y D is tr i bu t io n P lo t No rm a l; M e a n= 1 7 3 ; S tDe v= 1 2 0 ,4 0 ,3 0 ,2 0 ,1 0 ,0 X D e n s it y 1 7 5 ,4 0 ,0 0 8 1 7 3 N o rm a l; M e a n = 1 7 3 ; S tD e v= 1 D is t r ib u t io n P lo t n = 1 4 4 Intervalo de Confiança Teste de Hipóteses • Interpretação • Regra de Decisão • P-Valor X Θ N n n n n . . . . . . 1θ̂ 2θ̂ 3θ̂ Kθ̂ 3210-1-2-3 θ̂ ANOVA Definição • Decomposição da Variabilidade Total Var. Total = Var. Tratamentos + Var. Residual ANOVA • Delineamentos: Inteiramente casualizado, blocos ao acaso, quadrado latino, parcelas subdivididas, delineamentos em faixas. • Princípios Básicos da Experimentação Repetição Casualização Controle Local Princípios Básicos da Experimentação EB Repetições A A A A A A B B B B B B EB Repetições com Casualização A A B A B A B B A B B B A A B A A B EB Repetições com casualização e controle local A A B B A B A B B B B A A B A B A A Princípios Básicos da Experimentação Pressupostos para Realização da ANOVA • Normalidade (Histograma Res.; qqplot) (Shapiro-Wilk) • Independência (Res. x Valores ajustados) • Homocedasticidade (ResxTrat) (Bartlett) Experimentos no Delineamento Inteiramente Casualizado Características • Homogeneidade: Material Experimental Condições Ambientais • Alocação dos Tratamentos • Vantagens e Desvantagens ANOVA - DIC • Modelo Probabilístico ijiij ety ++= µ );(~ 2σµNeij iid ii t+= µµ Variabilidades EnvolvidasVariabilidades Envolvidas .1y ..y .2y .Iy Repetições Tratamentos 1 2 ... J Média 1 y11 y12 ... y1J 2 y21 y22 ... y2J ... ... ... ... ... ... I yI1 yI2 ... yIJ Ho: µ1 = µ2 = µ3 = … = µT Decomposição da Variabilidade ( ) ( ) ( )[ ] ( ) ( ) ( )( )..2..2 2 .. 2 .. ..2.. .. yyyyyyyy yyyyyy iiijiiij iiijij −−+−+− −+−=− ( ) ( ) ( )[ ].... .. yyyyyy iiijij −+−=− ( ) ( ) ( )∑ ∑∑∑∑ = === = −+−=− I i I i i J j iij I i J j ij yyJyyyy 1 2 1 .. 1 2 1 1 2 .. .. Decomposição da Variabilidade Distribuições Funções de Densidade ( ) 2 1 1 2 .. σ ∑∑ = = − I i J j ij yy ( ) 2 1 1 2 . σ ∑ ∑ = = − I i J j iij yy ( ) 2 1 2 ... σ ∑ = − I i i yyJ ∑∑ − I i J j ij Cy 2 Fontes de Variação Graus de Liberdade Soma de Quadrados Quadrado Médio F Tratamentos I - 1 SQtrat/(I-1) QMtrat/QMres Resíduo I.(J – 1) Por diferença SQres/I(J-1) Total I.J - 1 ∑ − I i i Cy J 2 . 1 SQHo Ho: µ1 = µ2 = µ3 = … = µT Ha: pelo menos um par difere Testes de Comparações Múltiplas e Análise de Regressão • Contrastes de Médias – Tukey – Duncan – Dunnett • Regressão Polinomial TUKEY r QM q sRe.=∆ EXEMPLO • Comparação: • 88t/ha e 93t/ha • ∆ = 7,6 t/ha Variabilidades EnvolvidasObtenção das Variabilidades Envolvidas Repetições Tratamentos 1 2 ... J Total 1 y11 y12 ... y1J y1. 2 y21 y22 ... y2J y2. ... ... ... ... ... ... I yI1 yI2 ... yIJ y3. y.. Ho: µ1 = µ2 = µ3 = … = µT Exemplo Linhagens Repetições Total I II III IV V VI L1 385 323 417 370 437 340 2272 L2 406 385 444 443 474 437 2589 L3 354 292 389 312 432 299 2078 L4 271 208 347 302 370 264 1762 L5 344 292 354 354 401 306 2051 L6 354 354 410 453 448 417 2436 L7 167 115 194 130 240 139 985 L8 344 385 410 437 437 410 2423 L9 385 385 396 453 458 417 2494 Total 19090 Somas de Quadrados • SQTotal = • SQTrat = 1,918.332 6.9 19090 )2494...25892272( 6 1 2222 =−+++= ∑ − I i i Cy J 2 . 1 ∑∑ − I i J j ij Cy 2 5,119.420 6.9 19090 417...323385 2 222 =−+++= Fontes de Variação Graus de Liberdade Soma de Quadrados Quadrado Médio F Tratamentos 9 - 1 332.918,1 332.918,1/8 21,48** Resíduo 9.(6 – 1) Por diferença 87.201,4/45 Total 9.6 - 1 420.119,5 SQTrat Ho: µ1 = µ2 = µ3 = … = µT Ha: pelo menos um par difere ANOVA TUKEY • q = amplitude total estudentizada • I e g.l. do Resíduo. r QM q sRe.=∆ • ∆=4,64.√1938/6 = 83,39 micras /h; • Diferença Significativa > ∆; • Exemplo: L6 x L4: 406,00 - 293,67 = 112,33 TUKEY Tabela Resumo Tratamento Média Diferenças L2 431,50 A L9 415,67 AB L6 406,00 AB L8 403,83 AB L1 378,67 AB L3 346,33 BC L5 341,83 BC L4 293,67 C L7 164,17 D Contrastes • Contraste: Y= a1µ1 + a2 µ2 + ... + akµk • Teste: 0=∑ k i i a )ˆ( ˆ YS DY t − = k k k kk r S a r S a r S aYV VaVaYYVOCYV 2 2 2 2 22 2 1 2 12 1 2 12 1 ...)ˆ(ˆ )ˆ(ˆ...)ˆ(ˆ)ˆ;ˆ(ˆ)ˆ(ˆ +++= ++== µµ Contrastes r QM aaa r S a r S a r S aYV s k k k k Re22 2 2 1 2 2 2 2 22 2 1 2 12 1 )...( ...)ˆ(ˆ +++= =+++= Tukey Aproximado • Dados Desbalanceados 2 )ˆ(ˆ .' YV q=∆ Contrastes • Ortogonais: Covariância Nula • I – 1 contrastes. 02 =∑ i k i i ii S r ba Exemplo • 4 Tratamentos: 1- Abacaxi (0,9x0,3 m) - 2 - Abacaxi (0,8x0,3 m) - 3 - Abacaxi + Amendoim - 4 - Abacaxi + Feijão - 1 (1 e 2) x (3 e 4) = - 13t/ha 2 (1) x (2) = - 3t/ha 3 (3) x (4) = 2t/ha 4 hat hat hat hat /5,60ˆ /5,62ˆ /5,56ˆ /5,53ˆ 4 3 2 1 = = = = µ µ µ µ TESTE “t” )ˆ( ˆ YS DY t − = Teste • Para o Contraste: (1 e 2) x (3 e 4) = - 13t/há )ˆ( 013 YS t −− = 4,0 8 8,0 ])1()1(11[ )...()ˆ(ˆ 2222 Re22 2 2 1 =−+−++= =+++= r QM aaaYV s k Teste “t” 55,20 4,0 013 −= −− =t Blocos Casualizados BLOCOS TRAT. 1 2 3 4 TOTAIS 1 142,36 144,78 145,19 138,88 271,21 2 139,28 137,77 144,44 130,61 552,10 3 140,73 134,06 136,07 144,11 554,97 4 150,88 135,83 136,97 136,36 560,04 5 153,49 165,02 151,75 150,22 620,48 TOTAIS 726,74 717,46 714,42 700,18 2858,80 Somas de Quadrados • SQTotal = SQTrat = SQBlocos = 95,1273 4.5 8,2858 22,150...36,142 2 22 =−++= ∑∑ − I i J j ij Cy 2 CCy J I i i −++=−∑ )48,620...21,271( 5 11 222 . CCy I J j j −++=−∑ )18,700...74,726( 5 11 222 . ANOVA Source DF Seq SS Adj SS Adj MS F P Tratamentos 4 794,93 794,93 198,73 5,87 0,007 BLOCOS 3 72,70 72,70 24,23 0,72 0,561 Error 12 406,32 406,32 33,86 Total 19 1273,95 Ensaios Fatoriais – Ex.17 85,321,322,821,419,86 80,219,218,819,422,85 78,318,619,021,119,64 103,526,425,126,325,73 101,325,226,724,624,82 = 102,625,425,026,026,21 = R1E1 4321 TOTAISREPETIÇÕESTRAT. Variabilidades 23,659.12 46 2,551 22 = × == IJ G C 79,198 4.6 2,551 3,21...0,262,26 2 222 =−+++= ∑∑ −= I i J j ijTotal CySQ 2 70,175)3,85...6,102( 4 11 222 . =−++=−= ∑ CCy J SQ I i iTrat Desdobramento do g.l. × ..2 ..1)( ..2)(Re ..5 lgERInteração lgEEspécies lgRcepientes lgsTratamento 551,2165,5181,8203,9TOTAIS 264,985,378,3101,3E2 286,380,2103,5102,6E1 TOTAISR3R2R1(4) 86,92)5,1658,1819,203( 8 1 222 Re =−++= CSQ cipientes 08,19)9,2643,286( 12 1 22 =−+= CSQEspécies 70,175)3,85...6,102( 4 1 22 =−++= CSQRE 76,6308,1986,9270,175 Re =−−= −−=× EspcERInteração SQSQSQRESQ Quadro da ANOVA Analysis of Variance for Altura Eucaliptos, using Adjusted SS for Tests Source DF Seq SS Adj SS Adj MS F P RECIPIENTE 2 92,861 92,861 46,430 36,20 0,000 ESPÉCIE 1 19,082 19,082 19,082 14,88 0,001 RECIPIENTE*ESPÉCIE 2 63,761 63,761 31,880 24,85 0,000 Error 18 23,090 23,090 1,283 Total 23 198,793 Split-Plot Exemplo aCaracterísticas: Divisão em subparcelas; Tratamentos principais: níveis de fator colocado; Tratamentos secundários: níveis de fator casualizado; Experimento: Calcário e Fertilizante; Modelo: yijk = µ + ci + fk + (cf)ik + bj + (cb)ij + eijk onde: (cb)ij = Resíduo (A) eijk = Resíduo (B) Croqui A2B1 A2B3 A2B2 A1B2 A1B1 A1B3 A1B2 A1B1 A1B3 A2B1 A2B2 A2B3 A2B1 A2B3 A2B2 A1B1 A1B3 A1B2 A1B2 A1B3 A1B1 A2B3 A2B2 A2B1 1°BLOCO 2°BLOCO 3°BLOCO 4°BLOCO Exemplo 18 VARIEDADES (A) TRATAMENTOS DE SEMENTES (B) BLOCOS TOTAIS1 2 3 4 A1 B1 42,9 41,6 28,9 30,8 144,2 B2 53,8 58,5 43,9 46,3 202,5 B3 49,5 53,8 40,7 39,4 183,4 B4 44,4 41,8 28,3 34,7 149,2 A2 B1 53,3 69,6 45,4 35,1 203,4 B2 57,6 69,6 42,4 51,9 221,5 B3 59,8 65,8 41,4 45,4 212,4 B4 64,1 57,4 44,1 51,6 217,2 A3 B1 62,3 58,5 44,6 50,3 215,7 B2 63,4 50,4 45,0 46,7 205,5 B3 64,5 46,1 62,6 50,3 223,5 B4 63,6 56,1 52,7 51,8 224,2 A4 B1 75,4 65,6 54,0 52,7 247,7 B2 70,3 67,3 57,6 58,5 253,7 B3 68,8 65,3 45,6 51,0 230,7 B4 71,6 69,4 56,6 47,4 245,0 TOTAIS 965,3 936,8 733,8 743,9 3379,8 Variabilidades (SQs) • C = 3.379,8²/64 = 178.485,13 • SQT = 42,9² + 41,6² + ... + 47,4² - C = 7.797,39 • SQBlocos = (965,3+ ... + 743,9²)/16 - C (4) BLOCO 1 BLOCO 2 BLOCO 3 BLOCO 4 TOTAIS A1 190,6 195,7 141,8 151,2 679,3 A2 234,8 262,4 173,3 184,0 854,5 A3 253,8 211,1 204,9 199,1 868,9 A4 286,1 267,6 213,8 209,6 977,1 TOTAIS 965,3 936,8 733,8 743,9 3.379,8 • SQVar(A) = (679,3² + ... + 977,1²)/16 – C • SQParc = (190,6² + ... + 209,6²)/4 – C • SQRes(A) = SQParc – SQBlocos – SQA = 6.309,19 – 2.842,87 – 2.848,02 = 618,19 (4) B1 B2 B3 B4 TOTAIS A1 144,2 202,5 183,4 149,2 679,3 A2 203,4 221,5 212,4 217,2 854,5 A3 215,7 205,5 223,5 224,2 868,9 A4 247,7 253,7 230,7 245,0 977,1 TOTAIS 811,0 883,2 850,0 835,6 3.379,8 • SQTrat de sem(B) = (811,0² + ... + 835,6²)/16 – C • SQA,B = (144,2² + ... + 245,0²)/4 – C • SQAxB = SQA,B – SQA – SQB = 3.605,02 – 2.848,02 – 170,53 • SQRes(B) = SQTotal – SQParc – SQB – SQAxB = 7.797,39 – 6.309,19 - 170,53 – 586,47 = 731,20 Quadro da ANOVA Analysis of Variance for Aveia, using Adjusted SS for Tests Source DF Seq SS Adj SS Adj MS F P Blocks 3 2842,87 2842,87 947,62 31,60 0,000 A 3 2848,02 2848,02 949,34 31,66 0,000 B 3 170,54 170,54 56,85 1,90 0,144 A*B 9 586,47 586,47 65,16 2,17 0,042 Error 45 1349,50 1349,50 29,99 Total 63 7797,39 Análise Combinatória • Objetivo: resolver problemas de contagem • Estabelecer métodos (contagem → Agrupamentos) • Princípio Fundamental da Contagem (PFC) Evento (fato) → composto etapas → cada uma por certas quantidades; Evento (fato) = produto dessas etapas Exemplos 1. Refeição; 2. Vestir; 3. Carro; 4. Obter nº naturais: a) 3 algarismos (com rep.); {1a5} b) 3 algarismos distintos; {1a5} c) 4 alg. Distintos; {0a4} d) Múltiplos de 5 c/4alg. dist.; {0a5} Exemplos 5. Nº naturais maiores que 64.000; {0;1;2;4;5;6;7;9} com 5 alg. distintos; 6. Placas; 7. Ordem crescente os N com 4 alg. dist.; {1;3;5;7}. Que lugar (ordem) ocupa o nº 5731? 8. Turista (viagem): A→B (3R e 2F); B→C (2R e 2F). Percursos distintos?
Compartilhar