Baixe o app para aproveitar ainda mais
Prévia do material em texto
O TESTE QUIQUADRADO TESTE DE ADERÊNCIA O objetivo é comparar se uma distribuição de freqüência é realmente a distribuição esperada teoricamente (teste de aderência) Sejam: n - o nº de observações ei - a freqüência esperada na classe i oi - a freqüência observada na classe i k - o nº de classes O teste se baseia no grau de concordância entre ei e oi . A medida denominada quiquadrado é definida por: ∑ ∑ = = −=−= k i k i i i i ii n e o e eo 1 1 22 2 )(χ Os valores esperados são baseados na distribuição da população. Rejeitamos a hipótese de aderência se tal valor for maior que o valor do quiquadrado crítico com (k-1) graus de liberdade com o nível de significância estipulado. O teste quiquadrado só pode ser utilizado se todas as freqüências esperadas forem maiores que 1 e se no máximo 20% das freqüências esperadas forem menores que 5. Caso contrário deve-se agrupar as classes de forma a satisfazer tais condições. Por exemplo, se a porcentagem de funcionários de um laboratório nos grupos de idades de 18 a 20; 21 a 23; 24 a 26; 27 a 29 anos é de, respectivamente, 15%, 20%, 30% e 35% e se o nº de ocorrências de ações fora do padrão de segurança ocorridos em um ano nestas faixas etárias foram de 5, 10, 9 e 6, podemos afirmar que o número de ações fora do padrão de segurança para os funcionários segue a distribuição das faixas etárias, isto é, que a distribuição observada é de respectivamente 15%, 20%, 30% e 35% das ações fora do padrão em cada faixa etária? Testar utilizando α = 0,05. 18 a 20 21 a 23 24 a 26 27 a 29 oi 5 10 9 6 ei 4,5 6,0 9,0 10,5 Temos, por exemplo: 4,5 é igual a 15% do total de número de ações fora do padrão de segurança (30). Como temos uma casela com valor esperado inferior a 5, temos que agrupar as caselas. Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 1 18 a 23 24 a 26 27 a 29 oi 15 9 6 ei 10,5 9,0 10,5 g.l. = 2 991,5 857,330 5,10 6 0,9 9 5,10 15857,3 5,10 )5,106( 9 )99( 5,10 )5,1015( 2 2, 222 2 222 2 = =− ++==−+−+−= cr ou χ χχ R.C. = {χ2 / χ2 ≥ 5,991} 3,857 ∉ R.C., logo ao nível de significância de 5% afirmo que o número de ações fora do padrão de segurança para os funcionários é independente da idade. TABELAS DE CONTIGÊNCIA Queremos testar se duas variáveis aleatórias são independentes. Neste caso temos uma tabela de dupla entrada (as duas variáveis). Seja r o nº de níveis da primeira variável e c o nº de níveis da segunda variável. Temos que g.1. = (r-1) (c-1) e ( ) n e o e eo ij ij c j r iij ijij c j r i −=−= ∑∑∑∑ ==== 2 11 2 11 2χ Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 2 Neste caso eij é o produto das marginais da observação oij dividido pelo tamanho da amostra. Quando a tabela de contingência não for 2 x 2, a prova que quiquadrado pode ser aplicada somente se o nº de caselas com freqüência inferior a 5 for menor que 20% do total de caselas e se nenhuma casela tiver freqüência esperada inferior a 1. Se essas condições não forem satisfeitas pelos dados na forma em que foram coletados originalmente, o pesquisador deve combinar categorias de modo a aumentar as freqüências esperadas nas diversas caselas. Se em uma tabela 2 x 2, tivermos alguma freqüência esperada inferior a 5, o teste quiquadrado não poderá ser usado. Neste caso recomendamos a utilização do teste não-paramétrico de Fisher. Por exemplo, num estudo sobre suicidas realizado em Campo Grande -M.S., foi testado se havia independência entre as variáveis aleatórias motivo de tentativa de suicídio e sexo do suicida. Os resultados encontrados foram os seguintes: MOTIVO X SEXO FEMININO MASCULINO TOTAL Briga com namorado/cônjuge 40 7 47 34,23 12,77 Perda de emprego 3 1 4 2,91 1,09 Perda de ente querido 6 2 8 5,83 2,17 Conflitos familiares 38 10 48 34,96 13,04 Problemas financeiros 6 8 14 10,20 3,80 Não informa 4 1 5 3,64 1,36 Problemas na escola 1 0 1 0,73 0,27 Motivos de saúde 17 13 30 21,85 8,15 Outros 3 2 5 3,64 1,36 TOTAL 118 44 162 Temos por exemplo, 23,34 162 47118 11 == xe Como temos duas caselas com valor esperado menor que 1 e 10 caselas com valor esperado menor que 5, temos que agrupar as caselas. MOTIVO X SEXO FEMININO MASCULINO TOTAL Briga com namorado/cônjuge 40 7 47 34,23 12,77 Perda de emprego / Problemas 9 9 18 financeiros 13,11 4,89 Conflitos familiares 38 10 48 34,96 13,04 Motivos de saúde 17 13 30 21,85 8,15 Perda de ente querido/ Não 14 5 19 informa/Probl. na escola/Outros 13,84 5,16 TOTAL 118 44 162 Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 3 266,13005,0002,0889,2077,1707,0264,0457,3289,1604,2971,02 =+++++++++=obsχ ou 266,13162266,175162 16,5 5... 11,13 9 77,12 7 23,34 40 22222 =−=− ++++=obsχ Temos uma casela com valor esperado menor que 5, o que é menos de 20% do total de caselas. g.l. = 4 x 1 = 4 2 4%,5χ = 9,488 R.C. = { χ2 / χ2 ≥ 9,488} 13,266 ∈ R.C., logo ao nível de significância de 5%, rejeitamos H0, isto é, ao nível de significância de 5% afirmamos que as variáveis aleatórias motivo da tentativa de suicídio e sexo do suicida não são independentes. EXEMPLO ADICIONAL DE TESTE QUIQUADRADO 1)Foi retirada uma amostra de 125 bolos industrializados cujo peso marcado é de 250 grs. Deseja-se saber se o peso dos bolos tem uma distribuição aproximadamente normal. Peso dos 125 bolos amostrados 276 274 284 272 276 278 278 278 278 280 288 270 280 270 292 255 266 264 266 272 266 266 266 266 282 247 280 280 270 272 272 280 264 264 284 282 268 272 261 275 264 270 269 258 260 266 256 249 260 260 259 250 266 258 257 268 270 274 269 260 260 272 258 262 283 254 272 274 268 265 269 274 269 286 268 258 272 272 280 265 280 272 268 270 265 264 270 278 264 270 260 266 258 270 269 270 261 255 263 271 291 296 293 287 300 289 265 283 276 289 295 308 289 287 275 267 292 256 275 270 262 268 276 274 260 Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 4 Temos: grss grsX 0076,11 24,271 = = Os dados foram agrupados em 7 classes: PESO Frequência 240 I 250 2 250 I 260 13 260 I 270 43 270 I 280 39 280 I 290 20 290 I 300 6 300 I 310 2 Total 125 Vamos calcular os valores esperados, supondo a distribuição normal: 12706,034614,047320,0 )02,193,1( 0076,11 24,271260 0076,11 24,271250)260250( 02680,047320,05,0)93,1( 0076,11 24,271250)250( =−= =−<≤−= −<≤−=<≤ =−=−<= −<=< ZPZPXP ZPZPXP Prosseguimos o cálculo e obtemos a seguinte tabela: PESO zinf zsup Probab. ei oi 240 I 250 - -1,93 0,02680 3,35 2,00 250 I 260 -1,93 -1,02 0,12706 15,88 13,00 260 I 270 -1,02 -0,11 0,30234 37,79 43,00 270 I 280 -0,11 0,80 0,33194 41,49 39,00 280 I 290 0,80 1,70 0,16729 20,91 20,00 290 I 300 1,70 2,61 0,04004 5,01 6,00 300 I 310 2,61 - 0,00453 0,57 2,00 Total 125,00 125,00 Como temos uma classe com valor esperado inferior a 1, vamos agrupar as classes. Podemos continuar com um valor esperado inferior a 5 pois este representa menos de 20% do total de classes. PESO ei oi oi 2/ei 240 I 250 3,35 2,00 1,1940 250 I 260 15,88 13,00 10,6406 260 I 270 37,79 43,00 48,9251 270 I 280 41,49 39,00 36,6572 280 I 290 20,91 20,00 19,1285 290 I 310 5,58 8,00 11,4695 Total 128,0149 g.l. = 5 Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 5 0149,31250149,128 6 1 2 2 =−=−= ∑ = ne o i i iχ 070,112 5, =crχ R.C. = {χ2 / χ2 ≥ 11,070} 3,0149 ∉ R.C., logo ao nível de significância de 5% afirmo que a distribuição do peso dos bolos é aproximadamente normal. Pesos dos Bolos Histograma Fr eq ue nc ia 50 40 30 20 10 0 2)Uma indústria fez uma pesquisa para saber se os funcionários mais antigos estavam mais satisfeitos com a empresa que os mais novos. Definiu-se como funcionário antigo aquele funcionário que tinha mais de 5 anos de casa. Os resultados obtidos foram: Satisfação Má Boa Total Tempo de Casa 17 33 50 2 77 79 19 110 129 Novo Antigo Total Testar ao nível de significância de 5% as hipóteses: H0 : As variáveis aleatórias tempo de casa e satisfação são independentes Ha : As variáveis aleatórias tempo de casa e satisfação não são independentes o11 = 17 e11 = (19 x 50) /129 = 7,36 Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 6 o12 = 33 e12 = (110 x 50) /129 = 42,64 o21 = 2 e21 = (19 x 79) /129 = 11,64 o22 = 77 e22 = (110 x 79) /129 = 67,36 Satisfação Má Boa Total Tempo de Casa 17 33 50 7,36 42,64 2 77 79 11,64 67,36 19 110 129 Antigo Total Novo 143,24378,1979,7178,2607,122 =+++=obsχ ou 143,24129143,153129 36,67 77 64,11 2 64,42 33 36,7 17 22222 =−=− +++=obsχ g.l. = 1 x 1 = 1 2 1%,5χ =3,841 R.C. = { χ2 / χ2 ≥3,841} 24,143 ∈ R.C. Logo, ao nível de significância de 5%,rejeitamos H0, isto é, ao nível de significância de 5% afirmamos que não há independência entre as variáveis aleatórias tempo de casa e satisfação com a empresa.(Os mais antigos estão mais satisfeitos). O TESTE DE KOLMOGOROV-SMIRNOV O teste de Kolmogorov-Smirnov de uma amostra é um outro teste de aderência. Deve-se calcular a freqüência acumulada esperada segundo H0 com a freqüência acumulada observada. Determina-se o ponto em que estas distribuições têm maior diferença (em módulo). Rejeita-se H0 se este valor for superior a um valor D tabelado, o qual depende do tamanho n da amostra e do nível de significância utilizado. O teste de Kolmogorov-Smirnov não tem suposições quanto à magnitude dos valores esperados para poder ser utilizado e é, em geral, mais poderoso que o teste Quiquadrado, isto é, tem maior probabilidade de rejeitar que a verdadeira distribuição de freqüências é a distribuição testada segundo H0 quando esta hipótese for realmente falsa. Exemplos: 1)No exemplo dos funcionários do laboratório, queremos saber se a distribuição do número de ações fora do padrão de segurança por faixa etária é a mesma distribuição Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 7 dos funcionários nestes grupos de idades de 18 a 20; 21 a 23; 24 a 26; 27 a 29 anos, isto é, respectivamente, 15%, 20%, 30% e 35%. distr teórica oi distr observada distr acum teórica distr acum observada diferença 0,1500 5 0,1667 0,1500 0,1667 0,0167 0,2000 10 0,3333 0,3500 0,5000 0,1500 0,3000 9 0,3000 0,6500 0,8000 0,1500 0,3500 6 0,2000 1,0000 1,0000 0,0000 1,0000 30 1,0000 Diferença máxima = 0,15 Para n = 30 e nível de significância de 5%, temos que D = 0,24 Como 0,15 < 0,24 , ao nível de significância de 5%, afirmo que as ações fora dos padrões de segurança ocorreram segundo a distribuição de 15%, 20%, 30% e 35% nas faixas etárias estabelecidas. 2) No exemplo dos bolos industrializados, deseja-se saber se o peso dos bolos tem uma distribuição aproximadamente normal. PESO zinf zsup distr teórica distr t acum oi distr observ distr o acum diferença 240 I 250 - -1,93 0,02680 0,02680 2,00 0,01600 0,01600 0,01080 250 I 260 -1,93 -1,02 0,12706 0,15386 13,00 0,10400 0,12000 0,03386 260 I 270 -1,02 -0,11 0,30234 0,45620 43,00 0,34400 0,46400 0,00780 270 I 280 -0,11 0,80 0,33194 0,78814 39,00 0,31200 0,77600 0,01214 280 I 290 0,80 1,70 0,16729 0,95543 20,00 0,16000 0,93600 0,01943 290 I 300 1,70 2,61 0,04004 0,99547 6,00 0,04800 0,98400 0,01147 300 I 310 2,61 - 0,00453 1,00000 2,00 0,01600 1,00000 0,00000 Total 1,00000 125,00 1,00000 Diferença máxima = 0,03386 Para n=125 e nível de significância de 5%, temos que 12164,0 125 36,136,1 === n D Como 0,03386 < 0,12164 , ao nível de significância de 5%, afirmo que o peso dos bolos tem uma distribuição aproximadamente normal. Average: 271,24 StDev: 11,0076 N: 125 Kolmogorov-Smirnov Normality Test D+: 0,076 D-: 0,035 D : 0,076 Approximate P-Value: 0,073 250 260 270 280 290 300 310 ,001 ,01 ,05 ,20 ,50 ,80 ,95 ,99 ,999 Pr ob ab ilit y C1 Normal Probability Plot Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 8 ANÁLISE DE VARIÂNCIA A análise de variância deve ser utilizada quando queremos comparar mais de dois grupos ao mesmo tempo. Por exemplo, se quisermos comparar a produção de uma indústria nos três turnos, a saber, das 6h00 às 14h00, das 14h00 às 22h00 e das 22h00 às 6h00, podemos sortear aleatoriamente cinco funcionários por turno e anotar o nº de lotes produzidos por cada um deles. 1º Turno 2º Turno 3º Turno 23 22 18 22 19 19 21 19 21 22 20 20 21 18 18 Nº DE LOTES PRODUZIDOS Seja: n = o nº de elementos em cada grupo. (n = 5 ) k = o nº de grupos. (k = 3 ) Xij = o resultado obtido pelo i-ésimo indivíduo do j-ésimo grupo. Temos: 1 ≤ i ≤ n e 1 ≤ j ≤ k Por exemplo, X32 =19 é o nº de lotes produzidos pelo 3º indivíduo do 2º grupo (turno). Seja: T Xj i n = = ∑ 1 ij = soma dos valores do grupo j. No exemplo temos T1 = 109 ; T2 = 98 e T3 = 96 T T n j j= = média do grupo j. No exemplo temos 2,196,19;8,21 321 === TeTT G Tj j k = = ∑ 1 = soma geral. No exemplo, G = 303 G X nk T ki n ij j k j j k = = = = = ∑ ∑ ∑ 1 1 1 = média geral. Para quantificar a variabilidade dentro do grupo 1 usamos: ( )X T X T nii n i i n 1 1 2 1 1 2 1 2 1 − = − = = ∑ ∑ Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 9 Para quantificar a variabilidade dentro do grupo j , usamos: ( )X T X T nij j i n ij j i n − = − = = ∑ ∑2 1 2 2 1 Para quantificar a variabilidade total dentro dos grupos utilizamos a soma de quadrados dentro (SQD) definida por: SQD X T X T nj k i n ij j ij j i n j k = − = = = == ∑ ∑ ∑∑ 1 1 2 2 2 11 ( ) ( − ) No exemplo em questão: 8,188,62,98,2 5 96)18...18( 5 98)18...22( 5 109)21...23( 2 22 2 22 2 22 =++= −+++ −+++ −++= SQD SQD Observação: O SQD mede o caráter aleatório do experimento, isto é, o que não foi controlado pelo pesquisador. Por isto o SQD é também chamado de soma de quadrados devido ao erro experimental ou resíduo (SQR). Para quantificar a variabilidade existente entre os grupos utilizamos a soma de quadrados entre (SQE) definida por: SQE n T G T n G nkj k j j j k = − = = = ∑ ∑ 1 2 2 2 1 ( ) − No exemplo por nós utilizado, temos: 6,196,61202,6140 15 91809 5 9216960411881 15 303 5 96 5 98 5 109 2222 =−=−++=− ++=SQE A SQE representa a variação devida aos tratamentos utilizados (1º turno, 2º turno ou 3º turno). Se usarmos os dados como um todo, sem a informação de que há diferentes níveis do fator “tratamento”, como quantificaremos a variabilidade total? A soma de quadrados total (SQT) é definida por: Apostila de Estatística – 2004 – Autoria:Raquel Cymrot 10 SQT X G X G nki n j k ij ij i n j k = − = = = == ∑ ∑ ∑∑ 1 1 2 2 2 11 ( ) − No exemplo temos que SQT = 4,38 15 3032 =−6159 Prova-se que: SQT = SQD + SQE No exemplo utilizado 38,4 =18,8 + 19,6. Queremos testar: H0 : µ1 = µ2 = µ3 = ... = µk Sob H0, o quadrado médio dentro (QMD) é uma estimativa de σ2, onde: QMD SQD k n = −( )1 Sob H0, o quadrado médio entre (QME) também é uma estimativa de σ2, onde: QME SQE k = − 1 Pois SQE k n T G k n j k j X− = − − = == ∧ ∧∑1 11 2 2 2( ) σ σ Logo, se H0 é verdadeira, QMD e QME devem estar próximos, portanto a razão QME QMD deve estar próxima de um. Se H0 não for verdadeira o valor de QMD não deve se alterar pois este é baseado em cálculos de cada coluna separadamente. Neste caso, porém, o valor de QME deverá crescer à medida que as médias amostrais se afastem uma das outras, logo QME QMD excederá um quando H0 não for verdadeira. Denotamos F = QME QMD No exemplo por nós utilizado 255,6 57,1 80,9 12 8,18, 2 6,19 ==== FeQMDQME . Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 11 Temos que F = QME QMD tem distribuição F com υ1 = k-1 e υ2 = k(n-1) graus de liberdade onde a distribuição F tem origem na divisão de dois quiquadrados divididos anteriormente por seus graus de liberdade. Sob H0: QME QMD SQE k SQD k n = − − σ σ 2 2 1 1 ( ) ( ) ~ F (k - 1, k (n - 1)) onde SQE σ 2 ~ χ 2 (k - 1) e SQD σ 2 ~ χ 2 (k (n - 1)) Rejeito H0 se Fobservado for maior que Fcrítico, α% com (k - 1), k (n - 1) graus de liberdade (Fcr). Resumindo: Fonte de Variação Soma dos Quadrados g.1 Q.médio F Entre n T G T n G nkj k j j j k = = ∑ ∑− = − 1 2 2 2 1 ( ) k - 1 QME SQE k = − 1 QME QMD = Fo Dentro j k i n ij j ij j i n j k X T X T n= = == ∑ ∑ ∑∑− = − 1 1 2 2 2 11 ( ) k (n - 1) QMD SQD k n = −( )1 Total i n j k ij ij i n j k X G X G nk= = == ∑ ∑ ∑∑− = −1 1 2 21 2 1 ( ) nk - 1 Comparar o F0 com o Fcrítico, α%, (k - 1), k (n - 1) No exemplo por nós utilizado, temos: Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 12 Fonte de variação Soma de quadrados g.l. Quadrado médio F Entre turnos 19,60 2 9,80 6,255 Dentro dos turnos 18,80 12 1,57 Total 38,40 14 89,3255,6 12;2%,5 =>= FFobs logo, ao nível de significância de 5%, afirmamos que há diferença entre a produção dos três turnos. Contrastes Um contraste é uma comparação envolvendo duas ou mais médias dos níveis do fator em estudo. Representamos por C e definimos j k j jCC µ∑ = = 1 onde Cj’s são tais que ∑ j k jC o = = 1 Exemplos: ;1;1;0 2 1; 2 1;1 2 32132 321 32 1 −===→− −=−==→+− CCC CCC µµ µµµ Teste de Contraste ∑ = ∧ = k j jjTCC 1 C ∧ ~ N n C j k j0 2 1 2, σ = ∑ H0 : C = 0 Ha : C ≠ 0 Estimaremos por QMD. 2σ Para os dados do exemplo inicial sobre a produção nos três turnos, queremos testar ao nível de significância de 5% se: 0 2 : 3211 ≤ +−= µµµCH o Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 13 e 0: 322 =−= µµCH o Temos um problema a resolver. Quando um grande número de comparações são feitas em seguida a um teste F significante, algumas das rejeições das hipóteses nulas referentes aos contrastes podem ser devidas ao erro tipo I. Por exemplo, se dois testes independentes são feitos, cada um com nível de significância de 5%, qual a probabilidade das duas afirmações serem simultaneamente verdadeiras? P(V1 e V2) = P(V1) P(V2) = (1 - 0,05) (1 - 0,05) = 0,95 x 0,95 = 0,9025 Precisamos adotar um procedimento de comparações múltiplas, como por exemplo, o método de Bonferroni. O método consiste em trabalhar com nível de significância k α , para cada um dos testes, quando desejamos realizar k testes simultâneos. No exemplo faremos cada teste ao nível de significância de 2,5%. Temos: QMD = 1,57 n = 5 0 2 : 3210 ≤+− µµµH 40,2 2 20,1960,1980,21 2 ˆ 32 1 =+−=+−= TTTC 2 1; 2 1;1 321 −=−== CCC 2 33 1 2 =∑ =j jC Ccr = 0 + t 2,5%;12 sc t 2,5%;12 = 2,179 ( teste unilateral ) Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 14 496,1 2 3 5 57,1179,20 = +=crC R.C. = { C / C ≥ 1,496 } ˆ ˆ Cobs = 2,40 ∈ R.C. 0: 322 =− µµoH 40,020,1960,1932 =−=−=∧ TTC C1 = 0 ; C2 = 1 ; C3 = -1 2 3 1 2 =∑ =j jC Ccr1 = 0 – t 2,5%;12 sc Ccr2 = 0 + t 2,5%;12 sc t 2,5%;12 = 2,681 ( teste bilateral ) ( ) .125,22 5 57,1681,201 −= −=crC ( ) 125,22 5 57,1681,202 = +=crC R.C. = { C / C ≤ -2,125 ou C ≥ 2,125 } ˆ ˆ ˆ Cobs = 0,40 ∉ R.C. Conclusão: Ao nível de significância de 5%, afirmo que ( )µ , isto é, o 1º turno é o que tem a produção maior. µ µ µ µ1 2 3 22〉 + =e 3 Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 15 ANÁLISE DE REGRESSÃO A análise de regressão e correlação tem por finalidade a construção de um modelo que relacione as variáveis, bem como a análise de correlação entre elas. Modelo estatístico de regressão linear simples: Y1 = α + βXi + εi onde: α = termo constante β = coeficiente de regressão εi = erro aleatório Suposições de modelo: a) Xi não é variável aleatória b) E(εi) = 0 , consequentemente E(Yi) = α + βXi c) E(εi2) = σ2 = constante, logo VAR (εi) = σ2 d) Os erros são não correlacionados e) Os erros tem distribuição normal Concluímos que εi ~ N(0, σ2) Definimos: covariância de X, Y = σxy = E[ (X-E (X)) (Y-E(Y))] COV (X, Y) = n X Y X Y i n i i i i n i i n = = ∑ ∑ ∑− 1 1 =1 Coeficiente de correlação ρ σ ( )σ σ= XY X Y/ ρ ∧ = = = == == = = − − − ∑ ∑ ∑ ∑∑ ∑∑ r n X Y X Y n X X n Y Y i i i n i i n i i n i i i n i n i i i n i n 1 1 1 2 1 2 1 2 1 2 1 − ≤ ≤1 1ρ Observamos que se ρ = 0, não existe uma relação linear entre as variáveis X e Y. Estimamos os parâmetros α e β, utilizando o método dos mínimos quadrados. Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 16 Temos: β α ∧ = = == ∧ = = − − = = − ∑ ∑ ∑ ∑∑ b n X Y X Y n X X a Y bX i n i i i i n i i n i i n i n 1 1 2 1 1 2 1 =1 Por exemplo, a tabela abaixo mostra os gastos (em milhões de dólares) com pessoal contratado em determinada indústria em 7 anos consecutivos. ANO 1990 1991 1992 1993 1994 1995 1996 PESSOAL 3023 3108 3213 3280 3382 3492 3661 GASTO 24,4 28,0 31,8 35,5 39,9 45,5 53,5 Podemos estimar a reta dos mínimos quadrados: ANO Pessoal (X) Gasto (Y) X Y X2 Y2 1997 3023 24,4 73761,2 9138529 595,4 1998 3108 28,0 87024,0 9659664 784,0 1999 3213 31,8 102173,4 10323369 1011,2 2000 3280 35,5 116440,0 10758400 1260,3 2001 3382 39,9 134941,8 11437924 1592,0 20023492 45,5 158886,0 12194064 2070,3 2003 3661 53,5 195863,5 13402921 2862,3 Total 23159 258,6 869089,9 76914871 10175,4 b = 0,046 a = -114,81 Yi = -114,81 + 0,046 Xi Saída do EXCEL: Ferramentas / Análise de dados / Regressão Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção -114,812823 3,12584229 -36,7302 2,817E-07 -122,8480431 -106,7776025 Variável X 0,045869414 0,000943 48,64209 6,939E-08 0,043445364 0,048293464 Podemos avaliar os gastos totais na indústria (em milhões de dólares) num ano em que o total de pessoal é de 3300 funcionários. Y = -114,81 + 0,046 x 3300 = 36,56 milhões de dólares. Tal estimativa pode ser feita pelo valor de X estar dentro do intervalo usado para construir a reta de regressão e supondo que não houve motivo para a mudança de padrão do modelo. Podemos demonstrar que: a ~ N α σ , ( ) 2 2 1 2 1 X n X X i i n i i n = = ∑ ∑ − Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 17 b ~ N β σ, ( ) 2 2 1 X Xi i n − = ∑ Estimamos σ2 2 2 111 2 por s Y a Y b X Y ne i i i i n i n i n = − − − === ∑∑∑ ( ) i Podemos calcular: ( ) ( ) − ±= − ±= − = = − ∑ ∑ 2 2 2 1 2 1 22 2 .. .. XX stbCI XXn Xs taCI i e n n i i n i ie n β α Baseado nisto podemos calcular um intervalo com 95% de confiança para α e β, no exemplo dos gastos com pessoal. se2 = 0,2623 sa = 3,1258 sb = 0,0009 I.C.α = [-122,849 ; -106,776] I.C.β = [0,0434 ; 0,0483] Podemos testar Ho: α = αo ou Ho: α ≥ αo ou Ho: α ≤ αo, supondo a distribuição normal de a. Podemos testar Ho: β = βo ou Ho: β ≥ βo ou Ho: β ≤ βo, supondo a distribuição normal de b. No exemplo dos gastos com pessoal, podemos testar ao nível de significância de 5% as hipóteses: a) H0 : α ≤ -125 Ha : α > -125 sa = 3,1258 t5%,5 = 2,015 (teste unilateral) acr = -125 + 2,015 x 3,1258 = - 118,70 R.C. = { a / a ≥ - 118,70} Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 18 aobs = - 114,81 ∈ R.C., logo ao nível de significância de 5% rejeitamos Ho, isto é, ao nível de significância de 5%, afirmamos que α é maior que -125. b) H0 : β ≤ 0 Ha: β > 0 sb = 0,0009 t5%,5 = 2,015 (teste unilateral) bcr = 0 + 2, 015 x 0,0009 = 0,0019 R.C. = {b / b ≥ 0,0019} bobs = 0,046 ∈ R.C., logo ao nível de significância de 5% rejeitamos Ho, isto é, ao nível de significância de 5%, afirmamos que β é maior que zero. Teste de hipótese para o coeficiente de correlação ρ: Se supormos que X e Y são variáveis aleatórias normais independentes, prova-se que a distribuição de r só depende de n. Se quisermos testar H0 : ρ = 0, devemos usar a estatística: 2;12 2 ~ 1 )2( −− −= nobs Fr nrF No exemplo dos gastos com pessoal, temos: r = 0,9989 Saída do EXCEL: Estatística de regressão R múltiplo 0,99894506 R-Quadrado 0,997891233 R-quadrado ajustado 0,997469479 Erro padrão 0,512156375 Observações 7 H0 : ρ = 0 Ha : ρ ≠ 0 Fobs = 2366,053 F5%,1,5 = 6,61 Fobs > Fcr, logo ao nível de significância de 5% rejeitamos Ho, isto é, ao nível de significância de 5% afirmo que existe uma relação linear entre as variáveis pessoal contratado e gasto com pessoal. Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 19 Variável X 1 Plotagem de ajuste de linha 0,0 20,0 40,0 60,0 0 1000 2000 3000 4000 Variável X 1 Y Y Y previsto UTILIZAÇÃO DE TRANSFORMAÇÃO DE VARIÁVEIS Aplicação : o efeito da curva de aprendizagem Quando novas técnicas de produção são utilizadas em uma indústria, isto é, quando tratamos de processos não estabilizados, deve-se verificar se está caracterizado um processo de aprendizagem. Este processo caracteriza-se pela diminuição do tempo médio de produção à medida que se repete a nova técnica, cessando, tal processo, em algum ponto de evolução da curva, e como conseqüência pode-se notar uma diminuição no custo médio de utilização da mão-de-obra, maquinário e instalações específicas. Deve-se notar que se os efeitos da curva de aprendizagem forem mensurados em custos, devem ser descontadas as inflações no período, sendo melhor a utilização de unidades físicas tais como o tempo de duração da tarefa. A fórmula mais usual para representar o fenômeno da curva de aprendizagem é através de: Z = aw-b, onde: Z = tempo médio de produção de um lote a = tempo de produção do primeiro lote w = número acumulado de lotes produzidos até o momento b = índice da curva de aprendizagem (0 < b < 1) Aplicando-se o logarítmo neperiano na expressão acima, temos: lnZ = lna - blnw, ou Y = A + BX, onde: Y = lnZ A = lna B = -b Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 20 X = lnw Por exemplo, uma certa indústria acaba de produzir os primeiros 150 lotes utilizando uma nova técnica. Mais 150 lotes devem ser produzidos em breve. Tem sido notado, pela administração da indústria, que o tempo de utilização dos maquinários tem declinado a cada lote produzido. Dos arquivos da indústria, colheu-se os seguintes dados: UNIDADES CUMULATIVAS DURAÇÃO TOTAIS EM MINUTOS DE LOTES (MÉDIA/MINUTOS) 45 54 2430 60 50 3000 75 46 3450 120 42 5040 150 39 5850 Qual o tempo esperado para a produção dos próximos 150 lotes? w z X Y XY X2 45 54 3,8066 3,9890 15,1847 14,4907 600 50 4,0943 3,9120 16,0172 16,7637 75 46 4,3175 3,8286 16,5301 18,6407 120 42 4,7875 3,7377 17,8941 22,9201 150 39 5,0106 3,6636 18,3568 25,1065 TOTAL 22,0166 19,1309 83,9828 97,9216 B = -0,263 A = 4,98 b = 0,263 a = 146,19 Z = 146,19 w-0,263 Para w = 300, temos Z = 32,59. Temos que o tempo total de produção dos 300 lotes é de 9.777 minutos, logo o tempo de produção dos próximos 150 lotes é de 3.927 minutos. Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 21 C.E.P. – CONTROLE ESTATÍSTICO DO PROCESSO Definição: É um método sistemático de análise de dados e uso de informações para resolver problemas e controlar operações. Sistema de controle de qualidade: - Sistema de detecção: atua sobre o resultado do processo. - Sistema de prevenção: atua no processo. Custo da não qualidade: - Custo de prevenção. - Custo de avaliação. - Custo de reparação (custo de falhas internas e externas). Especificação: Definição: São os requisitos pré-estabelecidos do produto, que devem ser obedecidos a fim de que o mesmo atenda às necessidades para as quais foi criado. Através das especificações é que determinamos a qualidade do lote. Tolerância: Definição: É a faixa de variação admissível para a dimensão. Processo: Definição: É o sistema de trabalho adotado para se produzir determinado produto dentro das especificações, sendo constituído de cinco fatores que influenciam no seu comportamento: - Mão-de-obra. - Máquina. - Métodos. - Material. - Meio ambiente. Ferramentas básicas para a utilização de C.E.P.: Gráfico de Pareto Definição: É um gráfico de barras onde cada barra representa um dos problemas existentes. A altura de cada barra corresponde a incidência do problema que está sendo analisado e estes são ordenados de modo decrescente em relação as freqüências de Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 22 ocorrência.Essa abordagem foi feita por J. M. Juran, que estabeleceu a “regra dos poucos vitais e dos muitos triviais”. Através de sua utilização decide-se onde concentrar os esforços de modo a termos um melhor retorno Histograma Definição: É um diagrama de barras de uma distribuição de freqüências. Eles auxiliam na visualização da distribuição da característica que está sendo estudada. Folhas de verificação Definição: São folhas para coleta de dados que ajudam a garantir a qualidade dos mesmos. As mais comuns são as folhas de verificação para distribuições do processo, para itens defeituosos, para localização de defeitos e para causa e efeito. Diagrama de fluxo Definição: É um diagrama que mostra em qual ordem ocorrem os passos ou atividades de um processo, facilitando a identificação dos pontos do processo onde o controle das atividades deve ser iniciado. Diagrama de causa e efeito ou diagrama de espinha de peixe Definição: É um diagrama que tem como objetivo, pesquisar as relações entre causas e efeitos que intervém no processo. As causas ou os fatores são representados por setas que concorrem para o efeito que está sendo estudado. Geralmente os processos são analisados a partir de cinco grupos de fatores, a saber: máquina, método, material, mão-de-obra e ambiente. Diagrama de dispersão Definição: É um gráfico para duas características que ajuda a verificar a existência de relação causal e a determinar a força e tendência desta relação. Série Temporal Antes de se estabelecer os limites de controle e de se calcular os índices é importante ter certeza de que o processo está estável. Quando as amostras forem retiradas seqüencialmente, é necessário fazer um gráfico dos dados em função do tempo, isto é, em função da ordem em que esses dados foram coletados. Tendências e ciclos presentes no processo são facilmente detectados através do uso de tais gráficos. Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 23 Carta de controle: Definição: É uma ferramenta utilizada para verificar o comportamento do processo durante a sua execução, a fim de se saber se o mesmo está ou não está sob controle. Esta ferramenta é constituída de uma folha onde na frente aparecem os gráficos de controle e no verso o diário de bordo. Para se controlar as variações do processo ao longo do tempo é conveniente retirar-se algumas amostras em intervalos regulares de tempo de modo que estas sejam representativas do lote produzido naquele intervalo de tempo. Os resultados da avaliação destas amostras devem ser registrados num gráfico cartesiano denominado carta de controle. Através da utilização das cartas de controle podemos detectar variações na centralização, na dispersão ou em ambas. Diário de bordo: Definição: Diário de bordo é um complemento da carta de controle que traz em seu verso um espaço próprio para se registrar todas as mudanças ocorridas durante o processo. Este instrumento é de importância vital para a análise do comportamento do gráfico de controle, devendo ter em cada registro a data, a hora e o comentário explicando claramente todas as informações possíveis a respeito das mudanças ocorridas. Estabilidade: Definição: Diz-se que um processo está estável quando existe a repetibilidade de resultados. Só há sentido de se tentar controlar estatisticamente um processo estável. Coleta dos dados: - Que dados devem ser coletados? - Em que ponto do processo os dados devem ser coletados? - Como os dados serão coletados? (tempo, custo X acurácia e precisão do processo de medida) Para responder a estas perguntas devemos: 1) Selecionar amostras no início do processo e conhecer as limitações do operador. 2) Selecionar amostras separadamente para isolar as fontes de variação. 3) Minimizar mudanças dentro das amostras. 4) Decidir a freqüência de amostragem, levando em conta quão crítica é a característica estudada, qual é o controle e a capacidade histórica do processo, o tipo do processo e o custo envolvido. Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 24 Para coletarmos os dados de forma correta é importantíssimo: 1) Saber o objetivo de se coletarem os dados. 2) Identificar os parâmetros específicos. 3) Saber se a utilização do C.E.P. duplicará algo que já foi ou está sendo feito. 4) Decidir quem coletará os dados, como será feita tal coleta e onde os dados se originarão. 5) Construir os formulários de coleta dos dados e decidir onde e por quanto tempo os dados serão conservados. 6) Resolver quem coordenará o programa e decidir se há necessidade de algum treinamento. 7) Saber quem preparará o relatório final e para quem este será enviado. 8) Saber se já foi conseguida a autorização do orçamento para o projeto CARTAS DE CONTROLE PARA VARIÁVEIS: CARTAS DE CONTROLE PARA A MÉDIA ( X ) E PARA A AMPLITUDE ( R ) Limite de controle para média: n LSC X σµ 3+= n LICX σµ 3−= Estimativa da média = X Estimativa do desvio padrão (se n < 8) = 2d R , onde: R= amplitude amostral d2 é um fator tabelado que varia com o tamanho da amostra Temos: Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 25 nd RXLSC X 2 3+= nd RXLICX 2 3−= Se nd A 2 2 3= , então temos: RAXLSC X 2+= RAXLICX 2−= Se n ≥ 8, estima-se σ por s e utiliza-se a carta de controle para X e s. Limites de controle para a amplitude: Estimativa da amplitude = R Estimativa do desvio padrão da amplitude = d3σ, onde d3 é um fator de correção tabelado (para 2 ≤ n ≤ 10). Os limites serão: LSCR = . 3 13 4 2 3 2 3 RDR d dR d dR = += + LICR = RDRd dR d dR 3 2 3 2 3 313 = −= − se D3 > 0. Caso contrário não existirá LICR. ETAPAS PARA A CONSTRUÇÃO E INTERPRETAÇÂO DAS CARTAS DE X E R s. rior. 1) Preencher o cabeçalho e escolher o tamanho e a freqüência das amostra 2) Coletar as amostras, efetuar as medições e registrar os dados no quadro infe Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 26 3) Calcular X e R R4) Calcular X e 5)Só para gráficos feitos a mão: Determinar a escala para o gráfico das médias e áfico das médias: E) = (maior média + menor média)/2 ráfico das amplitudes: la igual a zero amente o dobro da maior amplitude encontrada da divisão = 2Rmax/5 ) Plotar as médias e amplitudes de cada uma das amostras nos respectivos gráficos. ) Calcular os limites de controle: ráfico das médias: amplitudes: Gr Centro da escala (C Valor de cada divisão = (maior média – menor média) /5 G Valor mínimo da esca Valor máximo da escala é aproximad nas amostras Valor de ca 6 7 G LS RAXC X 2+= RAXLICX 2−= fico das amplitudes: CR = D4 Grá LS R CR = D LI 3 R se LICR > 0. Caso contrário não existirá LICR. açar no gráfico das médias: 8) Tr A média das médias ( X ) com li Os LSC e LIC com linhas tracejadas. nha contínua X X Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 27 9) Traçar no gráfico das amplitudes: A média das amplitudes ( R ) com lin Os LSCR e LICR com linhas tracejadas. ha contínua. 0) Verificar se o processo é estável. Critérios mais utilizados: verificar em cada gráfico há ponto acima do limite superior de controle nem abaixo do limite inferior de ma seqüência de sete pontos acima ou abaixo da média.1) Interpretar as cartas de controle do processo, se necessário identificando e corrigindo 2) Se necessário calcular os novos limites de controle, desconsiderando as amostras Capacidade do processo Definição: É a característica que nos indica se o processo é capaz de manter a reprodu 1 se: -Não controle. -Não há u -Não há uma seqüência de sete pontos subindo ou descendo. 1 as causas especiais, utilizando o diário de bordo. 1 que deram origem a causas especiais. tibilidade, isto é, se ele consegue manter o limite superior e o limite inferior de controle entre o limite superior e o limite inferior de especificação. Só há sentido em calcular capacidade para processos estáveis. σˆ6 )( LIELSE dispersão tolerância p −==C nde LSE = limite superior de especificação. LIE = limite inferior de especificação. Se Cp > 1 então o processo tem condições de produzir itens dentro da especif O icação, se o mesmo estiver centralizado. Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 28 Cpk = 3 minZ Onde Zmin = min(Zi ;Zs) com: σˆ )( LIEaestatísticZi −= e σˆ )( aestatísticLSEZ s −= Por exemplo, no caso de estarmos analisando uma carta para X , σˆ )( LIEXZi −= e σˆ )( XLSEZ s −= Se Cpk 1 , o processo é dito capaz. ≥ Se Cpk < 1, o processo é dito incapaz. Se Cpk ≅ Cp, o processo está centralizado. Se o processo for incapaz devemos determinar a porcentagem de itens fora da especificação, utilizando a tabela da distribuição normal. DADOS PARA A CARTA DE CONTROLE PARA A MÉDIA ( X ) E PARA A AMPLITUDE ( R ) Especificação: 225 a 275 g Atividade: produção de bolo industrial Característica: peso do bolo (em g) Tamanho da amostra: 5 peças Freqüência média das retiradas de amostras: de ½ em ½ hora Total de amostras: 25 Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 29 RXhorário 54321 07:00 266 267 266 268 282 07:30 260 272 258 262 283 08:00 288 270 280 270 282 08:30 255 266 264 266 272 09:00 276 274 284 272 276 09:30 257 280 280 270 272 10:00 272 280 264 264 284 10:30 282 268 272 261 275 11:00 264 270 269 258 260 11:30 266 257 262 263 265 12:00 260 263 266 265 258 12:30 268 270 274 269 260 13:00 278 278 278 278 280 13:30 254 272 274 268 265 14:00 270 261 255 263 271 14:30 258 272 272 280 265 15:00 280 272 268 270 265 15:30 264 270 278 264 270 16:00 260 266 258 270 269 16:30 269 274 269 286 268 17:00 281 275 283 274 279 17:30 281 278 277 274 282 18:00 285 275 276 280 275 18:30 267 272 276 275 270 19:00 262 268 276 274 260 GABARITO: RXhorário 54321 07:00 266 267 266 268 282 269,8 16 07:30 260 272 258 262 283 267,0 25 08:00 288 270 280 270 282 278,0 18 08:30 255 266 264 266 272 264,6 17 09:00 276 274 284 272 276 276,4 12 09:30 257 280 280 270 272 271,8 23 10:00 272 280 264 264 284 272,8 20 10:30 282 268 272 261 275 271,6 21 11:00 264 270 269 258 260 264,2 12 11:30 266 257 262 263 265 262,6 9 12:00 260 263 266 265 258 262,4 8 12:30 268 270 274 269 260 268,2 14 13:00 278 278 278 278 280 278,4 2 13:30 254 272 274 268 265 266,6 20 14:00 270 261 255 263 271 264,0 16 14:30 258 272 272 280 265 269,4 22 15:00 280 272 268 270 265 271,0 15 15:30 264 270 278 264 270 269,2 14 16:00 260 266 258 270 269 264,6 12 16:30 269 274 269 286 268 273,2 18 17:00 281 275 283 274 279 278,4 9 17:30 281 278 277 274 282 278,4 8 18:00 285 275 276 280 275 278,2 10 18:30 267 272 276 275 270 272,0 9 19:00 262 268 276 274 260 268,0 16 X =270,43 ; R = 14,64 ; n = 5 Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 30 A2 = 0,577 ; D3 não existe ; D4 = 2,114 ; d2 = 2,326 29,6 326,2 64,14ˆ 2 === d Rσ 43,270ˆ == Xµ 88,27864,14577,043,2702 =+=+= xRAXLSC X 98,26164,14577,043,2702 =−=−= xRAXLICX Só para gráficos feitos a mão: 2704,270 2 4,2624,278 2 )( ≅=+=+= médiamenormédiamaiorCEescaladaCentro 0,32,3 5 4,2624,278 5 ≅=−=−= médiamenormédiamaiordivisãocadadeValor LSCR = D4 R = 2,114 x 14,64 = 30,95 LICR não existe Só para gráficos feitos a mão: Valor mínimo = 0 Valor de cada divisão = 10 5 252 5 2 max == xR Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 31 0Subgroup 5 10 15 20 25 260 270 280 Sa m pl e M ea n Mean=270,4 UCL=278,9 LCL=262,0 0 10 20 30 Sa m pl e Ra ng e R=14,64 UCL=30,96 LCL=0 Carta de controle para média e R para o peso do bolo industrial O processo está estável. Especificação: 225 a 275 g 132,1 29,66 50 ˆ6 )( >==−== x LIELSE dispersão tolerânciaC p σ 22,7 29,6 22543,270 ˆ )( =−=−= σ LIEXZi 73,0 29,6 43,270275 ˆ )( =−=−= σ XLSEZ s 124,0 3 73,0 3 ),min( 3 min <==== sipk ZZZC → o processo não é capaz. pkp CC ≠ → O processo não está centralizado Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 32 225 235 245 255 265 275 285 295 Análise de capacidade para a variável peso do bolo industrial USL Target LSL Mean Sample N StDev (Within) Cp CPU CPL Cpk Cpm PPM < LSL PPM > USL PPM Total PPM < LSL PPM > USL PPM Total 275,000 * 225,000 270,432 125 6,40944 1,30 0,24 2,36 0,24 * 0,00 272000,00 272000,00 0,00 238016,00 238016,00 Process Data Potential (Within) Capability Observed Performance Expected Performance LSL USL CARTAS DE CONTROLE PARA A MÉDIA ( X ) E PARA O DESVIO PADRÃO ( s ) Utilização quando n ≥ 8. Estimativa do desvio padrão = 4C s Onde C4 é um fator de correção tabelado que varia com o tamanho da amostra. Limites de controle para o gráfico das médias: sAXLSC X 3+= sAXLIC X 3−= Limites de controle para o gráfico do desvio padrão: LSCs = B4 s LICs = B3 s se LICs > 0. Caso contrário não existirá LICs. A3, B3, B4 são fatores tabelados que variam com o tamanho da amostra. Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 33 DADOS PARA CARTA DE CONTROLE PARA A MÉDIA ( X ) E PARA O DESVIO PADRÃO ( s) Especificação: 7,5 1 ± Atividade: produção de comprimidos Característica: diâmetro do comprimido (em mm) Tamanho da amostra: 9 comprimidos Freqüência média das retiradas de amostras: de ½ em ½ hora (das 7:00 h às 16:30 h) Total de amostras: 20 Xshdata 987654321/ 07:00 7,51 7,62 7,89 7,71 7,68 7,35 7,48 7,71 7,80 07:30 7,11 7,59 7,62 7,68 7,72 7,45 7,72 7,64 7,31 08:00 7,57 7,35 7,31 7,90 7,19 7,28 7,80 7,32 7,40 08:30 7,37 6,99 6,98 7,35 7,53 7,07 7,15 7,39 7,20 09:00 7,50 7,05 6,91 7,56 7,37 7,57 7,30 7,03 7,45 09:30 7,12 7,14 7,35 7,42 7,73 7,22 7,18 7,27 7,34 10:00 7,20 7,81 7,72 7,91 7,38 7,58 7,60 7,44 7,70 10:30 7,01 7,56 7,31 7,36 7,14 7,41 7,28 7,19 7,46 11:00 7,75 7,43 7,15 7,74 7,35 7,60 7,68 7,48 7,31 11:30 6,92 7,44 7,08 7,64 7,05 7,57 7,41 7,25 7,18 12:00 7,74 7,68 7,15 7,26 7,69 7,40 7,42 7,58 7,71 12:30 7,18 6,91 7,24 6,94 7,15 7,08 7,03 6,97 7,25 13:00 7,88 7,21 7,81 7,16 7,33 7,65 7,50 7,83 7,37 13:30 7,83 7,46 7,43 7,49 7,44 7,65 7,62 7,54 7,76 14:00 7,33 7,78 7,35 7,48 7,67 7,38 7,49 7,40 7,57 14:30 6,97 7,64 7,06 7,57 7,14 7,22 7,45 7,10 7,37 15:00 7,27 7,32 6,97 7,41 7,38 7,23 7,54 7,30 7,28 15:30 7,03 7,09 7,58 6,99 7,04 7,32 7,20 7,14 7,15 16:00 7,73 7,84 7,34 7,22 7,60 7,48 7,80 7,66 7,49 16:30 6,90 7,32 7,11 7,25 7,31 7,28 7,08 7,25 7,30 GABARITO: Xshdata 987654321/ 07:00 7,51 7,62 7,89 7,71 7,68 7,35 7,48 7,71 7,80 0,17 7,639 07:30 7,11 7,597,62 7,68 7,72 7,45 7,72 7,64 7,31 0,21 7,538 08:00 7,57 7,35 7,31 7,90 7,19 7,28 7,80 7,32 7,40 0,25 7,458 08:30 7,37 6,99 6,98 7,35 7,53 7,07 7,15 7,39 7,20 0,19 7,226 09:00 7,50 7,05 6,91 7,56 7,37 7,57 7,30 7,03 7,45 0,25 7,304 09:30 7,12 7,14 7,35 7,42 7,73 7,22 7,18 7,27 7,34 0,19 7,308 10:00 7,20 7,81 7,72 7,91 7,38 7,58 7,60 7,44 7,70 0,22 7,593 10:30 7,01 7,56 7,31 7,36 7,14 7,41 7,28 7,19 7,46 0,17 7,302 11:00 7,75 7,43 7,15 7,74 7,35 7,60 7,68 7,48 7,31 0,21 7,499 11:30 6,92 7,44 7,08 7,64 7,05 7,57 7,41 7,25 7,18 0,25 7,282 12:00 7,74 7,68 7,15 7,26 7,69 7,40 7,42 7,58 7,71 0,22 7,514 12:30 7,18 6,91 7,24 6,94 7,15 7,08 7,03 6,97 7,25 0,13 7,083 13:00 7,88 7,21 7,81 7,16 7,33 7,65 7,50 7,83 7,37 0,28 7,527 13:30 7,83 7,46 7,43 7,49 7,44 7,65 7,62 7,54 7,76 0,14 7,580 14:00 7,33 7,78 7,35 7,48 7,67 7,38 7,49 7,40 7,57 0,15 7,494 14:30 6,97 7,64 7,06 7,57 7,14 7,22 7,45 7,10 7,37 0,24 7,280 15:00 7,27 7,32 6,97 7,41 7,38 7,23 7,54 7,30 7,28 0,15 7,300 15:30 7,03 7,09 7,58 6,99 7,04 7,32 7,20 7,14 7,15 0,18 7,171 16:00 7,73 7,84 7,34 7,22 7,60 7,48 7,80 7,66 7,49 0,21 7,573 16:30 6,90 7,32 7,11 7,25 7,31 7,28 7,08 7,25 7,30 0,14 7,200 X =7,3936 ; s = 0,1974 ; n = 9 Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 34 A3 = 1,032 ; B3 = 0,239 ; B4 = 1,761 ; C4 = 0,9693 20365,0 9693,0 1974,0ˆ 4 === C sσ 3936,7ˆ == Xµ 5973,71974,0032,13936,73 =+=+= xsAXLSC X 1899,71974,0032,13936,73 =−=−= xsAXLICX 3476,01974,0761,14 === xsBLSCs 0472,01974,0239,03 === xsBLICs 0Subgroup 10 20 7,0 7,1 7,2 7,3 7,4 7,5 7,6 7,7 Sa m pl e M ea n Mean=7,394 UCL=7,597 LCL=7,190 0,0 0,1 0,2 0,3 0,4 Sa m pl e St D ev S=0,1974 UCL=0,3476 LCL=0,04721 gráfico de controle p/ média e s p/ o diâmetro do comprimido 1 1 1 Há três pontos fora do limite de controle. Teríamos que descobrir as causas, eliminá-las, recalcular os limites de controle para só depois analisar a capacidade do processo. Não há sentido em analisar a capacidade de processos não estáveis. Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 35 CARTAS DE CONTROLE PARA A MEDIANA ( ) E PARA A AMPLITUDE ( R ) X~ Limites de controle para o gráfico das medianas: RAXLSC X 2~ ~~ += .~~ 2~ RAXLICX −= 2 ~A é um fator tabelado que varia com o tamanho da amostra. Limites de controle para o gráfico da amplitude: LSCR = D4 R LICR = D3 R se LICR > 0. Caso contrário não existirá LICR. D3 e D4 são fatores tabelados que variam com o tamanho da amostra. DADOS PARA CARTA DE CONTROLE PARA A MEDIANA ( ) E PARA A AMPLITUDE ( R ) X~ Especificação: 0,05 a 0,18 Atividade: produção da peça Característica: diâmetro da peça (em mm) Tamanho da amostra: 5 peças Freqüência média das retiradas de amostras: de ½ em ½ hora (das 7:00 h às 16:30 h) Total de amostras: 20 Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 36 XRhdata ~54321/ 07:00 0,18 0,15 0,17 0,15 0,13 07:30 0,16 0,16 0,16 0,14 0,17 08:00 0,17 0,18 0,16 0,14 0,18 08:30 0,15 0,19 0,16 0,14 0,15 09:00 0,16 0,17 0,17 0,12 0,14 09:30 0,16 0,15 0,15 0,13 0,14 10:00 0,17 0,18 0,17 0,13 0,15 10:30 0,15 0,18 0,15 0,14 0,18 11:00 0,16 0,15 0,17 0,18 0,15 11:30 0,16 0,17 0,17 0,17 0,13 12:00 0,17 0,16 0,18 0,21 0,15 12:30 0,17 0,17 0,20 0,16 0,13 13:00 0,18 0,14 0,20 0,16 0,16 13:30 0,17 0,15 0,19 0,17 0,14 14:00 0,16 0,16 0,18 0,15 0,12 14:30 0,17 0,15 0,19 0,16 0,15 15:00 0,18 0,14 0,15 0,15 0,17 15:30 0,16 0,16 0,19 0,18 0,16 16:00 0,15 0,17 0,18 0,16 0,16 16:30 0,14 0,16 0,16 0,17 0,15 GABARITO: XRhdata ~54321/ 07:00 0,18 0,15 0,17 0,15 0,13 0,05 0,15 07:30 0,16 0,16 0,16 0,14 0,17 0,03 0,16 08:00 0,17 0,18 0,16 0,14 0,18 0,04 0,17 08:30 0,15 0,19 0,16 0,14 0,15 0,05 0,15 09:00 0,16 0,17 0,17 0,12 0,14 0,05 0,16 09:30 0,16 0,15 0,15 0,13 0,14 0,03 0,15 10:00 0,17 0,18 0,17 0,13 0,15 0,05 0,17 10:30 0,15 0,18 0,15 0,14 0,18 0,04 0,15 11:00 0,16 0,15 0,17 0,18 0,15 0,03 0,16 11:30 0,16 0,17 0,17 0,17 0,13 0,04 0,17 12:00 0,17 0,16 0,18 0,21 0,15 0,06 0,17 12:30 0,17 0,17 0,20 0,16 0,13 0,07 0,17 13:00 0,18 0,14 0,20 0,16 0,16 0,06 0,16 13:30 0,17 0,15 0,19 0,17 0,14 0,05 0,17 14:00 0,16 0,16 0,18 0,15 0,12 0,06 0,16 14:30 0,17 0,15 0,19 0,16 0,15 0,04 0,16 15:00 0,18 0,14 0,15 0,15 0,17 0,04 0,15 15:30 0,16 0,16 0,19 0,18 0,16 0,03 0,16 16:00 0,15 0,17 0,18 0,16 0,16 0,03 0,16 16:30 0,14 0,16 0,16 0,17 0,15 0,03 0,16 X~ = 0,161 ; R = 0,044 ; n = 5 2 ~A = 0,691 ; D3 não existe ; D4 = 2,114 ; d2 = 2,326 Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 37 019,0 326,2 044,0ˆ 2 === d Rσ 191,0044,0691,0161,0~~ 2~ =+=+= xRAXLSC X 131,0044,0691,0161,0~~ 2~ =−=−= xRAXLICX LSCR = D4 R = 2,114 x 0,044 = 0,093 LICR não existe O processo está estável. Especificação: (0,05 a 0,18) 114,1 019,06 13,0 ˆ6 )( >==−== x LIELSE dispersão tolerânciaC p σ 842,5 019,0 05,0161,0 ˆ )~( =−=−= σ LIEXZi 00,1 019,0 161,018,0 ˆ )~( =−=−= σ XLSEZ s 1333,0 3 00,1 3 ),min( 3 min <==== sipk ZZZC O processo é incapaz e não está centralizado. CARTAS DE CONTROLE PARA DADOS INDIVIDUAIS (X) e AMPLITUDE (R) É utilizada quando as medições são demoradas ou dispendiosas, quando o resultado é homogêneo ou quando se deseja controlar certos processos administrativos. Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 38 Limites de controle para o gráfico de dados individuais: LSCX = X + E2 R LICX = X - E2 R A amplitude é calculada pelo módulo da diferença de cada dado em relação ao dado posterior. Teremos, portanto, uma medida a menos que no total de dados coletados. Pode-se também achar a amplitude de cada 3 dados ou 4 dados , etc. Os grupos de dados selecionados constituirão os grupos móveis no cálculo da amplitude. E2 é um fator que varia com o tamanho da amostra e R é a média das amplitudes móveis. Limites de controle para o gráfico das amplitudes móveis: LSCR = D4 R LICR = D3 R se LICR > 0. Caso contrário não existirá LICR. D3 e D4 são fatores tabelados que variam com o tamanho da amostra. DADOS PARA CARTA DE CONTROLE DE DADOS INDIVIDUAIS (X) E PARA A AMPLITUDE (R) Especificação: 10 1,5 ± Atividade: preparação da substância Característica: acidez Tamanho da amostra: 1 galão Freqüência média das retiradas de amostras: de hora em hora (das 6:00 h às 23:00 h) Total de amostras: 18 RXhdata / Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 39 06:00 9,2 07:00 9,5 08:00 10,0 09:00 10,3 10:00 9,8 11:00 9,7 12:00 10,5 13:00 10,9 14:00 11,2 15:00 10,8 16:00 11,1 17:00 10,7 18:00 9,9 19:00 9,8 20:00 9,9 21:00 10,4 22:00 10,8 23:00 10,3 GABARITO: RXhdata / 06:00 9,2 07:00 9,5 0,3 08:00 10,0 0,5 09:00 10,3 0,3 10:00 9,8 0,5 11:00 9,7 0,1 12:00 10,5 0,8 13:00 10,9 0,4 14:00 11,2 0,3 15:00 10,8 0,4 16:00 11,1 0,3 17:00 10,7 0,4 18:00 9,9 0,8 19:00 9,8 0,1 20:00 9,9 0,1 21:00 10,4 0,5 22:00 10,8 0,4 23:00 10,3 0,5 X = 10,27 ; R = 0,39 ; n = 2 E2= 2,660 ; D3 não existe ; D4 = 3,267 ; d2 = 1,128 35,0 128,1 39,0ˆ 2 === d Rσ 27,10ˆ == Xµ Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 40 LSCX = X + E2 R = 10,27 + 2,660 x 0,39 = 11,31 LICX = X - E2 R = 10,27 – 2,660 x 0,39 = 9,23 LSCR = D4 R = 3,267 x 0,39 = 1,27 LICR não existe 0Subgroup10 20 9,0 9,5 10,0 10,5 11,0 11,5 In di vid ua l V al ue Mean=10,27 UCL=11,31 LCL=9,218 0,0 0,5 1,0 1,5 M ov in g Ra ng e R=0,3941 UCL=1,288 LCL=0 Gráfico de controle p/ dados individuais e R para a acidez 1 Há um ponto fora do limite de controle. Teríamos que descobrir as causas, eliminar as causas, recalcular os limites de controle para só depois analisar a capacidade do processo. Não há sentido em analisar capacidade de processos não estáveis. Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 41 CARTA DE CONTROLE PARA ATRIBUTOS: - Carta de controle de porcentagem de unidades defeituosas p - Carta de controle de quantidade de unidades defeituosas np - Carta de controle de quantidade de defeitos numa amostra c - Carta de controle de defeitos por unidade u CARTA DE CONTROLE DA PROPORÇÃO DE UNIDADES DEFEITUOSAS (p) ETAPAS PARA CONSTRUÇÃO DA CARTA DE p: 1) Preencher o cabeçalho e escolher o tamanho e a freqüência das amostras. 2) Coletar as k amostras (de tamanho ni),inspecioná-las e anotar na linha np o nº de unidades defeituosas da amostra (npi). 3)Calcular i i i n npp = 4)Calcular ∑ ∑ = === k i i k i i n np dasinspecionaunidadesdetotaln sdefeituosaunidadesdetotalnp 1 1 º º 5) Determinar a escala (para gráficos feitos a mão): Valor mínimo da escala igual a zero Valor máximo da escala é aproximadamente igual a 2 x pmax ou 1,5 x pmax dependendo da facilidade de colocação dos pontos na carta. Temos que pmax é igual ao maior valor p encontrado nas amostras. Valor de cada divisão = 2pmax/10 ou 1,5pmax/10 , dependendo da escolha feita anteriormente no cálculo do valor máximo da escala. 6) Plotar os pontos na carta. 7) Calcular os limites de controle: n pppLSC p )1(3 −+= Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 42 n pppLIC p )1(3 −−= se LICp > 0. Caso contrário LICp não existirá. Temos que: n é o tamanho médio das amostras, uma vez que o tamanho das amostras não precisa ser constante. 8) Traçar no gráfico de p: A média das porcentagens ( p ) com linha contínua Os LSCp e LICp com linhas tracejadas DADOS PARA CARTA DE CONTROLE DA PROPORÇÃO DE UNIDADES DEFEITUOSAS p Atividade: vulcanização Característica: proporção de peças defeituosas por amostra Tamanho da amostra: variável Freqüência: a cada turno (manhã, tarde e noite), durante 7 dias Total de amostras: 21 n np p 150 3 150 2 148 1 150 3 150 4 150 2 150 3 149 2 150 2 150 1 150 2 150 2 150 3 150 2 150 1 149 2 150 2 150 3 150 0 150 2 150 2 Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 43 GABARITO: n np p 150 3 0,020 150 2 0,013 148 1 0,007 150 3 0,020 150 4 0,027 150 2 0,013 150 3 0,020 149 2 0,013 150 2 0,013 150 1 0,007 150 2 0,013 150 2 0,013 150 3 0,020 150 2 0,013 150 1 0,007 149 2 0,013 150 2 0,013 150 3 0,020 150 0 0,000 150 2 0,013 150 2 0,013 3146 1 =∑ = k i in 8,149 21 3146 ==n 44 1 =∑ = k i inp 014,0 3146 44 1 1 === ∑ ∑ = = k i i k i i n np p LSCp 043,08,149 986,0014,03014,0)1(3 =+=−+= x n ppp LICp não existe Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 44 0 10 20 0,00 0,01 0,02 0,03 0,04 0,05 Sample Number Pr op or tio n Carta de controle p/ p para proporção de peças defeituosas P=0,01399 UCL=0,04275 LCL=0 Observação: O gráfico do programa Minitab não utiliza n . CARTA DE CONTROLE DA QUANTIDADE DE UNIDADES DEFEITUOSAS (np) ETAPAS PARA A CONSTRUÇÃO DA CARTA DE np: 1) Preencher o cabeçalho e escolher a freqüência das amostras e o tamanho n constante para todas as amostras. 2) Coletar os dados e registrar o nº de unidades defeituosas. 3)Calcular k np coletadasamostrasden sdefeituosaunidadesdetotalnnp k i i∑ === 1 º º 4)Calcular os limites de controle: −+= n npnpnpLSCnp 13 Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 45 −−= n npnpnpLICnp 13 se LICnp>0. Caso contrário não existirá LICnp. 5)Construir o gráfico, plotando no mesmo a quantidade de unidades defeituosas de cada amostra (np). DADOS PARA CARTA DE CONTROLE DA QUANTIDADE DE UNIDADES DEFEITUOSAS np Atividade: vulcanização Característica: quantidade de peças defeituosas por amostra Tamanho da amostra: 150 peças Freqüência: a cada turno (manhã, tarde e noite), durante 7 dias Total de amostras: 21 Dados: 2 , 3 , 0 , 1 , 2 , 2 , 4 , 3 , 4 , 2 , 1 , 2 , 3 , 2 , 3 , 1 , 0 , 2 , 2 , 2 , 3 GABARITO: Dados: 2 , 3 , 0 , 1 , 2 , 2 , 4 , 3 , 4 , 2 , 1 , 2 , 3 , 2 , 3 , 1 , 0 , 2 , 2 , 2 , 3 K = 21 ; n =150 44 1 =∑ = k i inp 10,2 21 441 === ∑ = k np np k i i LSCnp = 42,6150 10,2110,2310,213 = −+= −+ n npnpnp LICnp não existe Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 46 0 10 20 0 1 2 3 4 5 6 7 Sample Number Sa m pl e C ou nt Gráfico de controle p/ np para quantidade de defeitos por amostra NP=2,095 UCL=6,407 LCL=0 CARTA DE CONTROLE DA QUANTIDADE DE DEFEITOS NUMA AMOSTRA (c) ETAPAS PARA A CONSTRUÇÃO DA CARTA DE c: 1) Preencher o cabeçalho e escolher a freqüência das amostras e o tamanho constante para todas as amostras. 2) Coletar os dados e registrar o nº de defeitos em cada amostra ( c ). 3)Calcular k c coletadasamostrasden defeitosdetotalnc k i i∑ === 1 º º 4)Calcular os limites de controle: ccLSCc 3+= Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 47 ccLICc 3−= se LICC>0. Caso contrário não existirá LICC. 5) Construir o gráfico, plotando no mesmo a quantidade de defeitos encontrado em cada amostra (c). DADOS PARA CARTA DE CONTROLE DA QUANTIDADE DE DEFEITOS NUMA AMOSTRA c Atividade: confecção de um rolo de adesivo vinil Característica: quantidade de defeitos por amostra Tamanho da amostra: um rolo Freqüência: a cada 15 minutos durante 6 horas Total de amostras: 24 Dados: hora: 8:15 8:30 8:45 9:00 9:15 9:30 9:45 10:00 10:15 10:30 10:45 11:00 c: 3 4 3 2 1 4 5 3 2 4 3 2 hora: 11:15 11:30 11:45 13:00 13:15 13:30 13:45 14:00 14:15 14:30 14:45 15:00 c: 5 3 2 0 3 2 3 2 2 1 3 0 GABARITO: K = 24 62 1 =∑ = k i ic 6,2 24 621 === ∑ = k c c k i i LSCC = 4,76,236,23 =+=+ cc LICC não existe. Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 48 0 5 10 15 20 25 0 1 2 3 4 5 6 7 8 Sample Number Sa m pl e C ou nt Gráfico de controle p/ c para quantidade de defeitos num rolo de adesivi vinil C=2,583 UCL=7,405 LCL=0 CARTA DE CONTROLE DE DEFEITOS POR UNIDADE u ETAPAS PARA A CONSTRUÇÃO DA CARTA DE u: 1) Preencher o cabeçalho e escolher o tamanho e a freqüência das amostras. 2) Coletar os dados e registrar o nº de defeitos. 3)Calcular u = amostranadasinspecionaunidadesden amostranadefeitosden º º 4)Calcular ∑ ∑ = === k i i k i i n c dasinspecionaunidadesdetotaln defeitosdetotalnu 1 1 º º 5) Calcular os limites de controle:LSCU = n u3+u Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 49 n uuLICu 3−= se LICU > 0. Caso contrário não existirá LICU. onde n é o tamanho médio da amostra. 5)Construir o gráfico, plotando no mesmo a quantidade de defeitos por unidade em cada amostra (u). DADOS PARA CARTA DE CONTROLE DA QUANTIDADE DE DEFEITOS POR UNIDADE u Atividade: confecção de uma placa de PVC expandido Característica: quantidade de defeitos por placa Tamanho da amostra: variável Freqüência: a cada 15 minutos durante 6 horas Total de amostras: 24 hora n c u=c/n 08:15 15 18 08:30 13 15 08:45 12 16 09:00 10 10 09:15 12 11 09:30 12 11 09:45 15 18 10:00 13 13 10:15 12 15 10:30 10 12 10:45 11 10 11:00 11 13 11:15 12 13 11:30 10 8 11:45 12 11 12:00 12 10 13:15 12 15 13:30 11 13 13:45 12 12 14:00 12 13 14:15 10 11 14:30 12 13 14:45 11 10 15:00 12 11 GABARITO: Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 50 hora n c u=c/n 08:15 15 18 1,2 08:30 13 15 1,2 08:45 12 16 1,3 09:00 10 10 1,0 09:15 12 11 0,9 09:30 12 11 0,9 09:45 15 18 1,2 10:00 13 13 1,0 10:15 12 15 1,3 10:30 10 12 1,2 10:45 11 10 0,9 11:00 11 13 1,2 11:15 12 13 1,1 11:30 10 8 0,8 11:45 12 11 0,9 12:00 12 10 0,8 13:15 12 15 1,3 13:30 11 13 1,2 13:45 12 12 1,0 14:00 12 13 1,1 14:15 10 11 1,1 14:30 12 13 1,1 14:45 11 10 0,9 15:00 12 11 0,9 K = 24 284302 11 == ∑∑ == k i i k i i nc 06,1 284 302 1 1 === ∑ ∑ = = k i i k i i n c u 83,11 24 2841 === ∑ = k n n k i i LSCU = 96,1 83,11 06,1 306,13 =+=+ n uu LICU = 16,0 83,11 06,1 306,13 =−=− n uu Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 51 0 5 10 15 20 25 0 1 2 Sample Number Sa m pl e C ou nt Gráfico de controle p/ u para quantidade de defeitos por placa U=1,063 UCL=1,956 LCL=0,1703 Observação: O gráfico do programa Minitab não utiliza n Interpretação da carta de controle para atributos A existência de pontos abaixo do limite inferior de controle ou de sete pontos consecutivos descendentes ou de sete pontos consecutivos abaixo da linha média indica uma mudança favorável no processo, pois tais cartas registram unidades defeituosas ou nº de defeitos. Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 52 A CARTA DE CONTROLE PARA A SOMA CUMULATIVA ( CUSUM ) A maior desvantagem das cartas de Shewhart é que elas utilizam apenas as informações do processo contidas no último ponto plotado e ignora qualquer informação dada pela seqüência de pontos. Este fato faz as cartas de Shewhart pouco sensíveis a pequenas mudanças no processo, digamos de menos de 1,5σ. Outros critérios que não a saída dos limites de controle, podem ser adotados nas cartas de Shewhart, mas fora complicar sua utilização podem levar a um “super controle ”. Exemplo: Amostra xi xi -10 Ci=(xi -10)+Ci-1 1 9,45 -0,55 -0,55 2 7,99 -2,01 -2,56 3 9,29 -0,71 -3,27 4 11,66 1,66 -1,61 5 12,16 2,16 0,55 6 10,18 0,18 0,73 7 8,04 -1,96 -1,23 8 11,46 1,46 0,23 9 9,20 -0,80 -0,57 10 10,34 0,34 -0,23 11 9,03 -0,97 -1,20 12 11,47 1,47 0,27 13 10,51 0,51 0,78 14 9,40 -0,60 0,18 15 10,08 0,08 0,26 16 9,37 -0,63 -0,37 17 10,62 0,62 0,25 18 10,31 0,31 0,56 19 8,52 -1,48 -0,92 20 10,84 0,84 -0,08 21 10,90 0,90 0,82 22 9,33 -0,67 0,15 23 12,29 2,29 2,44 24 11,50 1,50 3,94 25 10,60 0,60 4,54 26 11,08 1,08 5,62 27 10,38 0,38 6,00 28 11,62 1,62 7,62 29 11,31 1,31 8,93 30 10,52 0,52 9,45 As 20 primeiras observações foram obtidas aleatoriamente de uma população com normal com µ=10 e σ=1. Temos: LSCX = 13 LICX = 7 10=X Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 53 Note que todas as 20 observações estão sob controle. As últimas 10 observações foram obtidas aleatoriamente de uma população com distribuição normal com µ=11 e σ=1. Nenhum dos pontos saiu dos limites de controle. Carta de Controle para X Como o CUSUM trabalha com somas cumulativas, ele detecta mais rapidamente pequenas mudanças e sua utilização é particularmente aconselhável quando n = 1. Isto faz a carta de controle para cartas de controle para somas cumulativas, muito indicada na indústria química e em processos industriais onde os subgrupos tem em geral tamanho um. Seja 0)( 0 1 0 =−= ∑ = CexC i j ji µ No exemplo:C 1 1 )10()10( − = +−=−= ∑ iii j ji Cxx Gráfico CUSUM Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 54 O gráfico de CUSUM não é uma carta de controle, pois não existem limites estatísticos de controle. Vamos estudar a maneira tabular do CUSUM. Supomos que as amostras tenham todas tamanho igual a um. Seja xi a i-ésima observação do processo. Se o processo está sob controle X ~ N( µo ; σ2 ) Vamos assumir que σ é conhecido ou que podemos estimá-lo. Podemos encarar µo como o valor alvo para a característica X. Suponha que desejamos controlar a viscosidade num alvo de 2000 centistokes a 100 ºC. O CUSUM permite perceber pequenas alterações de modo que possamos agir, manipulando outra variável, por exemplo, a taxa de alimentação do catalisador, trazer o processo de volta para seu alvo. Outras vezes o CUSUM detecta a presença de causas especiais. Sejam: Ci+ = max [ 0 , xi - (µ0 + k) + Ci-1+ ] Ci- = max [ 0 , (µ0 - k) - xi + Ci-1- ] Onde C0+ = C0- = 0 k é um valor de referência, geralmente metade da distância entre o objetivo µ0 e o valor da média fora de controle µ1 = µ0 + δσ , isto é: 22 01 µµσδ −==k Tanto Ci+ como Ci- ao tornarem-se negativos passam a assumir o valor igual a zero. Se Ci+ ou Ci- excederem o intervalo de decisão H, o processo é considerado fora de controle. Um valor aconselhável para H é 5σ. No exemplo, seja: µ0 = 10 n = 1 σ = 1 Queremos detectar uma alteração no valor da média de 1σ, isto é, µ1 = µ0 + σ. Vamos assumir H = 5. Como σ = 1,temos: 2 11 2 1 2 === xk σδ Ci+ = max [ 0 , xi – 10,5 + Ci-1+] Ci- = max [ 0 , 9,5 - xi + Ci-1-] N+ e N- são respectivamente contadores do número consecutivo de períodos em que as somas acumuladas Ci+ e Ci- não são zero. Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 55 Período a b i xi xi-10,5 Ci+ N+ 9,5-xi Ci- N- 1 9,45 -1,05 0 0 0,05 0,05 1 2 7,99 -2,51 0 0 1,51 1,56 2 3 9,29 -1,21 0 0 0,21 1,77 3 4 11,66 1,16 1,16 1 -2,16 0 0 5 12,16 1,66 2,82 2 -2,66 0 0 6 10,18 -0,32 2,5 3 -0,68 0 0 7 8,04 -2,46 0,04 4 1,46 1,46 1 8 11,46 0,96 1 5 -1,96 0 0 9 9,2 -1,3 0 0 0,3 0,3 1 10 10,34 -0,16 0 0 -0,84 0 0 11 9,03 -1,47 0 0 0,47 0,47 1 12 11,47 0,97 0,97 1 -1,97 0 0 13 10,51 0,01 0,98 2 -1,01 0 0 14 9,4 -1,1 0 0 0,1 0,1 1 15 10,08 -0,42 0 0 -0,58 0 0 16 9,37 -1,13 0 0 0,13 0,13 1 17 10,62 0,12 0,12 1 -1,12 0 0 18 10,31 -0,19 0 0 -0,81 0 0 19 8,52 -1,98 0 0 0,98 0,98 1 20 10,84 0,34 0,34 1 -1,34 0 0 21 10,9 0,4 0,74 2 -1,4 0 0 22 9,33 -1,17 0 0 0,17 0,17 1 23 12,29 1,79 1,79 1 -2,79 0 0 24 11,5 1 2,79 2 -2 0 0 25 10,6 0,1 2,89 3 -1,1 0 0 26 11,08 0,58 3,47 4 -1,58 0 0 27 10,38 -0,12 3,35 5 -0,88 0 0 28 11,62 1,12 4,47 6 -2,12 0 0 29 11,31 0,81 5,28 7 -1,81 0 0 30 10,52 0,02 5,3 8 -1,02 0 0 Para n=29, Ci+ = 5,28 > 5 logo o processo saiu de controle. Como N+=7 temos que o processo estava pela última vez sob controle no período 22 = 29 - 7. Um gráfico de barras pode ser feito para visualizar melhor a performance real do processo que levou a um valor particular do CUSUM. Apostila de Estatística – 2004 – Autoria: RaquelCymrot 56 As quantidades k , Ci+ , Ci- , N+ e N- podem ser usadas para estimar a média atual do processo, a fim de se poder dimensionar a ação a ser feita no processo de modo a traze-lo de volta para o alvo µ0. + + ++= N Ck i0ˆ µµ se HCi >+ ou − − −−= N Ck i0ˆ µµ se HCi >− No exemplo temos: 25,11 7 28,55,00,10ˆ 290 =++=++= + + N Ckµµ Se, no exemplo, a característica controlada for a viscosidade, concluiríamos que teríamos que ajustar a taxa de alimentação do catalisador de modo a resultar no ajuste da viscosidade em 1,25 unidades. Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 57 TABELA NORMAL PADRÃO: P(Z ≤ z ) = p = φ(z) inteiro e 1ª decimal de z 0 1 2 3 4 5 6 7 8 9 -3,9 0,0000 0,0000 0,0000 00 0,0000 0,0000 0,0000 -3,8 0,0001 0,0001 0,0001 01 0,0001 0,0001 0,0001 -3,7 0,0001 0,0001 0,0001 01 0,0001 0,0001 0,0001 -3,6 0,0002 0,0002 0,0001 01 0,0001 0,0001 0,0001 -3,5 0,0002 0,0002 0,0002 02 0,0002 0,0002 0,0002 -3,4 0,0003 0,0003 0,0003 03 0,0003 0,0003 0,0002 -3,3 0,0005 0,0005 0,0005 04 0,0004 0,0004 0,0003 -3,2 0,0007 0,0007 0,0006 06 0,0005 0,0005 0,0005 -3,1 0,0010 0,0009 0,0009 08 0,0008 0,0007 0,0007 -3,0 0,0013 0,0013 0,0013 11 0,0011 0,0010 0,0010 -2,9 0,0019 0,0018 0,0018 15 0,0015 0,0014 0,0014 -2,8 0,0026 0,0025 0,0024 21 0,0021 0,0020 0,0019 -2,7 0,0035 0,0034 0,0033 29 0,0028 0,0027 0,0026 -2,6 0,0047 0,0045 0,0044 39 0,0038 0,0037 0,0036 -2,5 0,0062 0,0060 0,0059 52 0,0051 0,0049 0,0048 -2,4 0,0082 0,0080 0,0078 69 0,0068 0,0066 0,0064 -2,3 0,0107 0,0104 0,0102 91 0,0089 0,0087 0,0084 -2,2 0,0139 0,0136 0,0132 19 0,0116 0,0113 0,0110 -2,1 0,0179 0,0174 0,0170 54 0,0150 0,0146 0,0143 -2,0 0,0228 0,0222 0,0217 97 0,0192 0,0188 0,0183 -1,9 0,0287 0,0281 0,0274 50 0,0244 0,0239 0,0233 -1,8 0,0359 0,0351 0,0344 14 0,0307 0,0301 0,0294 -1,7 0,0446 0,0436 0,0427 92 0,0384 0,0375 0,0367 -1,6 0,0548 0,0537 0,0526 85 0,0475 0,0465 0,0455 -1,5 0,0668 0,0655 0,0643 94 0,0582 0,0571 0,0559 -1,4 0,0808 0,0793 0,0778 21 0,0708 0,0694 0,0681 -1,3 0,0968 0,0951 0,0934 69 0,0853 0,0838 0,0823 -1,2 0,1151 0,1131 0,1112 38 0,1020 0,1003 0,0985 -1,1 0,1357 0,1335 0,1314 30 0,1210 0,1190 0,1170 -1,0 0,1587 0,1562 0,1539 46 0,1423 0,1401 0,1379 -0,9 0,1841 0,1814 0,1788 85 0,1660 0,1635 0,1611 -0,8 0,2119 0,2090 0,2061 49 0,1922 0,1894 0,1867 -0,7 0,2420 0,2389 0,2358 36 0,2206 0,2177 0,2148 -0,6 0,2743 0,2709 0,2676 46 0,2514 0,2483 0,2451 -0,5 0,3085 0,3050 0,3015 77 0,2843 0,2810 0,2776 -0,4 0,3446 0,3409 0,3372 28 0,3192 0,3156 0,3121 -0,3 0,3821 0,3783 0,3745 94 0,3557 0,3520 0,3483 -0,2 0,4207 0,4168 0,4129 74 0,3936 0,3897 0,3859 -0,1 0,4602 0,4562 0,4522 64 0,4325 0,4286 0,4247 0,0 0,5000 0,4960 0,4920 61 0,4721 0,4681 0,4641 0,1 0,5398 0,5438 0,5478 36 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 26 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 06 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 72 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 23 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 54 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 64 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 51 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 15 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 54 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 70 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 62 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 31 0,9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 79 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 06 0,9418 0,9429 0,9441 1,6 0,9452 0,9463 0,9474 15 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 08 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 86 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 50 0,9756 0,9761 0,9767 2,0 0,9772 0,9778 0,9783 03 0,9808 0,9812 0,9817 2,1 0,9821 0,9826 0,9830 46 0,9850 0,9854 0,9857 2,2 0,9861 0,9864 0,9868 81 0,9884 0,9887 0,9890 2,3 0,9893 0,9896 0,9898 09 0,9911 0,9913 0,9916 2,4 0,9918 0,9920 0,9922 31 0,9932 0,9934 0,9936 2,5 0,9938 0,9940 0,9941 48 0,9949 0,9951 0,9952 2,6 0,9953 0,9955 0,9956 61 0,9962 0,9963 0,9964 2,7 0,9965 0,9966 0,9967 71 0,9972 0,9973 0,9974 2,8 0,9974 0,9975 0,9976 79 0,9979 0,9980 0,9981 2,9 0,9981 0,9982 0,9982 85 0,9985 0,9986 0,9986 3,0 0,9987 0,9987 0,9987 89 0,9989 0,9990 0,9990 3,1 0,9990 0,9991 0,9991 92 0,9992 0,9993 0,9993 3,2 0,9993 0,9993 0,9994 94 0,9995 0,9995 0,9995 3,3 0,9995 0,9995 0,9995 96 0,9996 0,9996 0,9997 3,4 0,9997 0,9997 0,9997 97 0,9997 0,9997 0,9998 3,5 0,9998 0,9998 0,9998 98 0,9998 0,9998 0,9998 3,6 0,9998 0,9998 0,9999 99 0,9999 0,9999 0,9999 3,7 0,9999 0,9999 0,9999 99 0,9999 0,9999 0,9999 3,8 0,9999 0,9999 0,9999 99 0,9999 0,9999 0,9999 3,9 1,0000 1,0000 1,0000 00 1,0000 1,0000 1,0000 0,0000 0,0000 0,0000 0,00 0,0001 0,0001 0,0001 0,00 0,0001 0,0001 0,0001 0,00 0,0001 0,0001 0,0001 0,00 0,0002 0,0002 0,0002 0,00 0,0003 0,0003 0,0003 0,00 0,0004 0,0004 0,0004 0,00 0,0006 0,0006 0,0006 0,00 0,0009 0,0008 0,0008 0,00 0,0012 0,0012 0,0011 0,00 0,0017 0,0016 0,0016 0,00 0,0023 0,0023 0,0022 0,00 0,0032 0,0031 0,0030 0,00 0,0043 0,0041 0,0040 0,00 0,0057 0,0055 0,0054 0,00 0,0075 0,0073 0,0071 0,00 0,0099 0,0096 0,0094 0,00 0,0129 0,0125 0,0122 0,01 0,0166 0,0162 0,0158 0,01 0,0212 0,0207 0,0202 0,01 0,0268 0,0262 0,0256 0,02 0,0336 0,0329 0,0322 0,03 0,0418 0,0409 0,0401 0,03 0,0516 0,0505 0,0495 0,04 0,0630 0,0618 0,0606 0,05 0,0764 0,0749 0,0735 0,07 0,0918 0,0901 0,0885 0,08 0,1093 0,1075 0,1056 0,10 0,1292 0,1271 0,1251 0,12 0,1515 0,1492 0,1469 0,14 0,1762 0,1736 0,1711 0,16 0,2033 0,2005 0,1977 0,19 0,2327 0,2296 0,2266 0,22 0,2643 0,2611 0,2578 0,25 0,2981 0,2946 0,2912 0,28 0,3336 0,3300 0,3264 0,32 0,3707 0,3669 0,3632 0,35 0,4090 0,4052 0,4013 0,39 0,4483 0,4443 0,4404 0,43 0,4880 0,4840 0,4801 0,47 0,5517 0,5557 0,5596 0,56 0,5910 0,5948 0,5987 0,60 0,6293 0,6331 0,6368 0,64 0,6664 0,6700 0,6736 0,67 0,7019 0,7054 0,7088 0,71 0,7357 0,7389 0,7422 0,74 0,7673 0,7704 0,7734 0,77 0,7967 0,7995 0,8023 0,80 0,8238 0,8264 0,8289 0,83 0,8485 0,8508 0,8531 0,85 0,8708 0,8729 0,8749 0,87 0,8907 0,8925 0,8944 0,89 0,9082 0,9099 0,9115 0,91 0,9236 0,9251 0,9265 0,92 0,9370 0,9382 0,9394 0,94 0,9484 0,9495 0,9505 0,95 0,9582 0,9591 0,9599 0,96 0,9664 0,9671 0,9678 0,96 0,9732 0,9738 0,9744 0,97 0,9788 0,9793 0,9798 0,98 0,9834 0,9838 0,9842 0,98 0,9871 0,9875 0,9878 0,98 0,9901 0,9904 0,9906 0,99 0,9925 0,9927 0,9929 0,99 0,9943 0,9945 0,9946 0,99 0,9957 0,9959 0,9960 0,99 0,9968 0,9969 0,9970 0,99 0,9977 0,9977 0,9978 0,99 0,9983 0,9984 0,9984 0,99 0,9988 0,9988 0,9989 0,99 0,9991 0,9992 0,9992 0,99 0,9994 0,9994 0,9994 0,99 0,9996 0,9996 0,9996 0,99 0,9997 0,9997 0,9997 0,99 0,9998 0,9998 0,9998 0,99 0,9999 0,9999 0,9999 0,99 0,9999 0,9999 0,9999 0,99 0,9999 0,9999 0,9999 0,99 1,0000 1,0000 1,0000 1,00 2ª decimal de z Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 58 TABELA INVERSA DA NORMAL PADRÃO p = φ(z) = P(Z≤z) inteiro, 1ª e 2ª decimais de p 0 1 2 3 4 5 6 7 8 9 0,00 ∝ -3,0902 -2,8782 -2,7478 -2,6521 -2,5758 -2,5121 -2,4573 -2,4089 -2,3656 0,01 -2,3263 -2,2904 -2,2571 -2,2262 -2,1973 -2,1701 -2,1444 -2,1201 -2,0969 -2,0748 0,02 -2,0537 -2,0335 -2,0141 -1,9954 -1,9774 -1,9600 -1,9431 -1,9268 -1,9110 -1,8957 0,03 -1,8808 -1,8663 -1,8522 -1,8384 -1,8250 -1,8119 -1,7991 -1,7866 -1,7744 -1,7624 0,04 -1,7507 -1,7392 -1,7279 -1,7169 -1,7060 -1,6954 -1,6849 -1,6747 -1,6646 -1,6546 0,05 -1,6449 -1,6352 -1,6258 -1,6164 -1,6072 -1,5982 -1,5893 -1,5805 -1,5718 -1,5632 0,06 -1,5548 -1,5464 -1,5382 -1,5301 -1,5220 -1,5141 -1,5063 -1,4985 -1,4909 -1,4833 0,07 -1,4758 -1,4684 -1,4611 -1,4538 -1,4466 -1,4395 -1,4325 -1,4255 -1,4187 -1,4118 0,08 -1,4051 -1,3984 -1,3917 -1,3852 -1,3787 -1,3722 -1,3658 -1,3595 -1,3532 -1,3469 0,09 -1,3408 -1,3346 -1,3285 -1,3225 -1,3165 -1,3106 -1,3047 -1,2988 -1,2930
Compartilhar