Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA O presente material foi elaborado com o objetivo de facilitar as atividades em sala de aula, seguindo a bibliografia apresentada no final do texto. Esclarece-se que o material, não substitui a bibliografia apresentada, portanto, é necessário consultar os livros recomendados. Profa. Sachiko Araki Lira . 1º. SEMESTRE DE 2020 ii SUMÁRIO ESTATÍSTICA DESCRITIVA ........................................................................................................ 1 Introdução .................................................................................................................................... 1 1 Estatística Descritiva ................................................................................................................. 2 1.1 Variável Aleatória ................................................................................................................... 2 1.1.1 Arredondamento de Números .......................................................................................... 3 1.2 Tipos de Escalas e Variáveis ................................................................................................. 4 1.3 Tabelas .................................................................................................................................. 5 1.3.1 Elementos essenciais de uma tabela ............................................................................... 5 1.3.2 Tabelas de distribuição de frequências............................................................................. 6 1.3.2.1 Variável Discreta ........................................................................................................... 6 1.3.2.2 Variável Contínua .......................................................................................................... 8 1.4 Gráficos .................................................................................................................................. 9 1.4.1 Representação Gráfica ..................................................................................................... 9 1.4.2 Histograma de Frequências.............................................................................................. 9 1.4.3 Diagrama de Ramo e Folhas (Stem and Leaf Plot) ........................................................ 10 1.4.4 Gráfico de Boxplot ou da Caixa ...................................................................................... 11 1.4.5 Gráfico de Linhas ........................................................................................................... 11 1.5 Medidas de Localização, Variabilidade e Forma da Distribuição ........................................ 12 1.5.1 Tendência Central .......................................................................................................... 12 1.5.1.1 Esperança matemática ou média aritmética ................................................................ 12 1.5.1.2 Mediana ...................................................................................................................... 15 1.5.1.3 Moda ........................................................................................................................... 17 1.5.2 Medidas de Posição (ou Separatrizes) ........................................................................... 19 1.5.2.1 Quartil.......................................................................................................................... 19 1.5.3 Medidas de Dispersão .................................................................................................... 21 1.5.3.1 Amplitude Total ........................................................................................................... 22 1.5.3.2 Amplitude Interquartil ................................................................................................... 22 1.5.3.3 Desvio Médio ............................................................................................................... 22 1.5.3.4 Variância e Desvio Padrão .......................................................................................... 24 1.5.3.5 Coeficiente de Variação............................................................................................... 26 1.5.4 Forma da Distribuição .................................................................................................... 26 1.5.4.1 Coeficiente do momento de assimetria ........................................................................ 27 1.5.4.2 Coeficiente do momento de curtose ............................................................................ 27 Lista de Exercícios no. 1 – Estatística Descritiva ..................................................................... 29 ELEMENTOS DE PROBABILIDADES ....................................................................................... 32 Definições .................................................................................................................................. 32 2.1 Experimento Aleatório (E) ................................................................................................... 32 2.2 Espaço Amostral (S) ............................................................................................................ 32 iii 2.3 Evento .................................................................................................................................. 32 2.3.1 Evento Complementar .................................................................................................... 33 2.3.2 Eventos Independentes .................................................................................................. 33 2.3.3 Eventos Mutuamente Exclusivos .................................................................................... 34 2.4 Definição Clássica de Probabilidade .................................................................................... 35 2.5 Definição Axiomática de Probabilidade ................................................................................ 35 2.6 Probabilidade Condicional .................................................................................................... 35 2.7 Teorema da Probabilidade Total .......................................................................................... 36 2.8 Teorema de Bayes ............................................................................................................... 37 Lista de Exercícios no. 2 - Probabilidades ............................................................................... 38 VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE DISCRETA ................... 40 3.1 Definições ............................................................................................................................ 40 3.2 Distribuições de Probabilidade Discreta ............................................................................... 42 3.2.1 Distribuição binomial ...................................................................................................... 42 3.2.2 Distribuição de Poisson .................................................................................................. 44 3.2.3 Distribuição Hipergeométrica .......................................................................................... 46 Lista de Exercícios no. 3 – Distribuições de Probabilidade Discreta ........................................ 48 VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUA .................. 51 4.1 Definições ............................................................................................................................ 51 4.2 Distribuições de Probabilidade Continua .............................................................................. 53 4.2.1Distribuição Exponencial ................................................................................................ 53 4.2.2 Distribuição de Weibull ................................................................................................... 54 4.2.3 Distribuição normal ou Gaussiana .................................................................................. 57 4.2.3.1 Distribuição normal padronizada ou reduzida .............................................................. 59 4.2.4 Distribuição ( qui-quadrado) ..................................................................................... 60 4.2.5 Distribuição “ ” de Student ............................................................................................ 61 4.2.6 Distribuição F de Snedecor ............................................................................................ 62 Lista de Exercícios no. 4 – Distribuições de Probabilidade Contínua ...................................... 63 NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS.............................................. 65 5.1 Introdução ............................................................................................................................ 65 5.2 Amostragem Probabilística ................................................................................................... 65 5.2.1 Amostragem Aleatória Simples (AAS) ............................................................................ 65 5.2.2 Amostragem Sistemática ................................................................................................ 66 5.2.3 Amostragem Estratificada............................................................................................... 66 5.3 Distribuições Amostrais ........................................................................................................ 67 5.3.1 Distribuição Amostral de Médias .................................................................................... 67 Teorema Central do Limite ......................................................................................................... 70 5.3.2 Distribuição Amostral de Proporções .............................................................................. 70 5.3.3 Distribuição Amostral da Variância ................................................................................. 71 ESTIMAÇÃO DE PARÂMETROS .............................................................................................. 72 6.1 Introdução ............................................................................................................................ 72 6.2 Estimador e Estimativa ......................................................................................................... 72 2 t iv 6.3 Qualidades de um Estimador ............................................................................................... 72 6.4 Estimação por Pontos .......................................................................................................... 73 6.4.1 Estimador da Média Populacional .................................................................................. 73 6.4.2 Estimador da Variância Populacional ............................................................................. 73 6.4.3 Estimador do Desvio Padrão Populacional ..................................................................... 74 6.4.4 Estimador da Proporção Populacional ............................................................................ 74 6.5 Estimação por Intervalo ........................................................................................................ 74 6.5.1 Intervalo de Confiança para Média populacional ............................................................ 74 6.5.2 Intervalo de Confiança para Diferença entre Duas Médias Populacionais e ...... 78 6.5.3 Intervalo de Confiança para a Variância Populacional .................................................... 82 6.5.4 Intervalo de Confiança para o Desvio Padrão Populacional ........................................... 83 6.5.5 Intervalo de Confiança para Proporção Populacional ..................................................... 83 6.6 Dimensionamento da Amostra ............................................................................................. 84 6.6.1 Estimação da Média Populacional .................................................................................. 84 6.6.2 Estimação da Proporção Populacional ........................................................................... 85 Lista de Exercícios no. 5 - Intervalos de Confiança ................................................................ 86 Testes de Hipóteses .................................................................................................................. 89 7.1 Etapas para Testes de Hipóteses ......................................................................................... 89 7.1.1 Nível de Significância ..................................................................................................... 89 7.1.2 Erro Estatístico ............................................................................................................... 89 7.2 Testes Estatísticos Paramétricos ......................................................................................... 90 7.2.1 Teste para a Média Populacional ................................................................................... 90 7.2.1.1 Quando a variância populacional é Conhecida ...................................................... 90 7.2.1.2 Quando a variância populacional é desconhecida ................................................. 91 7.2.2 Teste para a Proporção Populacional ............................................................................. 93 7.2.3 Teste para a Variância Populacional .............................................................................. 95 7.2.4 Teste para a Diferença entre Duas Médias Populacionais.............................................. 96 7.2.4.1 Quando as variâncias populacionais e são Conhecidas .................................. 96 7.2.4.2 Quando as variâncias populacionais e são Desconhecidas ............................. 98 7.2.5 Duas Amostras Emparelhadas ..................................................................................... 102 7.2.6 Teste para Igualdade de Duas Variâncias .................................................................... 103 Lista de Exercícios no. 6 – Testes de Hipóteses ................................................................... 106 TESTES DE ADERÊNCIA ....................................................................................................... 109 Introdução ................................................................................................................................ 109 8.1 Teste Qui-quadrado de Aderência ...................................................................................... 109 8.2 Teste de Lilliefors ............................................................................................................... 113 Lista de Exercícios no. 7 – Testes de Aderência ................................................................... 115 ANÁLISE DA VARIÂNCIA ........................................................................................................ 117 Introdução ................................................................................................................................ 117 9.1 Fundamentos da ANOVA ................................................................................................... 117 9.2 Análise da Variância a um Critério de Classificação ........................................................... 119 1 2 2 2 2 1 2 2 2 1 2 2 v 9.3 ComparaçõesMúltiplas entre Médias................................................................................. 123 9.3.1 Teste de Scheffé .......................................................................................................... 123 Lista de Exercícios no. 8 – Análise da Variância ................................................................... 127 ANÁLISE DE CORRELAÇÃO E REGRESSÃO SIMPLES ....................................................... 129 10.1 Introdução ........................................................................................................................ 129 10.2 Diagrama de Dispersão .................................................................................................... 129 10.3 Análise de Correlação ...................................................................................................... 129 10.3.1 Coeficiente de Correlação Linear de Pearson ............................................................ 129 10.3.1.1 Teste de Hipóteses para Coeficiente de Correlação ................................................ 132 10.4 Análise de Regressão Linear Simples .............................................................................. 133 10.4.1 Estimação dos Parâmetros ......................................................................................... 133 10.4.2 Testes de Hipóteses na Regressão ........................................................................... 136 10.4.2.1Teste ..................................................................................................................... 136 10.4.2.2 Análise da Variância ................................................................................................ 137 10.4.3 Coeficiente de Determinação ou Explicação............................................................... 140 10.5 Ajuste de Curva Geométrica (ou Função Potência) .......................................................... 143 10.5.1 Estimativa dos Coeficientes ........................................................................................ 143 10.5.2 Testes de Hipóteses na Regressão ............................................................................ 144 10.5.2.1 Análise da Variância ................................................................................................ 144 10.5.3 Coeficiente de Determinação ou Explicação............................................................... 145 10.6 Ajuste de Função Exponencial ......................................................................................... 147 10.6.1 Estimativa dos Coeficientes ........................................................................................ 148 10.6.2 Testes de Hipóteses na Regressão ............................................................................ 149 10.6.2.1 Análise da Variância ................................................................................................ 149 10.6.3. Coeficiente de Determinação ou Explicação .............................................................. 149 Lista de Exercícios no. 9 – Análise de Correlação e Regressão ............................................ 152 ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA ......................................................................155 11 Introdução ........................................................................................................................... 154 11.1 Regressão Linear com 2 Variáveis Independentes ........................................................... 154 11.1.1 Estimativas dos Coeficientes de Regressão ............................................................... 154 11.1.2 Teste para Verificar a Significância da Regressão ..................................................... 155 11.1.3 Cálculo do Coeficiente de Determinação ou Explicação ............................................. 155 Lista de Exercícios no. 10 – Análise de Regressão Linear Múltipla ....................................... 160 CONTROLE ESTATÍSTICO DO PROCESSO .......................................................................... 161 12 Introdução ........................................................................................................................... 161 12.1 Gráficos de Controle ........................................................................................................ 161 12.2 Gráfico de Controle para Variáveis ................................................................................... 162 12.2.1 Gráfico de Controle de X ........................................................................................... 162 12.2.2 Gráfico de Controle de R ............................................................................................ 163 12.3 Gráfico de Controle para Atributos ................................................................................... 167 12.3.1 Gráfico de Controle para Fração de Não Conformes (Gráfico p) ................................ 167 Lista de Exercícios no. 11 – Controle Estatístico do Processo .............................................. 170 t vi BIBLIOGRAFIA ........................................................................................................................ 173 TABELAS ................................................................................................................................. 174 TABELA A1.1 – ÁREAS SOB A CURVA NORMAL ............................................................... 174 TABELA A1.2 – ÁREAS SOB A CURVA NORMAL ............................................................... 175 TABELA A2 - DISTRIBUIÇÃO ‘ ’ DE STUDENT .................................................................. 176 TABELA A3 - DISTRIBUIÇÃO DE 2 ................................................................................... 177 TABELA A4 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR (Nível de significância de 1%) ................ 178 TABELA A5 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR (Nível de significância de 5%) ................ 179 TABELA A6 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR (Nível de significância de 10%) .............. 180 TABELA A7 - VALORES CRÍTICOS PARA TESTE DE LILLIERFORS ....................... 181 SOLUÇÕES DAS LISTAS DE EXERCÍCIOS ........................................................................... 182 t )cd( 1 ESTATÍSTICA DESCRITIVA Introdução Estatística é a ciência que trata da coleta, organização, descrição, análise e interpretação dos dados experimentais. A FIGURA 1, a seguir, mostra o contexto em que se situa o estudo completo da Estatística, aqui subdividido em Estatística Descritiva e Estatística Indutiva (ou Inferência Estatística). FIGURA 1 - ESQUEMA GERAL DA ESTATÍSTICA FONTE: COSTA NETO (1994, p.4). A Estatística Descritiva é a parte que trata da organização e descrição de dados, através dos cálculos de médias, variâncias, estudo de gráficos, tabelas etc. A Teoria das Probabilidades permite-nos modelar os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza. É uma ferramenta fundamental para a inferência estatística. A Estatística Indutiva compreende um conjunto de técnicas baseadas em probabilidades, que a partir de dados amostrais, permite-nos tirar conclusões sobre a população de interesse. A Amostragem é o ponto de partida para um estudo estatístico. O estudo de qualquer fenômeno, seja ele natural, social, econômico ou biológico, exige a coleta e a análise de dados estatísticos. A coleta de dados é, pois, a fase inicial de qualquer pesquisa. A População é o conjunto de todas as observações potenciais sobre determinado fenômeno. O conjunto de dados efetivamente observados, ou extraídos, constitui uma amostra da população. É a partir do dado amostral, que se desenvolvem os estudos, com o objetivode se fazer inferências sobre a população. Estatística Descritiva Amostragem Cálculo das Probabilidade s Estatística Indutiva 2 1 ESTATÍSTICA DESCRITIVA O objetivo da estatística descritiva é organizar os dados e apresentá-los de forma a possibilitar a visualização das informações subjacentes (que não são observáveis). As técnicas estatísticas e gráficas, disponíveis para a análise exploratória de dados, podem ser aplicadas a qualquer conjunto de dados, sejam para dados populacionais ou amostrais. O parâmetro é uma medida numérica que descreve de forma reduzida alguma característica de uma população ou universo. É habitualmente representado por letras gregas. Por exemplo: μ (média), σ (desvio padrão), ρ (coeficiente de correlação). O parâmetro normalmente é desconhecido e, deseja-se estimar através de dados amostrais. Estatística ou medida amostral é uma medida numérica que descreve alguma característica de uma amostra. É habitualmente representada por letras latinas. Por exemplo: (média), S (desvio padrão), r (coeficiente de correlação). Em resumo, a análise exploratória de dados permite organizar os dados através de tabelas, gráficos e medidas de localização e dispersão, procurando mostrar um padrão ou comportamento de um conjunto de dados. 1.1 VARIÁVEL ALEATÓRIA Variável aleatória é aquela cujo valor numérico não é conhecido antes da sua observação. Esta tem uma distribuição de probabilidades associada, o que permite calcular a probabilidade de ocorrência de certos valores. Geralmente, utilizam-se letras maiúsculas (X, Y, Z...) para designar as variáveis aleatórias, e minúsculas (x, y, z...) para indicar particulares valores dessas variáveis. O comportamento de uma variável aleatória é descrito por sua distribuição de probabilidade. Exemplo: Suponha que em um lote de 10 parafusos, 2 são defeituosos. A variável aleatória X=número de parafusos defeituosos, na escolha de 3 parafusos com reposição, pode assumir os seguintes valores: sendo P=perfeito e D=defeituoso. A distribuição de probabilidades é apresentada no QUADRO1. QUADRO 1 - DISTRIBUIÇÃO DE PROBABILIDADES DA VARIÁVEL ALEATÓRIA X 0 1 2 3 X = === === = = DDDsse,3 PDDsouDPDsouDDPsse,2 PPDsouPDPsouDPPsse,1 PPPsse,0 )s(X xX = )xX(P = 512,0)108( 3 = 384,0)102()108(3 2 = 096,0)102()108(3 2 = 008,0)10/2( 3 = 3 A função de repartição ou função de distribuição acumulada da variável aleatória X é definida por Fx(x)=Px(X ≤ x),x ∈ R, ou seja, é definida como sendo a probabilidade de X assumir um valor menor ou igual a x. Como exemplo tem-se o QUADRO 2. QUADRO 2 - FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA DA VARIÁVEL ALEATÓRIA X 0 0,512 1 0,896 2 0,992 3 1,000 1.1.1 ARREDONDAMENTO DE NÚMEROS 1. Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica inalterado o último número que permanecer. Exemplo: seja o número 48,231, ao arredondar para 2 casas decimais ficará 48,23. 2. Quando o primeiro algarismo a ser abandonado for 6, 7, 8 ou 9, aumenta-se de uma unidade o último algarismo a permanecer. Exemplo: o número 23,077, ao arredondar para 2 casas decimais ficará 23,08. 3. Quando o primeiro algarismo a ser abandonado for 5, haverá duas formas: a) como regra geral, aumenta-se de uma unidade o último algarismo a permanecer. Exemplo: 12,5253 ficará 12,53. b) se ao 5 só seguirem zeros, o último algarismo a ser conservado só será aumentado se for ímpar. Exemplo: 24,7750 passa a ser 24,78 24,7650 passa a ser 24,76. Exemplos: arredondar os números dados para 2 casa decimais. 17,44452 ficará 17,44; 179,5673 ficará 179,57; 87,4931 ficará 87,49; 4,5652 ficará 4,57; 4,5650 ficará 4,56; 4,575 ficará 4,58. 4. Quando houver parcelas e total, e ocorrer diferença no arredondamento, deve-se fazer correção na parcela (ou parcelas) onde o erro relativo for menor. xX = )xX(P = )x(FX 512,0)108( 3 = 384,0)102()108(3 2 = 096,0)102()108(3 2 = 008,0)10/2( 3 = 4 Exemplo: 2,4 para 2 13,4 14 16,1 16 ----- ---- 31,9 32 1.2 TIPOS DE ESCALAS E VARIÁVEIS Uma variável pode se apresentar das seguintes formas, quanto aos valores assumidos: 1.o Escala nominal: o nível nominal de mensuração é caracterizado por dados que consistem em nomes, rótulos ou categorias apenas. Por exemplo, seja X, a variável “cor” dos automóveis vendidos durante um determinado mês. Neste caso, a variável X assume as categorias “prata”, “branco”, “preto”, etc., sendo denominada politômica. Quando assume somente duas categorias é denominada dicotômica. Não tem significado aritmético ou de quantificação, não se faz cálculos, apenas a contagem. 2.o Escala ordinal: no nível ordinal de mensuração os dados podem ser arranjados em alguma ordem, mas diferenças entre os valores dos dados ou não podem ser determinados ou não são significativas. Exemplo: Seja X a variável que indica a qualidade de um determinado produto. Tem-se então: A (indicando melhor qualidade), B (qualidade intermediária) e C (pior qualidade). 3.º Escala intervalar: o nível intervalar de mensuração é como o nível ordinal, com a propriedade adicional de que a diferença entre quaisquer dois valores de dados é significativa. No entanto, os dados nesse nível não têm um ponto inicial zero natural (quando o nada da quantidade está presente). Exemplo: As escalas para medir temperaturas como a Fahrenheit e a Celsius são exemplos de escalas intervalar. Não se pode afirmar que 40oC é duas vezes mais quente que uma temperatura de 20oC, embora se possa dizer que a diferença entre 20oC e 40oC é a mesma que entre 75oC e 95oC. No entanto, não há um ponto inicial natural. O valor 0oC, pode parecer um ponto inicial, mas é arbitrário e não significa ausência total de calor. Outro exemplo: os anos 1000, 2000, 1400, 1900. O tempo não começa no ano 0, de modo que o ano 0 é arbitrário e não um ponto inicial zero natural que represente nenhum tempo. 4.º Escala de razão: o nível de mensuração de razão é o nível intervalar com a propriedade adicional de que há também um ponto inicial zero natural (onde o zero indica que nada da quantidade está presente). Para valores nesse nível, diferenças e razões, são ambas significativas. Esse nível de mensuração é chamado de nível de razão porque o ponto inicial zero torna as razões significativas. Exemplo: diâmetro de cilindros de automóveis, por exemplo. De acordo com o nível de mensuração, a variável pode ser classificada em qualitativa ou quantitativa. Variável qualitativa é aquela cujo nível de mensuração é nominal ou ordinal, enquanto a quantitativa é aquela em que o nível de mensuração é intervalar ou de razão. A variável quantitativa pode ser ainda discreta ou contínua, sendo a primeira resultante de contagem, assumindo somente valores inteiros, e a última de medições, assumindo qualquer valor 5 no campo dos números reais. Apresentam-se, a seguir, os conceitos de variáveis quantitativas discretas e contínuas. Variável aleatória discreta: uma variável aleatória X é discreta se o conjunto de valores possíveis de X for finito ou infinito numerável. Variável aleatória contínua: a variável aleatória X é chamada de contínua quando o seu contradomínio é um conjunto infinito. A FIGURA 2 apresenta os tipos de variáveis de forma resumida. FIGURA 2 - TIPOS DE VARIÁVEIS Exemplo de aplicação: Seja uma população de peças produzidas em um determinado processo. É possível ter as seguintes situações conforme QUADRO 3: QUADRO 3 – CLASSIFICAÇÃO DAS VARIÁVEIS SEGUNDO TIPO VARIÁVEIS TIPO Estado: Conforme ou Não-conforme Qualitativa nominal Qualidade: 1ª., 2ª. ou 3ª.categoria Qualitativa ordinal Número de peças conformes Quantitativa discreta Comprimento das peças Quantitativa contínua 1.3 TABELAS 1.3.1 ELEMENTOS ESSENCIAIS DE UMA TABELA Uma tabela deve apresentar os dados de forma resumida, oferecendo uma visão geral do comportamento do fenômeno analisado. Uma tabela é constituída dos seguintes elementos: 1 - Título: é a indicação que precede a tabela e contém a identificação de três fatores do fenômeno. a) A data a qual se refere; Variável Qualitativa Quantitativa Nominal Ordinal Discreta Contínua FONTE: A autora FONTE: A autora 6 b) o local onde ocorreu o evento; c) o fenômeno que é descrito. 2 - Cabeçalho: é a parte superior da tabela que especifica o conteúdo das colunas. 3 - Corpo da tabela: é o espaço que contém as informações sobre o fenômeno observado. 4 - Fonte: é a indicação da entidade responsável pelo levantamento dos dados. Para obter mais informações consultar o manual de normalização de documentos científicos de acordo com as normas da ABNT (AMADEU, et al. 2015). 1.3.2 TABELAS DE DISTRIBUIÇÃO DE FREQUÊNCIAS Serão apresentados alguns conceitos importantes para a construção de tabelas de frequências. • Dados brutos: É o conjunto de dados numéricos obtidos e que ainda não foram organizados. • Rol: É o arranjo dos dados brutos em ordem crescente (ou decrescente). • Amplitude (At): É a diferença entre o maior e o menor dos valores observados. • Frequência absoluta ( ): É o número de vezes que um elemento aparece no conjunto de dados: onde é o número total de observações e é o número de valores diferentes observados. • Frequência Relativa ( ): e 1rf k 1i i = = • Frequência Absoluta Acumulada ( ): É a soma da frequência absoluta do valor assumida pela variável com todas as frequências absolutas anteriores. 1.3.2.1 VARIÁVEL DISCRETA Quando uma variável quantitativa discreta assume poucos valores, pode-se considerar que cada valor seja uma classe e que existe uma ordem natural nessas classes. Exemplo: Os dados que seguem apresentam os resultados da inspeção diária de todas as unidades de computadores produzidos durante os últimos 10 dias. O número de unidades não- conformes são: 4 - 7 - 5 - 8 - 6 - 6 - 4 - 5 - 8 - 7 if = = k 1i i nf n k rf n f f ir = acf i 7 TABELA 1 - DISTRIBUIÇÃO DE FREQUÊNCIAS DO NÚMERO DE UNIDADES NÃO CONFORMES DE COMPUTADORES PRODUZIDOS DURANTE 10 DIAS NÚMERO DE DEFEITOS NÚMERO DE DIAS (Freq.) 4 2 5 2 6 2 7 2 8 2 FONTE: MONTEGOMERY, D. C. NOTA: A produção diária é de 100 computadores. • Número de Classes (k) Quando se tratar de uma variável quantitativa discreta que pode assumir um grande número de valores distintos, a construção da tabela de frequências e de gráficos considerando cada valor como uma categoria fica inviável. A solução é agrupar os valores em classes ao elaborar a tabela. Segundo Bussab e Morettin (2002), a escolha dos intervalos dependerá do conhecimento que o pesquisador tem sobre os dados. Assim, a definição do número de intervalos ou classes é arbitrária. Mas, vale lembrar que, quando se utiliza um pequeno número de intervalos pode-se perder informações, e ao contrário, com um grande número de intervalos pode-se prejudicar o resumo dos dados. Existem duas soluções para a definição do número de intervalos bastante utilizadas que são: 1) Se o número de elementos (n) for menor ou igual a 25 então o número de classes (k) é igual a 5; se n for maior que 25, então o número de classes é aproximadamente a raiz quadrada positiva de n. Ou seja: Para n 25, k = 5 Para n > 25, k = 2) Fórmula de Sturges para número de classes: . ▪ Amplitude total ou “range” (At): É a diferença entre o maior e o menor valor observados no conjunto de dados. ▪ Amplitude dos intervalos ou das classes (h): É a divisão da amplitude total (At) pelo número de intervalos (k). Ou seja: h n )n(log3,31k + minmáxt XXA −= k At 8 1.3.2.2 VARIÁVEL CONTÍNUA Quando a variável quantitativa em estudo é contínua, que assume muitos valores distintos, o agrupamento dos dados em classes será sempre necessário, na construção das tabelas de frequências. Exemplo 1: A tabela abaixo apresenta as medidas de uma dimensão de uma peça produzida por um processo de usinagem. Construir a tabela de distribuição de frequências em classes. 102,8 - 136,4 - 110,1 - 115,9 - 118,5 - 149,3 - 125,3 - 144,8 - 129,7 - 132,7 135,0 – 108,2 - 138,1 - 138,6 - 139,6 - 144,4 - 125,9 - 145,2 - 145,7 – 120,4 ROL: 102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7 135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3 TABELA 2 - DISTRIBUIÇÃO DE FREQUÊNCIAS DAS MEDIDAS DE UMA DIMENSÃO DAS PEÇAS PRODUZIDAS POR UM PROCESSO DE USINAGEM INTERVALO DE CLASSES 102,8 |--- 112,8 3 0,15 3 112,8 |--- 122,8 3 0,15 6 122,8 |--- 132,8 4 0,20 10 132,8 |--- 142,8 5 0,25 15 142,8 |--- 152,8 5 0,25 20 TOTAL 20 1,00 FONTE: Elaborada pela autora. Exemplo 2: O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos), sendo feita 30 determinações: 45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 - 34 - 45 41 - 57 - 38 - 46 - 46 - 58 - 57 - 36 - 58 - 35 - 31 - 59 - 44 - 57 - 35 ROL: 31 - 34 - 35 - 35 - 36 - 37 - 38 - 39 - 39 - 40 - 41 -41 - 43 - 44 - 45 45 - 45 - 45 - 46 - 46 - 48 - 49 - 51 - 53 - 57- 57 - 57 - 58 - 58 – 59 (fórmula de Sturges) 50,468,1023,149XXA minmáxt =−=−= 5k = 103,9 5 50,46 k A h t === if rf fac 28,03159XXA minmáxt =−=−= 65,87)30log(3,31k =+= 54,7 6 28 k A h t === 9 TABELA 3 - DISTRIBUIÇÃO DE FREQUÊNCIAS DO TEMPO NECESSÁRIO PARA REALIZAÇAO DE CERTA OPERAÇÃO INDUSTRIAL INTERVALO DE CLASSES 31 |---- 36 4 0,13 4 36 |---- 41 6 0,20 10 41 |---- 46 8 0,27 18 46 |---- 51 4 0,13 22 51 |---- 56 2 0,07 24 56 |---- 61 6 0,20 30 TOTAL 30 1,00 FONTE: Elaborada pela autora. 1.4 GRÁFICOS 1.4.1 REPRESENTAÇÃO GRÁFICA O objetivo do gráfico é passar para o leitor uma visão clara do comportamento do fenômeno em estudo, uma vez que os gráficos transmitem informação mais imediata do que uma tabela. A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais: a) Simplicidade: O gráfico deve ser destituído de detalhes de importância secundária. b) Clareza: o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo. c) Veracidade: o gráfico deve ser a verdadeira expressão do fenômeno em estudo. 1.4.2 HISTOGRAMA DE FREQUÊNCIAS Este é um gráfico usado para apresentar dados organizados em intervalos de classes, utilizado principalmente para representar a distribuição de variáveis contínuas. if rf fac HISTOGRAMA DE FREQUÊNCIAS 0 1 2 3 4 5 6 7 8 9 10 Classes Freq. 76 105 134 163 221192 250 FONTE: Elaborado pela autora. GRÁFICO 1 – HISTOGRAMA DE FREQUÊNCIAS DA VARIÁVEL ALEATÓRIA X 10 1.4.3 DIAGRAMA DE RAMO E FOLHAS (STEM AND LEAF PLOT) Este diagrama é muito útil para uma primeira análise dos dados. Passos para construir um diagrama de ramo e folhas: 1. ordenar os valores para encontrar o valor mínimo e máximo dos dados; 2. dividir cada número em duas partes: um ramo, consistindo em um ou mais dígitos iniciais, e uma folha, consistindo nos dígitos restantes; 3. listar os valores do ramo em uma coluna vertical; 4. a partir daí colocam-se os valores na folha. O valor zero, significa que há informação e que é um número inteiro. Já, quando naquele valor inteiro não existe observações,não colocar nada, deixar em branco; 5. escrever as unidades para o ramo e folhas no gráfico. Considerando os dados do exemplo 1: Os dados referem-se às medidas de uma dimensão de uma peça produzida por um processo de usinagem. 102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7 135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3 RAMO FOLHA FREQ. 10 2 8 2 11 0 5 8 3 12 0 5 5 9 4 13 2 5 6 8 8 9 6 14 4 4 5 5 9 5 Considerando os dados do exemplo 2, tem-se: O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos): 31 - 34 - 35 - 35 - 36 - 37 - 38 - 39 - 39 - 40 - 41 -41 - 43 - 44 - 45 45 - 45 - 45 - 46 - 46 - 48 - 49 - 51 - 53 - 57- 57 - 57 - 58 - 58 – 59 RAMO FOLHA FREQ. 3 1 4 5 5 6 7 8 9 9 9 4 0 1 1 3 4 5 5 5 5 6 6 8 9 13 5 1 3 7 7 7 8 8 9 8 ix GRÁFICO 2 – DIAGRAMA DE RAMO E FOLHAS DE MEDI- DAS DE UMA DIMENSÃO DAS PEÇAS FONTE: Elaborado pela autora. GRÁFICO 3 – DIAGRAMA DE RAMO E FOLHAS DO TEMPO PARA REALIZAÇÃO DE CERTA OPERAÇÃO INDUSTRIAL FONTE: Elaborado pela autora. 11 1.4.4 GRÁFICO DE BOXPLOT OU DA CAIXA Comprimento da caixa = amplitude interquartílica = Q3 - Q1 A linha central do retângulo (“caixa”) representa a mediana da distribuição. As bordas superior e inferior do retângulo representam os quartis 1 e 3, respectivamente. Logo, a altura deste retângulo é chamada de amplitude interquartílica (IQ). Os traços horizontais ao final das linhas verticais são traçados sobre o último ponto (de um lado ou de outro) que não é considerado um outlier. Não há um consenso sobre a definição de um outlier. Porém, no caso do boxplot em geral, a maior parte das definições considera que pontos acima do valor do 3º quartil somado a 1,5 vezes a IQ ou os pontos abaixo do valor do 1º quartil diminuído de 1,5 vezes a IQ, são considerados outliers. 1.4.5 GRÁFICO DE LINHAS O gráfico de linhas é indicado para representar séries temporais ou sequência temporal, que é um conjunto de dados em que as observações são registradas na ordem em que elas ocorrem. Este tipo de gráfico é importante para a análise do controle de processo de produção e de séries temporais. A seguir, um exemplo de gráfico de média (Gráfico de X ) das medidas dos diâmetros internos (mm) de anéis de pistão de motores de automóveis, de 25 amostras de tamanho n=5. 12 1.5 MEDIDAS DE LOCALIZAÇÃO, VARIABILIDADE E FORMA DA DISTRIBUIÇÃO Estimador ou estatística é uma função dos valores da amostra, ou seja, é uma variável aleatória, pois depende dos elementos selecionados para compor a amostra. Ao analisarmos a distribuição de frequências de uma variável quantitativa, proveniente de uma amostra, deve-se verificar basicamente três características: ▪ Localização; ▪ Variabilidade ou Dispersão; ▪ Forma. 1.5.1 TENDÊNCIA CENTRAL As medidas de tendência central fazem parte, juntamente com as de posição, das chamadas medidas de localização, e indicam onde se concentra a maioria dos dados. 1.5.1.1 ESPERANÇA MATEMÁTICA OU MÉDIA ARITMÉTICA A esperança matemática ou média aritmética de uma variável aleatória X é o centro de gravidade do conjunto de dados, e é definida como a soma de todos os valores da variável dividida pelo número de observações. a) Para dados simples A esperança matemática ou média aritmética populacional é dada pela expressão: A média aritmética amostral é obtida através da seguinte expressão: = == N 1i ix N 1 )X(E = = n 1i ix n 1 X 252321191715131197531 74,015 74,010 74,005 74,000 73,995 73,990 Amostras Médias amostrais __ X=LC=74,00 LSC=74,01 LIC=73,99 GRÁFICO DE CONTROLE DE MÉDIA GRÁFICO 4 – GRÁFICO DE CONTROLE DE MÉDIAS 13 b) Para dados agrupados em classes (população) onde: k é o número de classes; é o ponto médio das classes. (amostra) onde: k é o número de classes; é o ponto médio das classes. Propriedades da Esperança Matemática 1. , sendo k=constante e X v.a. 2. 3. Sejam X e Y variáveis aleatórias. Então: 4. Sejam X e Y variáveis aleatórias independentes. Então: 5. v.a. centrada A média e os valores extremos: a média apresenta um grave problema, ela é fortemente influenciada pelos valores extremos. Por esta razão, deve-se fazer uma análise cuidadosa dos dados. Exemplos de aplicação: 1) Suponha que um engenheiro esteja projetando um conector de náilon para ser usado em uma aplicação automotiva. O engenheiro estabelece como especificação do projeto uma espessura de 3/32 polegadas, mas está inseguro acerca do efeito dessa decisão na força da remoção do conector. Oito unidades do protótipo são produzidas e suas forças de remoção são medidas (em libras-força): 12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1. A média da força de remoção será: libras-força N fx )X(E k 1i i i === ix n fx X k 1i i i == ix K)X(E)KX(E = )X(Ek)K.X(E = )Y(E)X(E)YX(E = )Y(E.)X(E)Y.X(E = 0)XX(E =− = = n 1i ix n 1 X 0,13 8 104 1,136,125,136,133,124,139,126,12 8 1 X ==+++++++= 14 2) Considere a seguinte distribuição: TABELA 4 - DISTRIBUIÇÃO DE FREQUENCIAS DO TEMPO NECESSÁRIO PARA REALIZAÇÃO DE CERTA OPERAÇÃO INDUSTRIAL INTERVALO DE CLASSES 31 |---- 36 4 0,13 4 36 |---- 41 6 0,20 10 41 |---- 46 8 0,27 18 46 |---- 51 4 0,13 22 51 |---- 56 2 0,07 24 56 |---- 61 6 0,20 30 TOTAL 30 1,00 FONTE: Elaborada pela autora. Calcular o tempo médio necessário para realizar a operação industrial. Solução: INTERVALO DE CLASSES 31 |---- 36 4 33,5 134,0 36 |---- 41 6 38,5 231,0 41 |---- 46 8 43,5 348,0 46 |---- 51 4 48,5 194,0 51 |---- 56 2 53,5 107,0 56 |---- 61 6 58,5 351,0 TOTAL 30 1365,0 3) Seja a distribuição de frequências a seguir. Calcular a média das medidas da dimensão das peças. TABELA 5 – DISTRIBUIÇÃO DE FREQUÊNCIAS DE MEDI – DAS DE UMA DIMENSÃO DE PEÇAS INTERVALO DE CLASSES 102,8 |--- 112,8 3 0,15 3 112,8 |--- 122,8 3 0,15 6 122,8 |--- 132,8 4 0,20 10 132,8 |--- 142,8 5 0,25 15 142,8 |--- 152,8 5 0,25 20 TOTAL 20 1,00 FONTE: Elaborada pela autora. if rf fac if ix iifx 45,50 30 1365 n fx X k 1i i i === = if rf fac 15 INTERVALO DE CLASSES 102,8 |--- 112,8 3 107,8 323,4 112,8 |--- 122,8 3 117,8 353,4 122,8 |--- 132,8 4 127,8 511,2 132,8 |--- 142,8 5 137,8 689,0 142,8 |--- 152,8 5 147,8 739,0 TOTAL 20 2616,0 1.5.1.2 MEDIANA A mediana é o valor que ocupa a posição central do conjunto de observações de uma variável, dividindo o conjunto em duas partes iguais, sendo que 50% dos dados tomam valores menores ou iguais ao valor da mediana e os 50% restantes, acima do seu valor. a) Para dados simples Etapas para a obtenção da mediana: 1. ordenar os dados em ordem crescente (pode ser também na ordem decrescente, mas não é comum e pode atrapalhar na hora de calcular as medidas de posição) 2. o lugar ou posição que a mediana ocupa é: 3. o valor da mediana é o valor da variável que ocupa o lugar . A mediana é independente dos valores extremos, porque ela só leva em consideração os valores de posição central. Exemplo de aplicação: 1) Considerando-se as forças de remoção, medidas em uma amostra de oito unidades do protótipo (em libras-força): 12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1. Rol: 12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 A mediana é a média aritmética dos valores que ocupam a posição 4 e 5. Logo, 2) Os dados que seguem são os resultados da inspeção diária de todas as unidades de computadoresproduzidos durante os últimos 10 dias. O número de unidades não-conformes são: 4 - 7 - 5 - 8 - 6 - 6 - 4 - 5 - 8 - 7 Calcular a mediana. if ix iifx 130,8 20 2616 n fx X k 1i i i === = 1 4 )1n( 2PosM e + − = ePosM 5,41 4 )18( 2PosMe =+ − = 13,0 2 1,139,12 Me = + = 16 Rol: 4 - 4 - 5 - 5 - 6 - 6 - 7 - 7 - 8 - 8 b) Dados agrupados em classes onde: é o limite inferior da classe que contém a mediana; é o número de elementos do conjunto de dados; é a frequência acumulada da classe anterior a que contém a mediana; é a frequência simples da classe que contém a mediana; é o intervalo ou amplitude da classe que contém a mediana. 1) Seja a distribuição de frequências a seguir. Calcular a mediana das medidas da dimensão das peças. TABELA 6 – DISTRIBUIÇÃO DE FREQUÊNCIAS DAS MEDIDAS DE UMA DIMENSÃO DAS PEÇAS INTERVALO DE CLASSES 102,8 |--- 112,8 3 112,8 |--- 122,8 3 122,8 |--- 132,8 4 132,8 |--- 142,8 5 142,8 |--- 152,8 5 TOTAL 20 Solução: 1) O passo inicial é calcular ; 2) Calcular as frequências acumuladas ( ). INTERVALO DE CLASSES 102,8 |--- 112,8 3 3 112,8 |--- 122,8 3 6 122,8 |--- 132,8 4 10 132,8 |--- 142,8 5 15 142,8 |--- 152,8 5 20 TOTAL 20 5,51 4 )110( 2PosMe =+ − = 6 2 66 Me = + = h f fac)2n( LM i ie − += iL n fac' if h if 10 2 20 2 n == acf if acf h f fac)2n( LM i ie − += 17 2) Considerando a distribuição a seguir, calcular a mediana. TABELA 7 – DISTRIBUIÇÃO DE FREQUÊNCIAS DO TEMPO GASTO PARA REALIZAÇÃO DA OPERAÇÃO INDUSTRIAL INTERVALO DE CLASSES 31 |---- 36 4 36 |---- 41 6 41 |---- 46 8 46 |---- 51 4 51 |---- 56 2 56 |---- 61 6 TOTAL 30 Solução: INTERVALO DE CLASSES 31 |---- 36 4 4 36 |---- 41 6 10 41 |---- 46 8 18 46 |---- 51 4 22 51 |---- 56 2 14 56 |---- 61 6 30 TOTAL 30 1.5.1.3 MODA a) Para dados simples A moda, representada por , é o valor que apresenta maior frequência. Ela pode não existir (distribuição amodal), ter somente um valor (unimodal) ou pode ter dois ou mais (bimodal ou multimodal), principalmente quando a variável assume muitos valores. Exemplo: 1) Considerando-se as forças de remoção, medidas em uma amostra de oito unidades do protótipo (em libras-força): 12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1. Para o exemplo tem-se que a moda é igual a 12,6 libras-força. 132,810 4 6)220( 8,122Me = − += if if acf 15 2 30 2 n == h f fac)2n( LM i ie − += 44,1255 8 10)15( 41Me = − += oM 18 b) Dados agrupados em classes X2M3M eo −= (moda de Pearson) Onde: é a mediana da distribuição de dados; é a média da distribuição de dados. h dd d LM 21 1 o i + += (moda de Czuber) Onde: iL : é o limite inferior da classe que contém a moda; 1d : é a diferença entre a frequência da classe que contém a moda e a frequência da classe vizinha anterior; 2d : é a diferença entre a frequência da classe que contém a moda e a frequência da classe vizinha posterior. Exemplos: 1) Dada a distribuição de frequências a seguir, calcular a moda. TABELA 8 – DISTRIBUIÇÃO DE FREQUÊNCIAS DO TEMPO GASTO PARA REALIZAÇÃO DA OPERAÇÃO INDUSTRIAL INTERVALO DE CLASSES 31 |---- 36 4 36 |---- 41 6 41 |---- 46 8 46 |---- 51 4 51 |---- 56 2 56 |---- 61 6 TOTAL 30 Solução: Tem-se que a média e a mediana da distribuição são, respectivamente: Logo, pelo método de Pearson, a moda será: Aplicando o método de Czuber tem-se: 67,425 42 2 41h dd d LM 21 1 o i = + += + += 2) Seja a distribuição de frequências a seguir. Calcular a moda das medidas da dimensão das peças. eM X if 45,50X = 44,125Me = 41,37550,452125,443X2M3M eo =−=−= 19 TABELA 9 – DISTRIBUIÇÃO DE FREQUÊNCIAS DAS MEDIDAS DE UMA DIMENSÃO DAS PEÇAS INTERVALO DE CLASSES 102,8 |--- 112,8 3 112,8 |--- 122,8 3 122,8 |--- 132,8 4 132,8 |--- 142,8 5 142,8 |--- 152,8 5 TOTAL 20 Solução: Tem-se que a média e a mediana da distribuição são, respectivamente: Logo, a moda de Pearson, será: 8,1368,13028,1323X2M3M eo =−=−= Aplicando o método de Czuber tem-se: Mo=Li+ d1 d1+d2 ×h=132,8+ 1 1+5 ×20=136,13 1.5.2 MEDIDAS DE POSIÇÃO (OU SEPARATRIZES) As separatrizes mais conhecidas são os quartis e os percentis. Os quartis dividem o conjunto de dados em quatro partes iguais e os percentis, em cem partes iguais. A cada quartil correspondem 25% do conjunto de dados e a percentil, 1%. Da mesma forma que para a mediana, as posições das separatrizes, para dados ordenados em ordem crescente. 1.5.2.1 QUARTIL São três medidas que dividem o conjunto de dados em 4 partes iguais, sendo que a cada quartil correspondem 25% dos dados. a) Para dados simples , Exemplo 1: Os dados a seguir são diâmetros (em cm) de peças de automóveis: 12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0 Calcular os quartis. if 130,8X = 132,810 4 6)220( 8,122Me = − += )QeQ,Q( 321 1 4 )1n( iPosQi + − = 3,2,1i = 20 (3º elemento), logo (5º elemento), logo (7º elemento), logo Exemplo 2: Os dados abaixo são as medidas de uma dimensão de uma peça produzida por um processo de usinagem. 102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7 135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3 Calcular os quartis (1,2 e 3) . (5,75º elemento), Logo, (10,5º elemento), Logo, (15,25º elemento), Logo, b) Para dados agrupados em classes , onde: é o número de elementos do conjunto de dados; é o limite inferior da classe que contém o quartil; é a freqüência acumulada da classe anterior a que contém o quartil; é a freqüência simples da classe que contém o quartil; é o intervalo ou amplitude da classe que contém o quartil. Exemplos: 1) Seja a distribuição de frequências a seguir. Calcular os quartis 1,2 e 3, das medidas da dimensão das peças. 3,01 4 )19( 1PosQ1 =+ − = 6,12Q1 = 5,01 4 )19( 2PosQ2 =+ − = 1,13Q2 = 7,0 1 4 )19( 3PosQ3 =+ − = 5,13Q3 = 5,751 4 )120( 1PosQ1 =+ − = 119,92575,0*)5,1184,120(5,118Q1 =−+= 10,51 4 )120( 2PosQ2 =+ − = 133,855,0*)7,1320,135(7,132Q2 =−+= 15,25 1 4 )120( 3PosQ3 =+ − = 140,8025,0*)6,1394,144(6,139Q3 =−+= 4 n iPosQi = 3,2,1i = h f fac)PosQ( LQ i i ii − += n iL fac' if h 21 TABELA 10 – DISTRIBUIÇÃO DE FREQUÊNCIAS DAS MEDIDAS DE UMA DIMENSÃO DAS PEÇAS INTERVALO DE CLASSES 102,8 |--- 112,8 3 3 112,8 |--- 122,8 3 6 122,8 |--- 132,8 4 10 132,8 |--- 142,8 5 15 142,8 |--- 152,8 5 20 TOTAL 20 Solução: a) 2) Dada a distribuição de freqüências a seguir, calcular os quartis 1,2 e 3. TABELA 11 – DISTRIBUIÇÃO DE FREQUÊN- CIAS DO TEMPO PARA REALI- ZAÇÃO DA OPERAÇÃO INDUS- TRIAL INTERVALO DE CLASSES 31 |---- 36 4 36 |---- 41 6 41 |---- 46 8 46 |---- 51 4 51 |---- 56 2 56 |---- 61 6 TOTAL 30 1.5.3 MEDIDAS DE DISPERSÃO Para descrever adequadamente a distribuição de frequências de uma variável quantitativa, além da informação do valor representativo da variável (tendência central), é necessário dizer também o quanto estes valores variam, ou seja, o quanto eles são dispersos. Somente a informação sobre a tendência central de um conjunto de dados não consegue representá-lo adequadamente. As medidas de dispersão medem o grau de variabilidade ou dispersão dos dados. if ac f 5 420 1PosQ1 == 119,4710 3 35 8,1121Q = − += 10 4 20 2PosQ2 == 132,8010 4 610 8,1222Q = − += 15 4 20 3PosQ3 == 142,8010 5 1015 8,132Q3 = − += if 22 1.5.3.1 AMPLITUDE TOTAL A amplitude total mede a distância entre o valor máximo e mínimo. Ela é uma estatística rudimentar, pois embora forneça uma noção de dispersão, não diz qual é sua natureza. Exemplo de aplicação: Exemplo 1: Os dados a seguir são diâmetros (em cm) de peças de automóveis: 12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0 Tem-se que: 1.5.3.2 AMPLITUDE INTERQUARTIL A amplitude interquartil, ou comprimento da caixa, é a distância entre o primeiro e terceiro quartil. É muito útil para detectar valores extremos, e é usado no diagrama de boxplot. Exemplo: considerando os dados referentes aos diâmetros (em cm) de peças de automóveis e os quartis correspondentes, já calculados anteriormente, calcular a amplitude interquartil. (3º elemento), logo (7º elemento), logo Para a construção do gráfico boxplot, tem-se: Para o exemplo em questão: Existe um valor outlier superior, que é 15,0. 1.5.3.3 DESVIO MÉDIO a) Para dados simples O desvio médio é a média dos valores absolutos dos desvios. É calculada através da expressão: minmáxt XXA −= 7,23,120,15XXA minmáxt =−=−= 13 QQQI −= 3,01 4 )19( 1PosQ1 =+ − = 6,12Q1 = 7,0 1 4 )19( 3PosQ3 =+ − = 5,13Q3 = 9,06,125,13IQ =−= IQ5,1Qeriorinfitelim 1 −= IQ5,1Qeriorsupitelim 3 += 25,119,05,16,12eriorinfitelim =−= 85,149,05,15,13eriorsupitelim =+= n Xx DM n 1i i = − = 23 Exemplo de aplicação: Os dados a seguir são diâmetros (em cm) de peças de automóveis: 12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0. Tem-se que: QUADRO 4 - VALORES DA VARIÁVEL X E DES- VIOS ABSOLUTOS EM RELAÇÃO À MÉDIA 12,3 0,92 12,6 0,62 12,6 0,62 12,9 0,32 13,1 0,12 13,4 0,18 13,5 0,28 13,6 0,38 15,0 1,78 5,22 b) Para dados agrupados em classes Dada a distribuição de frequências a seguir, calcular o desvio médio. Sabe-se que . INTERVALO DE CLASSES 31 |---- 36 4 33,5 12,0 48 36 |---- 41 6 38,5 7,0 42 41 |---- 46 8 43,5 2,0 16 46 |---- 51 4 48,5 3,0 12 51 |---- 56 2 53,5 8,0 16 56 |---- 61 6 58,5 13,0 78 TOTAL 30 212 22,13X = ix Xx i − 58,0 9 22,5 n Xx DM n 1i i == − = = n fXx DM k 1i ii = − = 50,45X = if ix Xx i − ii fXx − 07,70667,7 30 212 n fXx DM k 1i ii == − = = 24 1.5.3.4 VARIÂNCIA E DESVIO PADRÃO A variância da variável aleatória, representada por ou , é obtida elevando-se os desvios em relação à média ao quadrado. Quando se extrai a raiz quadrada da variância, tem-se o desvio padrão. Propriedades da Variância 1. , onde k=constante 2. , onde k=constante e X v.a. 3. Sejam X e Y v.a. independentes. Então: 4. Sejam X e Y v.a. não independentes (ou dependentes). Então: onde: (covariância) a) Para dados simples A variância e o desvio padrão populacional são obtidas pelas expressões: (variância) 2 = (desvio padrão) A variância e o desvio padrão amostral são obtidas pelas expressões: (variância) (desvio padrão) Exemplo de aplicação: Considerando o exemplo tem-se: QUADRO 5 - VALORES DA VARIÁVEL X E DESVIOS SIMPLES E QUADRÁTICOS EM RELA- ÇÃO À MÉDIA 12,3 -0,92 0,8464 12,6 -0,62 0,3844 12,6 -0,62 0,3844 12,9 -0,32 0,1024 13,1 -0,12 0,0144 13,4 0,18 0,0324 13,5 0,28 0,0784 13,6 0,38 0,1444 15,0 1,78 3,1684 5,1556 )X(V 2 0)k(V = )X(Vk)kX(V 2= )Y(V)X(V)YX(V += )Y,X(COV2)Y(V)X(V)YX(V ++=+ )Y,X(COV2)Y(V)X(V)YX(V −+=− )Y(E)X(E)XY(E)Y,X(COV −= ( ) = −= N 1i 22 ix N 1 ( ) = − − = n 1i 2 2 Xx 1n 1 S i 2 SS = iX Xx i − ( ) 2Xx i − 25 b) Para dados agrupados em classes A variância e o desvio padrão populacional são obtidas pelas expressões: (variância) 2 = (desvio padrão) A variância e o desvio padrão amostral são obtidas pelas expressões: (variância) (desvio padrão) Exemplo: Seja a distribuição de frequências a seguir. Calcular a variância e o desvio padrão. INTERVALO DE CLASSES 102,8 |--- 112,8 3 107,8 1587,0 112,8 |--- 122,8 3 117,8 507,0 122,8 |--- 132,8 4 127,8 36,0 132,8 |--- 142,8 5 137,8 245,0 142,8 |--- 152,8 5 147,8 1445,0 TOTAL 20 3820,0 Dados: ( ) 0,6445 19 1556,5 Xx 1n 1 S n 1i i 2 2 = − =− − = = 0,80S = ( ) ( ) N fx f fx k 1i 2 i k 1i k 1i 2 i 2 i i i = = = − = − = ( ) ( ) 1n fXx 1f fXx S k 1i 2 i k 1i k 1i 2 i 2 i i i − − = − − = = = = 2 SS = if ix i f)Xx( 2i − 130,8X = ( ) 0526,201 120 3820 1n fXx S k 1i 2 i 2 i = − = − − = = 18,14S = 26 Exercício: Dada a distribuição de frequências a seguir, calcular a variância e o desvio padrão. INTERVALO DE CLASSES 31 |---- 36 4 36 |---- 41 6 41 |---- 46 8 46 |---- 51 4 51 |---- 56 2 56 |---- 61 6 TOTAL 30 1.5.3.5 COEFICIENTE DE VARIAÇÃO É uma medida de dispersão relativa. É definido como o quociente entre o desvio padrão e a média, multiplicado por 100, para expressar porcentagem. Em algumas situações é desejável comparar o grau de dispersão de dois conjuntos de dados com unidades de medidas diferentes. Neste caso, deve-se usar o coeficiente de variação (CV), que é uma medida de dispersão relativa, e ela não é afetada pelas unidades de medida da variável. Ou ainda, quando as médias dos dois conjuntos de dados são muito distintas, neste caso faz-se necessário utilizar uma medida de dispersão relativa. coeficiente de variação populacional coeficiente de variação amostral Exemplo de aplicação: Para o exemplo tem-se: Dados: ; Logo, 1.5.4 FORMA DA DISTRIBUIÇÃO A distribuição de frequências de uma variável pode ter várias formas, mas existem três formas básicas, apresentadas através de histogramas e suas respectivas ogivas, que são gráficos específicos para distribuições de frequências. A distribuição é simétrica, quando as observações estão igualmente distribuídas em torno de um valor mais frequente (metade acima e metade abaixo). Já, a assimetria de uma distribuição pode ocorrer de duas formas: assimetria positiva; assimetria negativa. if 100CV = 100 X S CV = 130,8X = 18,14S = %84,10100 8,130 18,14 CV == 27 Em alguns casos, apenas o conhecimento da forma da distribuição de frequências de uma variável já nos fornece uma boa informação sobre o comportamento dessa variável. 1.5.4.1 COEFICIENTE DO MOMENTO DE ASSIMETRIA Uma distribuição é classificada como: Simétrica: e tem-se que média=mediana=moda Assimétrica negativa: e tem-se que média mediana moda Assimétrica positiva: e tem-se que moda mediana média Graficamente: FIGURA 3 - CLASSIFICAÇÃO DAS DISTRIBUIÇÕES QUANTO A ASSIMETRIA 1.5.4.2 COEFICIENTE DO MOMENTO DE CURTOSE A medida de curtose é o grau de achatamento da distribuição, é um indicador da forma desta distribuição. O coeficiente momento de curtose é definido como sendo: Se , a distribuição é platicúrtica e esta apresenta uma curva de frequência mais aberta, com os dados fracamente concentrados em torno de seu centro. Se , a distribuição é mesocúrtica e os dados estão razoavelmente concentrados em torno de seu centro. Se , a distribuição é leptocúrtica e esta apresenta uma curva de frequência bastante fechada, com os dados fortemente concentradosem torno de seu centro. 23 i 2 i 3 i k 1i i k 1i 3 f)Xx( n 1 f)Xx( n 1 a − − = = = 0a3 = 0a 3 0a3 2 k 1i 2 k 1i 4 4 ii ii f)Xx( n 1 f)Xx( n 1 a − − = = = 3a4 3a4 = 3a4 Assimetria positiva Simétrica Assimetria negativa 28 A curtose ou achatamento é mais uma medida com a finalidade de complementar a caracterização da dispersão em uma distribuição. Esta medida quantifica a concentração ou dispersão dos valores de um conjunto de dados em relação às medidas de tendência central em uma distribuição de frequências. Uma distribuição é classificada quanto ao grau de achatamento como: FIGURA 4 - CLASSIFICAÇÃO DAS DISTRIBUIÇÕES QUANTO A CURTOSE FONTE: COSTA NETO (1994) Exemplo 1: Para a distribuição de frequências das medidas da dimensão das peças apresentadas a seguir e as estatísticas já calculadas anteriormente, calcular os coeficientes de assimetria e curtose. INTERVALO DE CLASSES 102,8 |--- 112,8 3 112,8 |--- 122,8 3 122,8 |--- 132,8 4 132,8 |--- 142,8 5 142,8 |--- 152,8 5 TOTAL 20 Solução: INTERVALO DE CLASSES 102,8 |--- 112,8 3 107,8 -23 -69 1.587 -3.6501 839.523 112,8 |--- 122,8 3 117,8 -13 -39 507 -6.591 85.683 122,8 |--- 132,8 4 127,8 -3 -12 36 -108 324 132,8 |--- 142,8 5 137,8 7 35 245 1.715 12.005 142,8 |--- 152,8 5 147,8 17 85 1.445 24.565 417.605 TOTAL 20 0 3.820 -16.920 1.355.140 A distribuição apresenta assimetria negativa. if if ix )Xx( i − ii f)Xx( − i 2 i f)Xx( − i 3 i f)Xx( − i 4 i f)Xx( − -0,3205 820.3 20 1 )920.16( 20 1 f)Xx( n 1 f)Xx( n 1 a 23 2 3 23 i k 1i i k 1i ii 3 = − = − − = = = 29 A distribuição é platicúrtica. Exemplo 2: Dada a distribuição de frequências a seguir, calcular a assimetria e curtose. INTERVALO DE CLASSES 31 |---- 36 4 36 |---- 41 6 41 |---- 46 8 46 |---- 51 4 51 |---- 56 2 56 |---- 61 6 TOTAL 30 Solução: INTERVALO DE CLASSES 31 |---- 36 4 33,5 -12 -48 576 -6.912 82.944 36 |---- 41 6 38,5 -7 -42 294 -2.058 14.406 41 |---- 46 8 43,5 -2 -16 32 -64 128 46 |---- 51 4 48,5 3 12 36 108 324 51 |---- 56 2 53,5 8 16 128 1.024 8.192 56 |---- 61 6 58,5 13 78 1.014 13.182 171.366 TOTAL 30 0 2.080 5.280 277.360 A distribuição apresenta assimetria positiva. A distribuição é platicúrtica. LISTA DE EXERCÍCIOS NO. 1 – ESTATÍSTICA DESCRITIVA 1. Conceitue: a) População ou Universo; b) Amostra; c) Parâmetro; 1,8573 820.3 20 1 140.355.1 20 1 f)Xx( n 1 f)Xx( n 1 a 22 i 2 i i 4 i k 1i k 1i 4 = = − − = = = if if ix )Xx( i − ii f)Xx( − i 2 i f)Xx( − i 3 i f)Xx( − i 4 i f)Xx( − 0,3049 080.2 30 1 )280.5( 30 1 f)Xx( n 1 f)Xx( n 1 a 23 2 3 23 i k 1i i k 1i ii 3 = = − − = = = 1,9230 080.2 30 1 360.277 30 1 f)Xx( n 1 f)Xx( n 1 a 22 i 2 i i 4 i k 1i k 1i 4 = = − − = = = 30 d) Estatística ou medida amostral; e) Variável aleatória discreta e exemplifique; f) Variável aleatória contínua e exemplifique. 2. Uma importante característica de qualidade da água é a concentração de material sólido suspenso. Em seguida são apresentadas 30 medidas de sólidos suspensos de um certo lago. 42,4 - 65,7 - 29,8 - 58,7 - 52,1 - 55,8 - 57,0 - 68,7 - 67,3 - 67,3 - 54,3 - 54,0 - 73,1 - 81,3 - 59,9 56,9 - 62,2 - 69,9 - 66,9 - 59,0 - 56,3 - 43,3 - 57,4 - 45,3 - 80,1 - 49,7 - 42,8 - 42,4 - 59,6 - 65,8 a) construir a distribuição de frequências em classes (usar k=6); b) calcular as frequências relativa e acumulada; c) construir o histograma de frequências. 3. O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos), sendo feita 40 determinações: 45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 – 34 - 45 - 35 41 - 57 - 38 - 46 - 46 - 58 - 57 - 36 - 58 - 35 - 31 - 59 - 44 - 57 - 45 - 44 38 - 43 - 33 - 56 - 47 - 48 - 44 - 49 a) construir a distribuição de frequências em classes (usar k=7); b) calcular as frequências relativa e acumulada; c) construir o histograma de frequências. 4. Foram obtidas oito medidas do diâmetro interno de anéis de pistão forjados de um motor de um automóvel. Os dados (em mm) são: 74,001 - 74,003 - 74,015 - 74,000 - 74,005 - 74,002 - 74,005 - 74,004 Calcule a média, a mediana, a moda, o desvio médio, o desvio padrão e o coeficiente de variação da amostra. 5. Os tempos de esgotamento de um fluído isolante entre eletrodos a 34 kV, em minutos são: 0,19 - 0,78 - 0,96 - 1,31 - 2,78 - 3,16 - 4,15 - 4,67 - 4,85 - 6,50 - 7,35 - 8,01 - 8,27 - 12,06 - 31,75 - 32,52 - 33,91 - 36,71 - 72,89. Calcule a média, mediana, quartil 1, quartil 3, desvio padrão e coeficiente de variação e comente os resultados obtidos. (Usar a fórmula de Sturges para calcular o número de classes). 6. O pH de uma solução é medido oito vezes por uma operadora que usa o mesmo instrumento. Ela obteve os seguintes dados: 7,15 - 7,20 - 7,18 - 7,19 - 7,21 - 7,20 -7,16 - 7,18 Faça uma análise estatística dos dados e comente. 7. Prevenir a propagação de trinca de fadiga em estruturas de aviões é um importante elemento de segurança em aeronaves. Um estudo de engenharia para investigar a trinca de fadiga em n=9 asas reportou os seguintes comprimentos (em mm) de trinca: 2,13 - 2,96 - 3,02 - 1,82 - 1,15 - 1,37 - 2,04 - 2,47 - 2,60 Calcule a média, os quartis (1,2 e 3), o desvio padrão e o coeficiente de variação da amostra. Comente os resultados obtidos. 31 8. Uma amostra de 7 corpos de prova de concreto forneceu as seguintes resistências à ruptura (kg/cm2): 340 - 329 - 337 - 348 - 351 - 360 - 354 Calcular a média, mediana, moda, variância, desvio padrão e coeficiente de variação. Comente os resultados obtidos. 9. O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos), sendo feita 20 determinações: 45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 – 34 - 45 - 35 - 38 - 46 - 46 - 58 Faça uma análise estatística dos dados construindo a distribuição de frequências em classes (calcule também as medidas de assimetria e curtose). Usar k=5. 10. As taxas de octanagem de combustível para motor, de várias misturas de gasolina foram obtidas: 88,5 - 94,7 - 84,3 - 90,1 - 89,0 - 89,8 - 91,6 - 90,3 - 90,0 - 91,5 - 89,9 98,8 - 88,3 - 90,4 - 91,2 - 90,6 - 92,2 - 87,7 - 91,1 - 86,7 - 93,4 - 96,1 Faça uma análise estatística dos dados (calcule também as medidas de assimetria e curtose). Usar k=5. 11. A propagação de trincas por fadiga em diversas peças de aeronaves tem sido objeto de muitos estudos. Os dados a seguir consistem dos tempos de propagação (horas de vôo) para atingir um determinado tamanho de trinca em furos de fixadores propostos para uso em aeronaves militares. Usar k=5. 0,736 - 0,863 - 0,865 - 0,913 - 0,915 - 0,937 - 0,983 - 1,007 1,011 - 1,064 - 1,109 -1,132 - 1,140 - 1,153 - 1,253 - 1,394 a) calcule e compare os valores da média e mediana amostrais; b) calcule o desvio médio, desvio padrão e o coeficiente de variação; c) qual é a conclusão sobre a forma da distribuição (assimetria e curtose)? 12. O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos), sendo feita 12 medições: 45 – 37 – 39 – 48 – 51 – 40 - 53 – 49 – 39 – 41- 45 – 43 a) calcular Q1 (quartil 1), Q2 (quartil 2) e Q3 (quartil 3); b) construir o gráfico boxplot. 13. As taxas de octanagem de combustível para motor, de várias misturas degasolina foram obtidas: 88,5 - 94,7 – 80,0 - 90,1 - 89,0 - 89,8 - 91,6 - 90,3 - 90,0 - 91,5 - 89,9 a) calcular Q1 (quartil 1), Q2 (quartil 2) e Q3 (quartil 3); b) construir o gráfico boxplot. 32 ELEMENTOS DE PROBABILIDADES Definições 2.1 EXPERIMENTO ALEATÓRIO (E) Definição 1: É o fenômeno que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. O resultado final depende do acaso. 2.2 ESPAÇO AMOSTRAL (S) Definição 2: É o conjunto formado por todos os resultados possíveis em qualquer experimento aleatório. Exemplos: Sejam os experimentos aleatórios e os respectivos espaços amostrais: a) Inspecionar uma peça de automóvel. ; b) Tomar uma válvula eletrônica e verificar o tempo de vida útil. ; c) Inspecionar uma lâmpada. ; d) Medir o conteúdo de cobre no latão. 2.3 EVENTO Definição 3: É um subconjunto do espaço amostral S de um experimento aleatório. Exemplo: Seja o espaço amostral , resultado do experimento de seleção de duas peças, sendo c=peça conforme e n=peça não conforme. Suponha que A seja o subconjunto de resultados para os quais, no mínimo uma peça seja conforme. Então o evento A será: . Por serem subconjuntos, é possível realizar a operação de união (U) entre conjuntos. A União de Eventos representa a ocorrência de um evento OU de outro. Outra operação que pode ser feita sobre Eventos é a intersecção (∩). A intersecção de eventos representa a ocorrência de um E de outro. conformenão,conformeS −= 0x,RxS = defeituosanão,defeituosaS −= %90x%50,RxS = )n,n(),c,n(),n,c(),c,c(S = )c,n(,)n,c(),c,c(A = S A 33 União de eventos => Interseção de eventos => 2.3.1 EVENTO COMPLEMENTAR O evento complementar do evento A, representado por , é aquele que ocorre somente se A deixar de ocorrer. E tem-se que: => Ø => Seja o evento A, obter número 4 na face superior no lançamento de um dado . O evento complementar será: 2.3.2 EVENTOS INDEPENDENTES Quando a realização ou não realização de um dos eventos não afeta a probabilidade da realização do outro e vice-versa. Exemplos: 1) No lançamento de dois dados qual é a probabilidade de obter o nº 4 no primeiro dado e o nº 3 no segundo dado ? 2) Suponha que numa produção diária de 850 peças fabricadas contenha 50 peças que não satisfaçam as exigências dos consumidores. Duas peças são selecionadas, sendo que a primeira peça é reposta antes da segunda ser selecionada. Qual é a probabilidade das duas peças serem defeituosas? BA BA A SAAAA =+= 1)AA(P =+ == AAAA 0)AA(P = 4A = A 6,5,3,2,1A = 61)1dadono4.no(P)1(P == 61)2dadono3.no(P)2(P == 3616161)2(P)1(P)2E1(P)21(P ==== %35,00035,0 850 50 850 50 )DeD(P == A B A B BA 34 2.3.3 EVENTOS MUTUAMENTE EXCLUSIVOS Dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a possibilidade de realização do(s) outro(s). Assim, no lançamento de uma moeda, o evento "tirar cara" e o evento "tirar coroa" são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza. Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das probabilidades de que cada um deles se realize: Exemplos: 1) No lançamento de um dado qual a probabilidade de se tirar o nº 3 ou o nº 4 ? Os dois eventos são mutuamente exclusivos então: 2) Um parafuso é selecionado aleatoriamente de um lote de 100 parafusos, sendo que 15 apresentam pequenos defeitos e 10 são não-conformes (não aceitáveis). Qual é a probabilidade do parafuso selecionado ser: a) Perfeito ou apresentar pequeno defeito? b) Apresentar pequeno defeito ou não-conforme? Solução: a) b) )B(P)A(P)BOUA(P)BA(P +== 316161)4.no(P)3.no(P)BOUA(P)BA(P =+=+== 15,0 100 15 )defeitopequeno(P == 10,0 100 10 )conformenão(P ==− 75,0 100 75 )perfeito(P == 90,0 100 15 100 75 )defeitopequenoouperfeito(P =+= 25,0 100 10 100 15 )conformenãooudefeitopequeno(P =+=− A B S 35 2.4 DEFINIÇÃO CLÁSSICA DE PROBABILIDADE Seja A um subconjunto do espaço amostral S. Então, se todos os resultados elementares de S são equiprováveis, a medida da probabilidade de ocorrência do evento A é dada por: 2.5 DEFINIÇÃO AXIOMÁTICA DE PROBABILIDADE Seja o espaço amostral S associado a um certo experimento. A cada evento associa-se um número real representado por , chamado de probabilidade de , satisfazendo as propriedades: 1) 2) (ou seja, a probabilidade do evento certo é igual a 1 ) 3) sejam A e B dois eventos mutuamente exclusivos. A probabilidade de ocorrência de ou é igual à soma das probabilidades individuais. 2.6 PROBABILIDADE CONDICIONAL Definição 4: Sejam A e B eventos de um experimento E, com . Então a probabilidade condicional do evento A dado que B tenha ocorrido é: , Exemplo: O quadro a seguir fornece um exemplo de 400 itens classificados por falhas na superfície e como defeituosos (funcionalmente). DEFEITUOSO FALHAS NA SUPERFÍCIE Sim Não TOTAL Sim 10 18 28 Não 30 342 372 TOTAL 40 360 400 a) Qual é a probabilidade do item ser defeituoso, dado que apresenta falhas na superfície? b) Qual é a probabilidade de ter falhas na superfície dado que é defeituoso? Solução: )S(n )A(n Semelementosdenúmero Aemelementosdenúmero )A(P == SA )A(P A 1)A(P0 1)S(P = A B )B(P)A(P)BouA(P += 0)B(P )B(P )BA(P )B|A(P = EA 36 A Probabilidade Condicional pode assumir a forma abaixo, chamada algumas vezes de teorema da multiplicação de probabilidades: , ou de forma equivalente, Exemplo: A probabilidade de que o primeiro estágio de uma operação, numericamente controlada, de usinagem para pistões com alta rpm atenda às especificações é igual a 0,90. Falhas são devido a variações no metal, alinhamento de acessórios, condições da lâmina de corte, vibração e condições ambientais. Dado que o primeiro estágio atende às especificações, a probabilidade de que o segundo estágio de usinagem atenda à especificações é de 0,95. Qual a probabilidade de ambos os estágios atenderem as especificações? 2.7 TEOREMA DA PROBABILIDADE TOTAL Suponha que eventos aleatórios sejam conjuntos mutuamente exclusivos e exaustivos . Então: Exemplos: 1) A probabilidade de que um conector elétrico que seja mantido seco falhe durante o período de garantia de um computador portátil é 1%. Se o conector for molhado, a probabilidade de falha durante o período de garantia será de 5%. Se 90% dos conectores forem mantidos secos e 10% forem mantidos molhados, qual é a probabilidade dos conectores falharem durante o período da garantia? Solução: 2) Suponha que na fabricação de semicondutores, a probabilidade seja de 0,10 de que um chip que esteja sujeito a altos níveis de contaminação durante a fabricação cause uma falha no produto. A probabilidade é de 0,005 de que um chip que não esteja sujeito a altos níveis de contaminação durante a fabricação cause uma falha no produto. Em um dado instante da produção, 20% dos chips estão sujeitos a altos níveis de contaminação. Qual a probabilidade de um produto usando um desses chips vir a falhar? )B(P)B|A(P)BA(P = )A(P)A|B(P)BA(P = 855,090,095,0)A(P)A|B(P)BA(P === k21 A,,A,A k )S...,AAA( k21 = = i ii )A|B(P).A(P)B(P 37 Solução: 2.8 TEOREMA DE BAYES Uma das relações mais importantes envolvendo probabilidades condicionais é dada pelo teorema de Bayes, que expressa uma probabilidade condicional em termos de outras probabilidades condicionais. Exemplo: Uma determinada
Compartilhar