Baixe o app para aproveitar ainda mais
Prévia do material em texto
Métodos Estatísticos Aplicados à Produção Material Teórico Responsável pelo Conteúdo: Profa. Ms. Luciana Borin de Oliveira Revisão Técnica: Prof. Me. Carlos Henrique de Jesus Costa Revisão Textual: Profa. Esp. Kelciane da Rocha Campos Intervalo de Confiança • Intervalo de confiança • Amostragem • Estimação • Determinação do tamanho de uma amostra • Cálculo de intervalo de confiança para pequenas amostras • Intervalo de confiança para proporção O objetivo desta unidade é conhecer as definições envolvidas em intervalos de confiança aplicados à produção: · Amostragem; · Estimação. OBJETIVO DE APRENDIZADO Leia atentamente o conteúdo desta unidade, que lhe possibilitará conhecer as aplicações do estudo de Intervalos de Confiança em Engenharia. Você também encontrará nesta unidade uma atividade composta por questões de múltipla escolha, relacionadas com o conteúdo estudado. Além disso, terá a oportunidade de trocar conhecimentos e debater questões no Fórum de discussão. É extremamente importante que você consulte os materiais complementares, pois são ricos em informações, possibilitando-lhe o aprofundamento de seus estudos sobre este assunto. ORIENTAÇÕES Intervalo de Confi ança UNIDADE Intervalo de Confiança Contextualização Como vimos, várias são as aplicações para Intervalo de Confiança. Ao escolher uma amostra e determinar, por exemplo, seu desvio padrão, eu afirmo com uma porcentagem de confiança que a medida se encontra no intervalo pré-determinado pela amostra. Escolha a área em que você atua ou próxima a ela e busque dados que possam ser analisados. Você pode usar também dados do dia a dia. Aplique o conceito estudado, faça tabelas e gráficos, use planilhas eletrônicas. Avalie seu processo, calcule o desvio, amplitude e variância desses dados. Compare os dados! 6 7 Intervalo de Confiança Definição: Intervalo de confiança corresponde a uma estimativa que está frequentemente associada a estudos estatísticos, ou seja, é utilizado quando se quer determinar um determinado fator; por exemplo, no caso de uma pesquisa eleitoral, quando não é possível perguntar a toda população a intenção de voto, e esta será baseada em uma amostragem da população, ou, por exemplo, em um estudo hipotético sobre a obesidade mundial, no qual não seria possível utilizar a população mundial inteira no estudo, podemos utilizar uma amostragem da população, que poderia ser representada com a população de um bairro de uma grande cidade. Então, podemos considerar o intervalo de confiança como sendo um indicativo de confiança de uma estimativa e, portanto, descreve quanto podemos confiar em um resultado de uma pesquisa a qual é representada através de uma amostra do resultado de toda população de estudo. Amostragem Como vimos, amostragem trata-se do processo de coleta da amostra da população, através de métodos apropriados para essa seleção, com base em um estimador através do cálculo de probabilidades. É um conjunto de técnicas utilizadas para a coleta de uma amostra. Podemos dividir as amostras em 2 grupos, as amostragens probabilísticas ou aleatórias e as amostragens intencionais ou não probabilísticas. Amostragem probabilística ou aleatória Como diz o título, a seleção da amostra é feita aleatoriamente e cada elemento pertencente à população tem a mesma probabilidade de poder fazer parte da amostra. Amostragem intencional ou não probabilística A amostragem é feita a partir de uma escolha pré-determinada dos elementos constituintes da amostra. Para que possamos, então, utilizar amostras para fazermos inferências da média populacional, necessitamos da utilização da amostragem probabilística ou aleatória. 7 UNIDADE Intervalo de Confiança Amostragem Probabilística – Tipos a) Amostragem aleatória simples As amostragens probabilísticas são aquelas mais utilizadas. A probabilidade de cada elemento da amostra ser escolhido na amostragem é a mesma para todos os elementos. Todos os elementos da população em estudo têm a mesma chance de serem escolhidos. b) Amostragem sistemática Na amostragem sistemática, o processo de seleção é feito através de um critério de seleção pré-estabelecido. Por exemplo, podemos selecionar uma amostragem de peças em uma linha de produção por um determinado intervalo de tempo ou então selecionar um elemento a cada 20 peças produzidas em uma linha de produção. c) Amostragem estratificada Na amostragem estratificada, procedemos a amostragem segundo algum critério representativo da população; dividimos uma população em estratos (subpopulações). Por exemplo, em uma população, podemos dividi-la em critério de idade, faixa salarial, etc. d) Amostragem por conglomerados Na amostragem por conglomerados, a amostra selecionada consiste em uma subpopulação com uma composição muito parecida da população que se deseja estudar. Por exemplo, num estudo em que se deseja saber qual seria a aceitação no lançamento de um produto para a cidade de São Paulo, faz-se o lançamento desse produto anteriormente em Porto Alegre, que representa as mesmas características da cidade de São Paulo, só que numa população bem menor (um subpopulação). Estimação Conceituamos estimação como sendo um processo estatístico de estimativa para um determinado parâmetro populacional a partir de uma amostra obtida dessa população em questão. Utilizamos a estimativa para o cálculo aproximado de um parâmetro populacional de um valor específico ou então para o cálculo de um intervalo de valores, enquanto uma estatística é utilizada para o cálculo de aproximação de um parâmetro populacional. Por exemplo, utilizamos a estatística x para conclusão de que a estimativa da temperatura média de congelamento da água é de 0 oC. 8 9 Estimação por ponto Utilizamos quando desejamos conseguir um único valor de um certo parâmetro populacional utilizando uma amostra dessa população. Podemos exemplificar pelo desvio padrão s, que é uma medida estatística da amostra que produz a estimativa por ponto da população σ, ou então x, que é a média aritmética de uma amostra que produz a estimativa por ponto da população μ Estimação por intervalo Essa estimação também é chamada de intervalo de confiança. Consiste no intervalo de valores onde temos a probabilidade de a ocorrência do parâmetro estatístico populacional estar inserido. Essa probabilidade de o parâmetro estatístico estar contido no intervalo de confiança é denominado de coeficiente de confiança ou grau de confiança e é representado por (1 - α) e α o nível de significância ou grau de desconfiança. Os valores de (1 - α) mais utilizados são de: (1 - α) = 0,90 → 90% de grau de confiança (1 - α) = 0,95 → 95% de grau de confiança (1 - α) = 0,99 → 99% de grau de confiança Podemos considerar que há diferenças entre os estimadores, já que diferentes amostras retiradas da população irão levar a diferentes valores desses estimadores. A essa diferença entre o valor do parâmetro estatístico e o valor do estimador (estimativa) dá-se o nome de margem de erro ou erro de estimativa e representamos como: E = |estimativa – parâmetro| Margem de erro da média da amostra: Ex=|x - µ| Margem de erro do desvio-padrão da amostra: Es = |s - σ| Margem de erro da proporção da amostra: Ep = |p - p| Teorema central do limite Ele nos diz que quanto maior for o tamanho da amostra em relação à população, mais a média amostral de uma variável aleatória se aproxima de uma distribuição normal. Consideramos uma amostra suficientemente grande quando ela for maior do que 30. 9 UNIDADE Intervalo de Confiança Distribuição amostral das médias Consideramos todas as probabilidades associadas a todas as possíveis médias amostrais relacionadas a uma população como a distribuição amostraldas médias, onde a população segue uma distribuição normal. Propriedades: 1º A média da população é igual à média da distribuição amostral das médias: μx = μ, onde: μx = média da distribuição amostral das médias μ = média populacional 2º O desvio padrão da distribuição normal das médias é sempre menor que o desvio padrão populacional e é obtido dividindo-se o desvio padrão populacional pela raiz quadrada da quantidade de elementos da amostra. σ σ x n = ,onde: σx = desvio padrão da distribuição normal das médias σ =desvio padrão populacionaln= número de elementos da amostra 3º Com as médias amostrais seguindo uma distribuição normal, podemos utilizar a variável transformada Z para cálculo das probabilidades: Z x ou x n x = − −µ σ µ σ Z= Exemplificando: Sabe-se que numa indústria produtora de parafusos tem-se em uma linha de produção parafusos produzidos com a média μ = 2,5 cm e desvio padrão de 0,2 cm seguindo uma distribuição normal. Retirando- se desse processo uma amostra aleatória de 10 peças, qual é a probabilidade de encontramos nessa amostra uma média do tamanho dos parafusos superior a 2,6 cm? 10 11 Dos dados do exercício, temos: μ = 2,5 cm μx = 2,6 cm σ = 0,2 cm n =10, transportando esses dados para a equação Z x n = − µ σ Z = − ≅2 6 2 5 0 2 10 1 58 , , , , E buscando valor na tabela de distribuição normal transformada para os valores de Z temos 0,4418, que é a probabilidade de termos os tamanhos dos parafusos da amostra entre 2,5 e 2,6 cm. A probabilidade de serem maiores que 2,6 cm é a diferença entre 0,5 (área total a partir do centro da curva) e 0,4418 ( valor da área entre o centro do gráfico e o valor de 2,6 cm). O valor que se quer é o valor hachurado do gráfico. P ( x ≥ 2,6 cm) = 0,5-0,4418 = 0,0582 = 5,82% e graficamente temos: Intervalo de confiança para a média O intervalo de confiança da média corresponde ao intervalo de valores onde se encontra situada a média populacional e podemos considerar, quando temos um parâmetro em estudo sob uma distribuição normal, a média amostral x como um bom estimador para o cálculo dessa média populacional. A equação que define o cálculo do intervalo de confiança para a média é: IC = x - E ≤ μ ≤ x + E, com: E = margem de erro = Zα/2 σ * (x) n 11 UNIDADE Intervalo de Confiança Tal fórmula é utilizada quando conhecemos o desvio padrão da população (σ), o número de elementos da amostra é maior de 30, n>30, média da amostra (x) e Zα/2 é o valor crítico do valor de Z que corresponde ao nível de confiabilidade no qual se deseja estudar, e graficamente representamos: Exemplificando: Vamos supor que os valores médios mensais repassados de um conceituado plano de saúde a um grande laboratório de análises clínicas de uma amostra de 40 clientes é de R$ 1.600, e que esses repasses seguem uma distribuição normal com desvio padrão de R$ 32,00. Qual é o intervalo de confiança com 95% de confiabilidade para a população de clientes desse laboratório? Temos os dados: n = 40 σx = R$ 32,00 x = R$ 1600 (1 - α) = 95% 95 2 0 475 % ,= e buscando o valor de na Za/2 tabela temos 1 96 1 96, ,→ =Ζα/2 E Z= = ≅α σ 2 32 40 9 92* (x) , n 1,96 * I.C. (μ,95%) = (x - E ≤ μ ≤ x + E) = (1600 - 9,92 ≤ μ ≤1600 + 9,92) I.C. (μ,95%) = (1590,08 ≤ μ ≤ 1609,92) 12 13 Caso tivéssemos um número de n<0,005N, ou seja, o número de elementos da amostra é menor do que 5% dos valores da população, teríamos que utilizar um fator de correção no cálculo a margem de erro. Deve-se multiplicar N n N − −1 à margem de erro. Exemplificando: Vamos considerar a mesma situação do exemplo anterior, porém com uma amostra de 100 clientes de uma população de 1000 clientes. Qual seria o intervalo de confiança, com 90% de confiança, para os valores médios dos repasses aos laboratórios referentes aos 1000 clientes? N =1000 n = 100 σx= R$ 32,00 x = R$ 1600 (1 - α) = 90% 90 2 0 45 % ,= e buscando o valor de Zα/2 na tabela temos 1 64 1 64, ,→ =Zα/2 E Z x n N n N = ( ) − − = ≅α σ 2 1 1 64 32 100 900 999 5 0* * * *, , I.C. (μ,90%) = (x - E ≤ μ ≤ x + E) = (1600 - 5,0 ≤ μ ≤1600 + 5,0) I.C. (μ,90%) = (1595,0 ≤ μ ≤ 1605,0) Determinação do tamanho de uma amostra Utilizando a fórmula do cálculo da margem de erro E Z x n = ( ) α σ 2 * e desenvolvendo-a, temos: E Z x n n Z x E n Z x E n Z x E a= ⇒ = ⇒ ( ) = = 2 2 2 2 2 2 * * * * ( ) ( ) ( ) ( ) σ σ σ σ α α α 2 13 UNIDADE Intervalo de Confiança Exemplificando: Sabe-se que o desvio padrão da altura das mulheres brasileiras é de 7 cm. Qual deve ser o tamanho mínimo de elementos de uma amostra de mulheres para que tenhamos um erro cometido estimado de 2 cm ao nível de significância de 99%? Temos: σ(x) = 7 cm E = 2 cm (1 - α) = 99% 99 2 0 495 % ,= e buscando o valor de Zα 2 na tabela temos 2,58 → Zα 2 = 2,58 n Z x E = ( ) = ≅ α σ2 2 2 2 58 7 2 82 * *, Necessitaríamos de uma amostra de no mínimo 82 mulheres. Cálculo de intervalo de confiança para pequenas amostras No caso de termos uma população distribuída segundo uma distribuição normal, porém com uma amostragem com n<30 elementos e desvio padrão populacional desconhecido, não temos como utilizar a curva normal para determinação de intervalos de confiança da média populacional. Nesse caso, utilizamos para o cálculo do intervalo de confiança para a média populacional a distribuição de t de student. A distribuição de t de student, como a curva normal, possui simetria dos pontos em relação ao centro, e a sua média é zero, porém possui uma curva mais achatada em relação ao centro, comparando- se com a curva normal, e é representada a seguir. 14 15 A característica principal de diferença com a distribuição normal é que para cada quantidade n de amostra há uma distribuição diferente, enquanto que na curva normal só há uma distribuição padronizada. Outra característica é que quando n for maior que 30, a distribuição t de student se aproxima muito da distribuição normal. O cálculo da probabilidade associado à distribuição de t de student e o erro são calculados nas fórmulas: t x s n E t s n n n a − = = −1 2, / * µ − 1,α/2 Exemplifi cando: Vamos supor a seguinte amostra x com os seguintes elementos: 5,8,9,12,13. Tal amostra foi retirada de uma população que segue uma distribuição normal. Qual é o intervalo de confiança da média μ ao nível de significância de 95 %? 1º Calculamos a média da amostra x x x n s n x x n s i i i = = = = − − ( ) = = = ∑ ∑∑ 47 5 9 4 2 1 1 41 2 4 10 3 10 3 2 2 , , , , ≅≅ −( ) = = → 3 21 1 95 0 95 , % , eα α α =5% = 0,05 /2 = 2,5% = 0,025 t tn− = =1 2 4 2 5, / ; , %α buscando na tabela de t de student para 4 graus de liberdade e α = 0,025 temos = 2,276 E s n = =tn-1,a/2 * *, , ,2 276 3 21 5 3 27� 27 = ≤ = − ≤I.C ( ; %) ( , , , , ) I.C ( ; %) ( , , µ µ µ µ 99 9 4 3 27 9 4 3 99 6 13 12 67 ≤ + ≤ )) 15 UNIDADE Intervalo de Confiança Intervalo de confiança para proporção Consideremos p como a proporção de sucessos de uma população e q (1 - p) a proporção de fracassos em uma população. p^ será a proporção amostral de sucessos de uma amostra de tamanho n e q^ será a proporção amostral de fracassos de uma amostra de tamanho n. Calculamos p^ através da fórmula: p x n ^ = sendo x o número de sucessos ocorridos emdeterminada amostra n. E utilizando a distribuição normal padronizada, temos: Z p p p q n E Z p q n p E p p E a = − ∗ = = − < < + ^ ^ ^ / ^ * ^ ^ * I.C 2 Exemplificando: Em um processo fabril de peças automotivas em uma amostra de 200 peças aleatórias retiradas em um dia de produção, 40 peças apresentaram defeitos. Qual é o intervalo de confiança com 95% para a proporção de todas as peças defeituosas produzidas naquele dia de produção? p x n q^ ^, ,= = = =40 200 0 20 0 80 e 95 2 0 475 % ,= e buscando o valor de Za/2 na tabela temos: 1,96 → Za/2=1,96 E Z p qa= = ≅/ * ^ * ^ * *, , , ,2 n 1 96 0 20 0 80 200 0 06 I.C.(p;95%) = ( p p^ ^ E < p < E− + ) = ( 0 20 0 06 0 20 0 06, , , ,− < −p < ) I.C.(p;95%) = (0,14 < p < 0,26) 16 17 Determinação do tamanho da amostra para que se possa estimar a proporção p De forma análoga à determinação do tamanho da amostra no intervalo de confiança para a média, basta desenvolver a fórmula da margem de erro e chegamos, então: n Z p q E a= ( )/ * ^ * ^ 2 2 2 , quando p^ é conhecido n Z E a= ( )/ * ,2 2 2 0 25 , quando p^ é desconhecido. Nesse caso adota-se o máximo valor desta multiplicação que é representado por p^ = 0,5 e q^ = 0,5. Intervalo de confiança para variância populacional e desvio padrão populacional Sabemos que em uma produção industrial é muito importante monitorar a variação do processo industrial controlando-a. Imaginem em um processo de produção com milhares de peças de precisão produzidas. É muito importante que não haja muita variação entre elas, ou seja, que quase não tenha variação entre elas. Sabemos que a medida que nos dá essa variação é a variância (σ2) e um bom estimador representativo da variância populacional é s2 – variância amostral. Considerando uma população X distribuída com uma distribuição normal com média populacional μ e desvio padrão populacional σ2, para cada amostra aleatória n selecionada, haverá uma variância amostral associada e a estatística da amostra é dada através da distribuição de Qui-quadrado representada pela curva formada da equação: X n s n− = −( ) 1 2 2 2 1 * σ ,onde n = tamanho da amostra, s2 = variância da amostra e ; σ2 = variância da população, e tem as seguintes características: a) Todos os valores da distribuição de Qui- quadrado são maiores ou iguais a zero; b) As distribuições de Qui-quadrado são constituídas por uma família de curvas, cada uma delas determinada por 1 grau de liberdade que é dado pelo valor de n-1, representada na figura a seguir: c) 3 - A área sob cada curva da distribuição de Qui-quadrado é igual a 1. 17 UNIDADE Intervalo de Confiança O intervalo de confiança para a variância populacional é dado pela fórmula: n s X n s Xn a n a −( ) ≤ ≤ −( ) − − − 1 1 2 1 2 2 2 2 1 1 2 2 ; / ; / σ ,sendo n-1 o número de graus de liberdade exposto na tabela de Qui-quadrado. Exemplificando: Vamos considerar que em uma linha de produção de peças automotivas, as chapas de aço utilizadas para a fabricação das portas dianteiras de um automóvel são normalmente distribuídas. Os diâmetros dessas chapas em uma amostragem de 25 peças apresentaram uma variância de 5,4 cm. Qual será o intervalo de confiança com 95% de confiança para a variância da população? Temos dos dados: n-1 = 25 - 1 = 24 s = variância da amostra = 5,4 cm → s2 = (5,4)2 = 29,16 (α - 1) = 95% → α = 5% → α/2 = 2,5% = 0,025 1- α/2 = 1 - 0,05/2 = 1 - 0,025 = 0,975 Xn-1 2 , vamos retirar dois valores da tabela de distribuição de Qui-quadrado, o valor de 0,025 com 24 graus de liberdade e o valor de 0,975 com 24 graus de liberdade: X X 24 2 5 2 24 97 5 2 39 364 12 401 : , % : , % , ,= = e Transportando os valores para a fórmula do I.C para variância, temos: ( ) ( ) ( ) , ,; / ; / *n s X n s Xn a n a − ≤ ≤ − = − ≤ − − − 1 1 25 1 29 16 39 364 2 1 2 2 2 2 1 1 2 2 σ σσ σ σ 2 2 25 1 29 16 12 401 699 84 39 364 699 84 12 401 17 78 ≤ − ≤ ≤ = ≤ ( ) , , , , , , , * 22 56 43≤ , Caso desejássemos construir o intervalo de confiança para o desvio padrão populacional, bastaria extrairmos a raiz quadrada do resultado. No nosso exemplo, teríamos: Intervalo de confiança para o desvio padrão populacional: 4,22 ≤ σ ≤ 7,51 18 19 Material Complementar Para complementar os conhecimentos adquiridos e enriquecer sua compreensão sobre o assunto tratado nesta unidade, consulte os livros a seguir, disponíveis na Minha Biblioteca: Indicações para saber mais sobre os assuntos abordados nesta Unidade: Livros Curso de estatística. FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de estatística. 6. ed. São Paulo: Atlas, 2012. A estatística básica e sua prática. MOORE, David S.; NOTZ, William I.; FLIGNER, Michael A. A estatística básica e sua prática. 6. ed. Rio de Janeiro: LTC, 2014. Estatística aplicada à engenharia. MONTGOMERY, Douglas C.; RUNGER, George C.; HUBELE, Norma Faris. Estatística aplicada à engenharia. 2. ed. Rio de Janeiro: LTC, 2004. 19 UNIDADE Intervalo de Confiança Referências ASH, Robert B. Basic probability theory. Mineola, NY: Dover Publications, 2008. Disponível online em: <http://www.math.uiuc.edu/~r-ash/BPT/BPT. pdf>. Acesso em: 13 out. 2015. BERTSEKAS, D.; TSITSIKLIS, J. Introduction to probability. 2a. ed. Belmont, Mass: Athena Scientific, 2002. 416 p. CHUNG, K. Elementary probability theory: with stochastic processes and an introduction to mathematical finance. 4 ed. New York: Springer, 2003. DANTAS, C. Probabilidade: um curso introdutório. 3 ed. rev. São Paulo: EdUSP, 2008. DEGROOT, Morris H., SCHERVISH, Mark J. Probability and statistics. 4. ed. New York: Pearson, 2011. 912 p. DURRET, R. Elementary probability for applications. Cambridge: Cambridge University Press, 2009. 254 p. HINES, W. Probabilidade e estatística na engenharia. 4. ed. Rio de Janeiro: LTC, 2006. LARSON, R; FARBER, B. Estatística aplicada. 2. ed. São Paulo: Pearson Prentice Hall, 2004. MAGALHÃES, M.; LIMA, A. Noções de probabilidade e estatística. 7 ed. São Paulo: EDUSP. 2011. MEYER, P. L. Probabilidade: aplicações à estatística. 2 ed. Rio de Janeiro: Editora LTC. 2000. ROSS, S. M. Probabilidade: um curso moderno com aplicações. 8 ed. São Paulo: Artmed, 2010. 608 p. 20
Compartilhar