Baixe o app para aproveitar ainda mais
Prévia do material em texto
Métodos Estatísticos Aplicados à Produção Material Teórico Responsável pelo Conteúdo: Profa. Ms. Luciana Borin de Oliveira Revisão Técnica: Prof. Me. Carlos Henrique de Jesus Costa Revisão Textual: Profa. Esp. Kelciane da Rocha Campos Medidas de Dispersão • Medidas de dispersão • Medidas de dispersão (Dados não agrupados) • Medidas de dispersão (Dados agrupados) • Variável Contínua O principal objetivo desta unidade é trabalhar com os conceitos de amplitude, desvio e variância. Em Materiais didáticos, você encontrará o conteúdo e as atividades propostas para os temas. OBJETIVO DE APRENDIZADO Leia atentamente o conteúdo desta unidade, que lhe possibilitará conhecer as aplicações do estudo de Medidas de Dispersão em Engenharia. Você também encontrará nesta unidade uma atividade composta por questões de múltipla escolha, relacionadas com o conteúdo estudado. Além disso, terá a oportunidade de trocar conhecimentos e debater questões no Fórum de discussão. É extremamente importante que você consulte os materiais complementares, pois são ricos em informações, possibilitando-lhe o aprofundamento de seus estudos sobre este assunto. ORIENTAÇÕES Medidas de Dispersão UNIDADE Medidas de Dispersão Contextualização Como vimos, várias são as aplicações para as medidas de dispersão. Encontramos um artigo no qual os autores provaram a eficiência dessa ferramenta para estudar investimentos. Escolha a área em que você atua ou próxima a ela e busque dados que possam ser agrupados. Você pode usar também dados do dia a dia, como, por exemplo, a quantidade de horas que o sol fica disponível por dia. Aplique o conceito estudado, faça tabelas e gráficos, use planilhas eletrônicas. Avalie seu processo, calcule o desvio, amplitude e variância desses dados. Compare os dados! 6 7 Medidas de dispersão Estudamos com as medidas de posição central, média, mediana e moda com o intuito de podermos resumir em um único número aquilo que se apresentaria como sendo o que é “típico” ou “na média” para um conjunto de elementos. Porém, essas medidas necessitam de outras medidas que ajudam a caracterizar melhor o “resumo” do conjunto de elementos. Essas medidas nos mostram o quanto os dados se mostram dispersos em torno da posição central do nosso conjunto. Tais medidas nos proporcionam caracterizar, então, o grau de variação existente no conjunto de elementos e “explicar” melhor o resumo do conjunto de elementos, pois o valor de uma média aritmética pode ser igual para 2 conjuntos de elementos, mas os fenômenos que são retratados serem muito diferentes. Por exemplo: Consideremos uma cidade no litoral do nordeste brasileiro sob um clima tropical e uma cidade do litoral do Rio Grande do Sul que sofre a incidência de um clima temperado. Ambas as cidades possuem temperaturas médias anuais acima de 26 ºC, conforme podemos observar nos gráficos a seguir: Vemos nos gráficos que as temperaturas na cidade do NORDESTE variam muito pouco ao longo do ano, entre 25 e 27 ºC, enquanto que na cidade do SUL houve variações de 18 a 31ºC. Pergunta: como será que estão as praias nos meses de inverno nas 2 cidades? Certamente, a quantidade de banhistas na cidade do Nordeste será bem maior que na cidade do Sul. Outro exemplo: Vamos imaginar a média salarial de um gerente de empresa que tem seu salário fixo mensal de R$10.000 e a média salarial de um corretor de imóveis com o mesmo valor, que obtém sua renda através de comissões adquiridas pela venda de imóveis. Você acha que somente com essa informação da média salarial as distribuições de suas rendas são equivalentes? Podemos observar que há grandes diferenças entre a obtenção de suas rendas. O gerente de empresas tem a sua renda obtida de forma constante, o mesmo valor mês a mês, enquanto a renda obtida pelo corretor é muito mais esparsa; num mês pode obter uma renda muito 7 UNIDADE Medidas de Dispersão superior a R$ 10.000 com a comissão obtida e também pode passar alguns meses com a obtenção de uma renda muito inferior ou até mesmo não obter renda, o que exige desse trabalhador uma programação com despesas muito mais controladas, devido à imprevisibilidade da obtenção de suas rendas, enquanto o outro tem sua vida muito mais controlada. Voltando ao primeiro exemplo, concluímos que a distribuição de temperaturas da cidade da região Nordeste tem uma variação muito menor que da cidade do Sul, e de forma análoga concluímos que a distribuição de rendas do gerente de empresas é muito menor que do corretor de imóveis. Sendo assim, conforme já expusemos, as medidas de dispersão são medidas complementares às medidas de posição e estudaremos aqui as seguintes: • Amplitude; • Desvio médio; • Variância; • Desvio padrão. Medidas de dispersão (Dados não agrupados) Amplitude Como já estudamos anteriormente, a Amplitude Total (AT) ou Amplitude Amostral (R) é a subtração entre o elemento de maior valor e o de menor valor de uma sequência de dados. R = AT = xmax - xmin Por exemplo, em uma série de valores 2, 15, 4, 11, 1, 19, 5, temos a amplitude em: R = 19 – 1 = 18 Percebemos que quanto maior a diferença entre os elementos extremos da sequência, maior será a amplitude e, portanto, maior será a variação, ou dispersão dos valores da sequência. Como a amplitude depende de apenas a variação de dois valores de uma sequência, não nos fornece nenhuma informação da medida central da sequência, não levando em conta como se dá a variação entre os dados entre o valor máximo e mínimo da sequência de dados. É uma medida de pouca sensibilidade estatística, sendo utilizada para nos dar a informação de quanto há de variabilidade em uma amostra de dados. 8 9 Desvio a. Desvio em relação à média aritmética É calculado pela diferença entre um elemento de uma série e a média aritmética dessa mesma série. i id x x= − Considerando, por exemplo, as notas bimestrais de um aluno, temos: 6,0; 5,5; 7,0; 4,5. Como podemos calcular os desvios em relação à média aritmética? a.1) calculamos inicialmente a média aritmética das notas do aluno: 6,0 5,5 7,0 4,5 23 4 4 5,75 x x + + + = = = a.2) calculamos, então, os desvios em relação à média utilizando a fórmula i id x x= − d d d d 1 2 3 4 5 75 6 0 0 25 5 75 5 5 0 25 5 75 7 0 1 25 5 75 = − =− = − = = − =− = − , , , , , , , , , , 44 5 1 25, ,= Percebemos que sempre que somarmos todos os desvios em relação à média, o resultado sempre será zero. Do nosso exemplo: 1 2 3 4 0,25 0,25 1,25 1,25 d d d d zero+ + + − + − + == Essa relação é uma propriedade da média. ( ) zeroi id x x= − =∑ ∑ 9 UNIDADE Medidas de Dispersão Desvio médio Definimos como Desvio Médio (DM) a média aritmética dos valores absolutos dos desvios de cada valor de determinada série em relação à média aritmética da determinada série. ix xDM n − = ∑ Observação: O desvio absoluto é aquele no qual consideramos apenas o valor numérico, não importando se ele é positivo ou negativo em relação à média aritmética, pois se assim fosse, por exemplo se utilizássemos o desvio em relação à média, não haveria valor para o numerador da equação, pois seria zero. Utilizando os dados do exemplo anterior, temos: Notas do aluno: 6,0; 5,5; 7,0; 4,5. x d d d d d = = − =− ⇒ = = − = ⇒ = = 5 75 5 75 6 0 0 25 0 25 5 75 5 5 0 25 0 25 1 1 2 2 3 , , , , , , , , , 55 75 7 0 1 25 1 25 5 75 4 5 1 25 1 25 3 4 4 , , , , , , , , − =− ⇒ = = − = ⇒ = d d d Aplicando a fórmula: temos:i x x DM n − = =∑ 0,25 0,25 1,25 1,25 3 4 4 0,75 DM DM + + + = = = A conclusão a que se chega através do cálculo do desvio médio é queos valores da sequência estão afastados da média aritmética em 0,75, no nosso exemplo, em média. Variância Definimos a variância como sendo a média das diferenças ao quadrado entre cada valor de uma sequência e a média aritmética dessa mesma sequência, portanto a variância pode ser definida também como o desvio médio quadrático de uma sequência de dados. O cálculo da variância é dependente do conjunto de dados os quais ele representa, daí temos a variância de uma população e variância para uma amostra. 10 11 a. Variância populacional Ela é representada por 2σ e será calculada através da fórmula: ( )22 1 n ii x N µ σ −== ∑ Sendo: µ = média populacional N= quantidade de elementos da população b. Variância amostral Ela é representada por S2 e será calculada através da fórmula: ( )212 1 n ii X X S n −== − ∑ Sendo: X = média amostral n= quantidade de elementos da população n-1 = utilizada para amostras menores de 30 elementos. Para n>30 praticamente não há diferença. Por exemplo, vamos calcular a variância do seguinte conjunto de elementos A= {3; 6; 4; 8; 9}. Como trata- se de uma amostra, calcularemos a variância amostral (S2). 1º - Calcular o valor da média aritmética: 3 6 4 8 9 30 5 5 6 X X + + + + = = = 2º - Calcular os desvios médios: d d d d d 1 2 3 4 5 3 6 3 6 6 0 4 6 2 8 6 2 9 6 3 = − =− = − = = − =− = − = = − = 11 UNIDADE Medidas de Dispersão 3º - Aplicar a fórmula da variância populacional: ( )212 1 n ii X X S n −== − ∑ S S S 2 2 2 2 2 2 2 2 3 0 2 2 3 5 1 9 4 4 9 4 26 4 6 5 = − + + − + + − = + + + = = ( ) ( ) ( ) ( ) ( ) , Podemos calcular a variância populacional e amostral através de fórmulas mais simplificadas que se seguem: Para variância populacional, temos: ( )22 21 ii X X N N σ = − ∑∑ Para variância amostral, temos: ( )22 21 1 i i x S x n n = − − ∑∑ Desvio padrão O desvio padrão é calculado como sendo a raiz quadrada da variância da amostra. Ele indica o quanto os elementos da amostra estão afastados em relação à média aritmética dessa amostra. Calculamos o desvio padrão para a população e para a amostra. a) Desvio padrão da população: 2σ σ= + b) Desvio padrão da amostra: 2S S= + De forma análoga à variância, calculamos também o desvio padrão populacional e amostral através de fórmulas mais simplificadas que se seguem: 12 13 Para desvio padrão populacional, temos: 22 i i X X N N σ = − ∑ ∑ Para desvio padrão amostral, temos: S n x x n n i i= −( ) −( ) ∑∑* * 2 2 1 Medidas de dispersão (Dados agrupados) Amplitude Da mesma forma que para os dados não agrupados, a amplitude é dependente apenas dos valores máximos e mínimos da sequência que se está estudando. Exemplificando, vamos determinar a amplitude dos dados da série representados na tabela a seguir: xi fi 3 1 4 7 5 9 8 3 A amplitude será calculada pela diferença entre o maior valor da série e o menor valor da série: 8 3 5R = − = Desvio médio O Desvio Médio (DM) é determinado através do cálculo de média aritmética ponderada dos valores absolutos dos desvios de cada um dos elementos da série em estudo em relação à média aritmética dessa série. A ponderação será proporcionada pelas respectivas frequências. Calculamos o desvio médio através da equação: DM x x f f = −∑ ∑ i 1 i * 13 UNIDADE Medidas de Dispersão Exemplificando o cálculo do desvio médio, consideremos a tabela a seguir: xi fi 3 1 4 7 5 9 8 3 1º Calculamos a média aritmética da série de dados da tabela, através da fórmula de média aritmética x x f f =∑ ∑ i i i * x= + + + + + + = = 3 1 4 7 5 9 8 3 1 7 9 3 100 20 * * * * 5 2º Calculamos os desvios e completamos a tabela de dados: xi fi |xi-x| |xi-x|*fi 3 1 2 2 4 7 1 7 5 9 0 0 8 3 3 9 =∑ 20 18=∑ 3º Calculamos o desvio médio através da fórmula: DM x x f f DM i i i = − = = ∑ ∑ * ,1820 0 9 14 15 Variância Calcularemos a variância populacional e a variância amostral. Como tratam-se de dados agrupados, distribuído em tabela, incluiremos à tabela a frequência: a. Variância populacional – é calculada através da fórmula: ( )22 21 i ii i f X fX N N σ = − ∑∑ b. Variância amostral – é calculada através da fórmula: ( )22 21 1 i i i i f x S fx n n = − − ∑∑ Também podemos descrever a fórmula da variância amostral da seguinte forma: ( ) ( ) 22 2 1 i i i in f x fxS n n − = − ∑ ∑ Desvio padrão Calcularemos o desvio padrão populacional e a desvio padrão amostral. Como tratam-se de dados agrupados, distribuído em tabela, incluiremos à tabela a frequência. c. Desvio padrão populacional – é calculado através da fórmula: 22 i i i i f X fX N N σ = − ∑ ∑ d. Desvio padrão amostral – é calculado através da fórmula: ( ) ( ) 22 1 i i i in f x fxS n n − = − ∑ ∑ 15 UNIDADE Medidas de Dispersão Exemplificando os cálculos da variância e desvio padrão para valores agrupados, temos: Calcular a variância e desvio padrão populacional dos dados da tabela a seguir: xi fi 3 1 4 7 6 9 5 4 8 3 1º Vamos completar a tabela com colunas de 2 2; ; i i i i ix f x fx ix 2 ix if i if x 2 i if x 3 9 1 3 9 4 16 7 28 112 6 36 9 54 324 5 25 4 20 100 8 64 3 24 192 24=∑ 129=∑ 737=∑ 2º Faremos o cálculo da variância inserindo os dados na fórmula da variância populacional: σ σ σ 2 2 2 2 2 2 1 1 24 737 129 24 = − ( ) = − ( ) = ∑ ∑N f X f X Ni i i i 443 625 24 1 82 , ,≅ 3º Extraindo a raiz quadrada da variância, teremos, então, o desvio padrão populacional: 1,82 ,σ = ≅ 1 35 16 17 Variável contínua Amplitude Calculada através da subtração entre o limite superior da última classe e o limite inferior da primeira classe: max maxAT L l= − Desvio médio O desvio médio (DM) é determinado através do cálculo de média aritmética ponderada dos valores absolutos dos desvios de cada um dos elementos da série em estudo em relação à média aritmética dessa série. A ponderação será proporcionada pelas respectivas frequências. Os dados são apresentados na forma de distribuição de frequências em classes de valores. DM x x f f i i i = −∑ ∑ * Exemplificando o cálculo do desvio médio em relação aos dados da tabela a seguir: Intervalo de Classe if 0 4 4 4 8 7 8 12 6 12 16 3 1º Completamos a tabela com as colunas xi, xi fi e |xi-x|fi e calculamos a média aritmética: Intervalo de Classe fi xi xi fi |xi-x| fi 0 4 4 2 8 22,4 4 8 7 6 42 11,2 8 12 6 10 60 14,4 12 16 3 14 42 19,2 20=∑ 152=∑ 67,2=∑ 152 7,6 20 i i i x f x f = = =∑ ∑ 17 UNIDADE Medidas de Dispersão 2º Calcular o desvio médio aplicando a fórmula: DM x x f f DM i i i = − = = ∑ ∑ * , , 67 2 20 3 36 Variância e desvio padrão Calculamos essas 2 medidas através da mesma fórmula para os dados agrupados utilizando os valores de xi como sendo os pontos médios de cada classe da série de dados. Exemplificando e utilizando a tabela do exemplo anterior, vamos calcular a variância e desvio padrão através dos dados da tabela: Intervalo de Classe if 0 4 4 4 8 7 8 12 6 12 16 3 Incluímos na tabela os valores de 2, e :i i i i ix x ffx Intervalo de Classe i f ix x fi i f xi i2 0 4 4 2 8 16 4 8 7 6 42 252 8 12 6 10 60 600 12 16 3 14 42 588 20=∑ 152=∑ 1456=∑ Aplicando a fórmula da variância populacional, temos: σ σ 2 2 2 2 2 1 1 20 1456 152 20 = = − ( ) − ( ) ∑∑N f X f X Ni i i i = ⇒ = = = ⇒ =σ σ σ 2 2 2 300 8 20 15 04 15 04 3 87 , , , , variância desvio padrrão 18 19 Fazendo uma comparação entre os resultados de DM e desvio padrão, temos: • 3,87 3,36DMσ = > = ⇒o valor do desvio padrão é sempre maior que do desvio médio. Propriedades da variância (S2) e desvio padrão (S) a. A variância e desvio padrão de uma constante é sempre igual a zero: 2 ( ) 0 ( ) 0S c S c= ⇒ = b. Com a soma ou subtração de uma constante que seja diferente de zero, teremos a nova variância e desvio padrão iguais à variância e desvio padrão anteriores, não há alteração de valores. y x c Si i y x y xS S S= ± ⇒ = ⇒ =2 2 c. Com a multiplicação ou divisão de todos os valores por uma constante que seja diferente de zero, teremos a nova variância multiplicada ou dividida pelo quadrado da constante utilizada. O novo desvio padrão será obtido multiplicado ou dividido por essa constante. S cx c S x S cx cS x 2 2 2( )= ( ) =( ) ( ) 19 UNIDADE Medidas de Dispersão Material Complementar Para complementar os conhecimentos adquiridos e enriquecer sua compreensão sobre o assunto tratado nesta unidade, consulte os livros a seguir, disponíveis na Minha Biblioteca: Livros Estatística : para cursos de engenharia e informática. BARBETTA, Pedro Alberto; REIS, Marcelo Menezes; BORNIA, Antonio Cezar. Estatística: para cursos de engenharia e informática. 3. ed. São Paulo: Atlas, 2010. Curso de estatística. FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de estatística. 6. ed. São Paulo: Atlas, 2012. Controle estatístico de processos: uma abordagem prática para cursos de engenharia e administração. LOUZADA, Francisco et al. Controle estatístico de processos: uma abordagem prática para cursos de engenharia e administração. Rio de Janeiro: LTC, 2013. 20 21 Referências BUSSAB, Wilton O.; MORETTIN, P. A. Estatística básica. São Paulo: Editora Saraiva, 2006. 5ª ed. CASTANHEIRA, Nelson Pereira. Estatística aplicada a todos os níveis. Curitiba: IBPex, 2005. FONSECA, Jairo S.; MARTINS, Gilberto A. Curso de estatística. Editora Atlas, 2008. 6ª ed. MURRAY, Spiegel R. Estatística. Porto Alegre: Bookman, 4ª ed., 2009. SOARES, José Francisco; FARIAS, Alfredo A. de; CESAR, Cibele Comini. Introdução à estatística. Rio de Janeiro: Guanabara Koogan, 1991. TRIOLA, Mario F. Introdução à estatística. Tradução: Vera Regina de Farias e Flores. Rio de Janeiro: LTC, 2005. 9ª ed 21
Compartilhar