Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA Ana Laura Bertelli Grams Distribuições de probabilidade: esperança matemática, variância e desvio-padrão Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Resolver cálculos de esperança matemática. � Definir medidas de dispersão. � Realizar cálculos de variância e desvio-padrão. Introdução A análise estatística e a inferência sobre populações com base em amostras dependem de muitas medidas para que a tomada de decisões seja a melhor possível. Em estatística, dizemos que, quanto mais informações das características da variável em estudo tivermos, mais acertada será nossa decisão sobre ela. Neste capítulo, você descobrirá o que significa esperança matemática, variância e desvio-padrão. Esperança matemática A inferência estatística baseia-se no estudo de dados amostrais, e a busca da estimativa amostral (ou do valor esperado) ocorre para podermos estimar o verdadeiro parâmetro populacional para a tomada de decisão. A esperança matemática (estimativa) estuda como prever medidas populacionais desco- nhecidas, fundamentadas em resultados conhecidos na amostra. A rotina das pessoas é estabelecida pela inferência de fatos amostrais. Os exemplos citados por Milone (2006) revelam a naturalidade dessas apli- cações: em dias em que o céu está recheado de nuvens escuras, inferimos a possibilidade de chuvas; o fato de haver muita fumaça em uma edificação remete a uma eventualidade de um incêndio. Esses casos são eventos prováveis, mas nem sempre acontecem de fato. Na prática, há diversos fatos que buscam pela estimação e baseiam suas previsões, por exemplo, de vendas, de eleitores, de defeitos das peças em uma linha de produção, dos custos dos produtos, de dívidas, entre outros. Os dados descritivos amostrais são estimadores dos parâmetros populacionais. Por exemplo, a média amostral e a proporção amostral são consideradas esti- mativas pontuais, quando apresentadas a partir de um único número (ponto). Para estudos estatísticos, utilizamos com mais frequência a estimação por intervalo, que fornece um intervalo de valores possíveis, admitindo uma margem de confiança, considerando a estimativa pontual. Suponha que 500 pessoas são questionadas sobre seu consumo anual de carne vermelha, e a média amostral seja de 20 kg por pessoa, com desvio-padrão de 0,2 kg. � A média amostral de 20 kg é uma estimativa pontual para o consumo anual de carne vermelha por pessoa. � A média da população provavelmente está próxima de 20 kg, mas, possivelmente, não é exatamente igual a 20 kg. O intervalo de confiança estima o quanto a média amostral aproxima-se da média populacional. Se o intervalo de confiança fosse 20 ± 0,08, poderíamos calcular um nível de confiança que define a média populacional no intervalo ]19,92; 20,08[. Cálculo Seja p a probabilidade de um evento S ocorrer, a esperança matemática (E) é definida por: E = p ∙ S Distribuições de probabilidade: esperança matemática, variância e desvio-padrão2 Em um conjunto de dados de uma variável aleatória discreta x1, x2, ..., xn, em que a probabilidade de cada dado é p1, p2, ..., pn, respectivamente, define-se esperança matemática por: E(x) = p1 ∙ x1 + p2 ∙ x2 + ... pn ∙ xn Ou seja, E(x) = ∑ pi · xi n i = 1 Duas moedas são jogadas 14 vezes, e os resultados foram: � 5 jogadas sem nenhum resultado cara; � 6 jogadas, sendo apenas uma moeda cara; � 3 jogadas, sendo as duas moedas cara. Qual é o valor esperado de caras por lançamento? Temos que a probabilidade de nenhum resultado cara é: 5 14 , de apenas uma moeda ser cara: 6 14 ; e de as duas moedas serem cara: 3 14 . Assim, a esperança da variável cara ocorrer, por lançamento, é: 5 14 6 14 3 14 ∙ 0 + ∙ 1 + ∙ 2 = = 0,865 ∙ 0 + 6 ∙ 1 + 3 ∙ 2 14 Medidas de dispersão O estudo das medidas de posição é útil para fornecer boa parte das carac- terísticas de um conjunto de dados. Contudo, existem outros parâmetros que complementam a caracterização dos conjuntos, principalmente quando estes possuem uma disparidade consideravelmente grande para uma simples análise por medidas de posição. Chamamos esses parâmetros de medidas de dispersão, e eles indicam a variabilidade da variável em torno de uma medida de posição — comumente, a média aritmética. 3Distribuições de probabilidade: esperança matemática, variância e desvio-padrão Amplitude A amplitude é o mesmo que a variação entre dois elementos. Em um conjunto de dados, a amplitude total é encontrada por meio do cálculo da diferença entre o limite superior e o limite inferior, conforme segue: Ar = xmáx – xmin onde xmáx representa o limite superior, e xmin, o limite inferior. A amplitude é considerada uma medida instável, pois é influenciada pelas extremidades dos conjuntos. As próximas medidas não possuem essa caracte- rística, já que consideram todos os valores sob análise, sendo, assim, medidas mais utilizadas e com índices de variabilidade estáveis. Desvio médio O desvio médio é uma medida de dispersão, pela qual temos a média dos des- vios em relação a uma medida de posição, podendo ser a média das diferenças absolutas entre cada elemento do conjunto e a média aritmética. A seguinte expressão representa o desvio médio da população: D– m = ∑|x – μ| N onde x representa cada elemento do conjunto de dados, μ, a média da população, e N, a quantidade de desvios. Contudo, os dados analisados, na maioria dos estudos estatísticos, referem-se a uma amostra. Assim, para o cálculo do desvio médio amostral, utiliza-se a seguinte expressão, a qual fornece uma estimativa sem tendenciosidade do desvio médio da população. d – m = ∑|x – x–| n – 1 onde x representa cada elemento do conjunto de dados, x–, a média da população, e n, a quantidade de elementos na amostra. Distribuições de probabilidade: esperança matemática, variância e desvio-padrão4 Perceba que o desvio médio é uma medida não negativa. Por isso, calcula-se o módulo (valor absoluto) de cada desvio, pois entre cada uma das diferenças (de cada um dos valores com relação à média) pode-se ter valores positivos ou negativos. Ao se aplicar o módulo, elimina-se esse sinal. Variância A variância da população baseia-se no desvio médio. Para seu cálculo, os desvios em torno da média do conjunto são elevados ao quadrado. Sendo assim: σ2 = ∑(xi – μ) 2 N Em que xi representa cada elemento, μ, a média da população, e N, a quan- tidade de observações. A mesma explicação dada no cálculo do desvio médio vale para a variância, de modo que a variância de uma amostral é dada por: s2 = ∑(xi – x –)2 n – 1 onde 𝜎² é o valor numérico da variância, xi, representa cada elemento, x –, a média aritmética amostral, e n, o tamanho da amostra. Uma interpretação razoável do valor numérico da variância é dada por Anderson et al. (2006), quando sugere que a variância seja considerada como uma medida útil ao comparar a variabilidade entre variáveis, de modo que, em uma comparação de variáveis, aquela que tem a maior variância exibe maior variabilidade. Desvio-padrão A medida de dispersão, chamada desvio-padrão, é definida como a raiz qua- drada positiva da variância, simplesmente denotada por σ = √σ2, desvio-padrão da população. 5Distribuições de probabilidade: esperança matemática, variância e desvio-padrão O interesse em calcular e considerar o desvio-padrão como uma medida útil na análise estatística é que a variância se restringe a uma análise das unidades elevadas ao quadrado — por exemplo, a variância de medidas de comprimento é dada em medidas de área, enquanto que o desvio-padrão é medido nas mesmas unidades que os dados originais. Sendo assim, é facilmente comparado a outras medidas de posição ou outros dados estatísticos. Há, ainda, uma descrição de dados muito utilizada e derivada do desvio-padrão: o coeficiente de variação. Este é utilizado quando queremos comprar dois ou mais grupos de dados quanto à sua variabilidade e temos médias aritméticas distintas.Quanto menor for o coeficiente de variação, mais homogêneos serão os dados. Para casos com coeficiente de variação muito elevado, a média nem sempre será a medida de posição mais apropriada para resumir a variável. O coeficiente de variação é calculado em situações em que é preciso indicar o “tamanho” de , em relação à média aritmética. Ele é expresso em porcentagem, a partir de σ x– ∙ 100 % . Cálculos de variância e desvio-padrão A aplicação das expressões matemáticas indicadas anteriormente será mostrada aqui, a partir de alguns exemplos de cálculos de cada medida de dispersão. A resistência é uma característica importante para analisar materiais pré-fabricados. Cada um dos 8 elementos de placas pré-fabricadas de concreto foi submetido a um teste de tensão, e a largura máxima (mm) das trincas resultantes foi registrada no seguinte quadro: 0,794 3,870 0,483 0,924 2,230 1,038 1,285 0,598 Distribuições de probabilidade: esperança matemática, variância e desvio-padrão6 Qual é o desvio-padrão da largura das trincas? Solução: Para a resolução, utilizaremos três etapas: o cálculo da média, o cálculo da variância e, por fim, o desvio-padrão. 1. Cálculo da média aritmética: x– = ∑x n x– = 0,794 + 3,870 + 0,483 + 0,924 + 2,230 + 1,038 + 1,285 + 0,598 8 x– = 1,4 mm 2. Cálculo da variância: A partir da média, calculamos os desvios de cada elemento. s2 = ∑(xi – x –)2 n – 1 σ2 = (0,794 – 1,4) 2 + (3,87 – 1,4)2 + (0,483 – 1,4)2 + (0,924 – 1,4)2 + (2,23 – 1,4)2 + (1,038 – 1,4)2 + (1,285 – 1,4)2 + (0,598 – 1,4)2 8 – 1 s2 = 9,012 7 = 1,287 mm2 3. Cálculo do desvio-padrão: Sendo a variância 1,287, temos que: s = √1,287 = 1,135 mm Qual é o desvio-padrão da vida útil (em horas) de um determinado tipo de lâmpada, considerando as 20 observações amostrais a seguir? xi fi 612 4 666 3 7Distribuições de probabilidade: esperança matemática, variância e desvio-padrão xi fi 744 6 883 5 964 2 Total 20 Solução: As mesmas etapas do exemplo anterior devem ser seguidas. Entretanto, agora temos uma distribuição de frequências. Para o cálculo da média, será necessário multiplicarmos cada variável (vida útil) pela sua respectiva frequência. 1. Cálculo da média aritmética: x– = ∑(xi · fi) ∑fi x– = (612 · 4) + (666 · 3) + (744 · 6) + (883 · 5) + (964 · 2) 4 + 3 + 6 + 5 + 2 x– = 15.253 20 = 762,65 h 2. Cálculo da variância: s2 = ∑(xi – x –)2 n – 1 σ2 = 4 · (612 – 762,65) 2 + 3 · (666 – 762,65)2 + 6 · (744 – 762,65)2 + 5 · (883 – 762,65)2 + 2 · (964 – 762,65)2 20 –1 s2 = 274.396,6 19 = 14.441,93 h2 3. Cálculo do desvio-padrão: s = √14441,93 = 120,17 h Distribuições de probabilidade: esperança matemática, variância e desvio-padrão8 Os dados a seguir representam o tempo (em segundos) para carga de um aplicativo, num sistema compartilhado. Classes de tempo Número de observações [6, 7[ 14 [7, 8[ 4 [8, 9[ 7 [9, 10[ 3 [10, 11[ 0 [11, 12[ 0 [12, 13[ 2 Total 30 Determine o desvio-padrão e o coeficiente de variação dessa amostra. Solução: Nesse caso, temos uma distribuição de frequência em intervalos de classe. Por isso, precisamos encontrar o ponto médio de cada intervalo para, então, calcular a média e prosseguir com os cálculos das medidas de dispersão. Classes de tempo xi (ponto médio da classe) Número de observações [6, 7[ 6,5 14 [7, 8[ 7,5 4 [8, 9[ 8,5 7 [9, 10[ 9,5 3 [10, 11[ 10,5 0 [11, 12[ 11,5 0 [12, 13[ 12,5 2 Total 30 9Distribuições de probabilidade: esperança matemática, variância e desvio-padrão ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatística aplicada à administração e economia. 2. ed. São Paulo: Cengage Learning, 2008. MILONE, G. Estatística: geral e aplicada. São Paulo: Thomson Learning, 2006. Leitura recomendada MORETTIN, L. G. Estatística básica: probabilidade e inferência. São Paulo: Pearson Pren- tice Hall, 2010. 1. Cálculo da média aritmética: x– = (6,5 · 14) + (7,5 · 4) + (8,5 · 7) + (9,5 · 3) + (10,5 · 0) + (11,5 · 0) + (12,5 · 2) 14 + 4 + 7 + 3 + 0 + 0 + 2 x– = 234 30 = 7,8 s (Em distribuições de frequência como essas, os valores de x_i são expressos pelos respectivos pontos médios dos intervalos de classe). x– = (6,5 · 14) + (7,5 · 4) + (8,5 · 7) + (9,5 · 3) + (10,5 · 0) + (11,5 · 0) + (12,5 · 2) 14 + 4 + 7 + 3 + 0 + 0 + 2 x– = 234 30 = 7,8 s 2. Cálculo da variância: s2 = ∑(xi – x –)2 n – 1 s2 = 14 · (6,5 – 7,8) 2 + 4 · (7,5 – 7,8)2 + 7 · (8,5 – 7,8)2 + 3 · (9,5 – 7,8)2 + 2 · (12,5 – 7,8)2 30 –1 s2 = 80,3 29 = 2,769 s 2 3. Cálculo do desvio-padrão: s = √2,769 = 1,664 s Distribuições de probabilidade: esperança matemática, variância e desvio-padrão10 Conteúdo:
Compartilhar