Baixe o app para aproveitar ainda mais
Prévia do material em texto
UVA Universidade Veiga de Almeida Profª: Cinira Fernandes Estatística 1/ APOSTILA 4 MEDIDAS DE TENDÊNCIA CENTRAL (OU DE POSIÇÃO) As medidas de posição nos mostram a localização dos elementos da amostra quando esta é disposta em rol. As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana. Outras médias utilizadas são: geométrica, harmônica, quadrática, cúbica e bi quadrática. MÉDIA ARITMÉTICA ( ) Para valores discretos: É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores. .... onde xi são os valores da variável e n o número de valores. n = ∑ ���� Exemplos: a) Considerando um grupo de 5 pessoas com 22, 20, 21, 24 e 20 anos, calcule a idade média. b) Calcular a média aritmética ponderada de um aluno que obteve no bimestre 8,0 (peso 2), 7,0 na pesquisa (peso 3), 9,0 no debate (peso 1) e 5,0 no trabalho de equipe (peso 2). • Para valores agrupados em classes: Quando os dados estão agrupados, aceita-se, por convenção, que as freqüências se distribuem uniformemente ao longo da classe e que, portanto, o ponto médio da classe é o valor representativo do conjunto. Nesse caso, a média é calculada partindo-se do ponto médio da classe. onde Xi é o ponto médio da classe. ∑ ∑ = = = n i n i ii fi fX X 1 1 n fX n i ii X ∑ = =1 Exemplo: Calcular a estatura média de bebês conforme a tabela abaixo. Estaturas (cm) freqüência = fi ponto médio = xi ..xi.fi. 50 |------------ 54 4 52 208 54 |------------ 58 9 56 504 58 |------------ 62 11 60 660 62 |------------ 66 8 64 512 66 |------------ 70 5 68 340 70 |------------ 74 3 72 216 Total 40 2.440 Aplicando a fórmula acima temos: 2.440 / 40.= 61. logo... = 61 cm MODA - Mo É o valor que ocorre com maior freqüência em uma série de valores. Ex: O salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa fábrica. Ex: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10. Ex: A série { 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal Ex: A série { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série é bimodal. Com intervalos de classe: A classe que apresenta a maior freqüência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. Mo = ( li + Ls ) / 2 onde li = limite inferior da classe modal e Ls = limite superior da classe modal Exemplo: Calcule a estatura modal conforme a tabela abaixo. Classes (em cm) Freqüência 54 |------------ 58 9 58 |------------ 62 11 62 |------------ 66 8 66 |------------ 70 5 Resp: a classe modal é 58|-------- 62, pois é a de maior freqüência. l*=58 e L*=62 Mo = (58+62) / 2 = 60 cm ( este valor é estimado, pois não conhecemos o valor real da moda). MEDIANA - Md A mediana de um conjunto de valores, dispostos segundo uma ordem ( crescente ou decrescente), é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. Exemplo: Na série { 5, 2, 6, 13, 9, 15, 10 } a mediana é 9. Atenção! Se a série dada tiver número ímpar de termos: O valor mediano será o termo de ordem dado pela fórmula:.( n + 1 ) / 2 Se a série dada tiver número par de termos: O valor mediano será o termo de ordem dado pela fórmula :..[( n/2 ) +( n/2+ 1 )] / 2 Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 } n = 10 logo a fórmula ficará: [( 10/2 ) + (10/2 + 1)] / 2 [( 5 + 6)] / 2 será na realidade (5º termo+ 6º termo) / 2 5º termo = 2 6º termo = 3 A mediana será = (2+3) / 2 ou seja, Md = 2,5 . A mediana no exemplo será a média aritmética do 5º e 6º termos da série. A mediana em dados agrupados Ex: classes freqüência = fi Freqüência acumulada 50 |------------ 54 4 4 54 |------------ 58 9 13 58 |------------ 62 11 24 62 |------------ 66 8 32 66 |------------ 70 5 37 70 |------------ 74 3 40 total 40 = 40 / 2 =20 ( 20ªposição) logo.a classe mediana será 58 |---- 62 li= 58 faa = 13 fmd = 11 hmd = 4 Substituindo esses valores na fórmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 OBS: Esta mediana é estimada, pois não temos os 40 valores da distribuição. Emprego da Mediana • Quando desejamos obter o ponto que divide a distribuição em duas partes iguais. • Quando há valores extremos que afetam de maneira acentuada a média aritmética. • Quando a variável em estudo é salário. md md aa i hf fnlMd −+= )2/( MEDIDAS DE DISPERSÃO As medidas de dispersão indicam o quanto os dados se apresentam dispersos em torno da região central. Dispersão ou Variabilidade: É a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central ( média ou mediana ) tomado como ponto de comparação. A média - ainda que considerada como um número que tem a faculdade de representar uma série de valores - não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto. Ex: Consideremos os conjuntos A = {6, 6, 6, 6, 6, 6, 6}, B = {3, 4, 5, 6, 7, 8, 9}, C = {1, 2, 3, 6, 9, 10, 11} A média aritmética nos três conjuntos é igual a 6. As principais medidas de dispersão são: DESVIO (Di) O desvio é definido como sendo a medida do grau de dispersão de cada valor da variável em relação à média. Exemplo: __ Seja o conjunto B = {3, 4, 5, 6, 7, 8, 9} X = 42/7 = 6 D1 = 3 – 6 = – 3 D5 = 7 – 6 = 1 D2 = 4 – 6 = -2 D6 = 8 – 6 = 1 D3 = 5 – 6 = - 1 D7 = 9 – 6 = 3 D4 = 6 – 6 = 0 Exemplo: Calcular o desvio médio do conjunto de números { - 4 , - 3 , - 2 , 3 , 5 } = - 0, 2 e Md = - 2 Tabela auxiliar para cálculo do desvio médio Xi Xi - | Xi - | Xi - Md | Xi - Md | - 4 (- 4) - (-0,2) = -3,8 3,8 (- 4) - (-2) = - 2 2 - 3 - 2 3 5 ∑ = 16,8 ∑ = 15 Pela Média : Dm = ....../ 5 = 3,36 Pela Mediana : Dm = .... / 5 = 3 VARIÂNCIA- S2 Define-se variância como sendo a média aritmética dos quadrados dos desvios. É o desvio padrão elevado ao quadrado. A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é extremamente importante na inferência estatística e em combinações de amostras. DESVIO PADRÃO - S É a medida de dispersão mais geralmente empregada, pois leva em consideração a totalidade dos valores da variável em estudo. É um indicador de variabilidade bastante estável. O desvio padrão baseia-se nos desvios em torno da média aritmética e a sua fórmula básica pode ser traduzida como: a raiz quadrada da média aritmética dos quadrados dos desvios e é representada por S . Ex: Calcular o desvio padrão da população representada por - 4 , -3 , -2 , 3 , 5 Xi - 4 - 3 - 2 3 5 ∑�� = Sabemos que n = 5 e 62,8 / 5 =12,56. A raiz quadrada de 12,56 é o desvio padrão S= 3,54 ATENÇÃO! Quando nosso interesse não se restringe à descrição dos dados mas, partindo da amostra, visamos tirar inferências válidas para a respectiva população, convém efetuar uma modificação, que consiste em usar o divisor n - 1 em lugar de n. A fórmula ficará então: • Quando os dados estão agrupados (temos a presença de freqüências) a fórmula do desvio padrão ficará: Ex: Calcule o desvio padrão populacional da tabela abaixo: Xi f i Xi . f i . f i 0 2 0 2,1 -2,1 4,41 8,82 1 6 6 2,1 -1,1 1,21 7,26 2 12 24 2,1 -0,1 0,01 0,12 3 7 21 2,1 0,9 0,81 5,67 4 3 12 2,1 1,9 3,61 10,83 Total ∑ = - Sabemos que ∑ fi =......... e 32,7 / 30 = 1,09. - A raiz quadrada de........ é o desvio padrão = ............. Exemplo : Em uma turma, verificou-se através da análise das notas de 15 alunos, os seguintes desempenhos: Alunos Conceito na Prova 1 4,3 2 4,5 3 9 4 6 5 8 6 6,7 7 7,5 8 10 9 7,5 10 6,3 11 8 12 5,5 13 9,7 14 9,3 15 7,5 Total 109,8 Média Desvio Padrão Observamos no exemplo, que a média das provas, foi estimada em ........com desvio padrão em ........Concluímos que a maioria das notas concentrou-se em .......... e ........ . . Exercícios: 1) Calcule a amplitude, média e desvio padrão para os seguintes conjuntos de valores: a) {3; 3; 3; 3 } b) {2; 4; 6; 6; 6} c) {3; 5; 1; 5; 2; 4} 2) A tabela abaixo apresenta o tempo de internação, em dias, de pacientes acidentados no trabalho, em um dado hospital. De posse desses dados, calcule a média e o desvio padrão para esses valores. 3) O concurso para professor substituto da UFPR é constituído das provas de entrevista, títulos, escrita e didática, que têm respectivamente os pesos 1, 2, 3 e 4. Qual a média de um candidato que obteve as notas 80, 90, 70 e 80? 4) Considere 2 empresas que pagam os seguintes salários aos seus funcionários, em reais(R$): • Empresa A: 500,00; 600,00; 600,00; 700,00; 700,00; 800,00; 800,00; 800,00; 900,00; 900,00; 1000,00; 1000,00; 1100,00; • Empresa B: 100,00; 100,00; 100,00; 200,00; 200,00; 200,00; 300,00; 300,00; 500,00; 6000,00; a) Calcule e interprete as medidas de tendência central (média aritmética, mediana e moda) referentes à relação salarial de cada empresa. b) Ao analisar as medidas de tendência central (MTC) e esboçar, em um gráfico, a distribuição dos salários pagos pela empresa A, o que se pode concluir sobre a relação existente entre as suas MTC? Quanto à sua distribuição, ela é uma distribuição simétrica ou assimétrica ? c) Fazer o mesmo solicitado na letra b) para a empresa B. d) Encontre o desvio-padrão dos salários pagos pela empresa A e dos salários pagos pela empresa B, considerado o número total de salários que cada empresa paga. e) Comparando a média salarial da empresa A com a média salarial da empresa B, pode-se afirmar que as 2 médias têm a mesma representatividade? Justifique com base no desvio-padrão. f) Com base na conclusão da letra d), em qual das duas empresas você gostaria de trabalhar? Por quê? 5) Um dado foi lançado 50 vezes. A tabela a seguir mostra os seis resultados possíveis e as suas respectivas freqüências de ocorrências: Resultado 1 2 3 4 5 6 Freqüência 7 9 8 7 9 10 A freqüência de aparecimento de um resultado ímpar foi de: a) 2/5 b) 11/25 c) 12/25 d) ½ e) 13/25 6) Um laboratório clínico precisa se decidir por um entre três instrumentos (A,B e C) que será utilizado para fazer dosagens químicas no sangue. Foram preparadas soluções contendo uma concentração conhecida (10mg= ml) da substância a ser dosada. Os resultados obtidos com cada instrumento seguem abaixo: A: 5 10 7 15 16 12 4 8 10 13 B: 11 10 11 10 12 9 10 8 9 10 C: 9 10 8 9 9 8 10 11 7 9 Em medidas clínicas, três termos são utilizados freqüentemente: precisão, não-viciado e exatidão. i. Precisão: refere-se à dispersão de um conjunto de observações. Quanto menor a variabilidade maior a precisão. ii. Não-viciado: refere-se à tendência de um conjunto de medidas ser igual a um verdadeiro valor. iii. Para um instrumento ser Exato suas leituras precisam ser tanto precisas quanto não- viciadas. (a) Determine a média o desvio padrão para os três instrumentos. (b) Descreva os instrumentos em termos destas definições. (c) Qual instrumento você recomendaria ao laboratório? Justifique. 7) A tabela abaixo apresenta dados da vida útil de 100 baterias para automóveis (em meses). Construa o histograma e determine medidas de tendência central e dispersão. Comente os resultados Durabilidade Número de baterias 0 3 2 3 6 5 6 9 15 9 12 25 12 15 30 15 18 23 8) As concentrações de óxido de nitrogênio e de hidrocarbono (em µg=m3) foram determinadas em uma área urbana, em locais e horários específicos. Os dados são mostrados a seguir: D1a Nitrogen.Oxides Hydrocarbons 1 104 108 2 116 118 3 84 89 4 77 71 5 61 66 6 84 83 7 81 88 8 72 76 9 61 68 10 97 96 11 84 81 Calcule as médias e desvios padrão para cada variável e para a variável diferença entre as concentrações dos poluentes. 9) Os dados abaixo referem-se ao salário (em salários mínimos) de 20 funcionários administrativos em uma indústria. 10,1 7,3 8,5 5,0 4,2 3,1 2,2 9,0 9,4 6,1 3,3 10,7 1,5 8,2 10,0 4,7 3,5 6,5 8,9 6,1 a) construa uma tabela de freqüência agrupando os dados em intervalos de amplitude 2, a partir de 1; b) construa o histograma. 10) Uma pesquisa com usuários de transporte coletivo na cidade de São Paulo indagou sobre os diferentes tipos usados nas suas locomoções diárias. Dentre ônibus, metro e trem, o número de diferentes meios de transporte utilizados foi o seguinte: 2, 3, 2, 1, 2, 1, 2, 1, 2, 3, 1, 1, 1, 2, 2, 3, 1, 1, 1, 1, 2, 1, 1, 2, 2, 1, 2, 1, 2, 3. a) organize uma tabela de freqüência; b) faça uma representação gráfica; c) admitindo que essa amostra represente bem o comportamento do usuário paulistano, você acha que a porcentagem dos usuários que utilizam mais de um tipo de transporte é grande?
Compartilhar