Baixe o app para aproveitar ainda mais
Prévia do material em texto
AUTARQUIA EDUCACIONAL DO ARARIPE – AEDA FACULDADE DE CIÊNCIAS HUMANAS E SOCIAIS DE ARARIPINA - FACISA INTRODUÇÃO À ESTATÍSTICA 1. O QUE É ESTATÍSTICA? Durante um telejornal, o repórter divulgou uma pesquisa segundo a qual apenas 5% dos brasileiros têm o hábito de ler jornal diariamente. Você já pensou em como são feitas pesquisas como essa? Como é possível entrevistar toda a população brasileira para saber a porcentagem de leitores de jornal? Veremos, neste breve curso, que não é necessário entrevistar toda a população para se chegar a uma determinada conclusão sobre ela. Chegar a esse tipo de conclusão é objeto da estatística. Como uma primeira ideia, podemos entender a estatística como um método de estudo de comportamentos coletivos cujas conclusões são traduzidas em resultados numéricos. 2. UNIVERSO ESTATÍSTICO OU POPULAÇÃO ESTATÍSTICA O conjunto da totalidade dos indivíduos sobre o qual se faz uma inferência recebe o nome de população ou universo. A população congrega todas as observações que sejam relevantes para o estudo de uma ou mais características dos indivíduos, os quais podem ser concebidos tanto como seres animados ou inanimados. Em linguagem mais formal, a população é o conjunto constituído por todos os indivíduos que apresentem pelo menos uma característica comum, cujo comportamento interessa analisar (inferir). Exemplo: O governo encomenda ao IBGE (Instituto Brasileiro de Geografia e Estatística) uma pesquisa para conhecer o salário médio do brasileiro. O universo estatístico ou população estatística é, nesse caso, o conjunto de todos os assalariados brasileiros. Prof. THIAGO MAGALHÃES Página 2 3. AMOSTRA Quando o universo estatístico é muito vasto ou quando não é possível coletar dados de todos os seus elementos, retira-se desse universo um subconjunto, chamado de amostra, e os dados são coletados nessa amostra. Para que a amostra seja representativa, isto é, para que ela não apresente tendências diferentes das do universo estatístico, devemos adotar critérios para torná-la imparcial. Exemplo: Suponha-se, que se pretenda conhecer o conteúdo de ferro natural a ser exportado por um navio. O agregado ou população consiste em todo o minério de ferro a ser exportado por esse navio. Parte do minério é examinada, a fim de determinar seu teor de ferro, com o objetivo de tirar uma conclusão a respeito do teor de ferro natural do embarque completo. A parte de mineral selecionado constitui a amostra do embarque. Uma vez que se fará inferência sobre todo o minério embarcado a partir de apenas uma porção dele, a base do processo é a informação incompleta ou de amostra. 3.1. AMPLITUDE DE UMA AMOSTRA As estaturas, em metros, de vinte mulheres estão representadas na seguinte amostra: 1,59 1,60 1,65 1,72 1,58 1,50 1,48 1,62 1,65 1,65 1,70 1,58 1,45 1,63 1,65 1,68 1,50 1,43 1,49 1,56 Observe que a maior medida da amostra é 1,72m e que a menor é 1,43m. Dizemos que a amplitude dessa amostra é: 1,72 – 1,43 = 0,29m. Definição: A amplitude de uma amostra de números é b – a se, e somente se, b e a são, respectivamente, o maior e o menor número dessa amostra. Prof. THIAGO MAGALHÃES Página 3 4. ROL É toda sequência (a1; a2; a3; ...; an) de dados numéricos tal que: - cada termo, a partir do segundo, é maior ou igual ao seu antecessor; - ou cada termo, a partir do segundo, é menor ou igual ao seu antecessor. Exemplo: Ordenar (colocar em rol) as estaturas das vinte mulheres. 1,72 – 1,70 – 1,68 – 1,65 – 1,65 – 1,65 – 1,65 – 1,63 – 1,62 – 1,60 – 1,59 – 1,58 – 1,58 – 1,56 – 1,50 – 1,50 – 1,49 – 1,48 – 1,45 – 1,43 5. DISTRIBUIÇÃO DE FREQUÊNCIA Uma amostra de potes de margarina apresentou as seguintes massas, em gramas: 480; 505; 490; 500; 510; 450; 500; 470; 520; 550; 460; 500; 530; 480. Podemos separar os elementos dessa amostra em róis disjuntos; por exemplo: I. 450; 460; 470 II. 480; 480; 490 III. 500; 500; 500; 505; 510 IV. 520; 530 V. 550 Qualquer intervalo real, aberto, semiaberto ou fechado que contenha um rol da amostra é chamado de classe. Com relação aos róis disjuntos das massas da amostra dos potes de margarina, podemos ter, por exemplo: - o intervalo 450 ⊢ 480 - o intervalo 480 ⊢ 500 - o intervalo 500 ⊢ 520 - o intervalo 520 ⊢ 540 - o intervalo 540 ⊢ 560 Para dados quantitativos contínuos, geralmente resultantes de medições de características da qualidade de peças ou produtos, dividimos a faixa de variação dos dados em intervalos de classes. O menor valor da classe é denominado limite inferior (Li) e o maior valor da classe é denominado limite superior (Lsup). Prof. THIAGO MAGALHÃES Página 4 Convenção: o símbolo a ⊢ b indica o intervalo fechado no extremo da esquerda e aberto no extremo da esquerda, isto é: [a, b[. 5.1. CRITÉRIOS PARA FORMAÇÃO DE CLASSES Para separar os elementos de uma amostra de classes, adotamos alguns critérios com o objetivo de não permitir que um elemento da amostra pertença a mais de uma classe ou que não pertença a nenhuma delas. Esses critérios podem ser: I. Se a e b são, respectivamente, o menor e o maior elemento da amostra, então o extremo inferior da 1ª classe deve ser menor ou igual a a e o extremo superior da última classe deve ser maior que b; II. O extremo inferior de cada classe, a partir da 2ª, deve ser igual ao extremo superior da classe imediatamente anterior. Nota: esses critérios não são obrigatórios, mas são convenientes, principalmente para a construção de histogramas. 5.2 FREQUÊNCIA DE CLASSE A quantidade de elementos da amostra que pertencem a uma determinada classe é chamada de “frequência dessa classe”. No exemplo introdutório, separamos as massas (em gramas) dos potes de margarina segundo as classes: 450 ⊢ 480; 480 ⊢ 500; 500 ⊢ 520; 520 ⊢ 540; 540 ⊢ 560. - A frequência da classe 450 ⊢ 480 é igual a 3, pois 3 elementos da amostra pertencem a essa classe. - A frequência da classe 480 ⊢ 500 é igual a 3, pois 3 elementos da amostra pertencem a essa classe. - Analogamente, a classe 500 ⊢ 520, a classe 520 ⊢ 540 e a classe 540 ⊢ 560 têm frequências, respectivamente, iguais a 5, 2 e 1. Podemos apresentar as classes com suas respectivas frequências através de uma tabela chamada de tabela de distribuição de frequência: Prof. THIAGO MAGALHÃES Página 5 Classe (massa em gramas) Frequência (nº de potes) 450 ⊢ 480 3 480 ⊢ 500 3 500 ⊢ 520 5 520 ⊢ 540 2 540 ⊢ 560 1 6. AMPLITUDE DE UMA CLASSE Definição: Se a e b são extremos de uma classe, com a < b, chama-se amplitude dessa classe o número b – a. Na tabela anterior: - a classe 450 ⊢ 480 tem amplitude igual a 480 – 450 = 30, em gramas. - a classe 480 ⊢ 500 tem amplitude igual a 500 – 480 = 20, em gramas. 7. CLASSES UNITÁRIAS Podemos considerar uma classe como um único número real. Esse tipo de classe é denominado classe unitária. Exemplo: Para participar de uma olimpíada, um técnico fez teste com 40 ginastas que concorriam a uma vaga à ginástica rítmica. Veja, a seguir, a tabela de distribuição de frequência que mostra o desempenho das ginastas no teste. Classe (nota atribuída) Frequência (número de ginastas) 6,0 5 6,5 4 7,0 6 7,5 8 8,0 8 Prof. THIAGO MAGALHÃES Página 6 8,5 4 9,0 2 9,5 2 10,0 1 As notas atribuídas são classes unitárias, pois cada uma é um único número real. 8. FREQUÊNCIA RELATIVA DE UMA CLASSE Consideremos a tabela do exemplo anterior: A soma de todas as frequências, 5 + 4 + 6 + 8 + 8 + 4 + 2 + 2 + 1 = 40, é a frequência total (Ft ou 𝚺F) da distribuição. Dividindo a frequência F de uma classe pela frequência total Ft obtemos um número chamado de frequência relativa da classe. É usual apresentar-se a frequência relativa em porcentagem.Indicando a frequência relativa de uma classe por F%, tem-se que: F% = (F/Ft).100% Da tabela anterior temos, por exemplo, que: - a classe 6,0 tem frequência relativa igual a (5/40).100% = 0,125.100% = 12,5% - a classe 6,5 tem frequência relativa igual a (4/40).100% = 0,1.100% = 10% - a classe 7,0 tem frequência relativa igual a (6/40).100% = 0,15.100% = 15% Podemos então apresentar a tabela de distribuição de frequência e de frequência relativa: Classe (nota atribuída) F F% 6,0 5 12,5% 6,5 4 10% 7,0 6 15% 7,5 8 20% 8,0 8 20% 8,5 4 10% 9,0 2 5% 9,5 2 5% 10,0 1 2,5% Prof. THIAGO MAGALHÃES Página 7 𝚺 40 100% 9. REPRESENTAÇÃO GRÁFICAS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA Uma distribuição de frequência pode ser representada graficamente. Tais gráficos dividem-se em duas categorias: os de informação e os de análise. Os gráficos de informação têm como finalidade oferecer informações apenas quantitativas sobre a distribuição de frequência. Os de análise se destinam a estudos mais profundos, exigindo portanto maior precisão e rigor. Neste curso, vamos tratar apenas dos gráficos de informação. Alguns tipos desses gráficos são: - gráfico de barras verticais; - gráfico de barras horizontais; - gráfico por setores; - histograma. Vamos construir o gráfico de barras verticais, o gráfico de barras horizontais e o gráfico por setores, através do seguinte exemplo: para se ter uma ideia do nível de ensino numa determinada faculdade, escolheu-se uma amostra de 300 alunos do curso de Administração e aplicou-se uma prova. A tabela de distribuição de frequência abaixo mostra o resultado dessa prova. Classe (nota atribuída) Frequência (número de alunos) 2,0 40 3,0 85 5,0 75 6,0 50 7,0 30 8,0 20 Assim, temos: Prof. THIAGO MAGALHÃES Página 8 Gráfico de barras verticais Gráfico de barras horizontais Gráfico por setores Divide-se um círculo em setores, com ângulos proporcionais às frequências das classes. 0 10 20 30 40 50 60 70 80 90 1 2 3 4 5 6 7 8 Nº de alunos As frequências são dispostas num eixo vertical. 0 20 40 60 80 100 1 2 3 4 5 6 7 8 Nota As frequências são dispostas num eixo horizontal. Prof. THIAGO MAGALHÃES Página 9 10. HISTOGRAMA O histograma é um gráfico utilizado para representar uma distribuição de frequência em que as classes não são unitárias. O histograma é composto por retângulos (denominados células), cada um deles representando um conjunto de valores próximos (as classes). A largura da base de cada célula deve ser proporcional à amplitude do intervalo da classe que ela representa e a área de cada célula deve ser proporcional à frequência da mesma classe. Se todas as classes tiverem igual amplitude, então as alturas dos retângulos serão proporcionais às frequências das classes que eles representam. Construção: Na tabela de distribuição de frequência, acrescentamos uma coluna com os pontos médios de cada intervalo de classe, denotada por xm. Esta é definida como a média dos limites da classe sup 2 i m L L x . Estes valores são utilizados na construção. Algumas indicações na construção de distribuição de frequências são: - Na medida do possível, as classes deverão ter amplitudes iguais. - Escolher os limites dos intervalos entre duas possíveis observações. - O número de intervalos não deve ultrapassar 20. - Escolher limites que facilitem o agrupamento. - Marcar os pontos médios dos intervalos. 2 13% 3 28% 5 25% 6 17% 7 10% 8 7% Notas Prof. THIAGO MAGALHÃES Página 10 - Ao construir o histograma, cada retângulo deverá ter área proporcional à frequência relativa (ou à frequência absoluta, o que dá no mesmo) correspondente. Exemplo: Numa fábrica de motores elétricos, o gerente de produção precisa avaliar o problema de ruído excessivo do motor. Uma das possíveis causas está associada com variações no diâmetro do eixo. Assim, o gerente de produção mediu o diâmetro do eixo de 200 motores e o resultado está apresentado na tabela a seguir. Os valores estão em milésimos de milímetros. Classe Frequência Freq. Relativa F% Fac% Ponto médio [4,2 ; 4,4) 12 0,06 6 6 4,3 [4,4 ; 4,6) 16 0,08 8 14 4,5 [4,6 ; 4,8) 31 0,15 15,5 29,5 4,7 [4,8 ; 5) 66 0,33 33 62,5 4,9 [5 ; 5,2) 35 0,17 17,5 80 5,1 [5,2 ; 5,4) 25 0,12 12,5 92,5 5,3 [5,4 ; 5,6) 11 0,06 5,5 98 5,5 [5,6 ; 5,8) 4 0,02 2 100 5,7 E então, construímos o histograma correspondente. Prof. THIAGO MAGALHÃES Página 11 MEDIDAS DE POSIÇÃO E DISPERSÃO 1. INTRODUÇÃO Para avaliar o desempenho dos alunos do 3º Período de Administração, um professor estabeleceu o seguinte critério na escolha das questões para uma avaliação bimestral: - considera-se desempenho bom o de um aluno que obtenha nota maior ou igual a 7; - considera-se desempenho regular o de um aluno que obtenha nota maior ou igual a 5 e menor que 7; - considera-se desempenho fraco o de um aluno que obtenha nota menor que 5. A tabela seguinte mostra as notas dos vinte alunos de uma das salas que fizeram a prova: 8,0 5,5 6,5 3,0 4,5 8,0 5,5 6,0 6,5 2,0 4,0 7,5 6,5 4,5 5,0 10,0 4,0 8,0 7,0 8,0 Analisando individualmente a nota de cada aluno, podemos classificar o desempenho como bom, regular ou fraco. Para uma análise do desempenho da classe como um todo, necessitamos de alguns parâmetros: as medidas de posição Histograma Dados F re q ü ê n ci a 4.5 5.0 5.5 0 1 0 2 0 3 0 4 0 5 0 6 0 Prof. THIAGO MAGALHÃES Página 12 (ou de tendência central) e as medidas de dispersão, que servem para nos orientar à tendência da amostra. 2. MEDIDAS DE POSIÇÃO (MEDIDAS DE TENDÊNCIA CENTRAL) As medidas de posição que nos mostram o posicionamento dos elementos da amostra quando esta é disponível em rol. Algumas medidas de posição são: a média aritmética, a mediana e a moda. 2.1. MÉDIA ARITMÉTICA Seja X uma variável que assume os valores x1, x2, x3 ,..., xn. A média aritmética simples de X, representada por x , é definida por: 1 2 3 ... nx x x xx n ou ix x n xi : são os valores que a variável X assume n: número de elementos da amostra observada Exemplo: A produção leiteira diária da vaca B, durante uma semana, foi de 10, 15, 14, 13, 16, 19, e 18 litros. Determinar a produção média da semana (a média aritmética). ix x n ⟶ 10 15 14 13 16 19 18 15 7 x 2.2. MÉDIA ARITMÉTICA PONDERADA Se os valores da variável forem agrupados em uma distribuição de frequências será usada a média aritmética dos valores x1, x2, x3 ,..., xn ponderadas pelas respectivas frequências absolutas: f1, f2, f3 ,..., fn. .i ix f x n onde x : valores observados da variável ou ponto médio das classes f : frequência simples absoluta : número de elementos da amostra observada i i if n Prof. THIAGO MAGALHÃES Página 13 A fórmula acima será usada para as distribuições de frequências sem classes e com classes. (Dados sem classes): Determinar a média aritmética da tabela abaixo Número de filhos de um grupo de 50 casais Número de filhos ( xi ) Número de casais ( fi ) xi . ƒi 0 6 0.6 = 0 1 16 1.16 = 16 2 9 2.9 = 18 3 8 3.8 = 24 4 3 4.3 = 12 5 3 5.3 = 15 6 3 6.3 = 18 7 2 7.2 = 14 Total () 50 . 0 16 18 24 12 15 18 14 2,34 50 i ix f x n Os 50 casais possuem, em média, 2,3 filhos. Média aritmética para dados agrupados com classes intervalares Quando as classes não são unitárias para calcular a média tomamos o ponto médio xm de cada classee calculamos a média aritmética ponderada entre os valores de xm, atribuindo a cada um o peso igual à frequência da respectiva classe. (Dados com classes): Determinar a média aritmética da tabela abaixo. Taxas municipais de urbanização, no Estado de Alagoas (em %) em 1970. Número Prof. THIAGO MAGALHÃES Página 14 Taxas (em %) de Município s ( fi ) xm xm . ƒi 6 ⊢ 16 29 6 16 22 11 2 2 11.29 = 319 16 ⊢ 26 24 16 26 42 21 2 2 21.24 = 504 26 ⊢ 36 16 26 36 62 31 2 2 31.16 = 496 36 ⊢ 46 13 36 46 82 41 2 2 41.13 = 533 46 ⊢ 56 4 46 56 102 51 2 2 51.4 = 204 56 ⊢ 66 3 56 66 122 61 2 2 61.3 = 183 66 ⊢ 76 2 66 76 142 71 2 2 71.2 = 142 76 ⊢ 86 2 76 86 162 81 2 2 81.2 = 164 86 ⊢ 96 1 86 96 182 91 2 2 91.1 = 91 Total () 94 . 319 504 496 533 204 183 142 164 91 28,04 94 m ix f x n Propriedades da média aritmética 1ª propriedade A soma algébrica dos desvios em relação à média é zero (nula). di = (xi - x) = 0 onde: di são as distâncias ou afastamentos da média. Prof. THIAGO MAGALHÃES Página 15 Em uma distribuição simétrica será igual a zero e tenderá a zero se a distribuição for assimétrica. Idades ( xi ) di = xi - x 2 d1 = 2 – 6 = -4 4 d2 = 4 – 6 = -2 6 d3 = 6 – 6 = 0 8 d4 = 8 – 6 = +2 10 d5 = 10 – 6 = +4 0 2 4 6 8 10 6 5 x 2ª propriedade Somando-se ou subtraindo-se uma constante (c) a todos os valores de uma variável, a média do conjunto fica aumentada ou diminuída dessa constante. Somar o valor 2 aos dados da tabela e calcular a nova média Idades ( xi ) xi + 2 2 2 + 2 = 4 4 4 + 2 = 6 6 6 + 2 = 8 8 8 + 2 = 10 10 10 + 2 = 12 40 A nova média será: 40 8 5 x No caso, a média aritmética anterior ficou aumentada de 2. 3ª propriedade Prof. THIAGO MAGALHÃES Página 16 Multiplicando-se ou dividindo-se todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada ou dividida por essa constante: Multiplicar o valor 2 aos dados da tabela e calcular a nova média Idades ( xi ) xi . 2 2 2 . 2 = 4 4 4 . 2 = 8 6 6 . 2 = 12 8 8 . 2 = 16 10 10 . 2 = 20 60 A nova média será: 60 12 5 x No caso, a média aritmética anterior ficou multiplicada por 2. 4ª propriedade A média das médias é a média global de 2 ou mais grupos. x1 = 10 n1 = 15 x2 = 18 n2 = 23 Então: 1 1 2 2 1 2 ( . ) ( . ) ... ( . ) ... k k G k x n x n x n x n n n (10.15) (18.23) 14,84 15 23 Gx 5ª propriedade A soma dos quadrados dos afastamentos contados a partir da média aritmética é um mínimo. Prof. THIAGO MAGALHÃES Página 17 Idades ( xi ) di = (xi – x) di 2 = (xi – x) 2 2 d1 = 2 – 6 = -4 (– 4) 2 = 16 4 d2 = 4 – 6 = -2 (– 2) 2 = 4 6 d3 = 6 – 6 = 0 ( 0) 2 = 0 8 d4 = 8 – 6 = +2 ( +2) 2 = 4 10 d5 = 10 – 6 = +4 ( +4) 2 = 16 0 40 De modo que: (xi – x) 2 = 40 sendo este valor o menor possível. Isso significa que, se tomássemos outro valor que não a média (x), o resultado dessa operação seria maior que o obtido. 6ª propriedade A média aritmética é atraída pelos valores extremos. Considere os valores originais: xi : 2, 4, 6, 8, 10 6x Se o primeiro valor xi for alterado para 0: xi : 0, 4, 6, 8, 10 5,6x Se o último valor xi for alterado para 12: xi : 2, 4, 6, 8, 12 6,4x 2.3. MODA (Mo) Também chamada de norma, valor dominante ou valor típico. Define-se a moda como o valor que ocorre com maior frequência em conjunto de dados. Exemplo: Se o salário modal dos empregados de uma empresa é igual a mi l reais, este é o salário recebido pela maioria dos empregados dessa empresa. A moda é utilizada frequentemente quando os dados estão registrados na escala nominal. Prof. THIAGO MAGALHÃES Página 18 Exemplo: Sexo dos alunos – Turma A – Escola Z Sexo Frequência Masculino 40 Feminino 60 Total 100 A moda é o sexo feminino porque tem maior frequência. Moda – para dados não agrupados Primeiramente os dados devem ser ordenados para, em seguida, observar o valor que tem maior frequência. Exemplo: Calcular a moda dos seguintes conjuntos de dados: 1. X = (4, 5, 5, 6, 6, 6, 7, 7, 8, 8) Mo = 6 (o valor mais frequente) Esse conjunto é unimodal, pois apresenta apenas uma moda. 2. Y = (1, 2, 2, 2, 3, 4, 4, 4, 5, 5, 6) Mo = 2 e Mo = 4 (valores mais frequentes) Esse conjunto é bimodal, pois apresenta duas modas. 3. Z = (1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5) Mo = 2, Mo = 3 e Mo = 4 (valores mais frequentes) Esse conjunto é plurimodal, pois apresenta mais de duas modas. 4. W = (1, 2, 3, 4, 5, 6) Esse conjunto é amodal porque não apresenta um valor predominante. Moda – para dados agrupados sem classes Basta observar, na tabela, o valor que apresenta maior frequência. ♦ Cálculo da moda pelo rol Prof. THIAGO MAGALHÃES Página 19 Na tabela abaixo, o resultado 1 aparece mais vezes Mo =1. Número de filhos de um grupo de 50 casais 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 5 5 5 6 6 6 7 7 ♦ Cálculo da moda pela distribuição de frequências sem classes Número de filhos de um grupo de 50 casais Número de filhos ( xi ) Número de casais ( fi ) O valor 1 apresenta a maior frequência. Mo = 1 Esse resultado indica que casais com um filho foi o resultado mais observado. 0 6 1 16 2 9 3 8 4 3 5 3 6 3 7 2 Total () 50 Moda – para dados agrupados com classes Prof. THIAGO MAGALHÃES Página 20 Taxas municipais de urbanização (em %) – Alagoas, 1970. 1º passo: Identifica-se a classe de maior frequência. Na Tabela é a 1ª classe: 6 ⊢ 16 2º passo: Aplica-se a fórmula: 1º processo: Moda bruta: 2 Li Ls Mo sendo, Li: limite inferior da classe modal = 6 Ls: limite superior da classe modal = 16 6 16 11% 2 Mo Taxas (em %) Número de Municípios ( fi ) 6 ⊢16 29 24 16 13 4 3 2 2 1 16 ⊢ 26 26 ⊢ 36 36 ⊢ 46 46 ⊢ 56 56 ⊢ 66 66 ⊢ 76 76 ⊢ 86 86 ⊢ 96 Total () 94 2º processo: Fórmula de Czuber: 1 1 2 .Mo D Mo L h D D (Método mais elaborado) sendo: LMo : limite inferior da classe h: intervalo da classe modal D1 : frequência simples da classe modal frequência simples anterior à da classe modal D2 : frequência simples da classe modal frequência simples posterior à da classe modal Na tabela acima, temos: LMo = 6 29 6 .10 14,5% 29 5 Mo h = 10 D1 = 29 0 = 29 Prof. THIAGO MAGALHÃES Página 21 D2 = 29 24 = 5 A taxa de urbanização mais frequente ficou em torno de 14,5%. 2.4. MEDIANA (Md) É uma medida de posição cujo número divide um conjunto de dados em duas partes iguais. Por esse motivo, a mediana é considerada uma medida separatriz. Portanto, a mediana se localiza no centro de um conjunto de números ordenados segundo uma ordem de grandeza. Mediana - para dados não agrupados a) O número de valores observados é impar Exemplo: Considere o conjunto de dados: X = (5, 2, 7, 10, 3, 4, 1) 1º) Colocar os valores em ordem crescente ou decrescente: X = (1, 2, 3, 4, 5, 7, 10) 2º) Determinar a ordem ou posição (P) da Mediana por 1 2 n P , quando n (nº de elementos) for ímpar. 7 1 4ª 2 P posição . O número que se encontra na 4ª posição é o número 4. b) O número de valores observados é par Exemplo: Considere o conjunto de dados: X = (4, 3, 9, 8, 7, 2, 10, 6) 1º) Colocar os valores em ordem crescente ou decrescente: X = (2, 3, 4, 6, 7, 8, 9, 10) 2º) Determinar a ordem ou posição (P) da Mediana por 2 n P e 1 2 n P , quando n (nº de elementos) for par. 8 4ª 2 P posição e Prof. THIAGO MAGALHÃES Página 22 Md = 4 8 1 5ª 2 P posição Os números são 6 (4ª posição) e 7 (5ª posição). Tira-se a média aritmética entre os dois números. 6 7 6,5 2 Md Mediana – para dados agrupados sem classes Número de filhos de um grupo de 50 casais Número de filhos ( xi ) Número de casais ( fi ) Fi 1º) Determinar a posição da mediana por: 2 n P e 1 2 n P , pois n é par 50 25ª 2 P posição e 50 1 26ª 2 P posição 2º) Pela Fi (freq. abs. Acumulada abaixo de) verifica-se que o 31 contém o 25º e 26º elemento 25º corresponde ao nº 2 26º corresponde ao nº 2 2 2 2 2 Md 0 6 6 1 16 22 2 9 31 3 8 39 4 3 42 5 3 45 6 3 48 7 2 50 Total () 50 O nº 2 deixa 50% dos valores, ou seja, é o elemento central Prof. THIAGO MAGALHÃES Página 23 Mediana – para dados agrupados com classes Taxas municipais de urbanização (em %) – Alagoas, 1970. 1º) Calcular a posição: 94 47ª 2 2 n P posição (Não importa de n for ímpar ou par) 2º) Pela Fi identifica-se a classe que contém a Md: O nº 47 está dentro de 53. Portanto, a classe da Md é a 2ª: 16 ⊢26. 3º) Aplica-se a fórmula: ( 2) .Md Md n Fa Md L h f onde, Taxas (em %) Número de Municípios ( fi ) Fi 6 ⊢ 16 29 29 16 ⊢ 26 24 53 26 ⊢ 36 16 69 36 ⊢ 46 13 82 46 ⊢ 56 4 86 56 ⊢ 66 3 89 66 ⊢ 76 2 91 76 ⊢ 86 2 93 86 ⊢ 96 1 94 Total () 94 * LMd = limite inferior da classe da Md = 16 * n = tamanho da amostra ou nº de elementos n/2 = 94/2 = 47 * Fa = frequência acumulada anterior à classe da Md = 29 * h = intervalo da classe da Md = 10 * fMd = frequência simples da classe da Md = 24 47 29 16 .10 23,5% 24 Md 50% das taxas de urbanização estão antes da taxa 23,5%. Prof. THIAGO MAGALHÃES Página 24 3. MEDIDAS DE DISPERSÃO Às vésperas de uma partida decisiva, o técnico de uma equipe de basquetebol prepara a escalação da equipe e depara-se com a seguinte dúvida: escalar o jogador A ou o jogador B, sendo que ambos estão em boas condições físicas. Para decidir, estuda os últimos cinco jogos de que participou o jogador A e os últimos cinco jogos de que participou o jogador B e percebe que A e B têm a mesma média de pontos por jogo. A decisão do técnico pode ser tomada apenas com essa informação? Veremos que tal informação não é suficiente para essa tomada de decisão, pois duas amostras de números x1, x2, x3, ..., xn e y1, y2, y3, ..., yn podem ter a mesma média aritmética e, no entanto, apresentar características muito diferentes. Vamos agora estudar algumas medidas obtidas de uma amostra de números que caracterizam um afastamento ou uma aproximação dos dados em torno da média. Tais medidas são chamadas de medidas de dispersão. 3.1. Desvio relativo Chama-se “desvio relativo de um elemento xi de uma amostra de números x1, x2, x3,..., xn” o número Dr (xi) tal que: ( )r i iD x x x onde x é a média aritmética dos números x1, x2, x3, ..., xn. Exemplo: As idades das jogadoras do time de voleibol da cidade são: 15; 16; 14; 17; 16; 18. Dessa amostra, temos que: - a média aritmética (em anos) é 15 16 14 17 16 18 16 6 x - o desvio relativo (em anos) do elemento 15 da amostra é D r (15) = 15 – 16 = -1 - o desvio relativo (em anos) do elemento 18 da amostra é D r (18) = 18 – 16 = 2 - o desvio relativo (em anos) do elemento 16 da amostra é Dr (16) = 16 – 16 = 0 Note que, se o desvio relativo de um elemento xi é: I. positivo, então xi está acima da média; II. negativo, então xi está abaixo da média; III. zero, então xi é igual a própria média. Prof. THIAGO MAGALHÃES Página 25 3.2. Desvio absoluto Chama-se “desvio absoluto de um elemento xi de uma amostra de números x1, x2, x3,..., xn” o número Da (xi) tal que: ( )a i iD x x x . Exemplo: As idades das jogadoras do time de voleibol são: 15; 16; 14; 17; 16; 18. Nessa amostra, vemos que: 16x Assim, temos que: - o desvio absoluto (em anos) do elemento 15 da amostra é (15) 15 16 1 1aD . - o desvio relativo (em anos) do elemento 18 da amostra é (18) 18 16 2 2aD . - o desvio relativo (em anos) do elemento 16 da amostra é (18) 16 16 0 0aD . 3.3. Desvio médio absoluto Chama-se “desvio médio absoluto (Dma) de uma amostra de números x1, x2, x3,..., xn” a média aritmética entre os desvios absolutos de todos os seus elementos. Isto é: 1 n i i ma x x D n Exemplo: As idades das jogadoras do time de voleibol são: 15; 16; 14; 17; 16; 18. Dessa amostra, temos: 16x Pela fórmula do desvio médio absoluto, calculamos: 15 16 16 16 14 16 17 16 16 16 18 16 6 maD 1 0 2 1 0 2 1 6 maD Logo, o desvio médio absoluto é 1 ano. Nota: o desvio médio absoluto é uma medida associada à amostra como um todo; quando no exemplo anterior dizemos que Dma = 1 ano, estamos afirmando que, em média, os elementos da amostra se afastam 1 ano da média aritmética, para cima ou para baixo. Prof. THIAGO MAGALHÃES Página 26 Desvio Médio - para dados agrupados em classes de frequências 1 . n m i i ma i x x f D f Taxas municipais de urbanização (em %) – Alagoas, 1970. 28,04x Taxas (em %) Número de Municípios ( fi ) Fi 6 ⊢ 16 29 29 16 ⊢ 26 24 53 26 ⊢ 36 16 69 36 ⊢ 46 13 82 46 ⊢ 56 4 86 56 ⊢ 66 3 89 66 ⊢ 76 2 91 76 ⊢ 86 2 93 86 ⊢ 96 1 94 Total () 94 28,04 11 .29 28,04 21 .24 28,04 31 .16 28,04 41 .13 28,04 51 .4 28,04 61 .3 28,04 71 .2 28,04 81 .2 28,04 91 .1 94 maD 494,16 168,96 47,36 168,48 91,84 98,88 85,92 105,92 62,96 94 maD Dma = 14,09 3.4. Desvio padrão Uma das medidas mais usadas para aferir a dispersão dos elementos de uma amostra de números em relação à média aritmética é o desvio padrão, simbolizado pela letra grega 𝛔 (sigma) e definido da seguinte maneira: Chama-se “desvio padrão de uma amostra de números x1, x2, x3,..., xn” o número dado por: Prof. THIAGO MAGALHÃES Página 27 2 1 n i x x n onde x é a média aritmética dos números x1, x2, x3, ..., xn. Exemplo: As idades das jogadoras do time de voleibol são: 15; 16; 14; 17; 16; 18. Dessa amostra, temos: 16x e 2 2 2 2 2 2 15 16 16 16 14 16 17 16 16 16 18 16 6 2 2 2 2 2 2 1 0 2 1 0 2 10 1,29 6 6 ano Nota: o desvio padrão, assim como o desvio médio absoluto, é uma medida associada à amostra como um todo, e não a cada elemento individualmente. O desvio padrão, assim como o desvio médio absoluto, mede o quanto os elementos estão próximos ou afastados da média. Desvio padrão – para dados agrupados sem e com classes 2 1 . n i i i x x f f Taxas (em %) Número de Município s ( fi ) xi ix x 2( )ix x 2( ) .i ix x f 28,04x 6 ⊢ 16 29 11 - 17,0 4 290,36 8420,4 8 16 ⊢ 26 24 21 -7,04 49,56 1189,4 7 Prof. THIAGO MAGALHÃES Página 28 26 ⊢ 36 16 31 2,96 8,76 140,18 36 ⊢ 46 13 41 12,9 6 167,96 2183,5 46 ⊢ 56 4 51 22,9 6 527,16 2108,6 4 56 ⊢ 66 3 61 32,9 6 1086,36 3259,0 8 66 ⊢ 76 2 71 42,9 6 1845,56 3691,1 2 76 ⊢ 86 2 81 52,9 6 2804,76 5609,5 2 86 ⊢ 96 1 91 62,9 6 3963,96 3963,9 6 Total () 94 8420,48 1189,47 140,18 2183,5 2108,64 3259,08 3691,12 5609,52 3963,96 94 30565,95 325,17 18,03 94 3.5. Variância Chama-se “variância de uma amostra de números x1, x2, x3,..., xn” o quadrado do desvio padrão, isto é: 2 2 1 n i x x n Exemplo 1: As idades das jogadoras do time de voleibol são: 15; 16; 14; 17; 16; 18. Dessa amostra, temos: 16x e 𝛔 = 1,29 ano portanto 𝛔2 = (1,29)2 = 1,66 ano2. Exemplo 2: Na amostra 184, 179, 190, 181, 178 das massas, em gramas, de cinco barras de chocolate, temos que: Prof. THIAGO MAGALHÃES Página 29 184 179 190 181 178 182,4 5 x 2 2 2 2 2 2 (184 182,4) (179 182,4) (190 182,4) (181 182,4) (178 182,4) 5 2 2 2 2 2 2 (1,6) ( 3,4) (7,6) ( 1,4) ( 4,4) 18,64 5 𝛔2 = 18,64 g2 Nota: a desvantagem em se usar a variância como medida de dispersão é que, se os elementos da amostra se apresentam numa unidade u (grama, g, por exemplo), a variância se apresenta na unidade u2, o que pode causar dificuldade de interpretação. No exemplo anterior, como interpretar g2? Para contornar essa dificuldade, é mais conveniente, nesse caso, usarmos o desvio padrão, cuja unidade de medida é a mesma dos elementos da amostra. Variância – para dados agrupados sem e com classes 2 2 1 . n i i i x x f f Taxas (em %) Número de Município s ( fi ) xi ix x 2( )ix x 2( ) .i ix x f 28,04x 6 ⊢ 16 29 11 - 17,0 4 290,36 8420,4 8 16 ⊢ 26 24 21 -7,04 49,56 1189,4 7 26 ⊢ 36 16 31 2,96 8,76 140,18 36 ⊢ 46 13 41 12,9 6 167,96 2183,5 Prof. THIAGO MAGALHÃES Página 30 46 ⊢ 56 4 51 22,9 6 527,16 2108,6 4 56 ⊢ 66 3 61 32,9 6 1086,36 3259,0 8 66 ⊢ 76 2 71 42,9 6 1845,56 3691,1 2 76 ⊢ 86 2 81 52,9 6 2804,76 5609,5 2 86 ⊢ 96 1 91 62,9 6 3963,96 3963,9 6 Total () 94 2 8420,48 1189,47 140,18 2183,5 2108,64 3259,08 3691,12 5609,52 3963,96 94 2 30565,95 325,17 94 EXERCÍCIOS (CESPE - Fiscal de Tributos Estaduais do Mato Grosso) “Uma empresa do ramo de construção civil contratou 200 operários para executar uma obra de 100.000 m2 em 12 meses. A tabela abaixo apresenta a distribuição dos salários semanais brutos – S – dos 200 operários.” Função Salário semanal bruto (S) Número de operários F1 R$100,00 < S < R$140,00 50 F2 R$140,00 < S < R$160,00 80 F3 R$160,00 < S < R$240,00 40 F4 R$240,00 < S < R$360,00 30 Total 200 Prof. THIAGO MAGALHÃES Página 31 Para cada função, essa empresa apresenta ainda as seguintes estatísticas sobre o salário semanal bruto por função. Função Média Mediana F1 R$ 130,00 R$ 120,00 F2 R$ 150,00 R$ 145,00 F3 R$ 170,00 R$ 200,00 F4 R$ 290,00 R$ 280,00 Considerando os dados fornecidos acima, julgue os itens abaixo: 1. O salário médio semanal bruto dos operários dessa empresa é igual a R$175,00. 2. A mediana da distribuição dos salários é igual a R$152,50. 3. A moda da distribuição dos salários, segundo a fórmula de Czuber, é igual a R$148,57. 4. 36,25% dos operários recebem salário semanal bruto entre R$130,00 e R$155,00. 5. Se a empresa pagar R$10,00 a mais para cada um dos seus 200 operários, a variância do salário semanal bruto dos operários não sofrerá alteração. 6. Se a empresa der um aumento de 10% para cada um dos seus 200 operários, a variância do salário semanal bruto dos operários aumentará em 21%. 7. 7,5% dos operários receberam salário semanal bruto maior ou igual a R$280,00. 8. Considere, por hipótese, que os operários, insatisfeitos com seu salário, ameaçam fazer greve, e que a empresa prontamente lhes faça uma proposta de aumento salarial de 20% sobre o valor bruto para todos os operários, descontando, porém, as refeições fornecidas no valor de R$34,00/semana para cada um dos operários. Nessa hipótese, a proposta apresentada pela empresa não alterará a média dos salários semanais brutos dos operários. (CESPE – PAS 3) O gráfico abaixo representa o número mensal de transplantes de córnea realizados em um determinado hospital durante o ano de 2002. Prof. THIAGO MAGALHÃES Página 32 Com base nos dados do texto acima, julgue os itens a seguir, considerando o conjunto formado pelas quantidades mensais de transplantes de córnea realizados em 2002. 9. A mediana do conjunto é igual a 10. 10. A média do conjunto é superior a 11. 11. A soma das quantidades de transplantes realizados nos meses de janeiro e dezembro correspondeu a mais de 35% do total de transplantes realizados durante o ano. 12. Se em cada mês tivesse sido realizado 1 transplante a mais do que aquele número apresentado no gráfico, então a média mensal do número de transplantes realizados em 2002 seria 10% maior que a da situação apresentada. 13. O desvio-padrão do subconjunto correspondente às quantidades de transplantes realizados nos meses de janeiro a abril é maior que o do subconjunto correspondente às quantidades de transplantes realizados nos meses de maio a agosto. 14. Se, em 2002, o número de transplantes realizados a cada mês tivesse sido o dobro do apresentado no gráfico, a variância do conjunto formado pelas quantidades mensais de transplantes realizados em 2002 teria sido o dobro da variância do conjunto original. (CESPE) Respirando veneno O inverno de 1998 vai ter uma péssima qualidade doar – uma das piores da história. Quem garante são os especialistas. A estiagem provocada pelo El Niño deve tornar este período mais seco, dificultando a dispersão de gases e fumaças. Os técnicos acreditam que este inverno será ainda pior que o de 1997. Saiba em quantos dias do Prof. THIAGO MAGALHÃES Página 33 ano passado a poluição ficou acima dos níveis aceitáveis nas cidades que têm controle da qualidade do ar. Observe a tabela. Considerando a série numérica formada pelos números da tabela, julgue os seguintes itens. 15. O número de dias em que Volta Redonda apresentou poluição acima dos níveis aceitáveis é a mediana da série, indicando que, das 11 cidades, cinco apresentaram índices de poluição menores que o de Volta Redonda. 16. A média aritmética da série indica o número de dias com poluição acima dos níveis aceitáveis que cada cidade analisada teria se o total de dias fosse igualmente distribuído por todas as cidades analisadas. 17. Tanto um gráfico de setores como um gráfico de barras são representações adequadas para a série estudada. 18. A moda da série é de 132, indicando que São Paulo foi a cidade que mais tempo ficou com índices de poluição acima dos níveis aceitáveis. (CESPE – BB/2009 – Escriturário) O gráfico a seguir, que ilustra a previsão das reservas monetárias de alguns países, em 2008, deve ser considerado para o julgamento dos itens de 19 a 22. Prof. THIAGO MAGALHÃES Página 34 Com base nas informações do gráfico apresentado acima, julgue os seguintes itens. 19. Considerando-se que, na época da realização dos estudos que deram origem ao gráfico, 1 dólar equivalesse a R$ 1,80, é correto afirmar que, nessa época, o valor previsto para as reservas internacionais da China era superior a R$ 2.500.000.000.000,00. 20. Em 2008, as reservas previstas para a Índia superarão as previstas para o Brasil em mais de 55%. 21. Entre as reservas apresentadas no gráfico, apenas as da Rússia e da China superam a média aritmética das reservas de todos eles. 22. O quadrado do desvio-padrão da sequência numérica formada pelas reservas dos cinco países apresentados no gráfico acima é superior a 84+ 154+ 164+ 184+ 304. Gabarito 1 E 9 C 17 E 2 E 10 E 18 E 3 E 11 C 19 C 4 E 12 C 20 E 5 C 13 C 21 E 6 C 14 E 22 C 7 C 15 E 8 C 16 C
Compartilhar