Baixe o app para aproveitar ainda mais
Prévia do material em texto
Matemática, Probabilidade e Estatística banco do brasil ESTATÍSTICA Livro Eletrônico JOSIMAR PADILHA Professor do Gran Cursos Online. Ministra aulas presenciais, telepresenciais e online de Matemá- tica Básica, Raciocínio Lógico, Matemática Finan- ceira e Estatística para processos seletivos em concursos públicos estaduais e federais. Além disso, é professor de Matemática e Raciocínio Lógico em várias faculdades do Distrito Federal. É servidor público há mais de 20 anos. Autor de diversas obras e palestrante. 3 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha SUMÁRIO Noções de Estatística ..................................................................................5 Introdução ................................................................................................5 População X Amostra ..................................................................................6 Censo X Estimação .....................................................................................6 Dados Estatísticos ......................................................................................7 Distribuição de Frequência .........................................................................10 1. Representação dos Dados Discretos ........................................................10 1.1. Frequência Simples Absoluta (fi) ..........................................................11 1.2. Frequência Relativa (Fr) ......................................................................11 1.3. Frequência Acumulada (Fac) .................................................................12 Amplitude Amostral a) – RANGE .................................................................14 Representação de Dados em Classes ...........................................................14 1. Classe .................................................................................................15 Amplitude da Classe c) ..............................................................................15 Ponto Médio da Classe (Pm) ........................................................................15 Medidas de Tendência Central e Separatrizes ................................................16 Média Aritmética ......................................................................................16 1.1. Mediana ............................................................................................23 1.2. Média X Mediana ................................................................................24 1.3. Moda ................................................................................................30 2. Medidas de Dispersão ............................................................................32 2.1. Desvio ..............................................................................................32 2.2. Amplitude .........................................................................................33 4 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 2.3. Variância...........................................................................................34 2.4. Desvio Padrão ...................................................................................39 2.5. Coeficiente de Variação (Cv) ................................................................43 Assimetria ...............................................................................................49 Distribuição Simétrica ...............................................................................49 Distribuições Assimétricas ..........................................................................49 Curtose ...................................................................................................53 Coeficiente Percentílico de Curtose ..............................................................54 Coeficiente Momento de Curtose .................................................................55 Questões de Concurso ...............................................................................61 Gabarito ..................................................................................................66 5 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha NOÇÕES DE ESTATÍSTICA Introdução Olá, concurseiro(a), vamos continuar? Bem, neste módulo, serão apresentados métodos para resolução de questões de concursos públicos relacionados a problemas envolvendo o conteúdo de noções de estatística, relacionados abaixo: [1. NOÇÕES DE ESTATÍSTICA; POPULAÇÃO E AMOSTRA; ANÁLISE E IN- TERPRETAÇÃO DE TABELAS E GRÁFICOS; ESTATÍSTICA DESCRITIVA (MÉ- DIA, MEDIANA, VARIÂNCIA, DESVIO PADRÃO)] Propõe-se aqui que se desenvolva, gradualmente, o raciocínio criativo, com apli- cação de conceitos e propriedades, promovendo maior independência na busca de soluções de problemas, aprendendo a interpretar tais questões por meio da prática e da aplicação de métodos que facilitarão na conclusão das questões. De uma maneira clara, simples e bem objetiva, iremos aprender como a banca examinadora exige o assunto indicado nesta aula. O conteúdo deste módulo é de suma importância, pois trata de assuntos cobra- dos nas provas de concursos públicos pela banca CESGRANRIO. Primeiramente, vamos entender o que é estatística?! É um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos, por meio da obtenção de dados e consequente or- ganização, resumo, apresentação, análise e conclusões baseadas nos dados. É de suma importância para tomada de decisões, sendo utilizada em diversas áreas do conhecimento. 6 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Em estatística, temos que definir o nosso campo de estudo, até mesmo porque alguns dos parâmetros que serão definidos dependem do lugar em que as informa- ções (dados) são adquiridas. População X Amostra 1. População: conjunto universo de todos os elementos (pessoas, objetos e outros), com uma característica comum, objeto de estudo. Um parâmetro é uma medida numérica que descreve alguma característica de uma população. 2. Amostra: é qualquer subconjunto não vazio de uma população. Uma esta- tística (estimador) é uma medida numérica que descreve alguma característica de uma amostra. Vejamos um exemplo. No fenômeno coletivo “eleição para síndico”, a população é o conjunto de todos os moradores do condomínio. Um parâmetro é quantidade de votos recebidos pelo candidato X. Uma amostra poderia ser um grupo de 100 eleitores selecionados ale- atoriamente no condomínio. Uma estatística seria a proporção de votos recebidos pelo candidato X, na amostra. Censo X Estimação Processos estatísticos utilizados no estudo de fenômenos coletivos. 1. Censo: é uma avaliação direta de um parâmetro, através dos dados obtidos de todos os componentes da população. 7 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha É caro, lento, quase sempre desatualizado, admite erro processual zero e confiabi- lidade 100%. 2. Estimação: é uma avaliação indireta de um parâmetro, com base em um estimador, por meio do cálculo de probabilidades. Fique atento(a)! É barato, rápido, atualizado, admite erro processual positivo e confiabilidade menor que 100%. Dados Estatísticos Para tomada de decisões, é de suma importância que os dados amostrais devam ser coletados de modo apropriado, através de um processo de seleção aleatória. O objetivo da estatística é, em grande parte, o uso de dados amostrais para se faze- rem inferências (ou generalizações) sobre uma população inteira. Desta forma, se não forem coletados de modo apropriado, podem se tornar inú- teis, ou induzir a erro o processo decisório. Quanto à organização dos dados, podemos ter 1. Dados Brutos: dados obtidos diretamente da observação, osquais não es- tão numericamente organizados. 2. Rol: são dados brutos numericamente organizados, de forma crescente ou decrescente. 8 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha É importantíssimo sabermos sobre tipo dos dados, pois, dependendo da variável ou do atributo de estudo, aplicaremos o método adequado. Vejamos. 1. DADOS QUANTITATIVOS: possuem características numéricas, represen- tando contagens ou medidas. Os dados aqui serão chamados de variáveis. Podem ser classificados em: 1.1 discretos: são dados que possuem variáveis que assumem determinados valores inteiros, 0 ou 1 ou 2 e assim por diante, em um intervalo de valores. Exemplos: quantidade de alunos na sala, quantidade de aparelhos de TV em uma residência, etc. 1.2 Contínuos: são dados que possuem variáveis que podem assumir qualquer valor em um intervalo de valores. Exemplos: altura, peso, salário, temperatura, etc. 2. DADOS QUALITATIVOS: são dados que possuem características não-nu- méricas, podendo ser separados em diferentes categorias. Os dados aqui serão chamados de atributos. Podem ser classificados em: 2.1. dados nominais: são dados categóricos, que consistem em nomes ou rótulos. Possuem característica não-numérica, logo, não podem ser ordenados (tal como do menor para o maior). Exemplos: sexo (masculino ou feminino), cor dos olhos (pretos, castanhos, azuis, etc.), resposta de sondagem de sim, não e indeciso. Para serem processados estatisticamente, são atribuídos valores numéricos a tais atributos. 9 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 2.2. dados por postos: são dados estatísticos que dependem de uma avaliação subjetiva quanto à preferência ou desempenho em um conjunto de observações. Por exemplo: concursos de moda, canto, etc. Para que possamos fixar esses conceitos, vamos comentar uma questão de con- curso, ok?! 1. (CESGRANRIO) No questionário socioeconômico que faz parte integrante do ENADE há questões que abordam as seguintes informações sobre o aluno: I – Unidade da Federação em que nasceu; II – Número de irmãos; III – Faixa de renda mensal da família; IV – Estado civil; V – Horas por semana de dedicação aos estudos. São qualitativas APENAS as variáveis a) I e III b) I e IV c) I, IV e V d) II, III e V e) I, II, IV e V Letra b. Vamos classificar cada uma das variáveis abaixo, conforme os conceitos vistos acima: 10 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha I – Unidade da Federação em que nasceu (qualitativa) II – Número de irmãos (quantitativa) III – Faixa de renda mensal da família (quantitativa) IV – Estado civil (qualitativa) V – Horas por semana de dedicação aos estudos (quantitativa) Dessa forma, temos como dados qualitativos as afirmativas I e IV. Vejamos outro conceito importantíssimo usado para a construção de gráficos, na interpretação de situações, e na estatística inferencial. Distribuição de Frequência É uma representação tabular dos dados estatísticos, discretos ou contínuos, sendo uma forma de resumir grandes conjuntos de dados. Dados representados em uma tabela de frequência facilitam a construção de gráficos (tais como histo- gramas), bem como a compreensão sobre a natureza dos dados. Como podem ser representados os dados discretos? 1. Representação dos Dados Discretos Considere a seguinte amostra de valores, relativos às idades de um grupo de 20 adolescentes: 4, 8, 8, 6, 6, 8, 5, 5, 6, 7, 7, 7, 6, 6, 7, 5, 5, 7, 5, 5 Agora, vamos representar os dados amostrais acima em tabelas de frequências: 11 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 1.1. Frequência Simples Absoluta (fi) A frequência simples de um elemento é o número de vezes que o elemento fi- gura no conjunto de dados. Para os dados discretos da amostra acima, teremos a seguinte distribuição de frequência: Idade (x i) Frequência (f i) 4 1 5 6 6 5 7 5 8 3 TOTAL 1.2. Frequência Relativa (Fr) É a razão entre a frequência relativa da variável e o número total (n) de ele- mentos da série. Idade (x i) Frequência (f i) Frequência Relativa 4 1 1/20=0,05=5% 5 6 6/20= 0,3= 30% 6 5 5/20=0,25=25% 7 5 5/20=0,25= 25% 8 3 3/20=0,15=15% TOTAL 20/20 = 1 = 100% 12 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 1.3. Frequência Acumulada (Fac) É o somatório da frequência simples da variável com as frequências simples dos elementos que o antecedem. Fac = f1 + f2 + f3+ f4 +...+ fi Idade (x i) Frequência (f i) Frequência acumulada 4 1 1 5 6 7 6 5 12 7 5 17 8 3 20 TOTAL Vejamos uma questão de concurso em que é necessário o conhecimento de fre- quência acumulada para sua resolução. 2. (CESGRANRIO) A tabela abaixo apresenta as frequências acumuladas das ida- des de 20 jovens entre 14 e 20 anos. Um desses jovens será escolhido ao acaso. Qual a probabilidade de que o jovem escolhido tenha menos de 18 anos, sabendo que esse jovem terá 16 anos ou mais? a) 8/14 b) 8/16 c) 8/20 13 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha d) 3/14 e) 3/16 Letra b. Temos uma questão de probabilidade, porém, para que possamos determinar o espaço amostral (casos possíveis) e os casos favoráveis, não podemos trabalhar com a frequência acumulada e sim com a frequência absoluta. Desta forma, vamos construir mais uma coluna com as frequências absolutas, em que teremos os dados discretos relativos a variável de estudo (idade). Idade (anos) Frequência Relativa (fr) Frequência Absoluta (fi) 14 2 = 2 15 4 (4-2) = 2 16 9 (9-4) = 5 17 12 (12-9) =3 18 15 (15-12) =3 19 18 (18-15) =3 20 20 (20-18) = 2 A questão trata de probabilidade condicional, uma vez que temos a seguinte per- gunta: “Qual a probabilidade de que o jovem escolhido tenha menos de 18 anos, 14 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha sabendo que esse jovem terá 16 anos ou mais?”. Isso significa que o espaço amos- tral (condição) são os jovens que têm 16 anos ou mais, ou seja, 16 jovens (5 + 3+ 3+ 3+ 2). Os casos favoráveis (aquilo que serve), são os jovens que têm menos de 18 anos, isto é, aqueles que tem menos de 18 anos (5+3) dentro dos 16 jovens selecionados. Vamos agora aplicar a fórmula de probabilidade: P (n) = Casos favoráveis / Casos possíveis. P (n) = 8 / 16 Vejamos agora um outro conceito importante em nosso estudo por estatística: Amplitude Amostral a) – RANGE É a diferença entre o maior e o menor valor da amostra. Considere a seguinte amostra de valores, relativos às idades de um grupo de 20 adolescentes: 4, 8, 8, 6, 6, 8, 5, 5, 6, 7, 7, 7, 6, 6, 7, 5, 5, 7, 5, 5 Do exemplo dado acima, A = 8 - 4 = 4. Representação de Dados em Classes Na representação de grandes quantidades de dados, principalmente dos contí- nuos, utiliza-se a forma de intervalos de classe. Pode ser aplicada a dados discre- tos, quando se tratarem de grandes amostras. 15 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 1. Classe É cada um dos intervalos ou grupos obtidos a partir do conjunto de dados. Há diversos métodos para se determinar o número de classes. Vamos citar dois. 1.1. Regra do quadrado: K = n , em que n é o tamanho da amostra. Utiliza-se o valor mais próximo do quadrado perfeito. 1.2. Regra de Sturges: K = 1 + 3,3 log n Amplitude da Classe c) Na forma moderna, é a diferença entre os limites superior e inferior da classe. Ls: Limite superior Li: Limite inferior Classe: Ls- li Ponto Médio da Classe (Pm) É a média aritmética simples dos limites superior e inferior de cada classe. Pm= (Ls + Li) / 2 Classes Frequência (f i) Pm (xi) xi. fi 2 │--- 4 3 3 9 4 │--- 6 5 5 25 6 │--- 8 10 7 70 8 │--- 10 5 9 45 10 │--- 12 3 11 33 26 182 16 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Medidasde Tendência Central e Separatrizes No estudo de uma série estatística, é conveniente o cálculo de algumas medidas que a caracterizam. Estas medidas, quando bem interpretadas, podem fornecer- -nos informações muito valiosas com respeito à série estatística. Em suma, podemos reduzi-la a alguns valores, cuja interpretação fornece-nos uma compreensão bastante precisa da série. Um destes valores é a medida de ten- dência central. É um valor intermediário da série, ou seja, um valor compreendido entre o me- nor e o maior valor da série. É também um valor em torno do qual os elementos da série estão distribuídos e a posiciona em relação ao eixo horizontal. Em resumo, a medida de tendência central procura estabelecer um número no eixo horizontal em torno do qual a série se concentra. As principais medidas de tendência central são: 1. MÉDIA; 2. MEDIANA; 3. MODA. Média Aritmética A MÉDIA ARITMÉTICA é o somatório de todos os termos dividido pelo número total de termos. Dentre os parâmetros estatísticos mais usados, podemos destacar a média arit- mética, pois muitas pessoas, de algum modo, já utilizaram ou utilizam constan- temente os cálculos envolvendo médias. Dessa forma, é considerada uma medida 17 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha de tendência central, pois focaliza valores médios dentre os maiores e menores. A efetuação dos cálculos pode ser considerada de forma fácil, pois consiste em dividir a soma total dos valores pelo número de valores; o resultado dessa divisão será considerado a média aritmética dos termos. Me: média S: soma dos termos n: número de termos Me= S / n Podemos representar a média aritmética pela seguinte expressão: Acredito que você não tenha dúvida quanto à média aritmética, porém, é de suma importância sabermos algumas propriedades, vejamos: Pulo do Gato 1ª Propriedade A soma algébrica dos desvios em relação à média é zero (nula). ∑di = ∑ (xi – x) = 0 Onde: di são as distâncias ou afastamentos da média. 2ª Propriedade Somando-se ou subtraindo-se uma constante c) a todos os valores de uma variá- vel, a média do conjunto fica aumentada ou diminuída dessa constante. 3ª Propriedade Multiplicando-se ou dividindo-se todos os valores de uma variável por uma cons- tante (c), a média do conjunto fica multiplicada ou dividida por essa constante. 18 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 4ª Propriedade A média das médias é a média global de 2 ou mais grupos. 5ª Propriedade A soma dos quadrados dos afastamentos contados a partir da média aritmética é um mínimo. 6ª Propriedade A média aritmética é atraída pelos valores extremos. Considere os valores originais Xi: 2,4,6,8,10 → x=6 Se o primeiro valor xi for alterado para 0: Xi: 0,4,6,8,10 → x = 5,6 Se o último valor xi for alterado para 12: Xi: 2,4,6,8,12 → x = 6,4 3. (2016/IADES/PC-DF/PERITO CRIMINAL) A média das idades dos 45 empregados de uma corporação é de 32 anos. Para os próximos meses, estão previstas as apo- sentadorias de cinco empregados cuja média de idades é de 62 anos. Considerando essa situação hipotética, é correto afirmar que, após a efetivação de todas as apo- sentadorias, a média das idades da corporação passará a ser a seguinte: a) 25,11 anos. b) 26 anos. c) 28,25 anos. d) 30,75 anos. e) 36 anos. 19 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Letra c. A questão afirma que a média era de 32 anos para 45 funcionários. Um detalhe importante quanto à média aritmética é com relação ao somatório, isto é, a média aritmética, por si só, não é uma boa medida para tomada de decisão, pois, segundo as propriedades vistas, podemos afirmar que a mesma sofre influência dos valores extremos. Porém, com a média aritmética, podemos calcular o somatório de todos os valores do conjunto. Vejamos: Me=X/quantidade de funcionários X – corresponde ao valor da soma das idades de todos os 45 funcionários: 32=X/45 X=1440 (soma de todas as idades) Se a média era de 62 anos para 5 funcionários, podemos calcular a soma das ida- des desses funcionários: Me=Y/quantidade de funcionários. Y corresponde ao valor da soma das idades de todos os 5 funcionários: 62=Y/5 Y=310 (soma da idade dos 5 funcionários) A diferença das somas das idades (diferença entre X e Y) será a soma das idades dos 40 funcionários (45-5). A soma das idades dos 40 funcionários denominada Z, que é X-Y=1440-310=1130 (novo somatório dos funcionários da corporação). Nova média: Me=Z/40 Me=1130/40 Me= 28,25 20 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 4. (CESGRANRIO) Analise as afirmativas a seguir. A média aritmética nem sempre é a melhor medida de tendência central. PORQUE A média aritmética é influenciada por valores extremos do conjunto de dados. Considerando-se as relações entre as afirmações, conclui-se que a) as duas asserções são verdadeiras e a segunda é uma justificativa correta da primeira. b) as duas asserções são verdadeiras e a segunda não é uma justificativa correta da primeira. c) a primeira asserção é uma proposição verdadeira e a segunda, uma proposição falsa. d) a primeira asserção é uma proposição falsa e a segunda, uma proposição ver- dadeira. e) tanto a primeira como a segunda são proposições falsas. Letra a. Essa questão só ratifica o que já temos falado aqui em nosso material, sendo as- sim, a resposta será a letra a. 5. (CESGRANRIO PETROBRAS/2008/ADMINISTRADOR JÚNIOR) A tabela abaixo apresenta os pesos de um grupo de pessoas e suas respectivas frequências. 21 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Não há observações coincidentes com os extremos das classes. O peso médio do conjunto de pessoas, em kgf, é a) 60 b) 65 c) 67 d) 70 e) 75 Letra c. Para que possamos calcular a média aritmética em que os valores se encontram em valores contínuos, ou seja, em intervalo de classes, temos que encontrar os pontos médios de cada intervalo, para que possamos multiplicar pela frequência. O ponto médio é a média aritmética dos extremos da classe. Por exemplo, o ponto médio da primeira classe é (40+ 50) /2 = 45. Para encontrar a média, iremos somar os valores da coluna xi fi e dividir pela quan- tidade de observações. 22 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 6. (MPE-RO/CESGRANRIO) A tabela apresenta uma distribuição de frequência dos salários dos 200 empregados de certa empresa. O salário médio, aproximadamente, vale: a) R$ 600,00 b) R$ 780,00 c) R$ 890,50 d) R$ 1 040,00 e) R$ 1430,00 Letra c. Para calcular a média aritmética de uma distribuição de frequências, convenciona- mos que todos os valores incluídos em um determinado intervalo de classe coinci- dem com o seu ponto médio. Na tabela que será construída, iremos inserir uma coluna para os pontos médios das classes (xi) e em seguida multiplicaremos esses valores pelas suas respectivas frequências. Não se esqueça de que, para calcular o ponto médio das classes, bas- ta calcular a média aritmética dos extremos das classes; por exemplo, o primeiro ponto médio é (260 + 520) / 2 = 390 23 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 1.1. Mediana A MEDIANA, é uma medida de posição do centro da distribuição dos dados, de- finida do seguinte modo: Colocamos os elementos da amostra em rol, ou seja, ordem crescente ou de- crescente, e encontramos a mediana que (pertencente ou não à amostra) e divide ao meio, isto é, 50% dos elementos da amostra são menores ou iguais à mediana e os outros 50% são maiores ou iguais à mediana. Para a determinação da mediana, utiliza-se a seguinte regra, depois de ordena- da a amostra de n elementos: 1. Se n é ímpar, a mediana é o elemento central. { 1, 3, 4, 5, 7} Elemento central e) = (n+1) /2 e = (5+1)/2e = 6/2 e= 3ª posição Md= 4 24 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 2. Se n é par, a mediana é a semissoma dos dois elementos médios. { 1,3,5,6,7,9} Elemento central e) = (n) /2 e = (6)/2 e = 6/2 e= 3ª posição Como n é par, devemos calcular a média aritmética entre o 3º e 4º elementos, veja: Md= ( 3ª posição + 4ª posição ) / 2 Md = (5 + 6)/ 2 Md= 5,5 1.2. Média X Mediana Vamos realizar algumas ponderações a respeito de média e mediana. Como medida de posição, a mediana é mais robusta do que a média, pois não é tão sensível aos dados, ou seja, não sofre tanto influência dos extremos. 1. Em uma distribuição simétrica, a média e a mediana coincidem. 2. A mediana não é tão sensível, como a média, às observações, que são muito maiores ou muito menores do que as restantes (outliers). Porém, a média reflete o valor de todas as observações, isto é, para encontrarmos mais à frente os valores de dispersão e até mesmo realizarmos algumas inferências, a média será de suma importância. Como já visto, a média, ao contrário da mediana, é uma medida muito influen- ciada por valores “muito grandes” ou “muito pequenos”, mesmo que estes valores surjam em pequeno número na amostra. Estes valores são os responsáveis pela 25 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha má utilização da média em muitas situações em que teria mais significado utilizar a mediana. A partir do exposto, podemos deduzir, que se a distribuição dos dados: 1. se for aproximadamente simétrica, a média aproxima-se da mediana. 2. se for assimétrica à direita (alguns valores grandes como “outliers”), a média tende a ser maior que a mediana. 3. se for assimétrica à esquerda (alguns valores pequenos como “outliers”), a média tende a ser inferior à mediana. Vamos para mais uma questão comentada, para que possamos entender a re- lação existente entre Média e Mediana. 7. (FUNIVERSA/PCDF) A tabela abaixo mostra o resultado da renda per capta de duas cidades, X e Y, medido em reais. X Y MEDIANA 4.000 1.250 MÉDIA 3.750 4.750 Com bases nessas informações, pergunta-se: 1) qual das duas cidades tem o melhor padrão de vida? (Considere que todos os outros fatores são iguais) 2) considerando que as duas cidades têm populações de mesmo tamanho e que a taxa de impostos é de 10% em ambas, qual a cidade tem maior arrecadação? Assinale a alternativa que apresenta as repostas corretas às perguntas 1 e 2, res- pectivamente. a) Cidade X e cidade X b) Cidade Y e cidade Y 26 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha c) Cidade X e cidade Y d) Cidade Y e cidade X e) Não há informações suficientes para responder às perguntas Letra c. Essa questão é interessante, pois mostra uma interpretação quanto à diferença da média e mediana, e suas implicações. O melhor padrão de vida deve refletir a real situação da população, sendo assim, precisamos de um valor que mostre uma regularidade, independentemente dos va- lores extremos. O melhor parâmetro para isso é a mediana, pois divide a população em duas partes iguais (50%) para cada lado; logo, a população X possui a renda per capita mediana de 4.000, dando a entender que temos uma população com um valor alto bem distribuído no grupo quanto à renda. Partindo do fato de que as duas populações têm a mesma quantidade de pessoas, a média da população X é inferior à da população Y, significando que a arrecadação total é menor, uma vez que, para encontrar o somatório, basta multiplicarmos a média pela quantidade de pessoas. Dessa forma, a população Y possui maior arrecadação, uma vez que possui maior média aritmética. 1) para a primeira pergunta: qual das duas cidades tem o melhor padrão de vida? (Considere que todos os outros fatores são iguais) Temos como resposta a cidade X. 2) considerando que as duas cidades têm populações de mesmo tamanho e que a taxa de impostos é de 10% em ambas, qual a cidade tem maior arrecadação? Temos como resposta a cidade Y. 27 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 8. (FGV) A medida de um conjunto ordenado de dados, que divide este conjunto em duas partes de igual número de observações, denomina-se: a) média. b) moda. c) mediana. d) desvio padrão. e) variância. Letra c. Essa questão trata do conceito de mediana, em que é uma medida de posição do centro da distribuição dos dados apresentados em rol. Treinando um pouco, vamos lá! Para resolver as três questões abaixo, utilize as informações a seguir. O número de ausentes, por sala, em um dos prédios de aplicação de certo exa- me de proficiência aplicado em certa região, segue a seguinte distribuição: 9. (CESGRANRIO) O número total de salas de aplicação neste prédio foi a) 5 b) 10 28 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha c) 11 d) 25 e) 47 Letra d. O número total de salas é dado pelo somatório da frequência absoluta. 10. (CESGRANRIO) Qual foi o número médio aproximado de ausentes por sala? a) 10,7 b) 5,0 c) 4,7 d) 4,3 e) 2,5 Letra d. Para encontrarmos a média aritmética, temos que multiplicar o valor de cada va- riável de estudo pela frequência e depois dividirmos pelo somatório da frequência. Vamos lá! Me = 107 / 25 = 4,28 = 4,3 29 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 11. (CESGRANRIO) A mediana do número de ausentes neste prédio é a) 3,0 b) 3,5 c) 4,0 d) 4,5 e) 5,0 Letra c. Para encontrarmos a mediana, primeiramente temos que colocar os valores em rol, ordem crescente, porém, são 25 valores. Se você quiser, pode coloca-los em ordem e determinar a mediana, mas quero aproveitar para mostrar outra maneira. Vamos lançar mão do conhecimento de frequência acumulada e, ao calcularmos o elemento central e com a frequência acumulada, tornar-se-á mais rápido encontrar a mediana. Veja. Como n é ímpar, a mediana é o elemento central. Elemento central e) = (n+1) /2 e = (25+1)/2 e = 26/2 e= 13ª posição Para encontrarmos o décimo terceiro termo, iremos utilizar a tabela e criarmos mais uma coluna, essa com a frequência acumulada. Ausência Frequência Frequência acumulada 0 1 1º 1 2 3 º 2 3 6 º 3 4 10 º 30 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 4 5 15 º 5 2 17 º 6 3 20 º 7 3 23 º 9 1 24 º 10 1 25 º A linha da tabela indica que o valor de 4 ausências se repete da décima primeira posição até a décima quinta posição. Como a mediana está na 13ª posição, podemos inferir que a mediana são 4 ausências. 1.3. Moda Podemos definir a moda como sendo o valor que possui maior frequência, se os dados forem discretos, ou, o intervalo de classe com maior frequência, se os dados forem contínuos. Assim, da representação gráfica dos dados, obtém-se imediatamente o valor que representa a moda ou a classe modal. Este parâmetro é bastante útil para reduzir a informação de um conjunto de da- dos qualitativos, apresentados sob a forma de nomes ou categorias, para os quais não se pode calcular a média e por vezes nem a mediana. Um exemplo bem simples é: Os dados abaixo se referem à idade de 20 jovens de uma turma de atletas dos jogos escolares das escolas públicas do DF. Idade: {12, 11, 12, 13, 12, 11, 13, 12, 12, 11, 14, 13, 13, 12, 11, 12, 13, 14, 11, 14} A moda desse conjunto de dados será a idade que mais aparece, ou seja: Mo = 12 (pois é a idade que possui maior frequência). 31 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Obs.:� Apesar de simples, a moda nem sempre é única. Caso, no conjunto, existam poucas observações, muito frequentemente não haverá valores repetidos, com o que nenhum deles satisfaz a condição de moda. Por exemplo, a idade de nove pessoas: 15; 25; 59; 45; 60; 12; 13 e 33; estes nove dados não possuem uma moda,sendo um conjunto amodal. Por outro lado, se a distri- buição da idade de 15 idosos for: 63; 67; 70; 69; 81; 57; 63; 73; 68; 63; 71; 71; 71 e 83, esse grupo possui duas modas (63 e 71 anos). Neste caso, a distribuição diz-se bimodal. Será unimodal no caso de apresentar uma só moda e multimodal se apresentar várias modas. Em dados discretos, percebemos que é bem tranquilo encontrarmos a moda, porém, se os dados forem contínuos, ou seja, em intervalo de classes, como en- contrar a moda? Mostre que você aprendeu!!! Um pequeno levantamento para melhorar a qualidade da produção de textos em um escritório colheu dados sobre o número de erros de digitação por página. A ta- bela abaixo apresenta o resultado desse levantamento. 32 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 12. (CESPE) A partir das informações apresentadas no texto, assinale a opção in- correta. a) O número mediano de erros de digitação por página é igual a 1 erro por página. b) A moda do número de erros de digitação é igual a 1 erro por página. c) A amplitude total do número de erros de digitação é igual a 4 erros por página. d) Em média, o número de erros por página é igual a 2. Letra d. As medidas de tendência central, estudadas até agora, fornecem informações ape- nas sobre o tamanho do valor central de um conjunto de valores, sendo discretos ou contínuos, de uma distribuição de frequência dessas observações. Não há infor- mação, porém, a respeito de como estão dispersas as observações em torno desse valor central (representativo desse conjunto de observações). Para uma melhor interpretação no que diz respeito à tomada de decisões, temos que calcular novas medidas chamadas de Dispersão, que vão nos indicar, com algum detalhe, de que forma o conjunto das observações se comporta em função dos valores de centra- lidade. 2. Medidas de Dispersão 2.1. Desvio Em um conjunto de valores numéricos, o desvio é a “distância” de cada uma dessas informações até a média aritmética delas. O desvio é obtido subtraindo cada um dos valores de um conjunto de informa- ções da média aritmética desse conjunto. 33 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Assim, os desvios devem ser calculados para cada elemento desse conjunto. Vejamos um exemplo: quatro alunos de engenharia obtém as seguintes notas na prova de Cálculo 3. N1 = 6,5, N2 = 6,5, N3 = 6,0 e N4 = 5,0. Calculando a nota média dos alunos, temos: Me= 6,0 Em relação a nota média, temos os seguintes desvios: d1 = 6,5 – 6,0 = 0,5 d2 = 6,5 – 6,0 = 0,5 d3 = 6,0 – 6,0 = 0 d4 = 5,0 – 6,0 = – 1,0 Obs.:� 1. O sinal nos desvios é importante, pois determina se a nota tirada é maior ou menor que a média. � 2. A soma dos desvios é igual a zero. 2.2. Amplitude Em um conjunto de informações numéricas, a primeira medida de tendência central é chamada amplitude e é obtida a partir da diferença entre a maior infor- mação da lista e a menor. Usando o mesmo exemplo utilizado acima, das notas dos dois alunos, observe a amplitude das notas deles: Primeiro: Média 6,0; amplitude = 6,5 – 5,5 = 1,0 Segundo: Média 6,0; amplitude = 10,0 – 1,0 = 9,0 34 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Observando apenas esses números, é possível perceber que o primeiro aluno estabilizou as notas de suas provas e o segundo, não. Para concluir que o segundo aluno teve melhor desenvolvimento, ainda precisamos ver o restante de suas notas. 2.3. Variância A variância é a soma dos quadrados dividida pelo número de observações do conjunto menos uma, em caso de amostras. A variância é representada por S2, sendo calculada pela fórmula: ∑ (xi – Média)2 / (n – 1) Ou seja, S2 = SQ / (n-1) Obs.:� em casos em que o conjunto de valores é uma população, teremos a variân- cia calculada da seguinte forma: ∑ (xi – Média)2 / (n) S2 = SQ / (n) O denominador “n – 1” da variância é determinado por graus de liberdade. O princípio dos graus de liberdade é constantemente utilizado na estatística, uma vez que se é comum trabalhar com amostras. Considerando um conjunto de “n” observações (dados) e fixando uma média para esse grupo, existe a liberdade de escolher os valores numéricos de n-1 obser- vações, o valor da última observação estará fixado para atender ao requisito de ser a soma dos desvios da média igual a zero. Vejamos uma questão comentada. 35 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 13. (CESGRANRIO) A tabela abaixo, representa as frequências acumuladas das idades de 20 jovens entre 14 e 20 anos Uma das medidas de dispersão é a variância populacional, que é calculada por Sabendo-se que m é a média aritmética dessas idades, qual a variância das idades na população formada pelos 20 jovens? a) 0,15 b) 0,20 c) 1,78 d) 3,20 e) 3,35 Letra e. Para que possamos calcular a variância, que é média do quadrado dos desvios, va- mos encontrar primeiramente a média aritmética. 36 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha A tabela nos forneceu a frequência acumulada, logo, é necessário que encontremos as frequências absolutas, vamos lá: Idade (anos) Frequência Acumulada Frequência absoluta 14 2 2 15 4 4-2=2 16 9 9-4=5 17 12 12-9=3 18 15 15-12=3 19 18 18-15=3 20 20 20-18=2 Me= (2x14) + (2x15) + (5x16) + (3x17)+ (3x18) + (3x19) + (2x20) = 20 Me= 28 + 30 + 80 + 51+ 54+ 57+ 40 = 340 /20 = 17 20 S2 = [2(14-17)2 + 2(15-17)2+ 5(16-17)2+ 3(17-17)2+ 3(18-17)2+ 3(19-17)2+ 2(20-17)2]/ 20 S2= [ (2x 9)+ ( 2x 4) + (5X1) + (3 X0 ) + (3 X 1) + (3 X 1) + (3X 4)+ (2X9)] 20 S2= 18 + 8 + 5 + 0+ 3 + 3 + 12 + 18 = 67/20 = 3,35 20 A resposta é a letra “e”. 14. (FUNCAB-2013) Em estatística, existe um conceito que é definido, para um conjunto de dados, como “a média dos quadrados das diferenças dos valores em relação à sua média. “Essa definição conceitua: a) amplitude. b) desvio-padrão. 37 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha c) coeficiente de variação. d) variância. e) estimador Letra d. Conforme o conceito já visto nesta aula, podemos inferir que se trata de variância. 15. (2015/VUNESP/PREFEITURA DE SÃO PAULO-SP) Utilize o texto e as tabelas para responder à questão. Duas amostras de 8 pessoas foram escolhidas em duas escolas, A e B, para a rea- lização de um estudo sobre a obesidade entre adolescentes. As 16 pessoas foram pesadas, e o resultado está expresso nas tabelas a seguir: Escola A Escola B Pessoas Massa (kg) Pessoas Massa (kg) 1 62 1 73 2 63 2 66 3 65 3 70 4 60 4 71 5 64 5 72 6 63 6 71 7 66 7 72 8 61 8 73 A soma das variâncias obtidas em cada um dos grupos é igual a a) 7. b) 9. c) 8. d) 6. e) 10. 38 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Letra c. A média aritmética de cada escola é dada por: Me A = (62+63+65+60+64+63+66+61)/8 = 63 Me B = (73+66+70+71+72+71+72+73)/8=71 Após encontrarmos as médias aritméticas, vamos calcular os desvios em relação às médias: Escola A: d1: 62-63=-1; d2:63-63=0; d3: 65-63=2; d4: 60-63=-3; d5: 64-63=-1; d6: 63-63=0; d7: 66-63=3; d8: 61-63=-3 Escola B: d1: 73-71=2; d2: 66-71=-5; d3: 70-71=-1; d4: 71-71=0; d5: 72-71=1; d6: 71-71=0; d7: 72-71=1; d8: 73-71=2 39 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Escola A: var(x)= -1²+0²+2²+...+-3²/8 var(x)=28/8=3,5 Escola B: var(x)=2²+-5²+...+2²/8 var(x)=36/8=4,5 Resposta: 3,5+4,5=8 2.4. Desvio Padrão O desvio padrão é uma das mais utilizadas medidas de variação de um grupo de dados. A vantagem que apresenta sobre a variância é de permitir uma interpretação direta da variação do conjunto de dados, pois o desvio padrão é expresso na mesma unidade que a variável (Kg, cm, atm...). É representado por “s” e calculado por: s = √∑( xi – Média)2/ (n – 1) Podemos entender o desvio padrão como uma média dos valores absolutos dos desvios, ou seja, dos desvios considerados todos com sinal positivo; média essa obtida, porém, por um processo bastante elaborado: calculamos o quadrado de cada desvio, obtemos a média desses quadrados e, depois, obtemos a raiz quadra- da da média dos quadrados dos desvios. É a estatística utilizada quando se deseja comparar a variação de conjuntos de observações que diferem na média ou que são medidos em grandezas diferentes (unidades de medição diferentes). O coeficiente de variação (C.V.) é o desvio pa- drão expresso como uma porcentagem média. CV = 100. (s / Média. (%) 40 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 16. (CESGRANRIO) Um grupo é formado por 10 pessoas, cujas idades são: 17 19 19 20 20 20 20 21 22 22 Seja µ a média aritmética das idades e σ seu desvio padrão. O número de pessoas desse grupo cujas idades pertencem ao intervalo [µ – σ, µ + σ] é (Considere √2 = 1,4) a) 9 b) 8 c) 7 d) 6 e) 5 Letra c. Seja µ a média aritmética das idades: µ= (17+ 19+ 19+ 20+ 20+ 20+ 20+ 21+ 22+ 22)/10 µ = 200/10= 20 σ2 = [(17-20)2 + 2(19-20)2 + 4(20-20)2+ 1(21-20)2+ 2(22-20)2]/10 σ2 = 20/10 σ2 = 2 σ = √2 = 1,4 Substituindo no intervalo, temos: [µ – σ, µ + σ] [20 -1,4, 20 + σ] [18,6; 21,4] 41 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Quais as idades que se encontram entre 18, 6 e 21,4 das 10 pessoas? Serão: {19,19, 20, 20,20, 20, 21}. Sete pessoas. 17. (2014/VUNESP/DESENVOLVESP) Um casal tem 4 filhos com idades de 1, 6, 8 e 15 anos, respectivamente. O desvio padrão das idades dos filhos é de, aproxima- damente, a) 625. b) 15. c) 14. d) 7. e) 5. Letra e. O Desvio padrão é a raiz quadradas da variância, porém, precisamos encontrar a média aritmética, que será: Me = 30/4 = 7,5. Calculando a variância: S2= (1-7,5)2+ (6-7,5)2 +(8-7,5)2+ (15-7,5)2 4 S2= 101/4= 25,25 S = 5,02 Propriedades do Desvio Padrão e da Variância: 1 – somando-se (ou subtraindo-se) a cada elemento uma constante qualquer, o Desvio Padrão e a Variância não se alteram. 42 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 2 – multiplicando-se (ou dividindo-se) cada elemento por uma constante qualquer: – O desvio padrão fica multiplicado (ou dividido) por essa constante; a vari- ância fica multiplicada (ou dividida) PELO QUADRADO dessa constante. Vamos agora resolver duas questões aplicando as propriedades da média arit- mética, variância e desvio padrão. 18. (ESAF) Em certa empresa, o salário médio era de R$ 90.000,00 e o desvio pa- drão dos salários era de R$ 10.000,00. Todos os salários receberam um aumento de 10%. O desvio padrão dos salários passou a ser de: a) R$ 10.000,00 b) R$ 10.100,00 c) R$ 10.500,00 d) R$ 10.900,00 e) R$ 11.000,00 Letra d. Essa questão é uma aplicação das propriedades do desvio padrão, em que aumen- tar 10% significa multiplicar por uma constante 1,1. Segundo a propriedade: multiplicando-se (ou dividindo-se) cada elemento por uma constante qualquer, o desvio padrão fica multiplicado (ou dividido) por essa constante. Dessa forma, podemos inferir que o novo desvio padrão será: 10.000,00 x 1,1 = 11.000,00 43 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 19. (CESGRARNIO) Se Y = 2X+1 e a variância de X vale 2, a variância de Y é igual a: a) 2 b) 4 c) 5 d) 8 e) 9 Letra d. De acordo com as propriedades da variância, temos que, se multiplicarmos cada elemento por uma constante, a nova variância será multiplicada pelo quadrado da constante. Quanto à soma, a variância fica inalterável. Dessa forma, teremos: VY = 2VX+1 VY = (2)2VX+1 VY = (2)2.(2) +1 ( a soma fica inalterável) VY = (2)2.(2) = 8 2.5. Coeficiente de Variação (Cv) O coeficiente de variação é uma medida relativa de variabilidade. Será calculada pelo coeficiente entre o desvio padrão e a média aritmética. Na estatística descritiva, o desvio-padrão por si só apresenta algumas limita- ções. Assim, um desvio-padrão de três unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 300; no entanto, se a média for igual a 30, por exemplo, o desvio de 3 unidades torna-se representativo. 44 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Sabemos que o desvio-padrão é expresso na mesma unidade dos dados; desta forma, não é possível aplicá-lo na comparação de duas ou mais séries de valores expressas em unidades diferentes. Para atender a essa limitação, podemos caracterizar a dispersão ou variabilida- de dos dados em termos relativos a seu valor médio, medida essa denominada de Coeficiente de Variação. Obs.:� o coeficiente CV é expresso em percentual, pois o desvio padrão e a média possuem as mesmas unidades de medidas. Vejamos uma aplicação. Considere a tabela abaixo que contém as estaturas e os pesos de um mesmo grupo de indivíduos: Média aritmética Desvio padrão Estaturas 175 cm 5 cm Pesos 68 kg 2 Kg Qual das medidas, estatura ou peso, possui maior variação, ou seja, é mais he- terogêneo? Apenas com o desvio padrão não é possível responder a essa pergunta, uma vez que estamos realizando uma comparação entre 02 grandezas. O ideal é calcu- larmos o coeficiente de variação da estatura e do peso e realizarmos uma análise. A série que apresentar a maior variação, ou seja, o maior valor do coeficiente CV, será a série de maior heterogeneidade. Vamos aplicar a fórmula em cada grandeza: CV Estatura: Cv= (5/175) x 100 Cv= 2,85% 45 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha CV Peso Cv= (2/68) x 100 Cv= 2,94% Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão que os pesos, ou seja, maior heterogeneidade. 20. (FUNDAÇÃO CARLOS CHAGAS) Seja X uma variável com média 3 e coeficiente de variação igual a 0,5. Seja Y = -2X + 3. As variâncias de X e Y são dadas, res- pectivamente, por a) 1,5 e 6. b) 2,25 e 9. c) 1,5 e 3. d) 2,25 e 5. e) 2,5 e 6. Letra b. Para encontrarmos as variâncias de X e Y, vamos aplicar as propriedades e a fór- mula do coeficiente de variação. Vamos lá!!! Cvx = coeficiente de variação de x Sx= desvio padrão de x Xx= Média aritmética de x CVx = Sx/Xx ( coeficiente de variação de x) 0,5 = Sx / 3 Sx= 1,5 46 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Sx2= (1,5)2 Sx2= 2,25 (variação de X) Y= -2x + 3 Sy2=-2(Sx2) + 3 (a soma de três não altera a variância) Sy2=-2(Sx2) Sy2=(-2)2.(2,25) = 9 21. (ESAF) Um certo atributo W, medido em unidades apropriadas, tem média amostral 5 e desvio-padrão unitário. Assinale a opção que corresponde ao coefi- ciente de variação, para a mesma amostra, do atributo Y = 5 + 5W. a) 16,7% b) 20,0% c) 55,0% d) 50,8% e) 70,2% Letra a. Outra questão com aplicação das propriedades, vamos lá: Xw = média de W; Sw = desvio padrão de W; Xw = 5 Sw = 1 Para que possamos encontrar o coeficiente de variação de Y, precisamos do desvio padrão e da média aritmética. XY = 5 + 5XW. XY = 5 + 5(5) XY = 30 (média de y) 47 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Desvio padrão de y: SY = 5 + 5SW. SY = 5 + 5(1). (Somar no desvio padrão não influencia, inalterável) SY = 0 + 5(1) = 5 Agora sim, temos a média e o desvio padrão Y, podemos encontrar o coeficiente de variação. Cv y= SY / XY Cv y= 5 / 30 Cv y= 1,16666 = 16,7% 22. (ESAF) O atributo Z= (X-2)/3 tem média amostral 20 e variância amostral 2,56. Assinale a opção que corresponde ao coeficiente de variação amostral de X. a) 12,9% b) 50,1% c) 7,7% d) 31,2% e) 10,0% Letra c. Temos que Z= (X-2)/3, então vamos melhorar um pouco essa expressão: 3Z = X – 2 X – = 3Z + 2 XZ=20 (média de Z) S2z=2,56 (variância de Z) Sz= √2,56 = 1,6 (desvio padrão de Z) 48 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Para encontrarmos o coeficiente de variação X: Cvx= Sx/Xx X – = 3Z + 2 Xx = 3Zz + 2 Xx = 3(20) + 2 Xx = 62 X – = 3Z + 2 Sx = 3. Sz + 2 (somar ou subtrair uma constante no desvio é inalterável) Sx = 3. (1,6) + 0 Sx =4,8 Cvx= Sx/Xx Cvx= 4,8/62 Cvx= 7,7% 23. (2016/VUNESP/MPE-SP) Na estatística, são considerados medidas de disper- são: a) média e moda. b) percentil e coeficiente de variação. c) amplitude total e percentil. d) amplitude total e desvio padrão. e) variância e média. Letra d. Na Estatística descritiva, dispersão mostra o quão dispersa se encontra a distri- buição os valores em relação à média. Exemplos comuns de medidas de dispersão estatística são a variância, o desvio padrão e a amplitude interquartil. 49 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Ainda com relação à estatística descritiva, vejamos sobre assimetria e curtose: Assimetria As medidas de assimetria indicam o grau de assimetria de uma distribuição de frequências unimodal em relação a uma linha vertical que passa por seu ponto mais elevado. Distribuição Simétrica Graficamente, uma distribuição simétrica tem associada a si uma curva de fre- quências unimodal apresentando duas “caudas” simétricas em relação a uma li- nha vertical, que passa por seu ponto mais alto (eixo de simetria). Distribuições Assimétricas Uma distribuição assimétrica tem associada a si uma curva de frequências uni- modal que apresenta, a partir do seu ponto mais alto, uma “cauda” mais longa para a direita (assimetria positiva) ou para a esquerda (assimetria negativa). 50 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Nas distribuições assimétricas, os valores da moda, da mediana e da média, di- vergem, sendo que a média sempre estará do mesmo lado que a cauda mais longa. Fonte: https://www.grancursospresencial.com.br/novo/upload/a419092005194957.pdf Agora, vamos juntos comentar uma questão para que possamos entender melhor. 24. (2014/VUNESP/TJ-PA/ANALISTA JUDICIÁRIO/ESTATÍSTICA) A figura abaixo representa o gráfico relativo a uma distribuição de frequência F para uma amostra de dados. Seja Me o valor da média, Md o valor da mediana e Mo o valor da moda, então: 51 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha a) Me < Md < Mo b) Md < Mo < Me c) Mo < Md < Me d) Me < Mo < Md e) Md < Me < Mo Letra c. Independentemente se a distribuição é assimétrica, à direita ou à esquerda, a maior frequência se encontra no ápice do gráfico, ou seja, é a moda. O gráfico da questão trata de uma distribuição assimétrica à direita. A medida de tendência central que sofre influência dos extremos é a média aritmética, logo, fica a dica, ela sempre estará na calda do gráfico. Sendo assim, sobra a mediana que se encontrará entre a moda e a média aritmética. A reta x cresce da esquerda para a direita: Temos que a Mo < Md < Me. 52 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 25. (CESGRANRIO) Analise as afirmações a seguir. Numa distribuição simétrica, a média e a mediana coincidem. PORQUE Numa distribuição simétrica a moda nem sempre existe. Quanto às afirmações acima, pode-se concluir que a) as duas asserções são verdadeiras e a segunda é uma justificativa correta da primeira. b) as duas asserções são verdadeiras e a segunda não é uma justificativa correta da primeira. c) a primeira asserção é uma proposição verdadeira e a segunda, uma proposição falsa. d) a primeira asserção é uma proposição falsa e a segunda, uma proposição ver- dadeira. e) tanto a primeira como a segunda são proposições falsas. Letra b. Conforme os conceitos vistos nesta aula, podemos inferir que as duas asserções são verdadeiras e a segunda não é uma justificativa correta da primeira. 26. (2015/VUNESP/TJ-SP) A distribuição de salários de uma empresa com 30 fun- cionários é dada na tabela seguinte. Salário (em salários mínimos) Funcionários 1,8 10 2,5 8 3,0 5 53 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 5,0 4 8,0 2 15,0 1 De acordo com a tabela, assinale a afirmação verdadeira. a) A distribuição é simétrica. b) A distribuição tem assimetria positiva. c) A moda é 10. d) A mediana é 5. e) O menor salário é 1. Letra b. MODA: analisando a tabela, podemos inferir que a moda igual a 1,8, devido ao aparecimento da maior frequência absoluta. MEDIANA: colocando os salários em rol, podemos encontrar a mediana igual a 2,5 (ordenando os valores dos salários (n = 30), e teremos que a posição 15º e 16º terá valores iguais a 2,5. Logo, mediana será a média aritmética (2,5 + 2,5) /2 = 2,5) MÉDIA = 15 + (8.2) + (5.4) + (3.5) + (2, 5.8) + (1, 8.10) / 30 = 104/30 = 3,5 Analisando os valores das medidas de centralidade, temos: Mo < Md < Me A distribuição é assimétrica positiva. Curtose Denomina-se curtose o grau de “achatamento” de uma distribuição de frequên- cias, geralmente unimodal, medido em relação ao de uma distribuição normal (de Gauss) que é tomada como padrão. 54 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha De uma maneira mais simples, podemos dizer que curtose é o “grau de achata- mento” de uma distribuição de frequências; o que as medidas de curtose buscam indicar realmente é o grau de concentração de valores da distribuição em torno do centro desta distribuição. Numa distribuição unimodal, quanto maior for a concentração de valores em torno do centro da mesma, maior será o valor da sua curtose. Graficamente, isto será associado a uma curva com a parte central mais afilada, mostrando um pico de frequência simples mais destacado, mais pontiagudo, carac- terizando a moda da distribuição de forma mais nítida. Dizemos que uma distribuição de frequências é Mesocúrtica – quando apresenta uma medida de curtose igual à da distribui- ção normal. Platicúrtica – quando apresenta uma medida de curtose menor que a da dis- tribuição normal. Leptocúrtica – quando apresenta uma medida de curtose maior que a da dis- tribuição normal. Coeficiente Percentílico de Curtose Este coeficiente é definido como o quociente entre a amplitude semi-interquar- tílica e a amplitude entre o 10º e o 90º percentis. O valor deste coeficiente para a curva normal é 0, 26367... 55 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Assim sendo, ao calcularmos o coeficiente percentílico de curtose de uma distri- buição qualquer, teremos: Quando Cp ≅ 0,263 →diremos que a distribuição é mesocúrtica. Quando Cp < 0,263 →diremos que a distribuição é platicúrtica. Quando Cp > 0,263 →diremos que a distribuição é leptocúrtica. Coeficiente Momento de Curtose O coeficiente momento de curtose é definido como o quociente entre o momen- to centrado de quarta ordem (m4) e o quadrado do momento centrado de segunda ordem (variância). O valor deste coeficiente para a curva normal é 3,00. Portanto: Quando Cm ≅ 3,00 →diremos que a distribuição é mesocúrtica. Quando Cm < 3,00 →diremos que a distribuição é platicúrtica. Quando Cm > 3,00 →diremos que a distribuição é leptocúrtica. Fonte: https://www.grancursospresencial.com.br/novo/upload/a419092005194957.pdf 27. (2014/VUNESP/DESENVOLVESP) A medida do “achatamento” de uma distribui- ção de probabilidade é denominada a) assimetria. b) variância. c) desvio padrão. d) curtose. e) desvio absoluto médio. 56 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Letra d. Denomina-se curtose o grau de “achatamento” de uma distribuição de frequên- cias, geralmente unimodal, medido em relação ao de uma distribuição normal (de Gauss), que é tomada como padrão. Vejamos algumas questões de probabilidade,blz?! 28. (2015/VUNESP/PREFEITURA DE SÃO PAULO-SP) Em um bairro da cidade, foi feita uma enquete para verificar a preferência da comunidade em relação a dois projetos: construção de uma árvore de natal ou um espetáculo com um cantor popular. Os entrevistados deveriam optar por apenas uma dessas duas opções. Su- pondo que a chance de escolha de cada uma das opções é de 50%, a probabilidade de se conseguir 4 votos para o espetáculo e 2 votos para a construção da árvore, em um total de 6 votos, é, aproximadamente, igual a a) 24,5%. b) 44,9%. c) 33,3%. d) 23,4%. e) 28,1%. Letra d. Temos eventos sucessivos em que a chance de construção de uma árvore de natal é igual a 50%, e de um espetáculo com um cantor popular também é de 50%. 57 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Mas a questão afirma que, em seis votos, a chance de termos 4 votos para o espe- táculo e 2 votos para a construção da árvore é: E (espetáculo) = 1/2 A (árvore) = 1/2 E.E.E.E.A.A ½.½.½.½.½.½. = 1/64 Não podemos esquecer a questão da ordem em que os votos podem ocorrer, sendo assim, teremos 6!/4!.2!, ordens distintas, que é igual a 15 ordens. 29. (2015/VUNESP/TJ-SP/ESTATÍSTICO JUDICIÁRIO) Leia o texto a seguir para responder à questão. Uma pesquisa com uma amostra de jovens entre 18 e 25 anos de uma comunidade revelou que 70% deles estudam e que 50% deles trabalham. A pesquisa mostrou ainda que 40% desses jovens trabalham e estudam. Escolhido um jovem entre 18 e 25 anos dessa comunidade, a probabilidade de que seja estudante, sabendo-se que não trabalha, é de a) 30% b) 40% c) 50% d) 60% e) 70% 58 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha Letra d. Vamos construir os diagramas para que você possa entender melhor: Se 70% estudam e 40% estudam e trabalham, então 30% só estudam. Se 50% trabalham, então 50% não trabalham. P (n) = 30% / 50% P (n) = 60% 30. (2015/VUNESP/TJ-SP/ESTATÍSTICO JUDICIÁRIO) Leia o texto a seguir para responder à questão. Uma pesquisa com uma amostra de jovens entre 18 e 25 anos de uma comunidade revelou que 70% deles estudam e que 50% deles trabalham. A pesquisa mostrou ainda que 40% desses jovens trabalham e estudam. Escolhendo-se, ao acaso, dois jovens entre 18 e 25 anos dessa comunidade, a pro- babilidade de que pelo menos um deles seja estudante é de a) 91% b) 70% c) 49% 59 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha d) 30% e) 9% Letra a. Vamos construir os diagramas para que você possa entender melhor: Agora, temos dois jovens, em que pelo menos um seja estudante; então pode ser também os dois jovens estudantes. Pela exclusão, o que não pode acontecer são os dois jovens não serem estudantes. Vamos considerar o geral (todo =1) e subtrair o que não serve (os dois não serem estudantes): - (30/100 x 29/99) 1- (0,3. 0,2929) 1 - ( 0,0878787) = 0,9112 = 91% 31. (2014/VUNESP/TJ-PA/ANALISTA JUDICIÁRIO/ESTATÍSTICA) As probabilidades de três times de futebol A, B e C vencerem seus jogos na próxima rodada de um campeonato, considerando-se o time que cada um deles vai enfrentar, são inde- pendentes e são dadas por: pa) = 2/5; pb) = 3/8 e pc) = 1/2. Ocorrendo os três jogos, a probabilidade de que apenas A vença o seu jogo é: 60 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha a) 0,4%. b) 1,25%. c) 4%. d) 12,5%. e) 40%. Letra d. Temos que a probabilidade de A vencer: 2/5 Temos que a probabilidade de B perder: 5/8 Temos que a probabilidade de C perder: 1/2 2/5 x 5/8 x 1/2 = 10/80 = 0,125 = 12,5 % 61 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha QUESTÕES DE CONCURSO 1. (2015/PREFEITURA DE SÃO PAULO-SP) Utilize o texto e as tabelas para respon- der à questão. Duas amostras de 8 pessoas foram escolhidas em duas escolas, A e B, para a rea- lização de um estudo sobre a obesidade entre adolescentes. As 16 pessoas foram pesadas, e o resultado está expresso nas tabelas a seguir: Escola A Escola B Pessoas Massa (kg) Pessoas Massa (kg) 1 62 1 73 2 63 2 66 3 65 3 70 4 60 4 71 5 64 5 72 6 63 6 71 7 66 7 72 8 61 8 73 Percentualmente, a média aritmética das massas dos alunos relacionados da escola B supera a média aritmética das massas dos alunos relacionados da escola A em, aproximadamente, a) 17%. b) 13%. c) 21%. d) 18%. e) 9% 62 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 2. (2015/PREFEITURA DE SÃO PAULO-SP) Utilize o texto e as tabelas para respon- der à questão. Duas amostras de 8 pessoas foram escolhidas em duas escolas, A e B, para a rea- lização de um estudo sobre a obesidade entre adolescentes. As 16 pessoas foram pesadas, e o resultado está expresso nas tabelas a seguir: Escola A Escola B Pessoas Massa (kg) Pessoas Massa (kg) 1 62 1 73 2 63 2 66 3 65 3 70 4 60 4 71 5 64 5 72 6 63 6 71 7 66 7 72 8 61 8 73 A variabilidade dos dados da escola B é maior do que a variabilidade obtida com os dados da escola A. A diferença entre o desvio padrão obtido para a escola B e o desvio padrão obtido para a escola A está no intervalo entre a) 0,17 kg e 0,21 kg. b) 0,29 kg e 0,33 kg. c) 0,13 kg e 0,17 kg. d) 0,21 kg e 0,25 kg. e) 0,25 kg e 0,29 kg. 63 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 3. (2015/PREFEITURA DE SÃO PAULO-SP) A distorção ou o desvio que é compro- vadamente não representativo de distorção ou desvio em uma população denomi- na-se, a) estratificação. b) taxa tolerável de desvio. c) anomalia. XX d) amostragem estatística. e) unidade de amostragem. 4. (2015/VUNESP/TJ-SP) A distribuição de salários de uma empresa com 30 fun- cionários é dada na tabela seguinte. Salário (em salários mínimos) Funcionários 1,8 10 2,5 8 3,0 5 5,0 4 8,0 2 15,0 1 A média de salários mais a mediana é, aproximadamente, igual a a) 6,0. b) 6,5. c) 7,0. d) 7,5. e) 8,0. 64 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha 5. (2015/TJ-SP/ESTATÍSTICO JUDICIÁRIO) Considere a tabela de distribuição de frequência seguinte, em que xi é a variável estudada e fi é a frequência absoluta dos dados. xi fi 30 — 35 4 35 — 40 12 40 — 45 10 45 — 50 8 50 — 55 6 TOTAL 40 A mediana dos dados é a) 30,75. b) 42,00. c) 47,75. d) 50,25. e) 52,75. 6. (2015/TJ-SP/ESTATÍSTICO JUDICIÁRIO) Na tabela seguinte, são anotadas as idades de 40 pessoas inscritas para participar do júri em um julgamento. 19 19 22 22 22 27 27 28 29 29 29 30 31 33 33 34 34 34 35 35 35 36 36 37 38 38 38 38 42 44 44 44 46 48 52 58 68 68 78 82 65 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha O juiz, consultando essa tabela, decide não convocar os candidatos cujas idades es- tão abaixo do 1º quartil, bem como aqueles cujas idades estão acima do 3º quartil. O 1º e o 3º quartil são, respectivamente, a) 29 e 44. b) 29 e 42. c) 30 e 44. d) 30 e 50. e) 29 e 46. 7. (2015/TJ-SP/ESTATÍSTICO JUDICIÁRIO) Dados os valores de uma variável: 5, 10, 15, 20, 25, as variâncias amostral e populacional são, respectivamente, a) 14,7 e 15. b) 125 e 250. c) 62,5 e 50. d) 29,4 e 30,8. e) 83,3 e 85. 66 de 66 MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA Estatística Prof. Josimar Padilha GABARITO 1. b 2. e 3. c 4. a 5. b 6. a 7. c
Compartilhar