Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA EXAME CFC Prof. Guilherme Neves @profguilhermeneves t.me/profguilhermeneves 5.12 Será admitido o uso de máquina calculadora, desde que não permita o armazenamento de texto. Conteúdo Programático - Estatística h) Distribuição de Frequência: Intervalos de classe. Histogramas e polígono de frequência. Frequência acumulada e relativa. Representação gráfica. i) Descrição de Dados: Média aritmética. Média geométrica. Mediana. Moda. Quartis, decis e percentis. Amplitude. Desvio médio, variância e desvio-padrão. Coeficiente de variação. j) Probabilidades: Eventos independentes, dependentes e mutuamente exclusivos. Valor esperado. Probabilidade condicional. Distribuição discreta e contínua. Distribuição binomial. Distribuição normal. Análise combinatória. Variáveis aleatórias. k) Regressão e Correlação: Teoria da correlação. Correlação linear e múltipla. Medidas de correlação. Mínimos quadrados. Equação da correlação. Erro padrão. Variação explicada e não explicada. Coeficiente de determinação e de correlação. Equação de regressão. Diagrama de dispersão. Análise de correlação e regressão. l) Números Índices: Construção de índices simples e compostos. Mudança de base de um número índice. Índice de preço ao consumidor. Deflação. m) Teoria da Amostragem: Amostras e populações. Amostra aleatória. Valor esperado. n) Testes de Hipóteses: Teste de diferenças de médias. Determinação do tamanho da amostra. Teste Qui Quadrado. Distribuição T Student. Distribuição binomial. Distribuição F. Teste de Diferença entre Variâncias. 𝑥 = 𝑥1 + 𝑥2 +⋯+ 𝑥𝑛 𝑛 𝑥 = σ𝑥𝑛 𝑛 Média Aritmética Exemplo: Calcular a média aritmética dos números 4, 7, 8, 29. Se um problema simplesmente pedir para calcular a média sem especificar qual o tipo de média, você deverá calcular a média aritmética. Se é dada a média de um conjunto, basta multiplicar a média pela quantidade de termos para calcular a soma total. Por exemplo, se a média salarial de 8 pessoas é de 1.500 reais, então, juntos, eles recebem 8 x 1.500 = 12.000 reais. Isto é decorrente da própria definição de média aritmética. ഥ𝑥 = 𝑆𝑜𝑚𝑎 𝑛 ⟺ 𝑆𝑜𝑚𝑎 = 𝑛 ∙ 𝑥 Média Aritmética Ponderada Matéria Nota (xi) Peso (pi) Matemática 9,5 4 Física 8,5 5 Química 7 3 História 5 1 Biologia 4 2 Média Aritmética Ponderada Matéria Nota (xi) Peso (pi) Nota x Peso Matemática 9,5 4 9,5 x 4 = 38 Física 8,5 5 8,5 x 5 = 42,5 Química 7 3 7 x 3 = 21 História 5 1 5 x 1 = 5 Biologia 4 2 4 x 2 = 8 Média Aritmética Ponderada 𝑥 = 38 + 42,5 + 21 + 5 + 8 4 + 5 + 3 + 1 + 2 = 114,5 15 ≅ 7,63 Matéria Nota (xi) Peso (pi) Nota x Peso Matemática 9,5 4 9,5 x 4 = 38 Física 8,5 5 8,5 x 5 = 42,5 Química 7 3 7 x 3 = 21 História 5 1 5 x 1 = 5 Biologia 4 2 4 x 2 = 8 Média Aritmética Ponderada Vamos generalizar. Se temos uma lista de números 𝑥1, 𝑥2, … , 𝑥𝑛 com pesos respectivos 𝑝1, 𝑝2, … , 𝑝𝑛 , então a média aritmética ponderada é dada por: ഥ𝑥 = 𝑥1𝑝1 + 𝑥2𝑝2 +⋯+ 𝑥𝑛𝑝𝑛 𝑝1 + 𝑝2 +⋯+ 𝑝𝑛 Média para Dados Agrupados por Valor Idade (xi) Frequência (fi) 25 21 30 47 34 54 38 41 41 37 Total 200 Idade (xi) Frequência (fi) xi fi 25 21 25 x 21 = 525 30 47 30 x 47 = 1.410 34 54 34 x 54 = 1.836 38 41 38 x 41 = 1.558 41 37 41 x 37 = 1.517 Total 200 6.846 Média para Dados Agrupados por Valor Idade (xi) Frequência (fi) xi fi 25 21 25 x 21 = 525 30 47 30 x 47 = 1.410 34 54 34 x 54 = 1.836 38 41 38 x 41 = 1.558 41 37 41 x 37 = 1.517 Total 200 6.846 𝑥 = 6.846 200 = 34,23 𝑎𝑛𝑜𝑠 Média para Dados Agrupados por Valor Média para Dados Agrupados por Classe Estaturas (cm) Frequência (fi) 150 – 154 4 154 – 158 9 158 – 162 11 162 – 166 8 166 – 170 5 170 – 174 3 Total 40 Média para Dados Agrupados por Classe Estaturas (cm) Frequência (fi) Ponto Médio (xi) 150 – 154 4 152 154 – 158 9 156 158 – 162 11 160 162 – 166 8 164 166 – 170 5 168 170 – 174 3 172 Total 40 Média para Dados Agrupados por Classe Estaturas (cm) Frequência (fi) Ponto Médio (xi) xi fi 150 – 154 4 152 4 x 152 = 608 154 – 158 9 156 9 x 156 = 1.404 158 – 162 11 160 11 x 160 = 1.760 162 – 166 8 164 8 x 164 = 1.312 166 – 170 5 168 5 x 168 = 840 170 – 174 3 172 3 x 172 = 516 Total 40 6.440 Estaturas (cm) Frequência (fi) Ponto Médio (xi) xi fi 150 – 154 4 152 4 x 152 = 608 154 – 158 9 156 9 x 156 = 1.404 158 – 162 11 160 11 x 160 = 1.760 162 – 166 8 164 8 x 164 = 1.312 166 – 170 5 168 5 x 168 = 840 170 – 174 3 172 3 x 172 = 516 Total 40 6.440 𝑥 = 6.440 40 = 161 𝑐𝑚 Média para Dados Agrupados por Classe 01. (CFC 2017/1) A tabela a seguir representa os salários médios de um grupo de 50 empregados de uma determinada Sociedade Empresária, em certo mês, agrupados em classes. Considerando-se apenas as informações apresentadas, o salário médio desses empregados, no mês indicado, foi de: a) R$2.520,00. b) R$3.800,00. c) R$4.000,00. d) R$4.600,00. Mediana A mediana (ou valor mediano) é outra medida de posição definida como número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. Mediana para Dados Não-Agrupados Tomemos como exemplo a seguinte série de valores: 5,10,13,12,7,8,4,3,9. Mediana para Dados Não-Agrupados Tomemos como exemplo a seguinte série de valores: 5,10,13,12,7,8,4,3,9. De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (colocar os dados brutos em rol) dos valores. 3,4,5,7,8,9,10,12,13. 2,6,7,10,12,13,18,21 Por definição, quando o número de elementos for par, a mediana será QUALQUER número entre os dois termos centrais. Como há infinitos valores entre os dois termos centrais e, portanto, infinitas medianas, CONVENCIONOU-SE utilizar o ponto médio para o cálculo da mediana. Estando ordenados os dados numéricos e sendo 𝑛 o número de elementos, o valor mediano será: - O termo de ordem 𝑛+1 2 , se 𝑛 for ímpar. - A média aritmética dos termos de ordem 𝑛 2 e 𝑛 2 + 1, se 𝑛 for par. O valor da mediana pode coincidir ou não com um elemento da série. Quando o número de elementos da série é ímpar, há coincidência. O mesmo não acontece, porém, quando esse número é par. A mediana depende da posição e não é influenciada por valores extremos dos elementos na série ordenada. Essa é uma das diferenças marcantes entre a mediana e a média (que se deixa influenciar, e muito, pelos valores extremos, também chamados de outliers). Mediana para Dados Agrupados por Valor Notas Frequência 2 2 4 6 6 10 8 12 10 9 Mediana para Dados Agrupados em Classes Classes Frequência 40 – 50 2 50 – 60 5 60 – 70 7 70 – 80 8 80 – 90 3 Mediana para Dados Agrupados em Classes 𝑴𝒅 = 𝒍𝒊 + 𝒏 2 − 𝒇𝒂𝒄𝒂𝒏𝒕 𝒇𝒊 ∙ 𝒉 Moda A moda é definida como sendo aquele valor ou valores que ocorrem com maior frequência em um rol. Moda A moda é definida como sendo aquele valor ou valores que ocorrem com maior frequência em um rol. Baseado neste contexto, um conjunto de valores pode apresentar mais de uma moda. Nesse caso, dizemos ser plurimodal (ou polimodal), caso contrário, será unimodal (apenas uma moda), ou ainda, amodal (quando todos os valores das variáveis em estudo apresentarem uma mesma frequência). Moda para Dados Não-Agrupados Para a identificação da moda em um conjunto ordenado de valores não agrupados em classe, basta verificar, no conjunto, aquele valor que aparece com maior frequência. Para a identificação da moda em um conjunto ordenado de valores não agrupados em classe, basta verificar, no conjunto, aquele valor que aparece com maior frequência. Exemplos: 𝑋1 = {1, 2, 3, 4, 6, 9, 10} – Conjunto Amodal, pois todos os valores possuem a mesma frequência. 𝑋2= {2, 4, 6, 10, 10, 10, 13} – Conjunto Unimodal (𝑀𝑜 = 10) 𝑋3 = {2, 2, 2, 3, 4, 4, 4, 5, 6, 10, 13} – Conjunto Bimodal (𝑀𝑜1 = 2 e 𝑀𝑜2 = 4). Moda para Dados Agrupados Quando os dados estiverem dispostos em uma tabela com frequências, não agrupados em classes, a localização da moda é imediata, bastando para isso, verificar na tabela, qual o valor associado à maior frequência. Moda para Dados Agrupados Quando os dados estiverem dispostos em uma tabela com frequências, não agrupados em classes, a localização da moda é imediata, bastando para isso, verificar na tabela, qual o valor associado à maior frequência. Estatura (m) Frequência 1,60 3 1,62 8 1,64 12 1,70 20 1,73 10 1,80 7 1,83 3 1,88 1 02. (CFC 2015/2) Uma Sociedade Empresária obteve uma receita total, no ano de 2014, no valor de R$31.200,00, distribuída mensalmente como segue: Analisando-se os dados e calculando-se as medidas de tendência central, pode-se afirmar que a mediana é de: a) R$1.450,00. b) R$1.850,00. c) R$2.600,00. d) R$2.700,00. 03. (CFC 2014/2) Uma empresa de logística oferece serviços de armazenagem em um galpão climatizado e serviços de transporte de mercadorias. O valor das tarifas a serem cobradas por ambos os serviços foi estabelecido em função do espaço necessário para a armazenagem e da distância para o frete. As tarifas estabelecidas são apresentadas na tabela abaixo: Com base nos dados apresentados na tabela acima, assinale a opção INCORRETA. a) A média aritmética da Tarifa do Frete por km rodado é de R$2,29 por km. b) A média aritmética da Tarifa da Armazenagem por m2 é de R$52,00 por m2. c) A mediana da Tarifa da Armazenagem do espaço total é de R$156,00. d) A mediana da Tarifa do Frete para a distância total é de R$68,57. 04. (CFC 2011/1) Os preços em reais (R$) para uma amostra de equipamentos de som estão indicados na tabela abaixo. Com base na amostra, o valor CORRETO da mediana é igual a: a) R$440,00. b) R$470,00. c) R$512,00. d) R$627,00. Variância A variância é a média aritmética dos quadrados dos desvios. 𝜎2 = 𝑥𝑖 − 𝑥 2 𝑛 Variância Desvio Padrão O desvio padrão é a raiz quadrada da variância. O desvio padrão é a raiz quadrada da variância. A variância é o quadrado do desvio padrão. Desvio Padrão Se os elementos forem todos iguais, todos os desvios serão iguais a zero. Consequentemente, a variância será nula e também o desvio padrão. População e Amostra Variância populacional → 𝜎2 Variância amostral → 𝑠2 Desvio padrão populacional → 𝜎 Desvio padrão amostral → 𝑠 População e Amostra 𝜎2 = 𝑥𝑖 − 𝑥 2 𝑛 𝑠2 = 𝑥𝑖 − 𝑥 2 𝑛 − 1 Dados os valores de uma variável: 5, 10, 15, 20, 25, as variâncias amostral e populacional são, respectivamente, a) 14,7 e 15. b) 125 e 250. c) 62,5 e 50. d) 29,4 e 30,8. e) 83,3 e 85. O desvio padrão dos valores 2, 6, 4, 3, e 5 é, aproximadamente, a) 2,00. b) 1,83. c) 1,65. d) 1,41. e) 1,29. Propriedades do Desvio Padrão Somando-se (ou subtraindo-se) uma constante c de todos os valores de uma lista de números, o desvio padrão não é alterado. Multiplicando-se (ou dividindo-se) uma constante c de todos os valores de uma lista de números, o desvio padrão da lista fica multiplicado (ou dividido) por esta constante. Propriedades do Desvio Padrão Somando-se (ou subtraindo-se) uma constante c de todos os valores de uma lista de números, a variância não é alterada. Multiplicando-se (ou dividindo-se) uma constante c de todos os valores de uma lista de números, a variância da lista fica multiplicado (ou dividido) pelo quadrado dessa constante. Propriedades da Variância Variância Populacional → 𝜎2 = 𝑋2 − 𝑋 2 Variância Amostral → 𝑠2 = 𝑋2 − 𝑋 2 ∙ 𝑛 𝑛−1 Fórmula Alternativa para Variância O desvio padrão dos valores 2, 6, 4, 3, e 5 é, aproximadamente, a) 2,00. b) 1,83. c) 1,65. d) 1,41. e) 1,29. Coeficiente de Variação O coeficiente de variação é a razão entre o desvio padrão e a média, ou seja, 𝐶𝑉 = 𝜎 𝑋 . Coeficiente de Variação O coeficiente de variação é a razão entre o desvio padrão e a média, ou seja, 𝐶𝑉 = 𝜎 𝑋 . Como o desvio padrão e a média possuem a mesma unidade, o coeficiente de variação é adimensional. É muito comum que o coeficiente de variação seja expresso em porcentagem. Coeficiente de Variação 05. (CFC 2019/1) Durante o primeiro semestre de 2019, as Sociedades Empresárias Alfa e Beta apresentaram os seguintes valores de receitas de vendas ao mês: Considerando apenas as informações apresentadas, quais são os respectivos valores que mais se aproximam do desvio-padrão amostral das receitas de vendas da Sociedade Alfa e da Sociedade Beta no primeiro semestre de 2019? a) 7.071,07 e 7.340,91 b) 7.340,91 e 7.071,07 c) 7.340,91 e 8.041,56 d) 7.745,97 e 8.916,28 06. (CFC 2019/2) Os seguintes dados amostrais foram obtidos de uma pesquisa que buscou saber o comportamento de determinada ação cotada em bolsa de valores no decorrer de nove pregões. Considerando apenas os dados amostrais apresentados, é correto afirmar que: a) A mediana dos preços é igual a R$ 7,50. b) A variância dos preços é, aproximadamente, R$ 0,30. c) A média aritmética simples dos preços é igual a R$ 7,00. d) O desvio-padrão dos preços é, aproximadamente, R$ 0,09. Aluno Altura (cm) Massa (kg) 1 158 55 2 156 52 3 177 74 4 159 57 5 164 64 6 158 59 7 184 91 8 177 85 9 168 66 10 160 52 11 173 68 12 154 51 13 172 83 14 174 69 15 173 70 16 168 75 17 155 47 18 155 55 19 181 87 20 167 64 21 164 62 22 163 63 23 166 63 24 170 69 25 171 67 Correlação Linear Aluno Altura (cm) Massa (kg) 1 158 55 2 156 52 3 177 74 4 159 57 5 164 64 6 158 59 7 184 91 8 177 85 9 168 66 10 160 52 11 173 68 12 154 51 13 172 83 14 174 69 15 173 70 16 168 75 17 155 47 18 155 55 19 181 87 20 167 64 21 164 62 22 163 63 23 166 63 24 170 69 25 171 67 Correlação Linear 𝑟 = 𝑋𝑖 − ത𝑋 ∙ 𝑌𝑖 − ത𝑌 𝑋𝑖 − ത𝑋 2 ∙ 𝑌𝑖 − ത𝑌 2 Coeficiente de Correlação Linear de Pearson 𝑋𝑖 − ത𝑋 ∙ 𝑌𝑖 − ത𝑌 = 𝑋𝑖 ∙ 𝑌𝑖 − 𝑛 ∙ ത𝑋 ∙ ത𝑌 𝑋𝑖 − ത𝑋 ∙ 𝑌𝑖 − ത𝑌 = 𝑋𝑖 ∙ 𝑌𝑖 − 𝑛 ∙ ത𝑋 ∙ ത𝑌 𝑋𝑖 − ത𝑋 2 =𝑋𝑖 2 − 𝑛 ∙ ത𝑋 2 𝑋𝑖 − ത𝑋 ∙ 𝑌𝑖 − ത𝑌 = 𝑋𝑖 ∙ 𝑌𝑖 − 𝑛 ∙ ത𝑋 ∙ ത𝑌 𝑋𝑖 − ത𝑋 2 =𝑋𝑖 2 − 𝑛 ∙ ത𝑋 2 𝑌𝑖 − ത𝑌 2 =𝑌𝑖 2 − 𝑛 ∙ ത𝑌 2 −1 ≤ 𝑟 ≤ 1 −1 ≤ 𝑟 ≤ 1 r = 0,9293355 −1 ≤ 𝑟 ≤ 1 r = 0,9293355 r = 1 −1 ≤ 𝑟 ≤ 1 r = -0,9836038 −1 ≤ 𝑟 ≤ 1 r = -0,9836038 r = -1 −1 ≤ 𝑟 ≤ 1 r = -0,0205218 É importante notar que o coeficiente de correlação calcula a “força” da relação linear entre as variáveis. Se o coeficiente é zero ou bem próximo de zero, então não existe relação linear entre as variáveis. Entretanto, é possível que as variáveis sigam um outro modelo matemático (polinomial, trigonométrico, logarítmico, exponencial, etc). Uma forte correlação não significa causalidade. A correlação mede a relação linear entre duas variáveis, mas não significa que a variação de uma cause a variação da outra. Por exemplo, existe uma correlação entre o consumo de cerveja e o número de ataques de tubarão. Com o aumento da temperatura no verão, mais pessoas vão à praia e consomem mais cerveja. Com isso, aumenta também o número de ataques de tubarão. Dessa forma, o aumento de temperatura no verão é a causa comum aos dois aumentos. É possível ainda que dois eventos tenham uma forte correlação mesmo sem causalidade nem causa em comum. Simplesmente por acaso. São as chamadas “correlações espúrias”. X Y 1 3 3 6 4 5 8 10 07. (CFC 2018/2) Durante todo o mês de julho de 2018, a Sociedade Empresária Alfa realizou pesquisa diária visando medir a força relativa da relação linear entre o número de acessos ao seu site na Internet e o volume de vendas (em R$) de seu Produto “A”. Sabe-se que os dados amostrais obtidos para os quatro primeiros dias de pesquisa foram: Considerando-se apenas as informações apresentadas, qualdas alternativas a seguir apresenta o valor que mais se aproxima do coeficiente de correlação (r de Pearson) existente entre o número de acessos ao site e o volume de vendas do Produto “A” nos quatro primeiros dias da pesquisa? a) 1. b) 4. c) 9. d) 18. 08. (CFC 2013/1) Uma determinada indústria produz três produtos. A produção total é 1.000 unidades por mês. O controle de qualidade da indústria registrou os seguintes números de peças defeituosas na produção: A probabilidade de encontrar uma peça defeituosa do produto B é de: a) 10%. b) 14%. c) 15%. d) 18%. Estatísticas do Departamento de Trânsito sobre o envolvimento de motoristas em acidentes com até 2 anos de habilitação indicam que o seguinte modelo pode ser adotado, ou seja, a variável aleatória X representa o número de acidentes e assume valores 0,1,2,3 e 4: O valor esperado e o desvio padrão da variável aleatória X são, respectivamente, a) 1,9 e 1,64 b) 1,9 e 2,69 c) 2,0 e 1,64 d) 2,0 e 2,69 e) 2,69 e 1,9 Número de Acidentes (X) 0 1 2 3 4 P(X=x) 0,3 0,2 0,1 0,1 0,3 09. (CFC 2013/1) Um investidor está considerando duas alternativas de investimento. Para cada alternativa de investimento, há três resultados possíveis. O Valor Presente Líquido – VPL dos resultados e a respectiva probabilidade de ocorrência, para cada alternativa de investimento, são: Considerando o Valor Esperado dos dois investimentos, é CORRETO afirmar que o melhor investimento é o: a) Investimento A, cujo valor esperado é de R$152.000,00, superior ao valor esperado do Investimento B. b) Investimento A, cujo valor esperado é de R$456.000,00, superior ao valor esperado do Investimento B. c) Investimento B, cujo valor esperado é de R$176.000,00, superior ao valor esperado do Investimento A. d) Investimento B, cujo valor esperado é de R$200.000,00, superior ao valor esperado do Investimento A. 10. (CFC 2013/2) Uma sociedade empresária apresentou as seguintes estimativas de vendas de computadores: A quantidade esperada de unidades a serem vendidas no mês é de: a) 140 unidades. b) 164 unidades. c) 165 unidades. d) 660 unidades. 11. (CFC 2011/1) A quantidade diária de unidades vendidas do produto X em uma determinada indústria segue uma distribuição normal, com média de 1.000 unidades e desvio padrão de 200 unidades. O gráfico abaixo representa a distribuição normal padrão com média igual a 0 (zero) e desvio-padrão igual a 1 (um), cujas percentagens representam as probabilidades entre os valores de desvio-padrão. Com base nas informações fornecidas, é CORRETO afirmar que: a) a probabilidade de a quantidade vendida ficar abaixo de 800 unidades é de 34,13%. b) a probabilidade de a quantidade vendida ficar acima de 1.200 unidades é de 13,6%. c) a probabilidade de a quantidade vendida ficar entre 800 e 1.200 unidades é de 68,26%. d) a probabilidade de a quantidade vendida ficar entre 800 e 1.200 unidades é de 31,74%. OBRIGADO Prof. Guilherme Neves
Compartilhar