Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prof. Me. Luiz Felix UNIDADE I Estatística Aplicada Estatística: Um conjunto de métodos e processos quantitativos que serve para estudar e medir fenômenos coletivos. A estatística se interessa por obter conclusões a partir dos dados observados. A estatística facilita a tomada de decisões através do conhecimento de situações passadas, presentes e de previsões fundamentadas da evolução futura. Conceitos gerais Descritiva: tem por objetivo descrever e analisar determinada população, utilizando métodos numéricos e gráficos para se determinarem padrões em um conjunto de dados, e, assim, apresentar a informação em uma forma conveniente. Exemplo: Índice Nacional de Preço ao Consumidor (INPC) que envolve a sintetização dos aumentos dos produtos da cesta básica. Inferencial: tem por objetivo analisar e interpretar os dados coletados de uma determinada população, na maioria das vezes, a partir de resultados observados na amostra. Exemplo: Análise do mercado financeiro visando explicar tendências das taxas de juros. Estatística descritiva e inferencial Fonte: autoria própria ESTATÍSTICA Descritiva ou Dedutiva Inferencial ou Indutiva População: é uma coleção completa de todos os elementos a serem estudados que possuem uma característica em comum. Amostra: é um subconjunto da população. Amostragem: técnicas para selecionar amostras, que garantem, tanto quanto possível, caráter de representatividade. População, amostra e amostragem POPULAÇÃO AMOSTRA Fonte: https://www.educamaisbrasil.com.br/enem/matematica/estatistica Em uma pesquisa, quando se deseja empreender um estudo estatístico completo, existem fases do trabalho que devem ser trabalhadas para se chegar aos resultados finais do estudo. As principais fases são: definição do problema – delimitação do problema; planejamento – organização das ações que serão realizadas na pesquisa de campo; coleta de dados – ir a campo buscar as informações; apuração dos dados – organização das informações coletadas; apresentação dos dados – gráficos e tabelas; análise e interpretação dos dados – por meio da linguagem matemática (média, moda...). Fases do método estatístico Variáveis qualitativas Variáveis quantitativas Variáveis Com ordem Atributo NOMINAL ORDINAL Sem ordem Profissão Nacionalidade Tipo Sanguíneo Escolaridade Classe social Gravidade da doença Medição (fracionário) Número DISCRETA CONTÍNUA Contagem (inteiros) Número de filhos Quantidade de alunos Presentes comprados Peso Altura Tempo de espera Quando se trabalha com a observação, a mensuração, a análise e a interpretação de números, esses números nos conduzem a índices inflacionários, índices de desemprego, probabilidade de determinado candidato ganhar as eleições etc. Esses números, portanto, serão chamados de dados estatísticos, os quais precisarão ser organizados e sumarizados para sua correta interpretação. Dados brutos: após a coleta, temos dados ainda não organizados que chamamos dados brutos. Rol: é um arranjo de dados numéricos em ordem crescente ou decrescente de grandeza. Amplitude total: é a diferença entre o maior e o menor número. Dados brutos, rol e amplitude total Exemplo: Em um consultório, obtivemos a altura (em cm) dos 7 pacientes que aguardavam para serem atendidos. As alturas foram: 137, 140, 135, 133, 138, 145, 142. Dados brutos: 137, 140, 135, 133, 138, 145, 142 Rol: 133, 135, 137, 138, 140, 142,145 (ascendente). Rol: 145,142, 140, 138, 137, 135, 133 (descendente). A amplitude total que é a diferença entre o maior e o menor número, é dada por: A amplitude das idades: 145 – 133 = 12 Dados brutos, rol e amplitude total O símbolo xi (lê-se “x índice i”) irá representar qualquer um dos n valores assumidos pela variável x. (x1, x2, x3, x4, x5, ..., xn) e “n” é denominado índice. Se temos os valores 3, 5, 7 ,8 vemos que x1 = 3, x2 = 5, x3 = 7, x4 = 8 NOTAÇÃO SIGMA (∑): A letra maiúscula grega sigma (∑) é utilizada para representar somas. Assim, se determinada variável y tiver os valores 3, 5, 7, 9 e 11, o Σy será: Σy = 3 + 5 + 7 + 9 + 11 Logo, Σy = 35 Notação por índices Determine qual sequência de dados abaixo representa um Rol. a) R: 2, 7, 5, 8 b) S: 12, 11, 9, 15 c) X: 7, 7, 6, 13 d) Y: 4, 10, 12, 15 e) Z: 3, 6, 9, 1 Interatividade Determine qual sequência de dados abaixo representa um Rol. a) R: 2, 7, 5, 8 b) S: 12, 11, 9, 15 c) X: 7, 7, 6, 13 d) Y: 4, 10, 12, 15 e) Z: 3, 6, 9, 1 Resposta A) Em um conjunto de dados x = {2, 4, 6, 8, 10, 12}, em que n = 6, temos: B) = No conjunto de dados x = {2, 4, 6, 8, 10, 12} Notação por índices – Propriedades C) Representa o somatório de uma constante c. Em um conjunto de dados x = {7, 7, 7, 7, 7, 7}, em que n = 6, temos: D) ou No conjunto de dados x = {8, 3, 4, 5} e y = {5, 2, 0, 4} = 20 – 11 = 9 Notação por índices – Propriedades E) Em um conjunto de dados x = {2, 4, 6, 8, 10}, temos: F) No conjunto de dados x = {2, 4, 6, 8, 10}, temos: Notação por índices – Propriedades Os gráficos estatísticos são representações dos dados estatísticos, com o objetivo de permitir uma visão completa e rápida do fato estudado. Gráficos Fonte: livro-texto. Gráfico em setoresPictograma Gráfico em linhasGráfico em colunas As medidas de tendência central são usadas para indicar um valor que tende a representar melhor um conjunto de dados. Geralmente, localizam-se em torno do meio ou centro de uma distribuição, onde maior parte dos dados tende a se concentrar. As medidas mais usadas neste sentido são as chamadas medidas de tendência central: Média; Moda; Mediana. Medidas de tendência central para dados simples A média aritmética é um dos valores mais representativos de um conjunto de dados. É dada por: onde xi são os dados apurados e n a quantidade desses dados. Exemplo: Calcule a média aritmética do conjunto de dados: xi = 2, 4, 6, 8, 10, 12 = 2 + 4 + 6 + 8 + 10 + 12 = 42 = 7 6 6 Observações: A média aritmética sofre a influência de todos os dados. Deve ser usada quando a amostra for homogênea. Média aritmética simples Apesar do conceito da média aritmética simples não ser difícil, é preciso entender seu conceito. Exemplo: Uma amostra das notas das provas de matemática dos estudantes da 7ª série de uma grande escola de São Paulo xi, em que: xi = {87, 42, 64, 58, 90, 90, 85, 63, 47, 74, 100, 94} = 87 + 42 + 64 + 58 + 90 + 90 + 85 +63 + 47 + 74 + 100 + 94 = 894 = 74,5 12 12 A nota média na prova de matemática dos estudantes da 7ª série dessa escola de São Paulo, por amostragem, é 74,5. Média aritmética simples Nos quatro primeiros dias úteis de uma semana o gerente de uma loja atendeu 19, 15, 17 e 21 clientes. No quinto dia útil dessa semana esse gerente atendeu n clientes. A média do número diário de clientes atendidos por esse gerente nos cinco dias úteis dessa semana foi 19. Calcule o número de clientes atendidos no quinto dia útil. a) 14,4 b) 18 c) 19,5 d) 23 e) 25 Interatividade Nos quatro primeiros dias úteis de uma semana o gerente de uma loja atendeu 19, 15, 17 e 21 clientes. No quinto dia útil dessa semana esse gerente atendeu n clientes. A média do número diário de clientes atendidos por esse gerente nos cinco dias úteis dessa semana foi 19. Calcule o número de clientes atendidos no quinto dia útil. a) 14,4 Resolução: b) 1819 = 19 + 15 + 17 + 21 + n c) 19,5 5 d) 23 95 = 19 + 15 + 17 + 21 + n e) 25 95 – 19 – 15 – 17 – 21 = n 23 = n Resposta A média aritmética ponderada é utilizada quando queremos atribuir pesos distintos ou importâncias distintas aos elementos de um conjunto de dados. É dada por onde xi são os dados apurados e pi os respectivos pesos. Média aritmética ponderada Exemplo: Supondo que um estudante tenha de efetuar uma série de quatro exames para obter sua média final e passar de ano, cada exame possui um peso diferente na composição dessa média, conforme a tabela a seguir: = 68.(0,30) + 89.(0,20) + 45.(0,40) + 100.(0,10) 0,30 + 0,20 + 0,40 + 0,10 = 20,4 + 17,8 + 18 + 10 = 66,2 A nota média será, então, 66,2, resultado diferente do que seria obtido se utilizássemos a média aritmética simples. Média aritmética ponderada Fonte: livro-texto. Distribuição por frequência é a tabela em que se organizam grandes quantidades de dados, determinando o número de vezes que cada dado ocorre – frequência (fi) – e a porcentagem com que aparece – frequência relativa (fr). Exemplo: Em uma turma, a nota atribuída a 28 alunos, referente a um teste de estatística, foi disposta em ordem crescente conforme abaixo. Determine a média da turma. 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9,10. Observando que algumas notas se repetem, podemos utilizar o número de observações ou frequência de cada um deles como o peso ou fator de ponderação. Distribuição de frequência Fonte: livro-texto. Colocados em ordem crescente, mediana é o elemento que ocupa a posição central. Se o número de elementos do rol for ímpar, a Mediana será o valor central. Exemplo: Determinar a mediana dos seguintes valores: 2, 20, 12, 23, 20, 8, 12 Se o número de elementos do rol for par, a Mediana será a média dos 2 valores centrais. Exemplo: Determinar a mediana dos seguintes valores: 2, 20, 12, 23, 20, 8, 12, 21 Neste caso temos 2 elementos centrais: 12 e 20. A mediana é 12 + 20 = 32 = 16 2 2 Observação: A mediana não sofre a influência dos valores extremos (muito altos ou muito baixos). Deve ser usada quando a amostra for heterogênea. Mediana É o valor que ocorre com maior frequência em um conjunto de dados. Exemplos: a) notas do aluno Arlindo: 2, 8, 6, 5, 6 Mo = 6 b) notas do aluno Berlindo: 8, 8, 6, 5, 6 Mo = 6 e Mo = 8 (bimodal) c) notas do aluno Cerlindo: 2, 8, 6, 5, 7 Não há moda. Exemplo: Dada a tabela, determine a moda. A moda é o DVD, que é o produto que ocorre mais vezes. Moda Fonte: livro-texto. Em um processo de seleção compareceram 30 candidatos. A tabela abaixo apresenta a distribuição dos candidatos conforme a idade. Determine a idade média dos candidatos. a) 20,7 b) 22,1 c) 23 d) 23,4 e) 23,9 Interatividade Idade (anos) Quantidade de Candidatos 20 8 22 9 23 7 24 6 Total 30 Em um processo de seleção compareceram 30 candidatos. A tabela abaixo apresenta a distribuição dos candidatos conforme a idade. Determine a idade média dos candidatos. a) 20,7 Solução: b) 22,1 c) 23 d) 23,4 e) 23,9 Resposta Indicam o quanto os dados estão dispersos em torno da região central. Quanto maior as medidas de dispersão, mais heterogêneos são os dados, e ao contrário, quanto menor essas medidas, mais homogêneo é o conjunto de dados. Considere os seguintes conjuntos de valores de X, Y e Z: X: 70, 70, 70, 70, 70 Y: 68, 69, 70, 71, 72 Z: 5, 15, 50, 120, 160 Os 3 conjuntos apresentam a mesma média aritmética: 70. Notamos que o conjunto X é mais homogêneo que os conjuntos Y e Z. Medidas de dispersão para dados simples Quando se deseja entender, analisar e descrever de forma adequada um determinado conjunto de dados, faz-se necessário dispor não apenas de informações relativas à média, mediana e moda. É preciso que se disponha de informações relativas à variabilidade (dispersão) dos números que compõem o referido conjunto de dados. Essas medidas de variabilidade ou dispersão indicam se os dados observados estão próximos ou separados uns dos outros. Medidas de dispersão para dados simples O intervalo ou amplitude total de determinado conjunto de dados é obtido pela diferença entre o maior e o menor valor nesse conjunto de números. AmplitudeTotal = ValorMáximo – ValorMínimo Exemplo: Em um conjunto de dados xi = {2, 3, 3, 5, 5, 5, 8,10,12}, a amplitude total será: 12 – 2 = 10 Amplitude total Em um conjunto de dados amostrais xi = {2, 4, 6, 8, 10, 12}, em que n = 6, determine o desvio médio. Precisamos, primeiro, calcular a média, para então passarmos ao cálculo do desvio médio. Agora, podemos calcular os desvios para cada valor do conjunto de dados. Assim, temos: Desvio médio absoluto A variância de um conjunto qualquer de dados para dados não agrupados é determinada por: Variância Populacional Variância Amostral xi = elemento qualquer do conjunto considerado µ (ou x) = a média do conjunto de dados n = total de elementos Para calcular o desvio padrão, basta extrair a raiz quadrada da variância, seja ela populacional ou amostral. Variância e desvio padrão Fonte: https://www.matematicagenial.com/2018/09/o- alfabeto-grego-na-matematica.html O coeficiente de variação é utilizado para apresentar os valores de dispersão em torno da média em porcentagem. Quanto maior o coeficiente de variação, maior será o valor da dispersão dos dados e vice-versa. O coeficiente de variação é dado por: Onde Cv = coeficiente de variação S = desvio padrão x = média aritmética Coeficiente de variação Calcule a variância, o desvio padrão e o coeficiente de variação de determinado conjunto de dados xi = {1, 3, 5, 7, 9, 11, 13}, observado em uma amostra de 7 elementos. Por se tratar de amostra vamos utilizar a seguinte fórmula da variância: 1) Média 2) Vamos montar essa tabela: = 49 = 7 7 3) Variância = 112 = 18,67 6 4) Desvio padrão (S) = √18,67 = 4,32 5) Coeficiente de variação = 4,32 = 0,6171 61,71% 7 Exemplo de variância, desvio padrão e coeficiente de variação Fonte: autoria própria. Assinale a alternativa que respectivamente apresenta a variância e o desvio padrão do seguinte conjunto de dados que representa uma população xi = {1, 3, 5, 7, 9, 11, 13}. a) 16 e 4 b) 18,67 e 4,32 c) 18 e 4,24 d) 9 e 3 e) 4 e 2 Interatividade Assinale a alternativa que respectivamente apresenta a variância e o desvio padrão do seguinte conjunto de dados que representa uma população xi = {1, 3, 5, 7, 9, 11, 13}. a) 16 e 4 Resolução: Usar a fórmula da variância para população b) 18,67 e 4,32 c) 18 e 4,24 d) 9 e 3 1) Cálculo da média: = 49 = 7 e) 4 e 2 7 2) Montar a tabela: 3) Variância = 112 = 16 7 4) Desvio Padrão = √ 16 = 4 Resposta ATÉ A PRÓXIMA!
Compartilhar