Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prof. Me. José Lorandi UNIDADE II Estatística As Medidas de Tendência Central são usadas para representar o conjunto de dados em um único valor. São medidas de Tendência Central a Média, a Moda e a Mediana. Medidas e Tendência Central A primeira medida de Tendência Central a ser abordada é a Média, que é um estimador adequado para dados razoavelmente comportados (sem dados discrepantes). A Média pode ser Simples ou Ponderada. Médias Somatório é um operador matemático indicado por Σ usado para somas sucessivas. No Somatório, indica-se um índice com seu valor inicial e seu valor final, e esse índice é incrementado por uma unidade a cada parcela somada. Médias – Somatório Matematicamente, temos: Embaixo do símbolo de Somatório, define-se o índice que será incrementado e passamos o seu valor inicial. Sobre o símbolo de Somatório, colocamos o valor final do índice. Neste exemplo, o valor inicial do índice i é 0, e o valor final é n. Então, somam-se as parcelas de x cujo índice varia desde o valor inicial 0 até o valor final n. É usual adotarmos as letras i ou j para índice de somatórios. Médias – Somatório Exemplo da Aplicação. Calcule o valor da seguinte expressão matemática: No exemplo, a expressão pede para realizar o Somatório entre os próprios valores assumidos pelo índice i. Expandindo o Somatório, com o índice i iniciando em 1 e terminando em 5, temos: Médias – Somatório A Média de um conjunto de dados xi costuma ser indicada por x. Usa-se a notação X para representar a Média. A Média Aritmética Simples de N dados é obtida somando-se esses dados e dividindo-se o resultado da soma pelo número de dados N. Matematicamente, temos: Note que, para resolver essa equação, primeiro é preciso calcular o Somatório, que indica a soma de todos os dados xi, com i de 1 até N, e depois é preciso dividir o resultado pelo número de dados N. Média Aritmética Simples Exemplo de aplicação Imagine que os tempos de resposta de um computador ligado em rede sejam os listados na tabela 14 a seguir. Média Aritmética Simples Figura 1 - Cabos passando por trás de uma máquina Fonte: Disponível em: https://cutt.ly/OMx8p2R Pode-se calcular o tempo de resposta médio desse computador usando a seguinte equação: Como são 4 dados e N indica o número de dados, temos N = 4; logo, a soma dos dados deve ser feita do primeiro dado da tabela até o quarto e último dado, usando a letra t em vez de x na equação por se tratar da variável tempo (usualmente representado por t). Portanto, Média Aritmética Simples Tempo de resposta (ms) 1,013 1,102 1,004 1,121 Tabela 1 – Tempos de resposta de um computador ligado em rede Calcula-se primeiro a soma que está no numerador da fração: Média Aritmética Simples Então, calcula-se a divisão: Logo, o tempo de resposta médio desse computador na rede é de 1,060 ms. O tempo de resposta do computador em rede foi calculado em ms, ou seja, em milissegundos. Média Aritmética Simples Fernando está avaliando o preço médio de sua tarifa de energia elétrica nos cinco primeiros meses do ano. A planilha mostra os valores por mês, de janeiro a maio. Sua meta é fechar o semestre com um preço médio de R$ 130,00. Para alcançar a meta, o maior preço possível a pagar na tarifa do mês de junho será de: a) R$ 109,05. b) R$ 125,65. c) R$ 130,87. d) R$ 98,55. e) R$ 100,62. Interatividade Janeiro Fevereiro Março Abril Maio R$ 173,00 R$ 113,58 R$ 145,67 R$ 98,50 R$ 123,60 Resposta correta: b) R$ 125,65. Para determinar o maior preço a ser pago para manter o preço médio na meta, devemos calcular a média aritmética nos seis meses. Chamando de X o preço a ser pago em junho, temos: Portanto, o preço máximo a se pagar na conta de junho, é de R$ 125,65. Resposta Alguns Prefixos Alguns Prefixos Nome do prefixo Valor do prefixo mil (m) 10-3 ou 0,001 micro (μ) 10-6 ou 0,000001 nano (n) 10-9 ou 0,000000001 kilo (k) 103 ou 1.000 mega (M) 106 ou 1.000.000 giga (G) 109 ou 1.000.000.000 tera (T) 1012 ou 1.000.000.000.000 Tabela 15 – Alguns prefixos A Média Ponderada é calculada de modo que cada dado é multiplicado por seu peso pi. Se temos N medidas xi, cada uma associada a um peso pi, a Média Ponderada é calculada por: Note que, no numerador da fração, há a soma do produto de cada medida pelo seu peso e, no denominador, a soma de todos os pesos. Lembrando que é preciso calcular os somatórios para em seguida calcular a divisão. Média Ponderada Exemplo de aplicação Considere o caso de um aluno que tirou as seguintes notas: 8 na primeira prova, 7 na segunda prova e 4 na terceira prova. Se pensarmos em Média Aritmética Simples, a média do aluno seria superior a 5 e ele estaria aprovado na disciplina. Mas a vida não é tão simples para esse aluno, pois a última prova tem peso 3 e as demais têm peso 1. Média Ponderada Para calcular a média do aluno, é preciso usar a Média Ponderada. Da equação para esse cálculo, temos: Substituindo os pesos e as notas no somatório, ficamos com: Média Ponderada Note que, no numerador, soma-se o produto do peso de cada prova pela nota da respectiva prova e, no denominador, temos a soma dos pesos de cada prova. Fazendo os cálculos, chega-se a: A Média Ponderada das notas das provas, com nota 8 na primeira prova, nota 7 na segunda e nota 4 na terceira, com peso 3 na última prova e peso 1 nas demais, foi 5,4. Logo, o aluno foi aprovado ao considerar a média mínima igual a 5 para aprovação. Média Ponderada A Mediana é o valor central de um conjunto de dados quando esses são organizados em um Rol, seja ele crescente ou decrescente. Se temos uma quantidade ímpar de dados, o valor central é determinado sem maiores problemas, mas se temos um número par de dados, a Mediana é a média dos dois valores centrais. A Mediana é frequentemente indicada por Md. Mediana Considere as medidas para a espessura de uma chapa metálica, em milímetros, expressas na tabela 17 a seguir. Para calcular a Mediana, precisamos primeiro ordenar os dados. Aqui, faremos a ordenação de forma crescente, mas o resultado seria o mesmo se a ordenação fosse decrescente. Mediana Espessura (mm) 2,03 2,41 1,99 1,82 2,06 2,03 2,01 Tabela 17 – Medidas da espessura de uma chapa metálica, em milímetros Ordenando os dados do menor para o maior, temos o que se mostra na tabela 18 a seguir. O valor central da tabela é 2,03, pois temos 3 dados abaixo e 3 dados acima desse valor. Então, a mediana na espessura da chapa metálica é 2,03 mm. Mediana Espessura (mm) 1,82 1,99 2,01 2,03 2,03 2,06 2,41 Tabela 18 – Medidas ordenadas da espessura de uma chapa metálica, em milímetros A Média Ponderada dos números 5, 12, 20 e 15 com pesos respectivamente iguais a 1, 2, 3 e 4 é: a) 16,0. b) 14,9. c) 17,2. d) 17,8. e) 18,0. Interatividade Alternativa correta é B Calculando a Média Ponderada: Resposta 4 60 149 14,9 Definimos como Moda o valor mais frequente de uma distribuição de dados. A Moda é o valor com maior número de ocorrências. A Moda costuma ser indicada por Mo. Moda Voltando aos dados do exemplo de distribuição de salários em uma empresa, temos os seguintes valores. A Moda desses valores é o valor mais frequente, ou seja, com maior número de ocorrências. A faixa de valores com maior número de ocorrências é a faixa de 6 a 8 salários mínimos, com 12 funcionários com esse rendimento. Considerando a Moda como o ponto médio do intervalo, a Moda é igual a 7 salários mínimos. Moda Tabela 21 – Distribuição dos salários em uma empresa Salário (em salários mínimos) Número de funcionários 0├ 2 0 2├ 4 5 4├ 6 3 6├ 8 12 8├ 10 4 Podemos também calcular a Moda a partir de dados organizados em um Histograma. Considere o Histograma a seguir, com os resultadosde 14 lançamentos de um dado de 6 faces. A Moda é o valor mais frequente, ou seja, de maior número de ocorrências. Analisando o Histograma, vemos que o valor mais frequente foi 2. Logo, a Moda é 2. Moda Considere o histograma a seguir, com os resultados de 14 lançamentos de um dado de 6 faces. frequência 4 3 2 1 1 2 3 4 5 6 face Figura 22 – Exemplo de histograma construído a partir dos dados da tabela 3, com dados de frequência relativa dos resultados de 14 lançamentos de um dado de 6 faces Distribuição de frequência para lançamento de um dado numérico de 6 faces As Medidas de Dispersão têm como objetivo indicar o “espalhamento” dos dados, ou seja, se eles estão mais concentrados perto do valor médio ou mais espalhados em relação a esse valor. Medidas de Dispersão Figura 2 – Exemplo de espalhamento aplicado a discos coloridos A Amplitude Total, representada por A, é calculada pela diferença entre o maior dado e o menor dado do conjunto. Indicando um elemento qualquer do conjunto de dados como xi, com o menor dado sendo xmin e o maior dado sendo xmax, temos: Amplitude Total A = xmax – xmin Na cotação de uma peça para reposição em um servidor, foram obtidos os seguintes valores: Determina-se a Amplitude Total dos dados pela diferença entre o valor máximo e o valor mínimo. O valor máximo registrado na tabela 22 é R$ 683,20, e o mínimo, R$ 600,00. Dessa forma, tem-se: A = 683,20 - 600,00 A = 83,20 Logo, a Amplitude Total dos preços da peça de reposição do servidor é igual a R$ 83,20. Amplitude Total Tabela 22 – Cotação de preços de uma peça para o servidor Preço da peça (R$) 632,12 600,00 621,00 683,20 610,10 Caso os dados estejam organizados em uma distribuição de frequências, podemos determinar a Amplitude Total de duas formas: A Amplitude A é dada pela diferença entre o ponto médio da maior classe (ou intervalo) e o ponto médio da menor classe (ou intervalo). A Amplitude A é dada pela diferença entre o limite superior da maior classe (ou intervalo) e o limite inferior da menor classe (ou intervalo). O ponto médio de uma classe é calculado por: Na equação, Ls é o limite superior e Li é o limite inferior da classe (ou intervalo). Amplitude Total Quais valores são, respectivamente, a moda, média e mediana dos números da lista a seguir? 133, 425, 244, 385, 236, 236, 328, 1000, 299, 325 a) 236; 361,1 e 312. b) 244; 361 e 312. c) 236; 360 e 312. d) 236; 361,1 e 310. e) 236; 361,1 e 299. Interatividade Resposta: A alternativa correta é A A moda é o número que aparece com maior frequência. Observe que todos os números aparecem apenas uma vez na lista, exceto 236, que aparece duas vezes. Assim, a moda é 236. A média é obtida pela soma de todos os números e dividindo o resultado pela quantidade de números somados: M = 133 + 425 + 244 + 385 + 236 + 236 + 328 + 1000 + 299 + 325 10 M = 3611 10 M = 361,1 Resposta A mediana é o número central de uma lista em ordem crescente. Caso a lista tenha um número par de elementos, é a média entre os dois números centrais. 133, 236, 236, 244, 299, 325, 328, 385, 425, 1000 299 + 325 = 624 = 312 2 2 Assim, Moda, Média e Mediana são: 236; 361,1 e 312. Resposta O Desvio Médio Simples é um indicador de dispersão dos dados que considera o quanto cada dado xi se afasta do valor médio x. O Desvio Médio Simples é indicado por Dm e é calculado por: Na equação, N é o número de dados da população ou da amostra. Desvio Médio Simples A dispersão desses dados pode ser estimada calculando-se o Desvio Médio Simples, como feito a seguir. Desvio Médio Simples Diâmetro (mm) 20,34 20,39 20,28 20,34 Tabela 7 – Medidas de diâmetro de uma bolinha de gude O Desvio Médio Simples é a soma dos módulos das diferenças entre cada valor xi e o valor médio x, dividida pelo número de dados N. É preciso, então, calcular a Média dos dados. Para calcular a Média, soma-se todos os dados e divide-se esse resultado pelo número de dados, que, no caso, é N = 4. Desvio Médio Simples Voltando ao cálculo do Desvio Médio, ficamos com: Desvio Médio Simples 𝐃𝐦 = 𝐍 𝐢 = 𝟏|Σ 𝐱𝐢− 𝐱 | 𝐍 𝐃𝐦 = 𝟐𝟎, 𝟑𝟒 − 𝟐𝟎, 𝟑𝟒 + 𝟐𝟎, 𝟑𝟗 − 𝟐𝟎, 𝟑𝟒 + 𝟐𝟎, 𝟐𝟖 − 𝟐𝟎, 𝟑𝟒 + |𝟐𝟎, 𝟑𝟒 − 𝟐𝟎, 𝟑𝟒 𝟒 𝐃𝐦 = 𝟎 + 𝟎, 𝟎𝟓 + −𝟎, 𝟎𝟔 + |𝟎| 𝟒 Como o módulo de um número positivo é esse valor numérico positivo, e o módulo de um número negativo é esse valor numérico, mas também positivo, temos: Logo, o Desvio Médio das medidas de diâmetro da bolinha de gude é Dm = 0,027 mm. Desvio Médio Simples O Desvio Padrão é uma medida da dispersão dos dados em torno da média que considera o quadrado do desvio de cada dado em relação ao valor médio. O Desvio Padrão é frequentemente indicado pela letra grega 𝜎. O Desvio Padrão é calculado de forma distinta se temos uma amostra ou uma população. No caso de uma população, o Desvio Padrão 𝜎 de um conjunto de N dados xi, de valor médio x é dado por: Note que o procedimento de cálculo dessa expressão envolve subtrair o Valor Médio de cada dado e elevar o resultado ao quadrado, somar os resultados dessa diferença ao quadrado para todos os dados, dividir pelo número de dados para, finalmente, calcular a raiz quadrada do resultado. Variância e Desvio Padrão Se os dados são organizados em uma distribuição de Frequências fi de Ponto Médio Pmi, ainda para uma população, o Desvio Padrão é dado por: No caso de uma amostra, o Desvio Padrão 𝜎 de um conjunto de N dados xi, de valor médio x é dado por: Variância e Desvio Padrão Se os dados são organizados em uma distribuição de Frequências fi de Ponto Médio Pmi, ainda para uma amostra o desvio padrão é dado por: A variância é indicada por 𝜎2 e é o quadrado do Desvio Padrão. Novamente, pelo fato de os cálculos do Desvio Padrão e, consequentemente, da variância envolverem somas com vários termos, o uso de tabelas facilita o processo algébrico. Variância e Desvio Padrão O Desvio Padrão é uma estatística que tem como objetivo apontar o espalhamento dos dados em torno do valor médio. Quanto maior o Desvio Padrão, maior o espalhamento dos dados. Considere os seguintes valores médios e os Desvios Padrões para os conjuntos de medidas de tempo de resposta de um servidor em uma rede. Interpretação do Desvio Padrão Qual dos conjuntos de dados tem menor espalhamento, ou seja, está mais concentrado em torno do valor médio? O conjunto de dados com menor espalhamento é o com menor Desvio Padrão, ou seja, o conjunto de dados com x = 1,4 ms e 𝜎 = 0,1 ms. Interpretação do Desvio Padrão Numa turma, 20 alunos fizeram uma prova de matemática e a média desse grupo de alunos foi de 8,2, com desvio padrão de 0,85. Este mesmo grupo de alunos tira em português média de 7,8, com Desvio Padrão de 0,69. Na disciplina de matemática, qual foi maior a dispersão? a) Matemática: 0,85 / 8,2 = 0,10 ou 10%. b) Matemática: 0,95 / 8,2 = 0,10 ou 100%. c) Matemática: 0,75 / 8,2 = 0,10 ou 1000%. d) Matemática: 0,65 / 8,2 = 0,10 ou 10000%. e) Matemática: 0,45 / 8,2 = 0,10 ou 100000%. Interatividade Resposta: A alternativa correta é A Maior dispersão é calculada pelo desvio padrão sobre a média. Maior dispersão = Desvio padrão / Média. Então, temos que: Matemática: 0,85 / 8,2 = 0,10 ou 10% a) Matemática: 0,85 / 8,2 = 0,10 ou 10%. b) Matemática: 0,95 / 8,2 = 0,10 ou 100%. c) Matemática: 0,75 / 8,2 = 0,10 ou 1000%. d) Matemática: 0,65 / 8,2 = 0,10 ou 10000%. e) Matemática: 0,45 / 8,2 = 0,10 ou 100000%. Resposta ATÉ A PRÓXIMA!
Compartilhar