Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Paulo Júlio Gonçalves Monteiro O que é Estatística? Estatística é a de ser um conjunto de métodos especialmente apropriados à coleta, à apresentação (organização, resumo e descrição), à análise e à interpretação de dados de observação, tendo como objetivo a compreensão de uma realidade específica para a tomada da decisão. Resumidamente: Estatística é a área da matemática que coleta, analisa e interpreta dados experimentais utilizando teorias probabilísticas para explicar a ocorrência de eventos. Para que serve a Estatística? -A coleta, a organização, a sintetização e a apresentação de dados -A medição da variação nos dados e levantamento de dados -A estimativa dos parâmetros da população e a determinação da precisão das estimativas -A aplicação dos testes de hipótese em relação aos parâmetros -A análise da relação entre duas ou mais variáveis. A estatística trabalha com dois conjuntos de dados: o universo e a amostra. Apesar de a estatística se preocupar em obter informações sobre a população, dificilmente ela estuda todos os componentes da mesma Média, Moda e Mediana Média A média (Me) é calculada somando-se todos os valores de um conjunto de dados e dividindo-se pelo número de elementos deste conjunto. Como a média é uma medida sensível aos valores da amostra, é mais adequada para situações em que os dados são distribuídos mais ou menos de forma uniforme, ou seja, valores sem grandes discrepâncias. Sendo, Me: média x1, x2, x3,..., xn: valores dos dados n: número de elementos do conjunto de dados Média Exemplo: Os jogadores de uma equipe de basquete apresentam as seguintes idades: 28, 27, 19, 23 e 21 anos. Qual a média de idade desta equipe? Solução Me = 28+27+19+23+21 5 Me = 118 5 = 23.6 Moda A Moda (Mo) representa o valor mais frequente de um conjunto de dados, sendo assim, para defini-la basta observar a frequência com que os valores aparecem. Um conjunto de dados é chamado de bimodal quando apresenta duas modas, ou seja, dois valores são mais frequentes. Exemplo Em uma sapataria durante um dia foram vendidos os seguintes números de sapato: 34, 39, 36, 35, 37, 40, 36, 38, 36, 38 e 41. Qual o valor da moda desta amostra? Solução Observando os números vendidos notamos que o número 36 foi o que apresentou maior frequência (3 pares), portanto, a moda é igual a: Mo = 36 Mediana A Mediana (Md) representa o valor central de um conjunto de dados. Para encontrar o valor da mediana é necessário colocar os valores em ordem crescente ou decrescente. Quando o número elementos de um conjunto é par, a mediana é encontrada pela média dos dois valores centrais. Assim, esses valores são somados e divididos por dois. Mediana Exemplo Em uma escola, o professor de educação física anotou a altura de um grupo de alunos. Considerando que os valores medidos foram: 1,54 m; 1,67 m, 1,50 m; 1,65 m; 1,75 m; 1,69 m; 1,60 m; 1,55 m e 1,78 m, qual o valor da mediana das alturas dos alunos? Solução Primeiro devemos colocar os valores em ordem. Neste caso, colocaremos em ordem crescente. Assim, o conjunto de dados ficará: 1,50; 1,54; 1,55; 1,60; 1,65; 1,67; 1,69; 1,75; 1,78 Como o conjunto é formado por 9 elementos, que é um número ímpar, então a mediana será igual ao 5º elemento, ou seja: Md = 1,65 m Mediana Calcule o valor da mediana da seguinte amostra de dados: (32, 27, 15, 44, 15, 32). Solução Primeiro precisamos colocar os dados em ordem, assim temos: 15, 15, 27, 32, 32, 44 Como essa amostra é formada por 6 elementos, que é um número par, a mediana será igual a média dos elementos centrais, ou seja: Md = 27+32 2 = 59 2 = 29,5 Média Aritmética Média Aritmética A Média Aritmética de um conjunto de dados é obtida somando todos os valores e dividindo o valor encontrado pelo número de dados desse conjunto. É muito utilizada em estatística como uma medida de tendência central. Pode ser simples, onde todos os valores possuem a mesma importância, ou ponderada, quando considera pesos diferentes aos dados. Média Aritmética Simples Esse tipo de média funciona de forma mais adequada quando os valores são relativamente uniformes. Por ser sensível aos dados, nem sempre fornece os resultados mais adequados. Isso porque todos os dados possuem a mesma importância (peso). Fórmula Ms = X1+X2+X3+ …+Xn n Onde Ms: média aritmética simples x1, x2, x3,...,xn: valores dos dados n: número de dados Média Aritmética Simples Exemplo: Sabendo que as notas de um aluno foram: 8,2; 7,8; 10,0; 9,5; 6,7, qual a média que ele obteve no curso? Ms = 8,2+7,8+10,0+9,5+6,7 5 Ms = 42,2 5 Ms = 8,4 Média Aritmética Ponderada A média aritmética ponderada é calculada multiplicando cada valor do conjunto de dados pelo seu peso. Depois, encontra-se a soma desses valores que será dividida pela soma dos pesos. Mp = 𝑝1 . 𝑥1+𝑝2 . 𝑥2+ …+𝑃𝑛 . 𝑋𝑛 𝑝1 + 𝑝2+ …+𝑃𝑛 Onde, Mp: Média aritmética ponderada p1, p2,..., pn: pesos x1, x2,...,xn: valores dos dados Média Aritmética Ponderada Exemplo: Considerando as notas e os respectivos pesos de cada uma delas, indique qual a média que o aluno obteve no curso. Disciplina Nota Peso Biologia 8,2 3 Filosofia 10,0 2 Física 9,5 4 Geografia 7,8 2 História 10,0 2 Língua Portuguesa 9,5 3 Matemática 6,7 4 Média Aritmética Ponderada Mp = 3 . 8,2 + 2 . 10 + 4. 9,5 + 2 .7,8 + 2 .10 + 3 . 9.5+4 .6,7 3 + 2 + 4 + 2 + 2 + 3 + 4 Mp = 24,6 + 20+ 38+ 15,6+ 20+ 28,5 + 26,8 20 Mp = 173,5 20 Mp = 8,7 Medidas de Dispersão e Amostragem População e Amostra Na estatística, população é o conjunto total dos dados e amostra é um subconjunto da população. População População é o conjunto de elementos que possuem características em comum. É um termo bem mais amplo que no senso comum, podendo haver reunião de pessoas, objetos ou até mesmo ideias. Exemplo: Todos as pessoas com ensino superior no Brasil. Amostras Amostras, na estatística, são subconjuntos da população e possuem as mesmas características que a população tem. A técnica de retirada de uma amostra da população é chamada de amostragem. Exemplo: 2000 pessoas com ensino superior no Brasil. Parâmetros Os parâmetros são as características numéricas da população. Exemplo: As media das notas das pessoas com ensino superior no Brasil. Estimativas Torna-se caro e demorado trabalhar com a população inteira, por isso que são escolhidas amostras que possuem as mesmas características da população. A estimativa é uma medida numérica que descreve uma característica da amostra, que será avaliada e obtido um parâmetro que descreve uma característica da população. Distribuição de Frequências Quando se faz um levantamento sobre uma população, é retirado uma amostra dessa população, obtendo dados relativos à amostra e organizando esses dados em tabelas e gráficos, separando-os por classes ou categorias, contendo um número de elementos correspondentes para cada uma das variáveis. Medidas de Dispersão As medidas de dispersão servem para indicar o quanto os dados estão dispersos em torno da região central. Amplitude A amplitude (H) ou intervalo total é calculada pegando os valores extremos do conjunto de dados. Pode ser calculada pela seguinte fórmula: H = x1 – xn Onde: H: é a amplitude x1: é o primeiro valor xn: é o último valor. Desvio Os desvio serve para medir a dispersão entre uma variável em relação a medida de tendência central. É calculado pela seguinte fórmula: Di = xi – MA Onde: Di: é o desvio; xi: é uma variável qualquer; MA: é a média aritmética dos dados. Variância Variância é uma medida de dispersão e é usada também para expressar o quanto um conjunto de dados se desvia da média. O desvio padrão (DP) é definido como a raiz quadrada da variância (V). A vantagem de usar o desvio padrão ao invés da variância é que o desvio padrão é expresso na mesma unidade dos dados, o que facilita a comparação. ∑: símbolo de somatório. Indica que temos que somartodos os termos, desde a primeira posição (i=1) até a posição n xi: valor na posição i no conjunto de dados MA: média aritmética dos dados n: quantidade de dados Variância Exemplo Considerando as idades das crianças das duas festas indicadas anteriormente, vamos calcular a variância desses conjuntos de dados. Festa A Dados: 1 ano, 2 anos, 2 anos, 12 anos, 12 anos e 13 anos Média: Maα = 1+2+2+12+12+13 6 = 42 6 = 7 anos Variância: Vα = (1 −7)2+(2 −7)2+(2 −7)2+(12 −7)2+(12 −7)2+(13 −7)2 6 Vα = 36+25+25+25+25+36 6 ≅ 28,67 anos2 Variância Festa B Dados: 5 anos, 6 anos, 7 anos, 7 anos, 8 anos e 9 anos Média: Mab = 5+6+7+7+8+9 6 = 42 6 = 7 anos Variância: Vα = (5 −7)2+(6 −7)2+(7 −7)2+(7 −7)2+(8 −7)2+(9 −7)2 6 Vα = 4+1+0+0+1+4 6 ≅ 1,67 anos2 Desvio Padrão Exemplo Em uma equipe de remo os atletas possuem as seguintes alturas: 1,55 m ; 1,70 m e 1,80 m. Qual é o valor da média e do desvio padrão da altura desta equipe? Cálculo da média, sendo n = 3 Cálculo do desvio padrão a Desvio Padrão O desvio padrão é uma medida que expressa o grau de dispersão de um conjunto de dados. Ou seja, o desvio padrão indica o quanto um conjunto de dados é uniforme. Quanto mais próximo de 0 for o desvio padrão, mais homogêneo são os dados. O desvio padrão (DP) é calculado usando-se a seguinte fórmula: ∑: símbolo de somatório. Indica que temos que somar todos os termos, desde a primeira posição (i=1) até a posição n xi: valor na posição i no conjunto de dados MA: média aritmética dos dados n: quantidade de dados Desvio Padrão Exemplo Considerando ainda o exemplo anterior (sobre variância), vamos calcular o desvio padrão para as duas situações: DPa = 28,67 = 5,35 anos DPb = 1,67 =1,29 anos Agora, sabemos que a variação das idades do primeiro grupo em relação a média é de aproximadamente 5 anos, enquanto que a do segundo grupo é de apenas 1 ano. Coeficiente de Variação Para encontrar o coeficiente de variação, devemos multiplicar o desvio padrão por 100 e dividir o resultado pela média. Essa medida é expressa em porcentagem. CV = 100 .𝐷𝑃 𝑀𝐴 O coeficiente de variação é utilizado quando precisamos comparar variáveis que apresentam médias diferentes. Como o desvio padrão representa o quanto os dados estão dispersos em relação a uma média, ao comparar amostras com médias diferentes, a sua utilização pode gerar erros de interpretação. Desta forma, ao confrontar dois conjuntos de dados, o mais homogêneo será aquele que apresentar menor coeficiente de variação. Coeficiente de Variação Exemplo Um professor aplicou uma prova para duas turmas e calculou a média e o desvio padrão das notas obtidas. Os valores encontrados estão na tabela abaixo. Com base nesses valores, determine o coeficiente de variação de cada turma e indique a turma mais homogênea. Desvio Padrão Média Turma 1 2,6 6,2 Turma 2 3,0 8,5 Coeficiente de Variação Solução Calculando o coeficiente de variação de cada turma, temos: CV1 = 100 .2,6 6,2 ≅ 42% CV2 = 100 .3 8,5 ≅ 35% Desta forma, a turma mais homogênea é a turma 2, apesar de apresentar maior desvio padrão.
Compartilhar