Baixe o app para aproveitar ainda mais
Prévia do material em texto
PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA Prof. Paula Marinho Aula 4 APRESENTAÇÃO Continuamos na Estatística Descritiva. Já aprendemos a representar dados brutos em forma de tabelas e gráficos. Nesta aula aprenderemos calcular medidas de posição e tendência central. São elas a média, a moda e a mediana. Também estudaremos as medidas separatrizes: quartil, decil e percentil. Imagine que o conjunto numérico a seguir representa o salário anual, em R$, de 20 funcionários do departamento de Controle de Qualidade de uma indústria do setor automobilístico. 2 APRESENTAÇÃO 10.000,00 15.000,00 40.000,00 100.000,00 10.000,00 20.000,00 48.000,00 120.000,00 12.000,00 20.000,00 60.000,00 150.000,00 12.000,00 30.000,00 70.000,00 180.000,00 12.000,00 30.000,00 70.000,00 250.000,00 3 Os valores de média, moda e mediana para este conjunto numérico são: MÉDIA 62.950,00 MEDIANA 35.000,00 MODA 12.000,00 Como interpretar estes valores tão diferentes? Qual dos três é o melhor indicador para representar este conjunto de dados? OBJETIVOS Ao final desta aula você deverá ser capaz de: Calcular a média, a moda e a mediana para dados brutos e tabela com e sem classes; Selecionar a melhor medida de posição e tendência central para um conjunto numérico; Comparar as características de cada medida estudada; Calcular as medidas separatrizes: quartil, decil e percentil. Construir o gráfico Boxplot e identificar valores outliers em um conjunto numérico. Efetuar os cálculos usando o Excel. 4 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 5 4.1 MÉDIA OU MÉDIA ARITMÉTICA Pode ser de dois tipos: simples ou ponderada. A média é um valor representativo de um conjunto de dados. A média é única para um dado conjunto de valores. Qualquer variação nos valores do conjunto observado implica em um novo valor de média. Não é uma medida resistente, pois mudanças nos valores da variável mudam o valor da média. Seu resultado é afetado pelos valores extremos, isto é, tende para os valores extremos. Das três medidas estudadas é a que tem o maior significado matemático. É representada pelo símbolo Lê-se: X barra. 6 4.1.1 MÉDIA ARITMÉTICA SIMPLES 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 7 4.1.2 MÉDIA ARITMÉTICA PONDERADA TABELA SEM CLASSES i NotasXi Frequênciafi Xifi 1 4 1 4x1=4 2 5 5 5x5=25 3 6 6 6x6=36 4 7 5 7x5=35 5 8 3 8x3=24 Total 20= n 124 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 8 4.1.2 MÉDIA ARITMÉTICA PONDERADA TABELA COM CLASSES classes fi xi - ponto médio de cada classe xifi 10 |- 20 5 (10+20)/2=15 15x5=75 20 |- 30 10 (20+30)/2=25 25x10=250 30 |- 40 15 (30+40)/2=35 35x15=525 40 |- 50 10 (40+50)/2=45 45x10=450 50 |- 60 5 (50+60)/2=55 55x5=275 Total 45 ----- 1575 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 9 4.2 MODA É o valor da variável que mais se repete, que se destaca em relação aos outros valores. A moda é o valor da variável que ocorre com a maior frequência simples em um conjunto de números. A moda pode não existir (AMODAL - caso em que todos os valores da variável em estudo ocorrem com a mesma intensidade) e, mesmo que exista, pode não ser única (quando houver mais de um valor predominante). Pode ser UNIMODAL, BIMODAL, ... A mudança de um valor no conjunto observado pode não mudar a moda: é uma medida resistente. Não é afetada pelos valores extremos. É a única medida que pode ser determinada para uma variável qualitativa.. Seu símbolo e ou Mo. Lê-se: X chapéu 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 10 4.2.1 MODA PARA DADOS BRUTOS, NÃO TABELADOS: X = {4,5,5,6,6,6,7,7,8,8} Moda = 6 pois é o valor quer aparece mais vezes Y = {4,4,5,5,6,6} Não tem moda, amodal, pois todos os valores aparecem com a mesma frequência Z ={1,2,2,2,3,3,4,5,5,5,6,6} Bimodal, pois o 2 e o 5 aparecem em igual intensidade. Moda ={2;5} 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 11 4.2.2 MODA PARA DADOS TABELADOS SEM CLASSES: Qual a temperatura mínima diária mais comum medida no mês abaixo? Moda =2°C Temperatura fi 0oC 3 1oC 9 2oC 12 3oC 6 Total 30 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 12 4.2.2 MODA PARA DADOS TABELADOS COM CLASSES: 4.2.3.1 MODA BRUTA: É o método mais rudimentar. É representada pelo ponto médio da classe modal. Classe modal é a classe que apresenta a maior frequência simples. 4.2.3.2 MODA CZUBER: É o método que retorna um valor mais preciso, por levar em consideração a influência dos valores ao redor da moda. Calcula-se da seguinte forma: 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 13 A Classe Modal é 30 |--- 40 A Moda Bruta é 35 A Moda Czuber é: classes fi 10 |- 20 2 20 |- 30 3 30 |- 40 10 40 |- 50 9 50 |- 60 4 Total 28 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 14 4.3 MEDIANA A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou decrescente), é o valor central. Sua característica principal é dividir esse conjunto de números em duas partes iguais, com a mesma quantidade de valores. Dessa forma 50% dos valores observados são menores que a mediana e 50% desses valores são maiores que a mediana. É única, sempre pode ser calculada. Sempre existirá um valor de mediana para um conjunto numérico. 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 15 4.3 MEDIANA Por exemplo, se o maior valor da variável for duplicado a mediana não se altera: é uma medida resistente. Seu resultado não é afetado pelos valores extremos. Certas pesquisas de preço e salários preferem usar a Mediana em vez da Média pelo fato dela não ser influenciada por valores pequenos ou grandes demais, por valores ditos fora do padrão. A Mediana é uma das medidas Separatrizes que são a mediana, o quartil, o decil e o percentil. Seu símbolo pode ser Md ou Lê-se: X til. 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 16 4.3.1 MEDIANA PARA DADOS DADOS BRUTOS: Para dados brutos o cálculo é feito da seguinte forma: 1º - Ordenar os valores do conjunto observado; 2º - Verificar se n (o tamanho da amostra) é impar ou par; 3º - Para n ímpar, a mediana é o valor do meio; é o elemento que ocupa a posição EMd = (n+1)/2. Para n par, a mediana é a média dos dois valores do centrais, do elemento que ocupa a posição EMd = (n)/2 e com o seguinte. 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 17 EXEMPLO 8: Calcule a mediana para os valores abaixo: A = {2,3,6,12,15,23,30) n=7 ímpar Md = 12 ; é o elemento que ocupa a quarta posição ou seja EMd = (n+1)/2=(7+1)/2=4ª B = {3,6,9,12,14,15,17,20} N=8 par Md = (12+14)/2 = 13, A mediana é a média entre o elemento do meio, de ordem EMd =(n/2)=4º, com o elemento seguinte, o 5º. 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 18 4.3.2 MEDIANA PARA DADOS TABULADOS SEM CLASSES: Para uma tabela sem classes o cálculo é feito da seguinte forma: 1º - Verificar se a coluna de Xi está ordenada; 2º - Verificar se n é impar ou par; 3º - Localizar na coluna das frequências acumuladas abaixo (Fa), o meio da distribuição. A mediana será o valor da variável correspondente ao ponto central. Para n ímpar, a mediana é o valor do meio e está na posição EMd = (n+1)/2 Para n par, a mediana é a média dos dois valores centrais, do valor que ocupa a posição (EMd=n/2) com o valor seguinte. 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 19 valores xi frequencia fi Frequencia acumulada abaixo Fai valores xi frequencia fi Frequencia acumulada abaixo Fai 2 5 5 3 3 3 3 10 15 4 6 9 4 15 30 5 9 18 5 12 42 6 8 26 6 5 47 7 6 32 7 3 50 8 3 35 Total =n = 50 Total =n = 35 50 é par => n/2 = 25 35 é ímpar => (n+1)/2 = 18 a mediana será décimo oitavo valor a mediana será a média do vigésimo quinto valor com o vigésimo sextoMd= ( 4 + 4 ) / 2 = 4 Md= 5 a mediana será a média do vigésimo quinto valor com o vigésimo sexto. a mediana será décimo oitavo valor 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 20 4.3.3 MEDIANA PARA DADOS TABULADOS AGRUPADOS EM CLASSES: Para uma tabela com classes o cálculo da mediana é feito usando a fórmula abaixo: 1º - Verificar se a coluna das classes está ordenada; 2º - Calcular a posição da mediana dada por, não se fazendo distinção entre número par ou ímpar de observações (TOLEDO, pág. 160): 3º - Identificar o intervalo que contém a mediana localizando o EMd na coluna das Frequências Simples Acumuladas Abaixo Fa ; 4º - Aplicar a fórmula da interpolação para o cálculo da mediana: 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 21 classes fi Frequencia acumulada Fai 10 |- 20 10 10 20 |- 30 20 30 30 |- 40 35 65 40 |- 50 40 105 50 |- 60 25 130 60 |- 70 15 145 70 |- 80 5 150 Total 150 Emd = n/2 = 75 Oelemento mediano ocupa a septuagésima quinta posição li = 40 h = 10 Faa= 65 fi = 40 Md = = 40+((75-65)/40)*10 = 42,5 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 22 Mo < Md < Média Mo < Md < Média Mo = Md = Média 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 23 xxxxxxxx 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 24 xxxxxxxx 4 - MEDIDAS DE POSIÇÃO E DE TENDÊNCIA CENTRAL 25 xxxxxxxx PROBABILIDADE ESTATÍSTICA APLICADA À ENGENHARIA Profa. Paula Marinho ATIVIDADE ATIVIDADE 27 Considere a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Calcular a quantidade média de meninos por família. Número de Meninos xi Número de Famílias fi 0 2 1 6 2 10 3 12 4 4 total RESPOSTA 28 Número de Meninos xi Número de Famíliasfi xi.fi MÉDIA = 2,3 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 total 34 78 REFERÊNCIAS BIBLIOGRÁFICAS e RECURSOS PEDAGÓGICOS BIBLIOTECA DO CAMPUS BIBLIOTECA VIRTUAL MATERIAL DIDÁTICO CONTEÚDO ONLINE USO DO EXCEL E CALCULADORA CIENTÍFICA. 29 REFERÊNCIAS BALDI, Brigitte; MOORE, David S. A Prática da Estatística nas Ciências da Vida. Rio de Janeiro: LTC, 2014. LAPPONI, Juan Carlos. Estatística usando o Excel. São Paulo: Lapponi Treinamento de Editora LTDA, 2000. LEVINE, David M.; STEPHAN, David F.; KREHBIEL, Timothy C.; BERENSON, Mark L.. Estatística – Teoria e Aplicações. Rio de Janeiro: LTC, 2008. MC CLAVE, James; BENSON, P. George; SINCICH, Terry. Satistics For Business and Economics. Ney Jersey: Pearson, 2005. 30 REFERÊNCIAS MOORE, David S; NOTZ, William I.; FLINGER, Michael A. A Estatística Básica e sua Prática. Rio de Janeiro: LTC, 2014. MORETTIN, Pedro; BUSSAB, Wilton. Estatística Básica. São Paulo: Saraiva, 2002. TOLEDO, Geraldo; OVALE, Ivo. Estatística Básica. São Paulo: Atlas, 1985. TRIOLA, Mario F.. Introdução à Estatística. Rio de Janeiro: LTC, 2013. 31 Atividade Estruturada e Avaliação Trabalho de pesquisa, coleta e tratamento dos dados. Desenvolvida ao longo de todo o semestre. Compondo 2 pontos na AV1 e AV2 Provas online. Agendar com antecedência e não faltar. 32 SÍNTESE DA AULA Nesta aula: Aprendemos a calcular medidas de posição e tendência central como a média, a moda e a mediana. Aprendemos também a calcularmos as medidas separatrizes quartil, decil e percentil. Aprendemos a diferenciar as características e aplicações de cada uma dessas medidas. Aprendemos a construir o gráfico boxplot e a identificar elementos outliers. Aprendemos a fazer todos estes cálculos usando o Excel. 33 PRÓXIMA AULA PRÓXIMA AULA Na próxima aula, você estudará os seguintes assuntos: Medidas de dispersão como desvio padrão, variância e coeficiente de variação. Regra empírica do desvio padrão. Aplicações das medidas de dispersão em controle de processos. Cálculo dessas medidas no EXCEL. 34
Compartilhar