Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE FEDERAL DO PARÁ INSTITUTO DE TECNOLOGIA FACULDADE DE ENGENHARIA SANITÁRIA E AMBIENTAL DISCIPLINA: ESTATÍSTICA PROFESSOR: JOÃO PROTÁZIO LISTA DE EXERCÍCIOS – ESTATÍSTICA BÁSICA LORENA FREITAS SOARES AGUIAR – 201407740031 BELÉM 2017 Os dados da tabela abaixo foram obtidos de um experimento desenvolvido para avaliar o comportamento in vitro de abacaxi (Ananas comosus) e referem-se à variável altura dos brotos de explantes, em centímetros (os dados já estão apresentados crescentemente). Tabela 1 – Altura dos brotos de explantes de abacaxi 1,00 1,01 1,08 1,11 1,18 1,19 1,19 1,20 1,21 1,25 1,26 1,27 1,27 1,30 1,31 1,34 1,34 1,35 1,36 1,36 1,37 1,37 1,39 1,39 1,41 1,43 1,43 1,46 1,47 1,47 1,49 1,52 1,57 1,61 1,62 1,68 1,68 1,73 1,77 1.1 Preencha a Tabela 2. Tabela 2 – Distribuição de frequência da variável altura dos brotos ALTURA FREQUÊNCIA ABSOLUTA FREQUÊNCIA RELATIVA PORCENTAGEM (%) FREQ. REL. ACUM. 1,00 |-- 1,13 4 0,1 10 10 1,13 |-- 1,26 6 0,2 20 30 1,26 |-- 1,39 12 0,3 30 60 1,39 |-- 1,52 9 0,2 20 80 1,52 |-- 1,65 4 0,1 10 90 1,65 |-- 1,78 4 0,1 10 100 TOTAL 39 1,0 100 Construa um histograma e um polígono de frequência para ilustrar graficamente este conjunto de dados. Figura 1 – Distribuição de frequências da variável altura dos brotos Calcular a média, a mediana e a moda do conjunto de dados, considerando as Tabelas 1 e 2. Média ( A média aritmética de uma distribuição de frequências por pontos ou valores ou ainda por classes ou intervalos é dada por: = Onde, fi é a frequência absoluta de cada classe; xi é o ponto médio da cada classe; n é o número de elementos, nesse caso o número de alturas. Para o cálculo da média dos dados agrupados em classes foi necessário, primeiro obter-se os valores dos pontos médios de cada classe ou intervalo. Assim, os dados foram organizados e trabalhados conforme apresentado na Tabela 3: Tabela 3 – Cálculo do ponto médio de cada classe ALTURA FREQUÊNCIA ABSOLUTA (fi) xi fi 1,00 |-- 1,13 4 1,07 4,26 1,13 |-- 1,26 6 1,20 7,17 1,26 |-- 1,39 12 1,33 15,90 1,39 |-- 1,52 9 1,46 13,10 1,52 |-- 1,65 4 1,59 6,34 1,65 |-- 1,78 4 1,72 6,86 TOTAL 39 53,63 Após a elaboração da tabela, efetuou-se o cálculo da altura média. = = 1,38 Mediana (me) A mediana de uma distribuição de frequências por classes ou intervalos é dada pela seguinte expressão: me = lii + hi Onde, lii = limite inferior da classe mediana, isto é, a classe que contém o ou os valores centrais; hi = amplitude da classe mediana; fi = frequência absoluta da classe mediana; Fi-1 = frequência acumulada da classe anterior à classe mediana. Considerando que a classe mediana, na Tabela 3, é a que contém o valor central (1,36), isto é, a terceira classe, tem-se: me = 1,26 + 0,13 me = 1,36 Moda (mo) A moda de uma distribuição de frequências por classes ou intervalos é dada pelas seguinte expressão, denominada de moda de King: mo = lii + hi Onde, lii = limite inferior da classe modal, isto é, a classe de maior frequência; hi = amplitude da classe modal; fi = frequência absoluta da classe modal; fi+1 = frequência absoluta da classe posterior à classe modal. fi-1 = frequência absoluta da classe anterior à classe modal. Considerando que a classe de maior frequência (12), a classe modal, na Tabela 3, é a terceira classe, tem-se: mo = 1,26 + 0,13 mo = 1,34 Responda às seguintes interpretações relevantes: Fale sobre a simetria do conjunto de dados; A fim de avaliar-se a simetria do conjunto de dados, utilizou-se a seguinte relação devida a Karl Pearson: a1 = 3 ( Para o cálculo do desvio padrão (S) foi necessário efetuar-se o cálculo da variância (S2). Para este fim, inseriu-se mais uma coluna à direita, na Tabela 3, conforme ilustrado na Tabela 4. Tabela 4 – Cálculo do produto da frequência pelo quadrado do ponto médio ALTURA FREQUÊNCIA ABSOLUTA (fi) xi fxi fixi² 1,00 |-- 1,13 4 1,07 4,26 4,54 1,13 |-- 1,26 6 1,20 7,17 8,57 1,26 |-- 1,39 12 1,33 15,90 21,07 1,39 |-- 1,52 9 1,46 13,10 19,05 1,52 |-- 1,65 4 1,59 6,34 10,05 1,65 |-- 1,78 4 1,72 6,86 11,76 TOTAL 39 53,63 75,04 A variância da distribuição será: S2 = – S2 = – 1,90 S2 = 0,020 Logo, o desvio padrão será: S = S = S = 0,14 Assim, tendo-se o valor do desvio padrão, verificou-se a simetria do conjunto de dados, de modo que Se a1 for igual a zero então a distribuição (ou conjunto) é dito simétrico. Se a1 > 0 então a assimetria é positiva significando que o gráfico da distribuição tem uma cauda alongada à direita. Caso a1 seja negativo a cauda do gráfico será alongada à esquerda. Se uma distribuição de frequências é simétrica então as 3 medidas de posição coincidem, isto é: = me = mo Se a distribuição é positivamente assimétrica então > me > mo E se a distribuição é negativamente assimétrica então < me < mo Então, a1 = 3 ( a1 = 3 ( a1 = 0,43 Como a1 > 0, constata-se que a assimetria é positiva (a distribuição dos dados é positivamente assimétrica). O que se confirma na medida em que 1,38 > 1,36 > 1,34. Explicar porque 1,36 é um valor representativo; O valor 1,36 é representativo pois é a medida central, que divide o conjunto de dados em duas partes iguais e representa a composição numérica do conjunto. Além disso, está situado entre e média e a moda. Existem valores discrepantes? Por que? Sabe-se que os valores discrepantes são aqueles: Maiores que Qs + 1,5 (Qs – Qi) ou Menores que Qi – 1,5 (Qs – Qi) Sendo assim, para fazer a verificação, foi necessário calcular-se os quartis inferior (Qi) e superior (Qs). Procedeu-se da seguinte forma: Qi = (n+1) /4 Qi = (39+1) /4 Qi = 40 /4 Qi = 10º elemento = 1,25 Qs = 3 (n+1) /4 Qs = 3 [(39+1) /4] Qs = 3 10 Qs = 30º elemento = 1,47 Dessa forma, se os valores discrepantes são Maiores que 1,47 + 1,5 (1,47 – 1,25) = 1,80 ou Menores que 1,25 – 1,5 (1,47 – 1,25) = 0,92 Com base nos resultados obtidos, pode-se afirmar que não há valores discrepantes, no conjunto de dados. Calcular a variância para os dados de uma amostra de tamanho n=16, do diâmetro (em centímetro) da roseta foliar de bromélias expostas ao sol (X). Os dados amostrais (X) obtidos são apresentados na Tabela 5 a seguir e as lacunas de , X−, (X−)2 para a obtenção da variância devem ser preenchidos. Tabela 5 – Cálculo da variância do diâmetro da roseta foliar de bromélias n x x – (x –)² 1 5,4 6,9 -1,5 2,25 2 5,4 6,9 -1,5 2,25 3 5,8 6,9 -1,1 1,21 4 6,4 6,9 -0,5 0,25 5 6,4 6,9 -0,5 0,25 6 6,6 6,9 -0,3 0,09 7 6,6 6,9 -0,3 0,09 8 6,8 6,9 -0,1 0,01 9 6,8 6,9 -0,1 0,01 10 7,0 6,9 0,1 0,01 11 7,3 6,9 0,4 0,16 12 7,3 6,9 0,4 0,16 13 7,5 6,9 0,6 0,36 14 8,2 6,9 1,3 1,69 15 8,8 6,9 1,9 3,61 16 8,8 6,9 1,9 3,61 SOMA 111,1 16,01 Efetuando-se o cálculo da variância tem-se que: S2 = S2 = S2 = 1,00 Deseja-se saber se existe correlação entre o espaçamento das linhas na cultura da soja (X) e a fração da radiação solar extinta pela planta (Y). Para atender a esse objetivo foram coletados pares de valores das duas variáveis, descritos Tabela 6, abaixo: Tabela 6 – Valores de radiação e espaçamento na cultura de soja RADIAÇÃO (%) ESPAÇAMENTO (m) 0,2 0,53 0,3 0,51 0,4 0,48 0,5 0,45 0,6 0,44 0,7 0,41 0,8 0,40 0,9 0,39 1,0 0,36 1,1 0,30 Ilustrar este conjunto de dados através de sua tabela de dispersão, ou seja, o gráfico X Y. Figura 2 – Relação entrea radiação e o espaçamento na cultura de soja Verificar o tipo de correlação entre os dados, se positiva ou negativa, comentando o que isto quer dizer sobre os dados da tabela. Por meio da análise gráfica, percebe-se que há uma correlação negativa linear entre os dados: Neste caso, as variáveis mudam em direções opostas, são inversamente proporcionais. Calcular a o coeficiente de correlação, comentando sobre o resultado obtido. O cálculo do coeficiente de correlação foi obtido por meio da seguinte expressão: r = Para facilitar o cálculo do coeficiente de correlação efetuou-se os cálculos de cada termo da expressão e estes foram organizados na Tabela 7. Tabela 7 – Dados para o cálculo do coeficiente de correlação n x y x² y² xy 1 0,530 0,200 0,281 0,040 0,1060 2 0,510 0,300 0,260 0,090 0,1530 3 0,480 0,400 0,230 0,160 0,1920 4 0,450 0,500 0,203 0,250 0,2250 5 0,440 0,600 0,194 0,360 0,2640 6 0,410 0,700 0,168 0,490 0,2870 7 0,400 0,800 0,160 0,640 0,3200 8 0,390 0,900 0,152 0,810 0,3510 9 0,360 1,000 0,130 1,000 0,3600 10 0,300 1,100 0,090 1,210 0,3300 TOTAL 4,270 6,500 1,867 5,050 2,588 Após o obtenção dos dados, os mesmos foram inseridos na expressão: r = r = 0,99 Existe uma correlação linear negativa forte. Significa dizer que a maioria dos pares de valores das variáveis se situa próxima a uma reta com inclinação negativa. O resultado indica, então, que existe uma forte associação negativa entre os percentuais de radiação e os espaçamentos das linhas na cultura de soja. Em um estudo sobre o efeito do carbono (em %) contido em fios de aço utilizados em resistências elétricas (em μ oms cm a 20%), foram observados os resultados apresentados na Tabela 8, a seguir: Tabela 8 – Relação entre o efeito de carbono em resistências elétricas. CARBONO CONTIDO (EM %) RESISTÊNCIA (μ oms cm a 20 °C) 0,05 12,3 0,10 15,0 0,15 15,7 0,20 16,2 0,25 17,1 0,30 18,0 0,40 19,2 0,50 20,4 0,55 21,1 0,60 21,9 0,70 22,6 0,80 23,8 0,85 24,2 0,90 25,3 0,95 26,0 Calcule a correlação entre o carbono contido e a resistências, comentando os resultado; O cálculo da correlação foi realizado da mesma forma em que foi feito na questão 3. Semelhantemente, efetuou-se os cálculos de cada termo da expressão e estes foram organizados na Tabela 9. Tabela 9 – Dados para o cálculo do coeficiente de correlação x y x² y² xy 1 0,05 12,30 0,0025 151,29 0,62 2 0,10 15,00 0,0100 225,00 1,50 3 0,15 15,70 0,0225 246,49 2,36 4 0,20 16,20 0,0400 262,44 3,24 5 0,25 17,10 0,0625 292,41 4,28 6 0,30 18,00 0,0900 324,00 5,40 7 0,40 19,20 0,1600 368,64 7,68 8 0,50 20,40 0,2500 416,16 10,20 9 0,55 21,10 0,3025 445,21 11,61 10 0,60 21,90 0,3600 479,61 13,14 11 0,70 22,60 0,4900 510,76 15,82 12 0,80 23,80 0,6400 566,44 19,04 13 0,85 24,20 0,7225 585,64 20,57 14 0,90 25,30 0,8100 640,09 22,77 15 0,95 26,00 0,9025 676,00 24,70 TOTAL 7,30 298,80 4,87 6.190,18 162,91 Após o obtenção dos dados, os mesmos foram inseridos na expressão: r = r = 0,99 Existe uma correlação positiva forte. Significa dizer que a maioria dos pares de valores das variáveis se situa próxima a uma reta com inclinação positiva. O resultado indica, então, que existe uma forte associação positiva entre os percentuais de carbono contido e as resistências elétricas. Assim, pode-se dizer que, à medida em que X aumenta, Y também aumenta, e à medida que X diminui, Y também diminui. As variáveis tendem a variar juntas e no mesmo sentido. Usar o método de mínimos quadrados para estimar o modelo linear que relaciona o carbono contido e a resistência; Com base numa sucessão de pontos que representam um comportamento linear, pode-se traçar retas, encontrando-se diferentes valores para os coeficientes lineares. A determinação do modelo linear pelo método dos mínimos quadrados consiste em determinar o coeficiente angular a e o coeficiente linear b da equação da reta y = a.x + b. As expressões por meio das quais são extraídos ao valores dos parâmetros a e b são as seguintes: a = b = Para a utilização do referido método foi construída a Tabela 10, conforme indicado a seguir. Ressalta-se que aqui o eixo X corresponde ao carbono contido (em %) e o eixo Y as resistências elétricas (em μ oms cm a 20%). Tabela 10 – Valores de x, y, xy e x², e suas respectivas somatórias n x y xy x² 1 0,05 12,30 0,615 0,0025 2 0,10 15,00 1,500 0,0100 3 0,15 15,70 2,355 0,0225 4 0,20 16,20 3,240 0,0400 5 0,25 17,10 4,275 0,0625 6 0,30 18,00 5,400 0,0900 7 0,40 19,20 7,680 0,1600 8 0,50 20,40 10,200 0,2500 9 0,55 21,10 11,605 0,3025 10 0,60 21,90 13,140 0,3600 11 0,70 22,60 15,820 0,4900 12 0,80 23,80 19,040 0,6400 13 0,85 24,20 20,570 0,7225 14 0,90 25,30 22,770 0,8100 15 0,95 26,00 24,700 0,9025 SOMA 7,30 298,80 162,91 4,87 Com esses resultados, basta substituir os valores nas fórmulas para a e b, tendo-se n = 15: a = a = 13,28 b = b = 13,46 Portanto, tem-se que y = 13,28.x + 13,46. Calcule o valor estimado da resistência, relativo a cada quantidade de carbono contido nos fios; Ao substituir-se os valores de x da Tabela 8, na função, obtém-se os seguintes valores de y, apresentados na tabela 11: Tabela 11 – Valores estimados das resistências elétricas, através do modelo CARBONO CONTIDO (EM %) RESISTÊNCIA (μ oms cm a 20 °C) 0,05 14,12 0,10 14,79 0,15 15,45 0,20 16,12 0,25 16,78 0,30 17,44 0,40 18,77 0,50 20,10 0,55 20,76 0,60 21,43 0,70 22,76 0,80 24,08 0,85 24,75 0,90 25,41 0,95 26,08 Calcule a correlação entre os valores observados e estimados pelo modelo. Comente os resultados; O cálculo da correlação foi realizado da mesma forma em que foi feito na questão 3 e no item 4.1. Semelhantemente, efetuou-se os cálculos de cada termo da expressão e estes foram organizados na Tabela 12. Tabela 12 – Dados para o cálculo do coeficiente de correlação n x y x² y² xy 1 0,05 14,12 0,0025 199,49 0,71 2 0,10 14,79 0,0100 218,68 1,48 3 0,15 15,45 0,0225 238,76 2,32 4 0,20 16,12 0,0400 259,73 3,22 5 0,25 16,78 0,0625 281,57 4,20 6 0,30 17,44 0,0900 304,29 5,23 7 0,40 18,77 0,1600 352,39 7,51 8 0,50 20,10 0,2500 404,01 10,05 9 0,55 20,76 0,3025 431,14 11,42 10 0,60 21,43 0,3600 459,16 12,86 11 0,70 22,76 0,4900 517,84 15,93 12 0,80 24,08 0,6400 580,04 19,27 13 0,85 24,75 0,7225 612,46 21,04 14 0,90 25,41 0,8100 645,77 22,87 15 0,95 26,08 0,9025 679,96 24,77 TOTAL 7,30 298,84 4,87 6185,29 162,87 Em seguida, a correlação foi calculada: r = r = 1,00 Há uma correlação linear perfeita entre as variáveis, cujos pares de valores, isto é todos os pontos (x,y), se situam numa reta com inclinação positiva. À medida em que X aumenta, Y também aumenta, e à medida que X diminui, Y também diminui. As variáveis tendem a variar juntas e no mesmo sentido, de forma diretamente proporcional. Usando papel quadriculado, milimetrado ou algum aplicativo, ilustrar a solução do problema. Figura 2 – Ilustração da relação entre o efeito de carbono e as resistências elétricas, após o ajuste com modelo linear.
Compartilhar