Prévia do material em texto
01 A análise de correlação tem por objetivo medir a intensidade de relação entre as variáveis a partir de valores que estão compreendidos no intervalo -1 a 1. Conforme aponta Larson e Farber (2016), quanto mais próximo dos extremos, maior é a correlação entre as variáveis e à medida que o coeficiente se aproxima de zero significa que não há correlação. LARSON, R.; FARBER, B. Estatística Aplicada. 6. ed. São Paulo: Pearson, 2016. Sobre os tipos de correlação avalie as afirmativas a seguir. I. Correlação linear positiva ocorre quando a variável dependente está diretamente relacionada com a variável independente. II. Correlação linear negativa ocorre quando a variável dependente tem relação inversamente proporcional com a variável independente III. Há correlação entre as variáveis quando existir uma relação diretamente e inversamente proporcional, de maneira simultânea. É correto o que se afirma em: a. I, apenas. b. I e III, apenas. c. I e II, apenas. Resposta correta: uma correlação linear positiva ocorre quando a variável dependente está diretamente relacionada com a variável independente, já a correlação linear negativa ocorre quando a variável dependente tem relação inversamente proporcional com a variável independente. d. I, II e III. e. II e III, apenas. Feedback A resposta correta é: I e II, apenas. 02 Dada uma coleção de dados amostrais emparelhados, a equação de regressão é expressa a partir da relação , em que é o valor previsto a partir de um valor de x, de m que é a inclinação da reta e de b que é o intercepto em y, ou seja, é o valor de y no ponto onde a reta cruza esse eixo. Diante esse contexto, apresentamos a relação entre a variável peso (em libras) do plástico descartado (x) e a variável tamanho das residências (em pessoas) que o descartam : Mediante os calculo efetuado, a equação da reta de regressão linear que melhor ajusta esses valores é igual a: a. Resposta correta: lembrando que a equação da reta de regressão linear é dada por , devemos encontrar os valores de m e de b. Sabemos que e . Assim, vem: E Portanto, a resposta correta é b. c. d. e. Feedback A resposta correta é: 03 De acordo com Triola (2017), o coeficiente de correlação linear r mede o grau de relacionamento linear entre os valores emparelhados x e y em uma amostra. Esse coeficiente também recebe a denominação de coeficiente de correlação momento-produto de Pearson, em homenagem a Karl Pearson (1857-1936). TRIOLA, M. Introdução à Estatística. Rio de Janeiro: LTC, 2017 De acordo com a tabela a seguir, é correto afirmar que o coeficiente de correlação linear é igual a: a. 0,997 b. 0,597 c. 0,697 d. 0,797 e. 0,897 Resposta correta: todos os cálculos foram feitos de maneira correta. Seu cálculo é descrito pela fórmula: ,em que x é a variável independente (comprimento), y é a variável dependente (peso) e é o total de elementos. O cálculo leva a: Feedback A resposta correta é: 0,897 04 Muito semelhante ao conceito de correlação, a covariância apresenta-se na estatística como uma medida que verifica a relação entre duas variáveis. No entanto, existem diferenças nessas concepções. Quais são as características exclusivas da covariância? a. O valor encontrado pelo cálculo da covariância não é padronizado e seu sinal positivo indica respostas sobre a direção da relação entre as variáveis. b. Os valores da covariância não são padronizados e fornecem respostas sobre a direção da relação entre as variáveis. Resposta correta: os valores resultantes do cálculo da covariância não são padronizados como ocorre com o conceito de correlação, logo, abrangem o conjunto dos números reais; também, seu valor fornece respostas sobre a direção encontrada na relação entre as variáveis. c. O resultado da covariância não varia entre -1 e 1 e seu sinal indica respostas sobre o módulo, direção e sentido entre as variáveis. d. O cálculo da covariância resulta em números pertencentes ao conjunto dos números reais e seu sinal negativo fornece respostas sobre a direção da correlação entre as variáveis. e. A covariância é limitada de -1 e 1 e o sinal do valor encontrado indica padrões sobre a direção da relação entre as variáveis. Feedback A resposta correta é: Os valores da covariância não são padronizados e fornecem respostas sobre a direção da relação entre as variáveis. 05 De acordo com Larson e Farber (2016), o coeficiente de correlação linear mede a força entre duas variáveis e estabelece sua direção, sendo expresso pela equação: . Esse valor se concentra dentro do intervalo -1 a 1 que expressa a intensidade da relação entre as variáveis, que pode ser forte, moderada ou fraca. LARSON, R.; FARBER, B. Estatística Aplicada. 6. ed. São Paulo: Pearson, 2016. Observe os dados tabelados. Agora, avalie as afirmativas a seguir. I. II. III. o coeficiente de correlação linear é IV. V. Está correto o que se afirma em: a. I e II, apenas. b. II, III e IV, apenas. c. I, IV e V, apenas. d. III e V, apenas. e. I, II e III, apenas. Resposta correta: para calcularmos o coeficiente de correlação linear, devemos aplicar a seguinte relação: . Assim, atenção aos termos: ; ; e Feedback A resposta correta é: I, II e III, apenas. 06 De acordo com Freund e Simon (2009), na maioria dos conjuntos, os dados não são todos iguais entre si, sendo que a extensão de sua variabilidade é um problema a ser estudado dentro da estatística. Nesse sentido, é importante avaliar a extensão da dispersão dos dados a partir das medidas de dispersão ou variabilidade. FREUND, J. E.; SIMON, G. A. S. Estatística Aplicada: economia, administração e contabilidade. Porto Alegre: Bookman, 2009. Entre essas medidas encontramos a variância e o desvio-padrão. Nesse sentido, assinale V para a(s) verdadeira(s) e F para a(s) falsa(s). I. corresponde a variância de um conjunto de dados amostrais. II. Uma dificuldade da variância é que ela não é expressa nas mesmas unidades dos dados originais. III. Se o valor da variância de uma determinada população é 144, o desvio-padrão dessa mesma população vale 14. IV. Para encontrarmos o valor do desvio-padrão de uma determinada população, é necessário que encontremos a variância. V. Variância é a média aritmética dos quadrados dos desvios. Nesse sentido, assinale a alternativa que apresenta a sequência correta. a. V, V, V, V, F. b. F, V, V, V, F. c. F, V, F, V, V. Resposta correta: estudamos nessa unidade as medidas de dispersão, entre elas o desvio-padrão e a variância. Vimos que o desvio-padrão é a mais importante medida de dispersão e é calculado pela raiz quadrada da variância, assim, é necessário que tenhamos primeiro a variância para poder chegar ao valor do desvio-padrão. Além disso, estudamos que o desvio-padrão leva em conta todos os valores do conjunto de dados, correspondendo a uma variação dos valores em relação à média. d. V, V, F, F, V. e. F, V, F, V, F. Feedback A resposta correta é: F, V, F, V, V. 07 As medidas de dispersão avaliam o quanto uma entrada típica desvia-se da média. Quanto mais espalhados estiverem os dados, maior será o desvio. Ele é o resultado da raiz quadrada da variância, logo, o cálculo da variância é um passo intermediário para obtê-lo. É a medida de dispersão mais utilizada em estatística. O trecho acima refere-se: a. à medida de dispersão. b. à variância. c. à média. d. à frequência absoluta. e. ao desvio-padrão. Resposta correta: o trecho refere-se ao desvio-padrão, o resultado da raiz quadrada da variância. Ele corresponde a medida de variação mais útil e mais largamente utilizada e identifica a dispersão de um conjunto de dados em torno da média. Feedback A resposta correta é: ao desvio-padrão. 08 O número de homens adultos fumantes, registrado a partir do ano de 2010, indica uma relação linear negativa, modelada conforme a equação que foi ajustada aos dados recolhidos pela Secretaria de Saúde de determinado município. Considerando que o resultado é dado em milhares de pessoas e considerando que x é o período decorrido a partir de 2010, assinale a alternativacorreta. a. Em 2015, havia 28,5 mil fumantes. b. Em 2010, havia 27,5 mil fumantes. c. x é a variável independente e y a variável dependente. Resposta correta: em 2010 (), temos: mil fumantes; em 2015 (), temos: mil fumantes; em 2018 (), temos: mil fumantes. Em uma correlação linear, o objetivo é determinar se existe, ou não, uma relação entre duas variáveis (x: variável independente e y: variável dependente), estabelecida pela equação da reta de regressão linear . d. x é a variável dependente e y a variável independente. e. Em 2018, havia 29,5 mil fumantes. Feedback A resposta correta é: x é a variável independente e y a variável dependente. 09 Modelar algebricamente uma reta de ajuste linear possibilita a análise de regressão linear, pois resume uma relação linear. Nessa técnica, uma variável dependente é interligada a uma variável independente por intermédio de uma reta, cuja equação típica é dada por: . Assim, essa relação é descrita por um gráfico chamado de reta de regressão, reta de melhor ajuste ou ainda reta de mínimos quadrados. Diante desse contexto, assinale V para a(s) verdadeira(s) e F para a(s) falsa(s). I. As relações são expressas por e II. O ajuste de curvas no processo de regressão linear é deduzido pelo método dos mínimos quadrados. III. A reta de regressão é a que melhor se ajusta aos pontos amostrais. IV. A reta de regressão passa sempre pelo centroide . V. b é o coeficiente angular e m é o intercepto em y. Agora, assinale a alternativa que apresenta a sequência correta. a. F, V, F, F, V. b. V, V, F, F, F. c. V, V, V, V, F. Resposta correta: estudamos que a reta de regressão linear descreve a relação entre duas variáveis e que é representada por uma reta cujo coeficiente angular é m e o intercepto em y é b e que ela sempre passará pelo par ordenado . d. V, V, V, F, F. e. F, V, F, V, F. Feedback A resposta correta é: V, V, V, V, F. 10 O dispositivo de regressão linear possibilita previsões de valores a partir de dados passados. Dessa forma, é possível identificar as maiores tendências apresentadas por variáveis observadas, modelando matematicamente as informações numéricas que se deseja analisar a partir da equação de regressão linear. A tabela a seguir apresenta o descarte de plástico (libras) em relação ao tamanho da residência. Tabela: Distribuição entre quantidade de plástico descartado (lb) em função do tamanho da família (pessoas) Fonte: Elaborada pela autora, baseada em TRIOLA, 2017. TRIOLA, M. Introdução à Estatística. Rio de Janeiro: LTC, 2017 De acordo com a tabela, questionamos qual é a melhor predição do tamanho de uma residência que descarta 0,50 lb de plástico? a. aproximadamente 1,3 pessoas. Resposta correta: você primeiramente deverá encontrar a equação da reta de regressão linear dada por: . Sabemos que e . Assim, vem: e Portanto, a equação é igual a . Portanto, a melhor predição do tamanho de uma residência que descarta 0,50 lb de plástico é igual a pessoas ou 1,3 pessoas. b. aproximadamente 2,3 pessoas c. aproximadamente 3,2 pessoas d. aproximadamente 2,8 pessoas e. aproximadamente 1,8 pessoas Feedback A resposta correta é: aproximadamente 1,3 pessoas.