Prévia do material em texto
Fazer teste: Atividades de Sistematização _ 4 Informações do teste Descrição Instruções Várias tentativas Este teste permite 2 tentativas. Esta é a tentativa número 1. Forçar conclusão Este teste pode ser salvo e retomado posteriormente. Suas respostas foram salvas automaticamente. PERGUNTA 1 Sobre o cálculo da correlação r, assinale a alternativa incorreta: No cálculo de r, não há distinção entre variável explicativa e variável resposta Quando r=0, diz-se que é há uma associação infinitamente forte entre as variáveis x e y. -1<r<0 quando há uma associação negativa entre as variáveis x e y. O valor de r é calculado levando-se em consideração o desvio-padrão. 0<r<1 quando há uma associação positiva entre as variáveis x e y. 0,08 pontos Salva PERGUNTA 2 IDNO WEIGHT COLOR CLARITY RATER PRICE IDNO: número identificador do diamante WEIGHT: peso (quilates; 1 quilate = 200mg) COLOR: cor do diamante (escala alfabética, de D a Z) CLARITY: claridade (há 11 categorias de claridade, indicadas por siglas) RATER: organização certificadora de autenticidade (há três: GIA, IGI e HRD) PRICE: preço (em dólares norte-americanos) I. Existe uma correlação forte positiva (r maior que 0,9) entre as variáveis WEIGHT e PRICE II. Não há correlação entre as variáveis WEIGHT e PRICE III Existe uma corretação fraca negativa (r entre -0 5 e -0 1) entre as variáveis WEIGHT e PRICE Fonte: Pixabay - Licença CC O comércio de diamantes do mundo tem uma série de especificidades e também muitas polêmicas, já que muito de sua exploração envolve relações violentas entre exploradores, contrabandistas e comunidades explroadas, em especial na África. A beleza, e o valor, do diamante nascem de 4 fatores: a sua cor, claridade, tamanho (e peso) e lapidação. São os famosos “4 Cs” da indústria diamantífera: em inglês: color, clarity, carat e cut. O dataset Diamonds.xls contém os seguintes dados de 308 diamantes: Sobre este dataset, são feitas as seguintes afirmações: 0,08 pontos Salva Estado de Conclusão da Pergunta: https://bb.cruzeirodosulvirtual.com.br/bbcswebdav/pid-9876810-dt-content-rid-85793863_1/xid-85793863_1 III. Existe uma corretação fraca negativa (r entre -0,5 e -0,1) entre as variáveis WEIGHT e PRICE IV. É possível calcular a correlação entre COLOR e PRICE, sem fazer qualquer alteração nas variáveis Assinale a alternativa que contenha todas as afirmações verdadeiras, e apenas elas. Fonte do dataset: Journal of Statistics Education Apenas II II e IV III e IV I e IV Aoenas I PERGUNTA 3 A correlação entre wind e area é muito próxima de 0, podendo ser dito que praticamente não há correlação A correlação entre temp e area é fraca, positiva A correlação entre temp e wind é fraca, negativa Fonte: Wikimedia Commons - Licença CC As queimadas são um problema global, que podem afetar populações inteiras, inclusive alterando fatores climáticos importantes no mundo. Analise o dataset forestfires.csv , que é um conjunto de dados que contém fatores que podem levar a incêndios florestais no nordeste de Portugal. O dataset iInclui fatores climáticos e variáveis categóricas, como dias da semana. Contém 13 variáveis e 517 observações diárias. Para este exercício, porém, considere apenas as variáveis wind (velocidade do vento em km/h), temp (temperatura em Celsius) e area (área, em km2, afetada pela queimada). O formato .csv é um formato de representação de dados em texto bastante popular na área de Ciência de Dados. Todas as planilhas de cálculo têm mecanismos para importar arquivos csv. Para o Excel, por eemplo, veja neste link. Sobre este dataset, analise as seguintes afirmativas: Assinale a alternativa que contém todas as afirmativas corretas, e apenas elas. Fonte do dataset: [Cortez and Morais, 2007] P. Cortez and A. Morais. A Data Mining Approach to Predict Forest Fires using Meteorological Data. In J. Neves, M. F. Santos and J. Machado Eds., New Trends in Artificial Intelligence, Proceedings of the 13th EPIA 2007 - Portuguese Conference on Artificial Intelligence, December, Guimarães, Portugal, pp. 512-523, 2007. APPIA, ISBN-13 978-989-95618-0-9. Apenas a III Apenas a I Nenhuma está correta II e III Todas estão corretas 0,08 pontos Salva PERGUNTA 4 Sobre o Quarteto de Anscombe, o que não pode ser dito? Há outliers em alguns dos datasets. Trata-se de um conjunto de quatro datasets com os indivíduos idênticos entre si, mas com valores estatísticos, como média e variância, completamente diferentes. Trata-se de um conjunto de quatro datasets distintos com mesma média e variância. Mostra a importância da visualização de dados no processo da análise exploratória de dados A correlação entre x e y dos quatro datasets é aproximadamente igual 0,08 pontos Salva PERGUNTA 5 0,08 pontos Salva Estado de Conclusão da Pergunta: https://bb.cruzeirodosulvirtual.com.br/bbcswebdav/pid-9876810-dt-content-rid-85817096_1/xid-85817096_1 https://support.office.com/pt-br/article/importar-ou-exportar-arquivos-de-texto-txt-ou-csv-5250ac4c-663c-47ce-937b-339e391393ba I. Há uma correlação positiva entre fat (gordura) e calorias que não pode ser considerada forte; entretanto, é maior do que a correlação entre fat e sodium II. A correlação entre sodium e potass é muito baixa, praticamente nula III. A correlação entre calories e protein é positiva e forte Fonte: Maxpixel - Licença CC O consumo de cereais matutinos vem aumentando bastante no Brasil. Como a faixa de maior crescimento de consumo deste alimento está entre crianças e adolescentes, é necessário que os pais acompanhem sua alimentação e verifiquem os valores nutricionais de cada marca. O dataset cereal.csv contém dados nutricionais de 77 cereais. Analisando este dataset, têm-se as seguintes afirmativas: Assinale a alterantiva que contém todas as afirmativas corretas, e apenas estas. I e III II e III Todas estão corretas I e II Apenas II PERGUNTA 6 Fonte: Needpix - Licença CC É sabido que o tempo de sono pode impactar na qualidade de vida das pessoas. Em um levantamento feito pela Eurostat em 14 países da Europa (veja dataset TimeUse.csv ) a respeito do tempo gasto por homens (males) e mulheres (females) em atividades diárias mostra que a atividade que leva mais tempo para as pessoas é dormir (sleep), embora haja diferenças no tempo total de sono entre países. O que pode ser dito em quanto à corelação do tempo de sono entre homens e mulheres, por país? Negativa e forte Positiva e fraca Não há correlação Positiva e forte Negativa e fraca 0,08 pontos Salva PERGUNTA 7 O que não pode ser dito a respeito do cálculo da correlação? Correlação não implica em causalidade. A correlação requer que ambas as variáveis sejam quantitativas, para que os cálculos da fórmula de r façam sentido A correlação varia de acordo com a unidade de medida das observações. Por exemplo, para cálculo de correlação entre a altura e a massa corporal de um conjunto de pessoas, o valor de r para alturas em centímetros e massa em quilogramas é diferente do valor de r para alturas em polegadas e massa em libras. 0,08 pontos Salva Estado de Conclusão da Pergunta: https://bb.cruzeirodosulvirtual.com.br/bbcswebdav/pid-9876810-dt-content-rid-86160527_1/xid-86160527_1 https://bb.cruzeirodosulvirtual.com.br/bbcswebdav/pid-9876810-dt-content-rid-86160078_1/xid-86160078_1 Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as respostas. Não é possível, no cálculo da correlação, ter valores para r<-1 ou r>1. O cálculo da correlação não faz distinção entre variável explicativa e variável resposta. PERGUNTA 8 I. Em relação à variável Horsepower, as variáveis Displacement e Weight mantêm uma correlação positiva. II. Em relação à variável Horsepower, as variáveis MPG e Acceleration têm uma correlação negativa III. Quanto maior o valor de Displacement, maior o valor de MPG IV. Não há nenhuma correlação entre nenhuma dessas cinco variávies O dataset cars.csv contém informações a respeitode mais de 400 carros, entre elas: MPG (Milhas por Galão, medida de gasto de combustível)Displacement (Velocidade máxima - milhas por hora)Horsepower (Cavalos-vapor)Weight (Peso em libras)Acceleration (Tempo gasto para sair de 0 m/h a 100 m/h) Observe as afirmativas a seguir. Asinale a alternativa que contém todas as afirmativas corretas e apenas essas. Somente IV Somente III I e II II e III Somente I 0,08 pontos Salva PERGUNTA 9 Sejam duas variávies em uma distribuição, x e y. Se dissemos que x e y mantêm uma correlação positiva forte, isso significa que: Quanto maior o valor de x, menor o de y Quanto menor o valor de x, maior o de y O valor de y sempre será constante, independente do valor de x Quanto menor o valor de x, menor o de y x e y variam livremente e não há nenhuma relação entre seus valores 0,08 pontos Salva PERGUNTA 10 O que pode ser dito sobre uma correlação negativa forte? Ocorre apenas quando as variáveis da distribuição assumem valores positivos. Quando uma das variáveis cresce, a outra decresce Só ocorre quando o valor das variâncias de ambas as variáveis é begativo. Ocorre apenas quando as variáveis da distribuição assumem valores negativos. Quando uma das variáveis cresce, a outra cresce tamém 0,08 pontos Salva Salvar todas as respostas Fechar janela Salvar e Enviar Estado de Conclusão da Pergunta: https://bb.cruzeirodosulvirtual.com.br/bbcswebdav/pid-9876810-dt-content-rid-86173626_1/xid-86173626_1