Prévia do material em texto
AVALIAÇÃO 4 A estatística descritiva é uma subárea da estatística que envolve análises iniciais com o objetivo de obter as principais características e uma visão geral dos dados. São conceitos relacionados à estatística descritiva: Selecione a resposta: · A População, amostra, variáveis. · B População, objetos, dados. · C Amostra, dados, algoritmos. · D Variáveis, objetos, população. · E Variáveis, dados, mineração. Medidas de posição (também conhecidas como medidas de tendência central) são métricas que permitem analisar como os dados estão distribuídos e onde determinado valor se enquadra na população ou amostra. Considerando um conjunto de dados ordenado (v) com uma quantidade par de elementos (n), qual seria a mediana? Selecione a resposta: · A A mediana seria a média entre os valores das posições n/2 e (n/2)+1. · B A mediana seria a média entre os valores das posições n/2 e (n-1)/2. · C A mediana seria o ponto do meio. · D A mediana seria a soma de todos os elementos de (v) pela quantidade (n). · E Não há mediana, pois, para que haja mediana, deve-se ter uma quantidade ímpar de elementos. A variância é uma métrica que mede a dispersão dos dados. Dado um vetor v de tamanho n, a variância pode ser obtida calculando a diferença entre cada valor do vetor e a média. Por fim, a variância será a média dos quadrados das diferenças. Para calcular a variância amostral, subtraímos n por 1. Já o desvio padrão é a raiz quadrada da variância. Dado o vetor v = {1, 2, 2, 5, 1, 3, 14}, determine a média, a mediana e o desvio padrão amostral: Selecione a resposta: · A 2, 4, 4.618802. B 4, 2, 4.618802. · C 4, 2, 5.112. · D 5, 3, 9.54. · E 6, 4, 5.112. As técnicas de visualização de dados permitem a identificação de padrões não identificáveis a olho humano. Das visualizações a seguir, quais permitem a identificação de outliers? Selecione a resposta: · A Gráfico de dispersão e boxplot. · B Gráfico de barras e histograma. · C Gráfico de linhas e boxplot. · D Gráfico de linhas e histograma. · E Gráfico de dispersão e gráfico de barras. R é uma das linguagens de programação mais utilizadas para análise exploratória de dados. Ela fornece uma série de funções para estatística descritiva e visualizações de dados. Entre as funções a seguir, qual representa uma função usada para obter informações como média, mediana, valores mínimo e máximo em um vetor? Selecione a resposta: · A sd() B summary() · C median() · D mean() · E min()