Baixe o app para aproveitar ainda mais
Prévia do material em texto
1. Diversos materiais na Internet definem a ciência de dados como responsável apenas pelo processamento de dados. Entretanto, ela é responsável por outras etapas extremamente importantes para o uso de dados. Qual alternativa mostra a sequência correta de todas as etapas do ciclo da ciência de dados? C. Entender o problema, coletar os dados, armazenar os dados, processar os dados, explorar as informações dos resultados, comunicar os resultados e fornecer feedback. 2. O uso da ciência de dados vem se tornando comum nos últimos anos. Apesar disso, ainda existem pessoas que expressam de forma errada a correlação entre estatística e ciência de dados. Qual é a explicação correta sobre a correlação entre estatística e ciência de dados? E. A estatística é uma ferramenta da ciência de dados e é utilizada nas etapas de processar os dados e explorar as informações dos resultados. 3. Um questionário geral visando a analisar um grupo de pessoas com acompanhamento nutricional foi desenvolvido, composto pelas variáveis sexo, peso, altura, número de filhos, telefone e mês de início do acompanhamento. Classifique a classe de cada variável e assinale a alternativa que representa a sequência correta. A. Qualitativa nominal, quantitativa contínua, quantitativa contínua, quantitativa discreta, qualitativa nominal e qualitativa ordinal. Em uma escola no interior de São Paulo, é comum que o professor de Educação Física faça a medição de altura dos alunos no início do ano letivo e faça uma comparação entre as alturas medidas. Para isso, o professor mediu a altura de 100 alunos e montou uma tabela com a distribuição de frequência de altura. O que é possível concluir a partir da tabela? B. A maioria dos alunos tem entre 1,70 e 1,75m de altura. A minoria dos alunos tem entre 1,75 e 1,80m. Do total de alunos, 59% têm entre 1,50 e 1,70m. 5. A estatística descritiva é responsável pela etapa inicial de análise de dados. Por meio de suas métricas, é possível analisar a posição das variáveis e analisar a dispersão. Escolha a alternativa que melhor explica as medidas em estatística descritiva. E. Média, mediana, moda e quartis (1.º e 3.º) são medidas para análise de posição. A média é a soma de todas as observações dividida pelo número total de observações. A moda é o valor que a variável assume com maior frequência. A mediana, também conhecida como 2.º quartil, indica um valor que é maior que 50% das amostras ordenadas. O 1.º quartil (25%) indica um valor em que 25% das amostras ordenadas são menores, e o 3.º quartil (75%) indica um valor em que 75% das amostras ordenadas são menores. A amplitude e o coeficiente de variação são medidas de dispersão. A amplitude é dada pela diferença entre o valor máximo e o valor mínimo da variável. O coeficiente de variação é uma medida de dispersão relativa, que elimina o efeito da magnitude dos dados.
Compartilhar