Baixe o app para aproveitar ainda mais
Prévia do material em texto
Exercícios 1. Diversos materiais na Internet definem a ciência de dados como responsável apenas pelo processamento de dados. Entretanto, ela é responsável por outras etapas extremamente importantes para o uso de dados. Qual alternativa mostra a sequência correta de todas as etapas do ciclo da ciência de dados? Resposta incorreta. A. Entender o problema, coletar os dados, processar os dados, explorar as informações dos resultados e comunicar os resultados. As etapas do ciclo da ciência de dados que devem ser seguidas são: 1- entender o problema como um todo para determinar quais variáveis são importantes; 2- coletar os dados; 3- armazenar os dados; 4- processar os dados; 5- explorar as informações dos resultados; 6- comunicar os resultados; 7- fornecer feedback ao setor que solicitou o uso da ciência de dados. Para processar os dados, é necessário armazená-los. Após comunicar os resultados, há a última etapa, para fornecer feedback ao setor que solicitou o uso da ciência de dados. Antes de coletar os dados, é fundamental entender o problema como um todo para determinar quais variáveis são importantes. Além disso, todas as etapas apresentadas devem seguir a ordem; assim, é necessário entender o problema como um todo para determinar quais variáveis são importantes e só depois coletar os dados. A etapa de armazenamento dos dados deve ser feita antes do processamento deles. Resposta incorreta. B. Entender o problema, coletar os dados, processar os dados, explorar as informações dos resultados, comunicar os resultados e fornecer feedback. As etapas do ciclo da ciência de dados que devem ser seguidas são: 1- entender o problema como um todo para determinar quais variáveis são importantes; 2- coletar os dados; 3- armazenar os dados; 4- processar os dados; 5- explorar as informações dos resultados; 6- comunicar os resultados; 7- fornecer feedback ao setor que solicitou o uso da ciência de dados. Para processar os dados, é necessário armazená-los. Após comunicar os resultados, há a última etapa, para fornecer feedback ao setor que solicitou o uso da ciência de dados. Antes de coletar os dados, é fundamental entender o problema como um todo para determinar quais variáveis são importantes. Além disso, todas as etapas apresentadas devem seguir a ordem; assim, é necessário entender o problema como um todo para determinar quais variáveis são importantes e só depois coletar os dados. A etapa de armazenamento dos dados deve ser feita antes do processamento deles. Você acertou! C. Entender o problema, coletar os dados, armazenar os dados, processar os dados, explorar as informações dos resultados, comunicar os resultados e fornecer feedback. As etapas do ciclo da ciência de dados que devem ser seguidas são: 1- entender o problema como um todo para determinar quais variáveis são importantes; 2- coletar os dados; 3- armazenar os dados; 4- processar os dados; 5- explorar as informações dos resultados; 6- comunicar os resultados; 7- fornecer feedback ao setor que solicitou o uso da ciência de dados. Para processar os dados, é necessário armazená-los. Após comunicar os resultados, há a última etapa, para fornecer feedback ao setor que solicitou o uso da ciência de dados. Antes de coletar os dados, é fundamental entender o problema como um todo para determinar quais variáveis são importantes. Além disso, todas as etapas apresentadas devem seguir a ordem; assim, é necessário entender o problema como um todo para determinar quais variáveis são importantes e só depois coletar os dados. A etapa de armazenamento dos dados deve ser feita antes do processamento deles. Resposta incorreta. D. Coletar os dados, armazenar os dados, processar os dados, explorar as informações dos resultados, comunicar os resultados e fornecer feedback. As etapas do ciclo da ciência de dados que devem ser seguidas são: 1- entender o problema como um todo para determinar quais variáveis são importantes; 2- coletar os dados; 3- armazenar os dados; 4- processar os dados; 5- explorar as informações dos resultados; 6- comunicar os resultados; 7- fornecer feedback ao setor que solicitou o uso da ciência de dados. Para processar os dados, é necessário armazená-los. Após comunicar os resultados, há a última etapa, para fornecer feedback ao setor que solicitou o uso da ciência de dados. Antes de coletar os dados, é fundamental entender o problema como um todo para determinar quais variáveis são importantes. Além disso, todas as etapas apresentadas devem seguir a ordem; assim, é necessário entender o problema como um todo para determinar quais variáveis são importantes e só depois coletar os dados. A etapa de armazenamento dos dados deve ser feita antes do processamento deles. Resposta incorreta. E. Coletar os dados, entender o problema, processar os dados, armazenar os dados, explorar as informações dos resultados, comunicar os resultados e fornecer feedback. As etapas do ciclo da ciência de dados que devem ser seguidas são: 1- entender o problema como um todo para determinar quais variáveis são importantes; 2- coletar os dados; 3- armazenar os dados; 4- processar os dados; 5- explorar as informações dos resultados; 6- comunicar os resultados; 7- fornecer feedback ao setor que solicitou o uso da ciência de dados. Para processar os dados, é necessário armazená-los. Após comunicar os resultados, há a última etapa, para fornecer feedback ao setor que solicitou o uso da ciência de dados. Antes de coletar os dados, é fundamental entender o problema como um todo para determinar quais variáveis são importantes. Além disso, todas as etapas apresentadas devem seguir a ordem; assim, é necessário entender o problema como um todo para determinar quais variáveis são importantes e só depois coletar os dados. A etapa de armazenamento dos dados deve ser feita antes do processamento deles. 2. O uso da ciência de dados vem se tornando comum nos últimos anos. Apesar disso, ainda existem pessoas que expressam de forma errada a correlação entre estatística e ciência de dados. Qual é a explicação correta sobre a correlação entre estatística e ciência de dados? Resposta incorreta. A. São iguais. Ambas têm como objetivo analisar os dados. A ciência de dados e a estatística, além de serem distintas, não são apenas para analisar dados. Apesar de a estatística descritiva ser uma ferramenta ou método utilizado pela ciência de dados, ela não é utilizada na etapa de coletar os dados, e sim nas etapas de processar os dados e explorar as informações dos resultados. A ciência de dados é responsável por todas as etapas do ciclo de análise de dados. Resposta incorreta. B. A ciência de dados é um método utilizado pela estatística descritiva. A ciência de dados e a estatística, além de serem distintas, não são apenas para analisar dados. Apesar de a estatística descritiva ser uma ferramenta ou método utilizado pela ciência de dados, ela não é utilizada na etapa de coletar os dados, e sim nas etapas de processar os dados e explorar as informações dos resultados. A ciência de dados é responsável por todas as etapas do ciclo de análise de dados. Resposta incorreta. C. A estatística é utilizada para processar os dados, e a ciência de dados é responsável por interpretar os resultados da estatística. A ciência de dados e a estatística, além de serem distintas, não são apenas para analisar dados. Apesar de a estatística descritiva ser uma ferramenta ou método utilizado pela ciência de dados, ela não é utilizada na etapa de coletar os dados, e sim nas etapas de processar os dados e explorar as informações dos resultados. A ciência de dados é responsável por todas as etapas do ciclo de análise de dados. Resposta incorreta. D. A estatística é uma ferramenta da ciência de dados e é utilizada nas etapas de coleta e processamento de dados. A ciência de dados e a estatística, além de serem distintas, não são apenaspara analisar dados. Apesar de a estatística descritiva ser uma ferramenta ou método utilizado pela ciência de dados, ela não é utilizada na etapa de coletar os dados, e sim nas etapas de processar os dados e explorar as informações dos resultados. A ciência de dados é responsável por todas as etapas do ciclo de análise de dados. Você acertou! E. A estatística é uma ferramenta da ciência de dados e é utilizada nas etapas de processar os dados e explorar as informações dos resultados. A ciência de dados e a estatística, além de serem distintas, não são apenas para analisar dados. Apesar de a estatística descritiva ser uma ferramenta ou método utilizado pela ciência de dados, ela não é utilizada na etapa de coletar os dados, e sim nas etapas de processar os dados e explorar as informações dos resultados. A ciência de dados é responsável por todas as etapas do ciclo de análise de dados. 3. Um questionário geral visando a analisar um grupo de pessoas com acompanhamento nutricional foi desenvolvido, composto pelas variáveis sexo, peso, altura, número de filhos, telefone e mês de início do acompanhamento. Classifique a classe de cada variável e assinale a alternativa que representa a sequência correta. Você acertou! A. Qualitativa nominal, quantitativa contínua, quantitativa contínua, quantitativa discreta, qualitativa nominal e qualitativa ordinal. A sequência correta é: qualitativa nominal, quantitativa contínua, quantitativa contínua, quantitativa discreta, qualitativa nominal e qualitativa ordinal. A variável sexo é qualitativa nominal mesmo se fosse utilizado número no lugar de letra para indicar sexo masculino (1) ou feminino (2). As variáveis peso e altura podem assumir valores não inteiros, ou seja, são quantitativas contínuas. A variável número de filhos só pode assumir valores discretos, ou seja, é quantitativa discreta. O telefone, apesar de ser composto por números, não apresenta valores quantitativos, nem pode ser ordenado, ou seja, é uma variável qualitativa nominal. O mês de início do acompanhamento é qualitativa ordinal, uma vez que existe uma ordenação entre as categorias. Resposta incorreta. B. Qualitativa nominal, quantitativa contínua, quantitativa contínua, quantitativa discreta, quantitativa discreta e qualitativa ordinal. A sequência correta é: qualitativa nominal, quantitativa contínua, quantitativa contínua, quantitativa discreta, qualitativa nominal e qualitativa ordinal. A variável sexo é qualitativa nominal mesmo se fosse utilizado número no lugar de letra para indicar sexo masculino (1) ou feminino (2). As variáveis peso e altura podem assumir valores não inteiros, ou seja, são quantitativas contínuas. A variável número de filhos só pode assumir valores discretos, ou seja, é quantitativa discreta. O telefone, apesar de ser composto por números, não apresenta valores quantitativos, nem pode ser ordenado, ou seja, é uma variável qualitativa nominal. O mês de início do acompanhamento é qualitativa ordinal, uma vez que existe uma ordenação entre as categorias. Resposta incorreta. C. Qualitativa ordinal, quantitativa contínua, quantitativa contínua, quantitativa discreta, qualitativa nominal e qualitativa ordinal. A sequência correta é: qualitativa nominal, quantitativa contínua, quantitativa contínua, quantitativa discreta, qualitativa nominal e qualitativa ordinal. A variável sexo é qualitativa nominal mesmo se fosse utilizado número no lugar de letra para indicar sexo masculino (1) ou feminino (2). As variáveis peso e altura podem assumir valores não inteiros, ou seja, são quantitativas contínuas. A variável número de filhos só pode assumir valores discretos, ou seja, é quantitativa discreta. O telefone, apesar de ser composto por números, não apresenta valores quantitativos, nem pode ser ordenado, ou seja, é uma variável qualitativa nominal. O mês de início do acompanhamento é qualitativa ordinal, uma vez que existe uma ordenação entre as categorias. Resposta incorreta. D. Qualitativa nominal, quantitativa contínua, quantitativa contínua, quantitativa contínua, qualitativa nominal e qualitativa ordinal. A sequência correta é: qualitativa nominal, quantitativa contínua, quantitativa contínua, quantitativa discreta, qualitativa nominal e qualitativa ordinal. A variável sexo é qualitativa nominal mesmo se fosse utilizado número no lugar de letra para indicar sexo masculino (1) ou feminino (2). As variáveis peso e altura podem assumir valores não inteiros, ou seja, são quantitativas contínuas. A variável número de filhos só pode assumir valores discretos, ou seja, é quantitativa discreta. O telefone, apesar de ser composto por números, não apresenta valores quantitativos, nem pode ser ordenado, ou seja, é uma variável qualitativa nominal. O mês de início do acompanhamento é qualitativa ordinal, uma vez que existe uma ordenação entre as categorias. Resposta incorreta. E. Qualitativa nominal, quantitativa contínua, quantitativa discreta, quantitativa discreta, qualitativa nominal e qualitativa ordinal. A sequência correta é: qualitativa nominal, quantitativa contínua, quantitativa contínua, quantitativa discreta, qualitativa nominal e qualitativa ordinal. A variável sexo é qualitativa nominal mesmo se fosse utilizado número no lugar de letra para indicar sexo masculino (1) ou feminino (2). As variáveis peso e altura podem assumir valores não inteiros, ou seja, são quantitativas contínuas. A variável número de filhos só pode assumir valores discretos, ou seja, é quantitativa discreta. O telefone, apesar de ser composto por números, não apresenta valores quantitativos, nem pode ser ordenado, ou seja, é uma variável qualitativa nominal. O mês de início do acompanhamento é qualitativa ordinal, uma vez que existe uma ordenação entre as categorias. 4. Em uma escola no interior de São Paulo, é comum que o professor de Educação Física faça a medição de altura dos alunos no início do ano letivo e faça uma comparação entre as alturas medidas. Para isso, o professor mediu a altura de 100 alunos e montou uma tabela com a distribuição de frequência de altura. O que é possível concluir a partir da tabela? Resposta incorreta. A. A maioria dos alunos tem entre 1,65 e 1,70m de altura. A minoria dos alunos tem entre 1,50 e 1,55m. Do total de alunos, 59% têm entre 1,50 e 1,70m. A partir dos dados da tabela, é possível verificar que a maioria dos alunos tem entre 1,70 e 1,75m de altura. A minoria dos alunos tem entre 1,75 e 1,80m. E, do total de alunos, 59% têm entre 1,50 e 1,70m. Você acertou! B. A maioria dos alunos tem entre 1,70 e 1,75m de altura. A minoria dos alunos tem entre 1,75 e 1,80m. Do total de alunos, 59% têm entre 1,50 e 1,70m. A partir dos dados da tabela, é possível verificar que a maioria dos alunos tem entre 1,70 e 1,75m de altura. A minoria dos alunos tem entre 1,75 e 1,80m. E, do total de alunos, 59% têm entre 1,50 e 1,70m. Resposta incorreta. C. A maioria dos alunos tem entre 1,70 e 1,75m de altura. A minoria dos alunos tem entre 1,50 e 1,55m. Do total de alunos, 92% têm entre 1,50 e 1,70m. A partir dos dados da tabela, é possível verificar que a maioria dos alunos tem entre 1,70 e 1,75m de altura. A minoria dos alunos tem entre 1,75 e 1,80m. E, do total de alunos, 59% têm entre 1,50 e 1,70m. Resposta incorreta. D. A maioria dos alunos tem entre 1,65 e 1,70m de altura. A minoria dos alunos tem entre 1,75 e 1,80m. Do total de alunos, 59% têm entre 1,50 e 1,70m. A partir dos dados da tabela, é possível verificar que a maioria dos alunos tem entre 1,70 e 1,75m de altura. A minoria dos alunos tem entre 1,75 e 1,80m. E, do total de alunos, 59% têm entre 1,50 e 1,70m. Resposta incorreta. E. A maioria dos alunos tem entre 1,70 e 1,75m de altura. A minoria dos alunos tem entre 1,75 e 1,80m. Do total de alunos, 40% têm entre 1,50 e 1,70m. A partir dos dados da tabela, é possível verificarque a maioria dos alunos tem entre 1,70 e 1,75m de altura. A minoria dos alunos tem entre 1,75 e 1,80m. E, do total de alunos, 59% têm entre 1,50 e 1,70m. 5. A estatística descritiva é responsável pela etapa inicial de análise de dados. Por meio de suas métricas, é possível analisar a posição das variáveis e analisar a dispersão. Escolha a alternativa que melhor explica as medidas em estatística descritiva. Resposta incorreta. A. Média, mediana, moda e quartis (1.º e 3.º) são medidas para análise de posição. A média é a soma de todas as observações dividida pelo número total de observações. A mediana é o valor que a variável assume com maior frequência. A moda, também conhecida como 2.º quartil, indica um valor que é maior que 50% das amostras ordenadas. O 1.º quartil (25%) indica um valor em que 25% das amostras ordenadas são menores, e o 3.º quartil (75%) indica um valor em que 75% das amostras ordenadas são menores. A amplitude e o coeficiente de variação são medidas de dispersão. A amplitude é dada pela diferença entre o valor máximo e o valor mínimo da variável. O coeficiente de variação é uma medida de dispersão relativa, que elimina o efeito da magnitude dos dados. Média, mediana, moda e quartis (1.º e 3.º) são medidas para análise de posição. O 1.º quartil (25%) indica um valor em que 25% das amostras ordenadas são menores, e o 3.º quartil (75%) indica um valor em que 75% das amostras ordenadas são menores. A média é a soma de todas as observações dividida pelo número total de observações. A moda é o valor que a variável assume com maior frequência. A mediana, também conhecida como 2.º quartil, indica um valor que é maior que 50% das amostras ordenadas. A amplitude e o coeficiente de variação são medidas de dispersão. A amplitude é dada pela diferença entre o valor máximo e o valor mínimo da variável. O coeficiente de variação é uma medida de dispersão relativa, que elimina o efeito da magnitude dos dados. Resposta incorreta. B. Média, mediana, moda e amplitude são medidas para análise de posição. A média é a soma de todas as observações dividida pelo número total de observações. A moda é o valor que a variável assume com maior frequência. A mediana, também conhecida como 2.º quartil, indica um valor que é maior que 50% das amostras ordenadas. A amplitude é dada pela diferença entre o valor máximo e o valor mínimo da variável. Os quartis (1.º e 3.º) e o coeficiente de variação são medidas de dispersão. O 1.º quartil (25%) indica um valor em que 25% das amostras ordenadas são menores, e o 3.º quartil (75%) indica um valor em que 75% das amostras ordenadas são menores. O coeficiente de variação é uma medida de dispersão relativa, que elimina o efeito da magnitude dos dados. Média, mediana, moda e quartis (1.º e 3.º) são medidas para análise de posição. O 1.º quartil (25%) indica um valor em que 25% das amostras ordenadas são menores, e o 3.º quartil (75%) indica um valor em que 75% das amostras ordenadas são menores. A média é a soma de todas as observações dividida pelo número total de observações. A moda é o valor que a variável assume com maior frequência. A mediana, também conhecida como 2.º quartil, indica um valor que é maior que 50% das amostras ordenadas. A amplitude e o coeficiente de variação são medidas de dispersão. A amplitude é dada pela diferença entre o valor máximo e o valor mínimo da variável. O coeficiente de variação é uma medida de dispersão relativa, que elimina o efeito da magnitude dos dados. Resposta incorreta. C. Média, mediana, moda e quartis (1.º e 3.º) são medidas para análise de posição. A média é a soma de todas as observações dividida pelo número total de observações. A moda é o valor que a variável assume com maior frequência. A mediana, também conhecida como 2.º quartil, indica um valor que é maior que 50% das amostras ordenadas. O 1.º quartil (25%) indica um valor em que 25% das amostras ordenadas são menores, e o 3.º quartil (75%) indica um valor em que 75% das amostras ordenadas são menores. A amplitude e o coeficiente de variação são medidas de dispersão. A amplitude é dada pela diferença entre o valor máximo e o valor mínimo da variável. O coeficiente de variação é uma medida de dispersão relativa, que considera o efeito da magnitude dos dados. Média, mediana, moda e quartis (1.º e 3.º) são medidas para análise de posição. O 1.º quartil (25%) indica um valor em que 25% das amostras ordenadas são menores, e o 3.º quartil (75%) indica um valor em que 75% das amostras ordenadas são menores. A média é a soma de todas as observações dividida pelo número total de observações. A moda é o valor que a variável assume com maior frequência. A mediana, também conhecida como 2.º quartil, indica um valor que é maior que 50% das amostras ordenadas. A amplitude e o coeficiente de variação são medidas de dispersão. A amplitude é dada pela diferença entre o valor máximo e o valor mínimo da variável. O coeficiente de variação é uma medida de dispersão relativa, que elimina o efeito da magnitude dos dados. Resposta incorreta. D. Média, mediana, moda e quartis (1.º e 3.º) são medidas para análise de posição. A média é a soma de todas as observações dividida pelo número total de observações. A moda é o valor que a variável assume com maior frequência. A mediana, também conhecida como 2.º quartil, indica um valor que é maior que 50% das amostras ordenadas. O 1.º quartil (25%) indica um valor em que 25% das amostras ordenadas são menores, e o 3.º quartil (75%) indica um valor em que 75% das amostras ordenadas são menores. A amplitude e o coeficiente de variação são medidas de dispersão. A amplitude é o valor máximo que a variável assume. O coeficiente de variação é uma medida de dispersão relativa, que elimina o efeito da magnitude dos dados. Média, mediana, moda e quartis (1.º e 3.º) são medidas para análise de posição. O 1.º quartil (25%) indica um valor em que 25% das amostras ordenadas são menores, e o 3.º quartil (75%) indica um valor em que 75% das amostras ordenadas são menores. A média é a soma de todas as observações dividida pelo número total de observações. A moda é o valor que a variável assume com maior frequência. A mediana, também conhecida como 2.º quartil, indica um valor que é maior que 50% das amostras ordenadas. A amplitude e o coeficiente de variação são medidas de dispersão. A amplitude é dada pela diferença entre o valor máximo e o valor mínimo da variável. O coeficiente de variação é uma medida de dispersão relativa, que elimina o efeito da magnitude dos dados. Você acertou! E. Média, mediana, moda e quartis (1.º e 3.º) são medidas para análise de posição. A média é a soma de todas as observações dividida pelo número total de observações. A moda é o valor que a variável assume com maior frequência. A mediana, também conhecida como 2.º quartil, indica um valor que é maior que 50% das amostras ordenadas. O 1.º quartil (25%) indica um valor em que 25% das amostras ordenadas são menores, e o 3.º quartil (75%) indica um valor em que 75% das amostras ordenadas são menores. A amplitude e o coeficiente de variação são medidas de dispersão. A amplitude é dada pela diferença entre o valor máximo e o valor mínimo da variável. O coeficiente de variação é uma medida de dispersão relativa, que elimina o efeito da magnitude dos dados. Média, mediana, moda e quartis (1.º e 3.º) são medidas para análise de posição. O 1.º quartil (25%) indica um valor em que 25% das amostras ordenadas são menores, e o 3.º quartil (75%) indica um valor em que 75% das amostras ordenadas são menores. A média é a soma de todas as observações dividida pelo número total de observações. A moda é o valor que a variável assume com maior frequência. A mediana, também conhecida como 2.º quartil, indica um valor que é maior que 50% das amostras ordenadas. A amplitude e o coeficiente de variação são medidas de dispersão. A amplitude é dada pela diferença entreo valor máximo e o valor mínimo da variável. O coeficiente de variação é uma medida de dispersão relativa, que elimina o efeito da magnitude dos dados.
Compartilhar