Buscar

N2 - Programação Estatistica

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

· Pergunta 1
0 em 1 pontos
	
	
	
	Leia o excerto a seguir.
“O processo de ETL (Extract, Transform and Load) é o processo mais crítico e demorado na construção de um Data Warehouse, pois consiste na extração dos dados de bases heterogêneas, na transformação e limpeza destes dados, e na carga dos dados na base do DW.”
ABREU, G. G. S. F. Desmistificando o conceito de ETL . Maranhão, 2008. p. 52.
 
Considerando o excerto apresentado e o conceito de ETL, analise as afirmativas a seguir.
 
I.   Temos, na etapa de transformação, a definição das regras e funções que definem a qualidade dos dados.
II.  Etapa de carga é obrigatória, sendo as etapas restantes opcionais.
III. As etapas de extração e carga são obrigatórias, sendo a etapa de transformação opcional.
IV. As etapas de transformação e carga são obrigatórias, sendo a etapa de extração opcional.
 
Está correto o que se afirma em:
	
	
	
	
		Resposta Selecionada:
	 
I e II, apenas.
	Resposta Correta:
	 
I e III, apenas.
	Comentário da resposta:
	Sua resposta está incorreta. A alternativa está incorreta, pois as etapas de extração e carga são obrigatórias para que o processo de ETL ocorra; já a transformação/limpeza, dada a necessidade do projeto e a fonte de dados em questão, pode ser opcional.
	
	
	
· Pergunta 2
1 em 1 pontos
	
	
	
	No princípio dos dados organizados, temos o fornecimento de uma forma padrão de organizar seus valores em um conjunto de dados. Por meio desse padrão, torna-se mais facilitada a limpeza inicial dos dados, porque você não precisa começar do zero e reinventar sempre que necessitar realizar algo. Os conjuntos de dados organizados são todos iguais, mas todos os conjuntos de dados confusos são confusos à sua maneira.
 
WICKHAM, H. Tidy data. Journal of Statistical Software , v. 59, n. 10, 2014. Disponível em: https://www.jstatsoft.org/article/view/v059i10. Acesso em: 14 jul. 2020.
 
A partir do excerto apresentado e do conteúdo estudado sobre o Tidy Data, assinale a alternativa correta.
	
	
	
	
		Resposta Selecionada:
	 
O processo de organização de dados requer muito trabalho inicialmente, porém, a longo prazo, compensa.
	Resposta Correta:
	 
O processo de organização de dados requer muito trabalho inicialmente, porém, a longo prazo, compensa.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois, realmente, uma organização consistente dos dados, inicialmente, é trabalhosa, porém, em longo prazo compensa, pois terá os dados e as ferramentas organizadas, proporcionando um menor gasto de tempo nas questões analíticas.
	
	
	
· Pergunta 3
0 em 1 pontos
	
	
	
	O aprendizado em machine learning se dá de duas formas: pelo aprendizado supervisionado e o não supervisionado. No aprendizado supervisionado, temos algoritmos que aprendem por meio de um modelo para, assim, conseguirem prover a variável de interesse, baseando-se em variáveis dependentes. Já no aprendizado não supervisionado, temos as medições por meio de variáveis nas quais se tenha interesse, tendo como base alguma semelhança.
BREIMAN, L. Statistical modeling: the two cultures. IMS , v. 16, n. 3, p. 199-215, 2001.
 
Quanto ao texto apresentado, analise as alternativas, em relação ao aprendizado não supervisionado.
 
I.  Na aprendizagem não supervisionada, há permissão para se abordar os problemas com pouca ou nenhuma ideia de como os resultados devem se apresentar.
II. A aprendizagem não supervisionada não permite a abordagem de problemas com pouca ou nenhuma  ideia  a respeito de como os resultados devem se demonstrar.
III. Alguns exemplos de técnicas estatísticas que são aplicadas na aprendizagem não supervisionada são: redução de dimensionalidade, análise de agrupamento.
IV. A aprendizagem não supervisionada também pode ser usada para se reduzir o número de dimensões em um conjunto de dados.
 
Está correto o que se afirma em:
	
	
	
	
		Resposta Selecionada:
	 
I e III, apenas.
	Resposta Correta:
	 
I, III e IV, apenas.
 
	Comentário da resposta:
	Sua resposta está incorreta. A alternativa está incorreta, é exatamente o contrário à aprendizagem não supervisionada, pois ela permite a abordagem dos problemas com pouca ou quase nenhuma ideia de como os resultados devem se apresentar. Todavia, pode-se derivar a estrutura de dados de onde não obrigatoriamente sabe-se os efeitos das variáveis.
	
	
	
· Pergunta 4
1 em 1 pontos
	
	
	
	O big data
é uma estratégia de gerenciamento de informações abrangentes que envolvem e integra muitos tipos de dados e gerenciamentos de dados em conjunto com os dados tradicionais. Temos por definição de big data: volume, velocidade, variedade.
LANEY, D. Application delivery strategies . [ S. l. ]: META Group, 2001.
 
A respeito do Big Data, que são os grandes dados, a que se refere a sua característica de velocidade, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
 
I. ( ) Velocidade refere-se à obrigatoriedade de se gerar aplicações de forma rápida.
II. ( )  Velocidade refere-se à um alto fluxo de dados na entrada.
III. ( ) Velocidade refere-se à rapidez com que os dados se tornam inválidos no decorrer do tempo.
IV. ( ) Velocidade refere-se à urgência das aplicações em gerar respostas de forma rápida, a partir de grandes massas de dados.
 
Assinale a alternativa que apresenta a sequência correta.
	
	
	
	
		Resposta Selecionada:
	 
F, V, F, F.
	Resposta Correta:
	 
F, V, F, F.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois a velocidade realmente está relacionada ao alto fluxo de dados na entrada, analisando os dados no momento em que são criados. É importante que as informações fluam de forma rápida; por muitas vezes, é melhor ter os dados de forma limitada, mas em tempo real, do que vários dados em uma velocidade baixa.
	
	
	
· Pergunta 5
1 em 1 pontos
	
	
	
	Os fenômenos que abarcam as análises estatísticas são apresentados por meio das  suas semelhança. Dessa forma, podemos perceber que as medidas de dispersão podem auxiliar as medidas de tendência central a descrever o conjunto de dados.
 
Assinale V para a(s) alternativa(s) verdadeira(s) e F para a(s) falsa(s), tendo em vista o texto acima e os conhecimentos estudados sobre as medidas de dispersão.
 
I. ( )  Faz sentido calcular a média de um conjunto em que não existe variação dos seus elementos.
II. ( )  Há ausência de dispersão e a medida de dispersão é igual a zero.
III. ( ) Para a descrição de um conjunto de dados, é somente necessária uma medida de dispersão.
IV. ( ) A amplitude total é uma das medidas que fazem parte do conjunto de medidas de dispersão.
 
Assinale a alternativa que apresenta a sequência correta.
	
	
	
	
		Resposta Selecionada:
	 
F, V, F, V.
	Resposta Correta:
	 
F, V, F, V.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, porque, realmente, existe essa ausência de dispersão, e a medida de dispersão resulta em zero. No entanto, quando é aumentada a dispersão, o valor da medida aumenta, e sendo a variação muito grande, a média não será uma medida de tendência central representativa. Amplitude total é sim uma das medidas de dispersão que são compostas por: amplitude total, amplitude interquartílica, desvio padrão e variância.
	
	
	
· Pergunta 6
1 em 1 pontos
	
	
	
	Leia o excerto a seguir.
Grande tem sido a expansão da Estatística Descritiva por meio dos computadores. Esse aumento da competência na execução de grandes volumes de cálculos em pequenos intervalos de tempo transformou, quase que fundamentalmente, uma análise descritiva dos dados, tanto para efeito de apresentação de informações quanto para uso preliminar dessas informações para fins de análises (estatísticas) futuras.
 
SOUZA, E. F. M.; PETERNELLI, L. A.; MELLO, P. M. Software livre R: aplicação estatística. 2019. Disponível em: http://www2.ufersa.edu.br/portal/view/uploads/setores/137/Apostilas%20e%20Tutoriais%20-%20R%20Project/Apostila%20R%20-%20GenMelhor.pdf . Acesso em: 20 jul. 2020.
 
A partir do excerto apresentado edo conteúdo estudado sobre uso da análise descritiva em R, assinale a alternativa correta.
	
	
	
	
		Resposta Selecionada:
	 
É essencial uma análise descritiva dos dados para se realizar uma melhor apresentação das informações.
	Resposta Correta:
	 
É essencial uma análise descritiva dos dados para se realizar uma melhor apresentação das informações.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, uma vez que a análise descritiva dos dados obteve uma grande importância para a apresentação das informações e, até no uso preliminar dessas informações para o uso em análises estatísticas por vir.
	
	
	
· Pergunta 7
1 em 1 pontos
	
	
	
	Machine learning é “uma área de Inteligência Artificial que tem como objetivo desenvolver técnicas computacionais que permitam a predição e o aprendizado de determinados comportamentos ou padrões automaticamente a partir de experiências acumuladas por exemplos e problemas anteriores.”
 
MITCHELL,T. Machine Learning . Porto Alegre: McGraw-Hill Science, 1997. p. 103.
 
Com base no excerto apresentado e no conteúdo estudado sobre Machine Learning , analise as afirmativas a seguir:
 
I. No aprendizado por máquinas no machine learning, não é necessário que essa máquina (computador) tenha experiências anteriores.
II. O machine learning sempre irá basear o seu modelo de aprendizado em experiências anteriores.
III. O termo machine learning refere-se ao aprendizado de máquinas, que não faz parte da área de Inteligência Artificial.
IV. Experiências anteriores em machine learning são conhecidas como: inputs , e quando a máquina já é capaz de adaptar as respostas, é conhecida como outputs .
 
 
Está correto o que se afirma em:
	
	
	
	
		Resposta Selecionada:
	 
II e IV, apenas.
	Resposta Correta:
	 
II e IV, apenas.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, considerando que o machine learning tem sua base no aprendizado por meio da experiência que está dentro do campo da Inteligência Artificial, logo, é fundamental para os estudos de machine learning
o amparo de algoritmos de aprendizagem.
	
	
	
· Pergunta 8
1 em 1 pontos
	
	
	
	A Estatística é a ciência responsável pela coleta, organização e interpretação de dados, e a partir deles, permite-nos compreender quais são os mais influentes antes que sejam tomadas decisões importantes.
 
SOUZA, E. F. M.; PETERNELLI, L. A.; MELLO, P. M. Software livre R: aplicação estatística. 2019. Disponível em: http://www2.ufersa.edu.br/portal/view/uploads/setores/137/Apostilas%20e%20Tutoriais%20-%20R%20Project/Apostila%20R%20-%20GenMelhor.pdf . Acesso em: 20 jul. 2020.
 
Considerando o excerto apresentado sobre a Estatística Descritiva e como se divide em variáveis qualitativas e quantitativas, analise as afirmativas a seguir.
 
I. A variável qualitativa refere-se aos dados numéricos, enquanto a variável quantitativa refere-se aos dados categóricos.
II.  A variável que descreve uma categoria e também a qualidade dos dados é conhecida como quantitativa.
III. Na variável qualitativa, ela não assume valores numéricos, uma vez que relaciona outros fatores, como: nome, cor da pele.
IV. Na variável qualitativa, temos subdivisões conhecidas como nominais e ordinais.
 
Está correto o que se afirma em:
	
	
	
	
		Resposta Selecionada:
	 
III e IV, apenas.
	Resposta Correta:
	 
III e IV, apenas.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois, nessa variável, temos a descrição de uma categoria, assim como a qualidade dos dados, e não assume valores numéricos, uma vez que relaciona fatores como cor da pele, nomes, entre outros. Além disso, ela realmente se divide em nominais (cores, profissão) e ordinais (relação/ordenação).
	
	
	
· Pergunta 9
1 em 1 pontos
	
	
	
	O aprendizado em machine learning se dá de duas formas: pelo aprendizado supervisionado e o não supervisionado. No aprendizado supervisionado, temos algoritmos que aprendem por meio de um modelo para, assim, conseguirem prover a variável de interesse, baseando-se em variáveis dependentes. Já no aprendizado não supervisionado, temos as medições por meio de variáveis nas quais se tem interesse, tendo como base alguma semelhança.
BREIMAN, L. Statistical modeling: the two cultures. IMS , v. 16, n. 3, p. 199-215, 2001.
 
Considerando os conhecimentos estudados e o texto apresentado sobre o aprendizado supervisionado e não supervisionado, assinale a alternativa correta, a respeito do aprendizado supervisionado.
	
	
	
	
		Resposta Selecionada:
	 
No aprendizado supervisionado, os dados já são dados de uma forma rotulada.
	Resposta Correta:
	 
No aprendizado supervisionado, os dados já são dados de uma forma rotulada.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois a aprendizagem supervisionada busca saber a saída correta e semelhante ao conjunto, sabendo-se que existe uma relação entre entrada e saída. Assim, a relação entre entrada e saída fundamenta a aprendizagem supervisionada.
	
	
	
· Pergunta 10
1 em 1 pontos
	
	
	
	O objetivo último da análise estatística é o de tirar conclusões a partir dos dados de forma a enriquecer o nosso conhecimento da realidade. A partir disso, a análise estatística consegue prever eventos a partir dos dados históricos, refinando, assim, a tomada de decisão.
 
SILVESTRE, A. L. Análise de dados e estatística descritiva . São Paulo: Escolar Editora, 2007.
 
Tendo em vista o respectivo texto e o conhecimento dos processos de análise estatística, assinale a alternativa correta.
	
	
	
	
		Resposta Selecionada:
	 
Para um completo processo de análise estatística, devemos começar pelo problema, seguir com a explicação das medidas, com o recolhimento dos dados, a definição e a sintetização dos dados e os resultados estatísticos para, enfim, termos o relatório de estudo.
	Resposta Correta:
	 
Para um completo processo de análise estatística, devemos começar pelo problema, seguir com a explicação das medidas, com o recolhimento dos dados, a definição e a sintetização dos dados e os resultados estatísticos para, enfim, termos o relatório de estudo.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois, para gerarmos um processo de análise estatística, precisamos passar por todas essas fases, a fim de obtermos os melhores resultados. Tendo cada fase a sua importância para a construção de uma melhor solução.

Continue navegando