Logo Passei Direto
Buscar

Avaliação On-Line 2 (AOL 2) - Questionário

Ferramentas de estudo

Questões resolvidas

Leia o trecho a seguir: "Por exemplo, um conceito fundamental é o de determinar a similaridade de duas entidades descritas pelos dados. Essa capacidade forma a base de várias tarefas específicas. Ela pode ser usada diretamente para encontrar clientes semelhantes em uma base de dados." Fonte: PROVOST, Foster; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016. p. XIV.
A partir dessas informações e do conteúdo estudado a respeito das técnicas de similaridades para análises de dados, pode-se afirmar que:
a distância euclidiana calcula valores similares nas árvores de regressão.
quanto mais baixo o resultado da distância euclidiana, mais similar é o dado.
um dado similar tem vizinhos ímpares.
Dados distantes podem ser colocados no mesmo grupo de similaridade, desde que a análise seja feita com knn.
clusters e knn são a mesma coisa, ambos são cálculos que geram árvores de decisão.

Leia o trecho a seguir: "No cabeçalho, o arquivo deve trazer o nome do conjunto de dados através do atributo relação. Este nome deve ser precedido pela marca @RELATION, não precisando ser o mesmo nome físico do arquivo. Em seguida o cabeçalho deve conter os atributos que compõem a relação na marca @ATTRIBUTE. Cada atributo deve ter um nome e um tipo de dado, que pode ser numérico, texto, data ou categórico. A área data do arquivo tem seu início definido pela marca @DATA, os dados são dispostos em linhas, separados por vírgula, na mesma ordem que foram estabelecidos os atributos." Fonte: AMARAL, Fernando. Aprenda Mineração de Dados: Teoria e prática. Rio de Janeiro: Alta Books, 2016. p.17.
A partir do texto e do conteúdo estudado sobre sensibilidade e especificidade, analise as alternativas a seguir:
I. Cada attribute contém valor interno, que serão chamados de @DATA.
II. O tipo de arquivo usado pelo Weka é arff, o qual contém @RELATION, @ATTRIBUTE e @DATA.
III. O arquivo Weka contém dados que poderiam estar em uma tabela.
IV. O programa Weka é um software pago, mas seu teste é gratuito com as utilidades @ATTRIBUTE e @DATA.
II e IV.
I e III.
I e IV.
I e II.
II e III.

Leia o trecho a seguir: "A regressão linear, a regressão logística e máquinas de vetores de suporte são instâncias muito semelhantes de nossa técnica básica fundamental: ajustar um modelo linear aos dados." Fonte: PROVOST, Foster; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016. p. 88.
A partir dessas informações e do conteúdo estudado a respeito de regressão linear, analise as afirmacoes a seguir.
I. Slope significa o quanto a reta do gráfico está fora do quadrado, e isso pode ser em qualquer sentido.
II. Intercept é o valor de y, quando x for igual a 1.
III. R é o grau de correlação entre duas variáveis, ou seja, o nível de dependência.
IV. Há uma fórmula para descobrir o R.
II e IV.
I e II.
II e III.
I e IV.
III e IV.

Leia o trecho a seguir: “KNN é um método preguiçoso, no sentido de que nenhum modelo é aprendido com o treinamento. A idéia do KNN é extremamente simples e efetiva em várias aplicações.” Fonte: LIU, Bing. Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data. Chicago: Springer, 2008. p. 112.
Considerando essas informações e o conteúdo estudado, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s).
I. ( ) KNN estuda vizinhos mais próximos desde que menor que 10.
II. ( ) O ideal é escolher K par.
III. ( ) É possível calcular o melhor KNN, usando distâncias como a euclidiana, por exemplo.
IV. ( ) A distância euclidiana mede a distância entre os valores dos dados.
F, V, F, F.
F, F, V, V.
V, F, F, V.
F, F, V, F.
V, V, F, F.

Leia o trecho a seguir: "Uma matriz de confusão separa as decisões tomadas pelo classificador, tornando explícito como uma classe está sendo confundida com outra. Desta forma, diferentes tipos de erros podem ser tratados separadamente." Fonte: PROVOST, Foster; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016. p. 189.
A matriz de confusão pode ser explicada como:
I. Uma tabela com quatro opções, onde analisa-se quatro itens de um dataset.
II. TF sigifica que True (positivo) era a resposta certa.
III. TP significa um acerto referente a um dado positivo, que pode ter uma doença por exemplo.
IV. FN significa a ausência de erro naquela análise, ou seja, o modelo errou.
II e III.
II e IV.
III e IV.
I e III.
I e II.

Leia o trecho a seguir: "Uma variável é algo que você quer que o computador lembre enquanto seu programa estiver executando. Quando o Python se lembra de algo, é porque ele está armazenando esta informação no computador." Fonte: PAINE, Bryson. Ensine seus filhos a formatar: Um guia amigável aos pais para a programação Python. São Paulo: Novatec, 2015. p. 32.
As variáveis são “apelidos” que receberão algum valor. Ao referenciar esse apelido, o programador chama o valor recebido. Porém, para criar esses apelidos, é necessário seguir algumas regras. Analise as afirmações abaixo e assinale a alternativa correta.
I. Duas variáveis com os apelidos cliente1 e cliente 4 são válidas.
II. Uma variável com o apelido clienteespaco é válida.
III. Uma variável com o apelido 3casa é válida.
IV. Uma variável com o apelido cliente espaco3espaco é válida.
II e IV.
II e III.
I, III e V.
I e II.
I, II e IV.

Leia o trecho a seguir: Matplotlib é uma biblioteca versátil que gera visualizações de dados. Com variados tipos de desenhos e opções de estilos refinados, é um instrumento de trabalho bom para criar imagens profissionais e publicações científicas. Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt, 2017. p. 8.
Observe a seguir a sintaxe de uma matriz: plt.plot(matriz1, c='blue', label='êxitos') plt.title("comparação de vendas semestral em cinco meses") plt.ylabel(u'Aquisições') plt.legenda('lower right') plt.xlabel(u'Tentativas') plt.show() Com base no texto e no conteúdo estudado, analise as afirmativas abaixo sobre a sintaxe da matriz apresentada:
I. “Aquisições” será digitado embaixo do gráfico.
II. “Tentativas” será digitado ao lado do gráfico.
III. “Plt.title” mostrará o nome do gráfico acima dele.
IV. “Blue” é a cor da linha.
I e III.
II e IV.
I e IV.
III e IV.
II e III.

Leia trecho a seguir: "Enquanto Matplotlib oferece instrumentos nativos de visualização GUI (gráfica), jupyter-notebook é uma boa opção para executar e organizar seus dados visando à exibição (output). No jupyer-notebook [...], códigos e caixas podem ser separados dentro de blocos para melhor organização." Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt. 2017. p.19.
Com base no texto e no conteúdo estudado, analise as afirmações a seguir:
I. Netbeans é a IDE mais utilizada em Python.
II. Jupyter se mostra uma IDE muito popular em Data Science.
III. Spyder é um programa famoso em Python.
IV. Notepad é um editor de texto muito utilizado em Python.
II e III.
III e IV.
I e III.
II e IV.
III e V.

Leia o trecho a seguir: “A validação cruzada é um procedimento mais sofisticado de treinamento e teste de retenção. Gostaríamos não só de uma simples estimativa do desempenho de generalização, mas também de algumas estatísticas sobre o desempenho estimado, como a média e a variância, para que possamos entender como é esperado que o desempenho varie entre os conjuntos de dados.” Fonte: PROVOST, Foster; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016. p. 126.
Considerando essas informações e o conteúdo estudado, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s).
I. ( ) A validação cruzada pode analisar 5, 7, 10 ou outra quantidade de linhas.
II. ( ) A validação cruzada analisa uma coluna e depois passa para outra.
III. ( ) K é o valor de dados no dataset.
IV. ( ) É recomendável usar k = 10.
V, F, F, V.
F, F, V, V.
F, V, F, V.
V, F, V, F.
V, V, F, F.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Leia o trecho a seguir: "Por exemplo, um conceito fundamental é o de determinar a similaridade de duas entidades descritas pelos dados. Essa capacidade forma a base de várias tarefas específicas. Ela pode ser usada diretamente para encontrar clientes semelhantes em uma base de dados." Fonte: PROVOST, Foster; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016. p. XIV.
A partir dessas informações e do conteúdo estudado a respeito das técnicas de similaridades para análises de dados, pode-se afirmar que:
a distância euclidiana calcula valores similares nas árvores de regressão.
quanto mais baixo o resultado da distância euclidiana, mais similar é o dado.
um dado similar tem vizinhos ímpares.
Dados distantes podem ser colocados no mesmo grupo de similaridade, desde que a análise seja feita com knn.
clusters e knn são a mesma coisa, ambos são cálculos que geram árvores de decisão.

Leia o trecho a seguir: "No cabeçalho, o arquivo deve trazer o nome do conjunto de dados através do atributo relação. Este nome deve ser precedido pela marca @RELATION, não precisando ser o mesmo nome físico do arquivo. Em seguida o cabeçalho deve conter os atributos que compõem a relação na marca @ATTRIBUTE. Cada atributo deve ter um nome e um tipo de dado, que pode ser numérico, texto, data ou categórico. A área data do arquivo tem seu início definido pela marca @DATA, os dados são dispostos em linhas, separados por vírgula, na mesma ordem que foram estabelecidos os atributos." Fonte: AMARAL, Fernando. Aprenda Mineração de Dados: Teoria e prática. Rio de Janeiro: Alta Books, 2016. p.17.
A partir do texto e do conteúdo estudado sobre sensibilidade e especificidade, analise as alternativas a seguir:
I. Cada attribute contém valor interno, que serão chamados de @DATA.
II. O tipo de arquivo usado pelo Weka é arff, o qual contém @RELATION, @ATTRIBUTE e @DATA.
III. O arquivo Weka contém dados que poderiam estar em uma tabela.
IV. O programa Weka é um software pago, mas seu teste é gratuito com as utilidades @ATTRIBUTE e @DATA.
II e IV.
I e III.
I e IV.
I e II.
II e III.

Leia o trecho a seguir: "A regressão linear, a regressão logística e máquinas de vetores de suporte são instâncias muito semelhantes de nossa técnica básica fundamental: ajustar um modelo linear aos dados." Fonte: PROVOST, Foster; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016. p. 88.
A partir dessas informações e do conteúdo estudado a respeito de regressão linear, analise as afirmacoes a seguir.
I. Slope significa o quanto a reta do gráfico está fora do quadrado, e isso pode ser em qualquer sentido.
II. Intercept é o valor de y, quando x for igual a 1.
III. R é o grau de correlação entre duas variáveis, ou seja, o nível de dependência.
IV. Há uma fórmula para descobrir o R.
II e IV.
I e II.
II e III.
I e IV.
III e IV.

Leia o trecho a seguir: “KNN é um método preguiçoso, no sentido de que nenhum modelo é aprendido com o treinamento. A idéia do KNN é extremamente simples e efetiva em várias aplicações.” Fonte: LIU, Bing. Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data. Chicago: Springer, 2008. p. 112.
Considerando essas informações e o conteúdo estudado, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s).
I. ( ) KNN estuda vizinhos mais próximos desde que menor que 10.
II. ( ) O ideal é escolher K par.
III. ( ) É possível calcular o melhor KNN, usando distâncias como a euclidiana, por exemplo.
IV. ( ) A distância euclidiana mede a distância entre os valores dos dados.
F, V, F, F.
F, F, V, V.
V, F, F, V.
F, F, V, F.
V, V, F, F.

Leia o trecho a seguir: "Uma matriz de confusão separa as decisões tomadas pelo classificador, tornando explícito como uma classe está sendo confundida com outra. Desta forma, diferentes tipos de erros podem ser tratados separadamente." Fonte: PROVOST, Foster; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016. p. 189.
A matriz de confusão pode ser explicada como:
I. Uma tabela com quatro opções, onde analisa-se quatro itens de um dataset.
II. TF sigifica que True (positivo) era a resposta certa.
III. TP significa um acerto referente a um dado positivo, que pode ter uma doença por exemplo.
IV. FN significa a ausência de erro naquela análise, ou seja, o modelo errou.
II e III.
II e IV.
III e IV.
I e III.
I e II.

Leia o trecho a seguir: "Uma variável é algo que você quer que o computador lembre enquanto seu programa estiver executando. Quando o Python se lembra de algo, é porque ele está armazenando esta informação no computador." Fonte: PAINE, Bryson. Ensine seus filhos a formatar: Um guia amigável aos pais para a programação Python. São Paulo: Novatec, 2015. p. 32.
As variáveis são “apelidos” que receberão algum valor. Ao referenciar esse apelido, o programador chama o valor recebido. Porém, para criar esses apelidos, é necessário seguir algumas regras. Analise as afirmações abaixo e assinale a alternativa correta.
I. Duas variáveis com os apelidos cliente1 e cliente 4 são válidas.
II. Uma variável com o apelido clienteespaco é válida.
III. Uma variável com o apelido 3casa é válida.
IV. Uma variável com o apelido cliente espaco3espaco é válida.
II e IV.
II e III.
I, III e V.
I e II.
I, II e IV.

Leia o trecho a seguir: Matplotlib é uma biblioteca versátil que gera visualizações de dados. Com variados tipos de desenhos e opções de estilos refinados, é um instrumento de trabalho bom para criar imagens profissionais e publicações científicas. Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt, 2017. p. 8.
Observe a seguir a sintaxe de uma matriz: plt.plot(matriz1, c='blue', label='êxitos') plt.title("comparação de vendas semestral em cinco meses") plt.ylabel(u'Aquisições') plt.legenda('lower right') plt.xlabel(u'Tentativas') plt.show() Com base no texto e no conteúdo estudado, analise as afirmativas abaixo sobre a sintaxe da matriz apresentada:
I. “Aquisições” será digitado embaixo do gráfico.
II. “Tentativas” será digitado ao lado do gráfico.
III. “Plt.title” mostrará o nome do gráfico acima dele.
IV. “Blue” é a cor da linha.
I e III.
II e IV.
I e IV.
III e IV.
II e III.

Leia trecho a seguir: "Enquanto Matplotlib oferece instrumentos nativos de visualização GUI (gráfica), jupyter-notebook é uma boa opção para executar e organizar seus dados visando à exibição (output). No jupyer-notebook [...], códigos e caixas podem ser separados dentro de blocos para melhor organização." Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt. 2017. p.19.
Com base no texto e no conteúdo estudado, analise as afirmações a seguir:
I. Netbeans é a IDE mais utilizada em Python.
II. Jupyter se mostra uma IDE muito popular em Data Science.
III. Spyder é um programa famoso em Python.
IV. Notepad é um editor de texto muito utilizado em Python.
II e III.
III e IV.
I e III.
II e IV.
III e V.

Leia o trecho a seguir: “A validação cruzada é um procedimento mais sofisticado de treinamento e teste de retenção. Gostaríamos não só de uma simples estimativa do desempenho de generalização, mas também de algumas estatísticas sobre o desempenho estimado, como a média e a variância, para que possamos entender como é esperado que o desempenho varie entre os conjuntos de dados.” Fonte: PROVOST, Foster; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016. p. 126.
Considerando essas informações e o conteúdo estudado, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s).
I. ( ) A validação cruzada pode analisar 5, 7, 10 ou outra quantidade de linhas.
II. ( ) A validação cruzada analisa uma coluna e depois passa para outra.
III. ( ) K é o valor de dados no dataset.
IV. ( ) É recomendável usar k = 10.
V, F, F, V.
F, F, V, V.
F, V, F, V.
V, F, V, F.
V, V, F, F.

Prévia do material em texto

Conteúdo do teste
1. 
Parte superior do formulário
Pergunta 1
1 ponto
Leia o trecho a seguir:                   
“Por exemplo, um conceito fundamental é o de determinar a similaridade de duas entidades descritas pelos dados. Essa capacidade forma a base de várias tarefas específicas. Ela pode ser usada diretamente para encontrar clientes semelhantes em uma base de dados.”
Fonte: PROVOST, Foster; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016. p. XIV. 
A partir dessas informações e do conteúdo estudado a respeito das técnicas de similaridades para análises de dados, pode-se afirmar que: 
1. 
a distância euclidiana calcula valores similares nas árvores de regressão.
2. 
quanto mais baixo o resultado da distância euclidiana, mais similar é o dado. 
3. 
um dado similar tem vizinhos ímpares. 
4. 
Dados distantes podem ser colocados no mesmo grupo de similaridade, desde que a análise seja feita com knn. 
5. 
 clusters e knn são a mesma coisa, ambos são cálculos que geram árvores de decisão.
Parte inferior do formulário
2. 
Parte superior do formulário
Pergunta 2
1 ponto
Leia o trecho a seguir:
“No cabeçalho, o arquivo deve trazer o nome do conjunto de dados através do atributo relação. Este nome deve ser precedido pela marca @RELATION, não precisando ser o mesmo nome físico do arquivo. Em seguida o cabeçalho deve conter os atributos que compõem a relação na marca @ATTRIBUTE. Cada atributo deve ter um nome e um tipo de dado, que pode ser numérico, texto, data ou categórico. A área data do arquivo tem seu início definido pela marca @DATA, os dados são dispostos em linhas, separados por vírgula, na mesma ordem que foram estabelecidos os atributos.”
Fonte: AMARAL, Fernando. Aprenda Mineração de Dados: Teoria e prática. Rio de Janeiro: Alta Books, 2016. p.17.
A partir do texto e do conteúdo estudado sobre sensibilidade e especificidade, analise as alternativas a seguir:
I. Cada attribute contém valor interno, que serão chamados de @DATA.
II. O tipo de arquivo usado pelo Weka é arff, o qual contém @RELATION, @ATTRIBUTE e @DATA.
III. O arquivo Weka contém dados que poderiam estar em uma tabela.
IV. O programa Weka é um software pago, mas seu teste é gratuito com as utilidades @ATTRIBUTE e @DATA.
Está correto apenas o que se afirma em:
1. 
II e IV.
2. 
I e III.
3. 
I e IV.
4. 
I e II.
5. 
II e III.
Parte inferior do formulário
3. 
Parte superior do formulário
Pergunta 3
1 ponto
Leia o trecho a seguir:
“A regressão linear, a regressão logística e máquinas de vetores de suporte são instâncias muito semelhantes de nossa técnica básica fundamental: ajustar um modelo linear aos dados.” 
Fonte: PROVOST, Foster; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016. p. 88. 
A partir dessas informações e do conteúdo estudado a respeito de regressão linear, analise as afirmações a seguir.
I. Slope significa o quanto a reta do gráfico está fora do quadrado, e isso pode ser em qualquer sentido.
II. Intercept é o valor de y, quando x for igual a 1. 
III. R é o grau de correlação entre duas variáveis, ou seja, o nível de dependência. 
IV. Há uma fórmula para descobrir o R.
Está correto apenas o que se afirma em:
1. 
II e IV.
2. 
I e II.
3. 
II e III.
4. 
I e IV
5. 
III e IV.  
Parte inferior do formulário
4. 
Parte superior do formulário
Pergunta 4
1 ponto
Leia o trecho a seguir:
“KNN é um método preguiçoso, no sentido de que nenhum modelo é aprendido com o treinamento. A idéia do KNN é extremamente simples e efetiva em várias aplicações.”
Fonte: LIU, Bing. Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data. Chicago: Springer, 2008. p. 112.
Considerando essas informações e o conteúdo estudado, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s). 
I. ( ) KNN estuda vizinhos mais próximos desde que menor que 10.
II. ( ) O ideal é escolher K par.
III. ( ) É possível calcular o melhor KNN, usando distâncias como a euclidiana, por exemplo.
IV. ( ) A distância euclidiana mede a distância entre os valores dos dados. 
Agora, assinale a alternativa que apresenta a sequência correta:
1. 
F, V, F, F.
2. 
V, V, F, F.
3. 
V, F, F, V.
4. 
F, F, V, V.
5. 
F, F, V, F.
Parte inferior do formulário
5. 
Parte superior do formulário
Pergunta 5
1 ponto
Leia o trecho a seguir:
“Uma matriz de confusão separa as decisões tomadas pelo classificador, tornando explícito como uma classe está sendo confundida com outra. Desta forma, diferentes tipos de erros podem ser tratados separadamente.” 
Fonte: PROVOST, Foster; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016. p. 189. 
A matriz de confusão pode ser explicada como:
I. Uma tabela com quatro opções, onde analisa-se quatro itens de um dataset.
II. TF sigifica que True (positivo) era a resposta certa. 
III. TP significa um acerto referente a um dado positivo, que pode ter uma doença por exemplo. 
IV. FN significa a ausência de erro naquela análise, ou seja, o modelo errou. 
Está correto o que se afirma em:
1. 
II e III.
2. 
II e IV.
3. 
III e IV.      
4. 
 I e III.
5. 
I e II.
Parte inferior do formulário
6. 
Parte superior do formulário
Pergunta 6
1 ponto
Leia o trecho a seguir:
“Uma variável é algo que você quer que o computador lembre enquanto seu programa estiver executando. Quando o Python se lembra de algo, é porque ele está armazenando esta informação no computador.”
Fonte: PAINE, Bryson. Ensine seus filhos a formatar: Um guia amigável aos pais para a programação Python. São Paulo: Novatec, 2015. p. 32.
As variáveis são “apelidos” que receberão algum valor. Ao referenciar esse apelido, o programador chama o valor recebido. Porém, para criar esses apelidos, é necessário seguir algumas regras. Analise as afirmações abaixo e assinale a alternativa correta.
I. Duas variáveis com os apelidos cliente1 e cliente 4 são válidas.
II. Uma variável com o apelido clienteespaco é válida. 
III. Uma variável com o apelido 3casa é válida. 
IV. Uma variável com o apelido cliente espaco3espaco é válida.
Está correto apenas o que se afirma em:
1. 
II e IV.      
2. 
 II e III.
3. 
I, III e V.
4. 
I e II. 
5. 
I, II e IV.
Parte inferior do formulário
7. 
Parte superior do formulário
Pergunta 7
1 ponto
Leia o trecho a seguir:
Matplotlib é uma biblioteca versátil que gera visualizações de dados. Com variados tipos de desenhos e opções de estilos refinados, é um instrumento de trabalho bom para criar imagens profissionais e publicações científicas.
Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt, 2017. p. 8.
Observe a seguir a sintaxe de uma matriz:
plt.plot(matriz1, c='blue', label='êxitos')
plt.title("comparação de vendas semestral em cinco meses")
plt.ylabel(u'Aquisições')
plt.legenda('lower right')
plt.xlabel(u'Tentativas')
plt.show()
Com base no texto e no conteúdo estudado, analise as afirmativas abaixo sobre a sintaxe da matriz apresentada:
I. “Aquisições” será digitado embaixo do gráfico.
II. “Tentativas” será digitado ao lado do gráfico.
III. “Plt.title” mostrará o nome do gráfico acima dele.
IV. “Blue” é a cor da linha.
Está correto apenas o que se afirma em:
1. 
I e III. 
2. 
II e IV.
3. 
I e IV.
4. 
III e IV.
5. 
II e III.
Parte inferior do formulário
8. 
Parte superior do formulário
Pergunta 8
1 ponto
Leia trecho a seguir:
“Enquanto Matplotlib oferece instrumentos nativos de visualização GUI (gráfica), jupyter-notebook é uma boa opção para executar e organizar seus dados visando à exibição (output). No jupyer-notebook [...], códigos e caixas podem ser separados dentro de blocos para melhor organização.”
Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt. 2017. p.19.
Com base no texto e no conteúdo estudado, analise as afirmações a seguir:
I. Netbeans é a IDE mais utilizada em Python.II. Jupyter se mostra uma IDE muito popular em Data Science.
III. Spyder é um programa famoso em Python.
IV. Notepad é um editor de texto muito utilizado em Python.
Está correto apenas o que se afirma em:
1. 
III e IV.
2. 
II e III.
3. 
II e IV.
4. 
III e V.
5. 
I e III.
Parte inferior do formulário
9. 
Parte superior do formulário
Pergunta 9
1 ponto
Leia o trecho a seguir:
“A validação cruzada é um procedimento mais sofisticado de treinamento e teste de retenção. Gostaríamos não só de uma simples estimativa do desempenho de generalização, mas também de algumas estatísticas sobre o desempenho estimado, como a média e a variância, para que possamos entender como é esperado que o desempenho varie entre os conjuntos de dados.”
Fonte: PROVOST, Foster; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016. p. 126.
Considerando essas informações e o conteúdo estudado, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s).
I. ( ) A validação cruzada pode analisar 5, 7, 10 ou outra quantidade de linhas.
II. ( ) A validação cruzada analisa uma coluna e depois passa para outra.
III. ( ) K é o valor de dados no dataset.
IV. ( ) É recomendável usar k = 10.
Agora, assinale a alternativa que apresenta a sequência correta:
1. 
F, F, V, V.
2. 
V, V, F, F.
3. 
V, F, V, F.
4. 
V, F, F, V.
5. 
F, V, F, V.
Parte inferior do formulário
10. 
Parte superior do formulário
Pergunta 10
1 ponto
Leia o trecho a seguir:
“Ao obter a matriz de confusão, foi possível calcular as seguintes medidas de desempenho: precisão, sensibilidade, especificidade e acurácia. A matriz é de extrema relevância ao trabalho, pois com a sensibilidade permitiu avaliar a classificação correta dos doentes e a especificidade permitiu avaliar a classificação correta dos sadios.”
Fonte: MEDEIROS, Leonardo et.al. Análise no desempenho de algoritmos de aprendizagem supervisionada na classificação da marcha em Parkinsonianos. Alagoas: UFAL, 2017. p. 5.
Com base no texto e no que foi aprendido em relação à sensibilidade e à especificidade, analise as afirmativas a seguir:
I. Sensibilidade é o nível de proporção dos itens serem positivos, tanto para doenças e cancelamentos, quanto para oportunidades. 
II. Especificidade é a divisão dos totais pelos negativos. 
III. Especificidade é o nível de proporção dos itens seres negativos, tanto para doenças e cancelamentos, quanto para oportunidades.
IV. Sensibilidade é a divisão dos totais pelos positivos.
Está correto apenas o que se afirma em:
1. 
I e III.
2. 
I e II.
3. 
II e IV.
4. 
II e III.
5. 
I e IV.
Parte inferior do formulário

Mais conteúdos dessa disciplina