Buscar

APOSTILA - Fundamentos de Big Data - Unidade 4 (ANHEMBI MORUMBI UAM) CURTA SE LHE AJUDOU! :D

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Fundamentos de Big Data
Conceitos e Funcionalidades de Business Intelligence, Data Mining e Data Science
FUNDAMENTOS DE
BIG DATA
Esp. Heber Marques Gimenes
INICIAR
introdução
Introdução
Nesta unidade abordaremos o conteúdo sobre Business Intelligence, explorando, também, na prática, seus conceitos e algumas de suas ferramentas mais importantes, ferramentas de suma importância para a análise de dados
Na sequência, estudaremos dois modelos de análise de dados e filtragem. Essas ferramentas são o Data Science e Data Mining, que facilitam muito o trabalho dos profissionais de tecnologia, empresários e estão em alta no mercado hoje em dia.
Aprenderemos sobre eco-sistema de análise em Data Science e Data Mining, esses dois conceitos são importantes para a análise de dados, no relacionamento da informação a ser pesquisada com a tomada de decisões e ainda abordaremos os tipos de tarefa descritiva e preditiva.
Por fim, ainda nessa unidade, vamos conhecer algumas ferramentas de análise em BI.
Eco-sistema de Análise de Dados – Business Intelligence
Neste tópico abordaremos alguns conceitos sobre Business Intelligence, sua visão geral de funcionalidade e ainda conheceremos as principais ferramentas de BI utilizadas atualmente.
Visão Geral do Business Intelligence
Primeiramente, apresentamos o seguinte questionamento: O que você pensa o conceito Business Intelligence (BI)?
A tradução literal do termo Business Intelligence é: a inteligência para o negócio, ou seja, utilizar a tecnologia para incrementar e melhorar o negócio.
Sendo assim, o BI é o conjunto de conceitos e métodos utilizados na análise de dados, importados ou já disponíveis em outro sistema para melhor direcionamento das decisões empresariais.
Apesar de ser uma definição simples, não podemos perder de vista que o BI se caracteriza por um grande volume de dados, o que não poderia ser analisado sem o suporte das ferramentas, e, esse grande volume permite analisar e gerar indicadores.
É Importante destacar, que na prática, as ferramentas de BI são aplicadas e as análises realizadas em uma cópia do banco de dados da empresa, devido ao grande volume de dados.
Comparando o BI com os outros softwares, os softwares ERP (Enterprise Resource Planning) geram relatórios com os dados da movimentação com aquilo que aconteceu, já o BI tem a inteligência de gerar os dados da movimentação do que aconteceu, mas também mostrando causas, explicações e padrões para aqueles dados encontrados.
Com isso, esse conceito se encaixa muito bem nos dias de hoje, em que as instituições têm que ser proativas, ter reações rápidas ao mercado, e, ainda ter informações e indicadores exatos ao seu próprio negócio, muitas vezes necessitando mudar a forma de produzir, trabalhar ou entregar um serviço.
Segundo TURBAN, SHARDA, ARONSON e KING (2009, p. 24)
“As organizações privadas ou públicas têm consciência do atual ambiente de negócios e suas pressões. Elas usam diferentes ações para responder às pressões. A TLS da Toyota, por exemplo, usa o BI para aprimorar a comunicação e dar apoio aos executivos em sua tarefa de saber exatamente o que acontece em cada área de operação, quase em tempo real. Ela também usa o sistema para ter uma melhor colaboração com seus parceiros comerciais. Através disso, pode cortar gastos e melhorar a satisfação do cliente. Outras ações realizadas pelos gerentes podem incluir:
• Emprego de planejamento estratégico
• Uso de modelos de negócios novos e inovadores
• Reestruturação de processos de negócios
• Participação em alianças de negócios
• Aprimoramento dos sistemas de informações corporativos
• Aprimoramento das relações de parceria”
No trecho citado, vemos que a Empresa Toyota se utilizou dos recursos do BI em várias áreas, desde a produção até terceiros que se relacionam com a empresa. Com isso, obtiveram redução em seus custos e ainda conheceram melhor o seu negócio, com informações reais e atuais, pois essas informações são atualizadas em tempo real, chegando a um melhor entendimento e atendimento aos seus clientes e redução de custos.
Portanto, conhecendo os seus resultados e ainda sabendo o porquê dos resultados, podemos mudar as atitudes visando a melhora dos indicadores.
Ainda sobre as definições BI, segundo TURBAN, SHARDA, ARONSON e KING (2009, p. 24) “O processo do BI baseia-se na transformação de dados em informações, depois em decisões e finalmente em ações”.
Figura 4.1 – Tomada de decisão.
Fonte: 123rf.
Após entendermos, sobre os conceitos e funcionamento do BI vamos dar um novo passo, e para isso vamos para a seguinte questão:: Mas como o BI faz as extrações das informações?
No trecho a seguir, podemos verificar todas as suas fases:
Segundo CRUZ, Bruno C. MIRANDA, Bruno G. C. TURCHETE, Fellipe B (p. 18) “Tudo começa com coleção de dados, Data Warehousing, a integração de dados de uma ou mais fontes e assim, cria um repositório central de dados, um Data Warehouse – os armazéns de dados. Com essa imensidão de dados, Data Mining, aplica-se à mineração desses dados, o processo de explorar grandes quantidades de dados à procura de padrões consistentes para detectar relacionamentos e novos subconjuntos de dados a serem mapeados e extraírem informações privilegiadas. Análises, Analytics, de minerações gera relatórios, Reporting, detalhados para fortalecer o esclarecimento do cenário. Reengenharia de processos de negócios (BPR) trata se de uma estratégia de gestão de negócios para a análise e desenho dos fluxos de trabalho e dos processos de negócios visando a reestruturação organizacional, com o foco no design de baixo para cima de processos de negócios dentro de uma organização. E Benchmarking, a busca das melhores práticas com o propósito de maximizar o desempenho.”
Na figura 4.2, temos todos os conceitos e processos utilizados pelo BI, iniciando pelo Data Miningaté chegar aos resultados apresentados aos colaboradores que terão acesso as essas informações.
Figura 4.2 – Componentes e ferramentas do BI.
Portanto, o BI  entrou na vida das empresas, para ocupar um lugar que estava vago, pois, anteriormente tínhamos os resultados apenas pela ótica do que já aconteceu e que nem sempre poderia ser mudado.
Com a chegada do BI, a lacuna de como as coisas aconteceram foi preenchida com as análises de informações. Por exemplo, podemos entender a decisão de compra de um determinado produto por um cliente. Com isso, podemos ter mais insumos para produção do nosso produto, ou ainda no caso de comércio, trabalharmos com quantidades de estoque, próximo da realidade não deixando que sobre ou que falte.
Considerando os dados financeiros dessa movimentação de compra, podemos levantar mais informações quanto aos recebíveis e em programação para uma sazonalidade, em todos os casos podemos chegar a uma decisão correta e mais direcionada em nosso negócio com a ajuda do BI.
Ferramenta de Business Intelligence
Agora, iremos conhecer uma ferramenta chamada Pentaho a fim de vislumbrarmos mais de perto o que está sendo no mercado.
O Pentaho é uma ferramenta de extração, organização e geração de relatórios e consultas de banco de dados, que foi desenvolvido por um grupo de programadores do Estados Unidos, que tinham como objetivo de desenvolver uma ferramenta capaz de gerar e unificar os dados facilitando o tratamento das informações. O produto foi criado pela Pentaho Corporation, empresa que foi vendida a Hitachi em 2015.
A aplicação tem duas versões:
Paga
Paga
Conta com todo suporte da empresa.
Livre
Livre
Não conta com suporte da empresa, mas a ajuda necessária pode-se obter em fóruns.
Figura 4.3 – Tela site Pentaho
Fonte: Site About Pentaho
O Pentaho é dividido em módulos, que são:
· Pentaho Data Integration - PDI (Kettle),
· Pentaho Analysis View (Mondrian), Pentaho Reporting (Reporting),
· Pentaho Dashboards e
· Weka (Data Mining).
Neste sentido, segundo DIAS (2014 p.43) “Módulos do Pentaho
· Pentaho Data Integration - PDI (Kettle): utiliza as técnicas de ETL, para obtenção dos dados. Ela é capaz de se conectar com vários bancos de dados como Oracle, PostgreSQL,SQLServer, MySql, entre outros. Responsável em popular o DW, migração da base de dados e integração entre as aplicações;
· Pentaho Analysis View (Mondrian): conhecida como Mondrian, permite operações slice-and-dice, drill-down, entre outras, além da exploração gráficas de cubos OLAP.
· Pentaho Reporting (Reporting): esta ferramenta é capaz de gerar relatórios de alta qualidade com grande simplicidade;
· Pentaho Dashboards: permite a criação de painéis de controle, sendo possível reunir numa mesma tela os principais indicadores de um departamento ou de toda a empresa;
· Weka (Data Mining): permite a criação de testes de hipóteses na área de dados, utilizando a mineração de dados.”
Na figura abaixo apresentamos a suíte do pentaho, composta por vários softwares livres.
Figura 4.4 – Pentaho
A solução é constituída por algumas ferramentas: PAC, PUC, PME, PRD, PSW.
· Pentaho Administration Console (PAC): temos a funcionalidade login, tela para configurações de conexões com o banco.
· Pentaho User Console (PUC): Interface do usuário, onde estarão disponíveis as consultas e onde o usuário final poderá configurar a suas consultas de acordo com o seu nível.
· Pentaho Metada Editor (PME) : Para que o usuário final consiga configurar as suas pesquisar customizadas, é nessa ferramenta que são feitas as configurações de metadados para consulta.
· Pentaho Report Design (PRD): Essa ferramenta permite que sejam configurados os padrões das consultas e relatórios que os usuários irão utilizar em suas consultas no PUC. A configuração parte da seleção do banco, em seguida layout dos relatórios.
saiba mais
Saiba mais
Assim, vimos alguns conceitos e funcionalidades sobre o Pentaho, para aprofundamento do aprendizado podemos realizar o download da versão livre e começar a utilizá-lo!
ACESSAR
Figura 4.5 – Pentaho
Fonte: https://sourceforge.net
atividade
Atividade
Segundo DIAS (2014 p.43) “Módulos do Pentaho • Pentaho Data Integration - PDI (Kettle): utiliza as técnicas de ETL, para obtenção dos dados. Ela é capaz de se conectar com vários bancos de dados como Oracle, PostgreSQL, SQLServer, MySql, entre outros. Responsável em popular o DW, migração da base de dados e integração entre as aplicações [...]”
DIAS, Franciele D. Ferramentas olap: Um estudo baseado no sistema pentaho. Assis, 2014
Considerando o módulo Pentaho, assinale a alternativa correta:
Parte superior do formulário
a) Mondrian.
b) PUC.
c) PME.
d) PRD.
e) PAC.
Feedback: A alternativa correta é a letra A, pois se trata de um módulo Pentaho. Já a outras alternativas, são ferramentas e não módulos. Cada ferramenta dentro da sua especificidade, configuração de acesso, parametrização para geração dos relatórios, painel para geração de relatórios.Verificar Resposta
Parte inferior do formulário
Eco-sistema de Análise de Dados - Visão Geral Sobre Data Data Mining
Agora é hora de aprendermos sobre duas ferramentas de Business Intelligence: Data Mining e Data Warehouse.  
Data Mining
A tradução do termo Data Mining é mineração de dados, mas o que significa minerar dados?
É uma busca não comum de informação em um grande volume de dados. Essas buscas visam encontrar padrões - por meio de cálculos matemáticos, inteligência artificial, processamentos automáticos - para depois juntá-los e a partir daí criar uma coleção dos dados encontrados, considerando essa nova informação como padrão.
Figura 4.6 – Data Mining.
Fonte: https://br.freepik.com/vetores-gratis/conceito-de-processamento-de-dados-grandes-sala-de-servidores-acesso-ao-token-de-tecnologia-blockchain_3629651.htm
Vamos a um exemplo prático: Uma loja on-line de artigos esportivos vendeu camisas de um determinado time. Essa empresa quer enviar e-mails para os clientes que compraram as camisas, oferecendo outros produtos relacionados a esse time, pois está na final de um grande campeonato. Então, a loja deve atrelar a uma opção de compra de vários clientes, dentro de um período de tempo, e disparar promoções dos outros produtos.
Neste exemplo, utilizamos a mineração de dados para tomar decisões em relação ao negócio.
Segundo MANEGA (2002, p. 2) temos:
“[...]A partir de fontes de dados (bancos de dados, relatórios, logs de acesso, transações, etc) efetua-se uma limpeza (consistência, preenchimento de informações, remoção de ruído e redundâncias, etc). Disto nascem os repositórios organizados (Data Marts e Data Warehouses), que já são úteis de diversas maneiras. Mas é a partir deles que se pode selecionar algumas colunas para atravessarem o processo de mineração.”
Neste sentido, temos que ter em mente que o processo descrito apresentado, contempla vários passos, desde a definição do banco a ser “minerado” até as informações geradas pelos padrões encontrados no banco, é partindo desse ponto que iniciamos a mineração. A figura 4.7, mostra de uma forma visual os passos da mineração.
Figura 4.7 – Passos Data Mining.
Fonte: MANEGA (2002, p. 2)
Após todos os processos, o que teremos? Valiosos dados de conhecimento que nortearão a tomada de decisão.
Assim, podemos imaginar o valor desses dados! Dependendo da situação da empresa eles têm valor de alavancar negócios, elevando os lucros a outra patamar. Por outro lado, se os padrões não forem definidos corretamente, como essas informações seriam extraídas?
Por essa razão a filtragem, para definição de padrões, é feita sobre uma forma muito rigorosa, se baseando em cálculos matemáticos, se utilizando de inteligência artificial, mas mesmo assim correndo algum risco de humano na parametrização.
Na figura 4.8 podemos analisar o nível de abstração para chegarmos a um objeto, a melhor qualidade da informação para filtragem.
Figura 4.8 – Nível abstração
Fonte: MANEGA (2002, p 3)
Quanto maior o grau de abstração, maior a melhoria no nível de sabedoria, qualidade da informação, até chegarmos no nível de tomada de decisão por parte da empresa, conforme observarmos na figura 4.9.
Figura 4.9 – Tomada decisão
Fonte: MANEGA (2002, p. 3)
Tarefas Descritivas e Preditivas
Agora, vamos falar sobre os tipos de tarefas, aplicadas ao Data Mining, essas tarefas são classificadas em:
· Descritivas
As tarefas descritivas, são as que tem um valor como padrão, ou seja, esse valor é utilizado para a mineração dos dados.
Segundo CAMILO e SILVA (2009) “é a tarefa utilizada para descrever os padrões e tendências revelados pelos dados. A descrição geralmente oferece uma possível interpretação para os resultados obtidos. A tarefa de descrição é muito utilizada em conjunto com as técnicas de análise exploratória de dados, para comprovar a influência de certas variáveis no resultado obtido.”
‍
· Preditivas
Essa tarefa trabalha tentando simular o valor futuro do atributo. Ela se baseia em estatísticas e cálculos a fim de prever qual será o próximo valor.
Segundo CAMILO e SILVA (2009) “a tarefa de predição é similar às tarefas de classificação e estimação, porém ela visa descobrir o valor futuro de um determinado atributo.
Exemplos:
• Predizer o valor de uma ação três meses adiante;
• Predizer o percentual que será aumentado de tráfego na rede se a velocidade aumentar;
• Predizer o vencedor do campeonato baseando-se na comparação das estatísticas dos times. Alguns métodos de classificação e regressão podem ser usados para predição, com as devidas considerações.”
atividade
Atividade
Toda a seleção e definição dos padrões é feita sobre uma grande quantidade de requisitos, e se baseia em cálculos matemáticos e ainda se utiliza de IA (inteligência Artificial).
Neste sentido, assinale a alternativa correta, quanto ao nível de abstração.
Parte superior do formulário
a) Quanto maior abstração temos mais informações.
b) Quanto menor abstração temos menos informações.
c) Quanto maior abstração temos menos informações.
d) Quanto ao nível de abstração quantidade de informações será igual.
e) Quanto ao nível de abstração não influencia na qualidade da informação gerada como padrão.
Feedback: A alternativa correta é a letra A, pois quanto maior a abstração temos menos informações, e podemos chegar a umpadrão e chegando a esse padrão, podemos utilizá-lo para filtrar os dados do banco e extrair as informações.Verificar Resposta
Parte inferior do formulário
Eco-sistema de Análise de Dados
Como já vimos o funcionamento de Data Science/Data Mining, neste tópico iremos conhecer ferramentas de Data Science e alguns conceitos dessas ferramentas.
Falaremos de algumas ferramentas open source, então é interessante que você baixe e instale as ferramentas a fim de aprofundar os conhecimentos!
RapidMiner
O RapidMiner é o nosso primeiro exemplo de ferramenta de Data Mining, como já falamos é uma ferramenta open source. Pode ser baixada pelo endereço eletrônico https://rapidminer.com/products/, encontramos os produtos do RapidMiner.
Figura 4.10 – Site RapidMiner
Fonte: https://rapidminer.com/products/
Esta é uma ferramenta bem visual, facilitando a manipulação de dados e criação de workflows. Na figura 4.11, podemos observar um exemplo de workflow.
Figura 4.11 – Tela gráfica workflow
Fonte:  https://static.imasters.com.br/wp-content/uploads/2017/05/rapidminer-workflow.png
A ferramenta apresentada, permite criar rapidamente modelos preditivos, sem a necessidade de codificação e transformação dos dados.
Suas funcionalidades disponíveis são:
RapidMiner Studio
Aplicado no desenho de Workflows, desde o início do processo de mineração na importação das informações até os resultados
RapidMiner Server
Utilizado para gerenciar seus modelos, compartilhar com outros usuários.
RapidMiner Radoop
Utilizado para compilar e executar workflows armazenados no Hadoop.
No exemplo, ao executar a ferramenta, acessamos o seu estúdio e criamos um modelo visual em que podemos fazer a extração dos dados. Sendo ainda, é possível gerenciar os modelos criados e compila-los em Hadoop.
Weka
A outra ferramenta que iremos conhecer é a Weka, ferramenta desenvolvida em Java podendo ser utilizada em ambientes: Windows, Linux e Mac. A aplicação é de autoria da universidade de Waikato na Nova Zelândia. É um software open source cujo o projeto tem por objetivo, disseminar as técnicas de machine learning por meio do uso da ferramenta auxiliando na resolução dos problemas existentes.
Figura 4.12 – Weka.
Fonte: https://www.cs.waikato.ac.nz/ml/weka/
Da mesma forma da outra ferramenta citada, esta tem uma interface gráfica, que podemos fazer as configurações de banco de dados, escrever e executar métodos de processamentos e visualizar os resultados.
No link abaixo podemos baixar e estudar a ferramenta e a documentação  http://www.cs.waikato.ac.nz/ml/weka/.
atividade
Atividade
É uma ferramenta bem visual, facilitando a manipulação de dados, criação de workflows. Observe a figura apresentada, em que podemos observar um exemplo de workflow.
Figura 4.13 - Exemplo de workflow
Fonte: https://static.imasters.com.br/wp-content/uploads/2017/05/rapidminer-workflow.png
Considerando a afirmação apresentada, assinale a alternativa correta em relação às ferramentas do Rapidminer.
Parte superior do formulário
a) Workfow.
b) RapidMiner Studio.
c) Modelos preditivos.
d) Weka.
e) Hadoop.
Feedback: A alternativa correta é a letra B, pois o RapidMiner Studio é uma ferramenta do RapidMiner. As outras opções estão incorretas, pois o workflow é o local do armazenamento das informações, modelo preditivos são os modelos de consulta sem a parametrização, e o Weka é uma ferramenta de data Science da mesma forma que o Rapidminer.Verificar Resposta
Parte inferior do formulário
Eco-sistema de Análise de Dados
Agora, continuaremos a falar sobre as ferramentas disponíveis no mercado de desenvolvimento de softwares sobre Data Science.
Orange
A ferramenta Orange, foi desenvolvida pela Universidade de Ljubljana, feita em Python, C++ C e Cython, e sua principal característica é a mineração de dados e geração de relatórios.
É baseada em um pacote de programação visual, podendo ser criado um workflow através da ferramenta visual, seus widgets podem ser programáveis pelos usuários e ou poderão ser utilizados os já disponíveis na ferramenta.
Algumas características:
· Dados: podem ser carregados, salvos, tem suporte a operações com junção e seleção.
· Visualização: parte gráfica desenvolvida com componentes de criação gráfica.
· Modelos: regressão linear, random
· Avaliação: matriz da confusão
· Não supervisionado: cálculos de distâncias, mapa de distância.
Figura 4.14 – Tela Orange com dados.
Fonte: https://orange.biolab.si/
Figura 4.15 – consultas geradas.
Fonte: https://orange.biolab.si/
Knime
O software Knime, da mesma forma que os outros citados anteriormente, foi desenvolvido em uma universidade, a Konstanz, na Alemanha.
Desenvolvido para a análise, com módulos de integração e transformação de dados em relatórios e gráficos, hoje em dia conta com mais de 15.000 usuários pelo mundo em diversas áreas, desde indústrias, empresas de edição, indústrias automobilísticas e um grande grupo de pesquisas. Tem integração com Weka, entre outros.
A seguir conheça algumas telas para ambientação. Disponível para consulta, e download no link https://www.knime.org/, e lembrando que se trata de um software livre.
Figura 4.16 – Site Knime.
Fonte: https://www.knime.com/
Figura 4.17 – Dados processados pelo Knime
Fonte: https://dadosedecisoes.com.br/5-ferramentas-open-source-data-science/
reflita
Reflita
“Abstrair, no sentido que usamos aqui, é representar uma informação através de correspondentes simbólicos e genéricos. Este ponto é importante: como acabamos de ver, para ser genérico, é necessário "perder" um pouco dos dados, para só conservar a essência da informação.”
Fonte: NAVEGA (2002, p. 02).
saiba mais
Saiba mais
Para saber mais sobre o assunto de Data Mining, acesse o conteúdo do artigo do site Dev Media, maior site do Brasil em conteúdo para programadores, que traz muitas informações sobre Data Mining.
O artigo traz por exemplo que podemos aplicar o conceito de Data Mining e muito mais!
ACESSAR
atividade
Atividade
Em conhecimento em relação as ferramentas para mineração de dados, algumas ferramentas que são utilizadas em todo o mundo, que na sua maioria foram desenvolvidas dentro de universidades.
Em relação às características das ferramentas que conhecemos, assinale a alternativa correta.
Parte superior do formulário
a) Foram desenvolvidas por alunos.
b) As ferramentas são open source.
c) Ferramentas pagas.
d) Os filtros para pesquisa são estáticos.
e) Todos feitos em Java.
Feedback: A alternativa correta é a letra B, pois as outras respostas são incorretas, pois apresentam outras informações, como filtro, linguagem de programação e ferramentas de desenvolvimento.  As outras alternativas estão incorretas, pois  sobre as ferramentas apresentadas, as características citadas não estão presente em todas, somente a alternativa B.Verificar Resposta
Parte inferior do formulário
indicações
Material Complementar
LIVRO
Business Intelligence: Um enfoque gerencial para a inteligência do negócio
Editora: Bookman
Autor: Efraim Turban, Ramesh Sharda, Jay E. Aronson e David King – tradução de Fabiano Bruno Gonçalves.
ISBN: 978-0-13-234761-7
Comentário:  Nesta obra os autores trazem muita informação importante para quem quer trabalhar e aprender sobre o BI, trazendo casos práticos, dentre eles uma aplicação da Toyota Motors, com a ajuda do BI a empresa pode melhorar sua questão de logística, custo e satisfação do cliente.
Vale muita a pena essa leitura!
FILME
Vingadores – Era de Ultron
Ano:2015
Comentário: Nesse filme, os vingadores retiram uma caixa do Ultron, para ver que ele estava desenvolvendo, e no caso seria a sua raça superior, e o homem de ferro e o Hulk, estão acessando a caixa contendo o robô, e acabam o reprogramando através dos dados pesquisados pelo Jarvs (computador do Homem de Ferro), no caso ele faz uma busca e importa esses dados para o robô. Essa busca feita foi uma grande mineração de dados na internet para ser transferido para o robô que depois vem a ser o personagem Visão.
TRAILER
conclusão
Conclusão
Nesta unidade, estudamos alguns conceitos imprescindíveis:Data Mining, a mineração de dados em uma grande base, buscando informações que possam gerar  parâmetros, para ser utilizados como base nas pesquisas das informações e filtros apresentados como um histórico, também em forma de gráficos e outros documentos visuais para auxílio na tomada de decisões.
Vimos também os conceitos do Data Science que também é utilizado
para a pesquisa de informações, geração de gráficos e dados para auxílio das
empresas.
E ainda vimos algumas ferramentas e seus conceitos para busca de dados: Redminer, Orange Weka. e Knime.
Muito obrigado pela companhia e bom estudos!
referências
Referências Bibliográficas
TURBAN, Efraim; et al. Business Intelligence: Um enfoque gerencial para a inteligência do negócio. Porto Alegre: Bookman, 2009.
DIAS, Franciele D. Ferramentas olap: Um estudo baseado no sistema pentaho. Assis, 2014
DIAS, Franciele D. Ferramentas olap: Um estudo baseado no sistema pentaho. Disponível em: <https://cepein.femanet.com.br/BDigital/arqTccs/1111320138.pdf> Acesso em: 04 Mai. 2019.
CRUZ, Bruno C. MIRANDA, Bruno G. C. TURCHETE, Fellipe B. Conceitos de business intelligence por meio de estudos de caso: ferramentas pentaho e qlikview. Disponível em: <http://lyceumonline.usf.edu.br/salavirtual/documentos/2704.pdf > Acesso em: 04 Mai. 2019.
NAVEGA, Sergio. Princípios essenciais do data mining. Disponível em: <http://www.intelliwise.com/reports/i2002.pdf> Acesso em: 04 Mai. 2019.
CAMILO, Carlos de O. SILVA, João C. Mineração de Dados: Conceitos, Tarefas, Métodos e Ferramentas Disponível em: <http://www.portal.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf > Acesso em: 04 Mai. 2019.
Disponível em: <https://dadosedecisoes.com.br/5-ferramentas-open-source-data-science/> Acesso em: 04 Mai. 2019.
PENTAHO bi - Conhecendo a Plataforma, Arquitetura e Infraestrutura. Site Devmedia. Disponível em: <https://www.devmedia.com.br/pentaho-bi-conhecendo-a-plataforma-arquitetura-e-infraestrutura/31502> Acesso em: 04 Mai. 2019.
RAPIDMINER. Disponível em: <https://rapidminer.com/products/> Acesso em: 04 Mai. 2019.
KNIME. Disponível em: <https://www.knime.com/> Acesso em: 04 Mai. 2019.
IMASTER.Disponível em: <https://static.imasters.com.br/wp-content/uploads/2017/05/rapidminer-workflow.png> Acesso em: 04 Mai. 2019.
DADOS E DECISÕES. 5 Ferramentas open source para data science e big data. Disponível em: <https://dadosedecisoes.com.br/5-ferramentas-open-source-data-science/> Acesso em: 04 Mai. 2019.
IMPRIMIR
© 2019 - LAUREATE - Todos direitos reservados

Continue navegando