Buscar

Atividade Colaborativa Probabilidade e estatistica


Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Continue navegando


Prévia do material em texto

Atividade Colaborativa
A importância das ferramentas de organização de dados são cada vez mais indispensáveis nas empresas, como a capacidade de organizar um mar de dados que estão disponíveis nos ambientes virtuais (Internet). De maneira a melhor direcionar suas tomadas de decisões, com o objetivo de maximizar suas competências.
A análise de dados é cada vez mais importante para empresas que buscam descobrir insights que possam estar ocultos em um vasto mar de dados. As organizações podem obter uma perspectiva tremendamente valiosa sobre seus clientes e objetivos comerciais usando ferramentas projetadas para organizar, categorizar e inferir conclusões estatísticas de várias fontes de dados.
As empresas têm muitas ponderações e escolhas a serem feitas ao avaliar as ferramentas de análise de dados, mas encontrar o aplicativo correto e usar seus recursos com eficácia pode levar a uma transformação radical.
Existem diversos Softwares de análise de dados disponíveis hoje, entre eles destacamos: DataMelt, Knime Analytics Platform, Openrefine, Orange, Linguagem de programação R, Tableau Public, Trifacta Wrangler
 DataMelt
Também conhecida como DMelt, é uma plataforma computacional para análise estatística de Big Data e visualização científica. O programa é usado com mais frequência em ciências naturais, engenharia e modelagem e análise de mercados financeiros. A plataforma suporta muitas linguagens de programação, incluindo Python, Java e outras.
As organizações podem acessar vastas bibliotecas por meio de scripts dinâmicos, incluindo mais de 40 mil classes Java para computação e visualização e 500 módulos Python. Recursos mais avançados exigem uma licença de desenvolvedor ou comercial, mas a edição gratuita da DataMelt inclui muitos dos principais recursos necessários para explorar, analisar e visualizar dados.Roda em dispositivos Windows, Linux, macOS e Android.
 KNIME Analytics Platform
A Plataforma foi projetada para ajudar as organizações a manipular, analisar e modelar dados por meio de programação visual. O software inclui mais de 1 mil módulos, centenas de exemplos prontos para uso e uma variedade de ferramentas integradas para ajudar os usuários a descobrir possíveis insights ocultos em seus dados e prever futuros com o auxílio do aprendizado de máquina.
Em vez de escrever código, o KNIME permite que as organizações arrastem e soltem os pontos de conexão entre as atividades. A ferramenta de análise de dados também oferece suporte à combinação de dados entre arquivos de texto simples, bancos de dados, documentos, imagens, redes e dados baseados no Hadoop em um único fluxo de trabalho visual. A KNIME Analytics Platform é de código aberto e atualizada com novos lançamentos em uma base semestral. Está disponível para dispositivos Windows, macOS e Linux.
OpenRefine
Ou antigo Google Refine, ajuda as organizações a lidar com dados confusos. O Google deixou de apoiar o projeto em 2012, mas o aplicativo ainda está disponível e é atualizado regularmente por voluntários. O OpenRefine pode executar várias tarefas em dados, incluindo limpeza, transformação e formatação de dados para torná-los mais adequados para análise e exploração. A ferramenta também permite que os usuários recuperem dados de serviços da Web externos para reconciliar e correlacionar dados de várias origens.
O OpenRefine não é a melhor ferramenta para grandes bancos de dados, mas continua sendo uma opção importante e bem vista por muitas organizações, devido à quantidade significativa de tempo que os analistas gastam na limpeza de dados para modelagem preditiva. Está disponível para download no Windows, macOS e Linux.
 Orange
É uma ferramenta de análise e visualização de dados de código aberto desenvolvida na Universidade de Ljubljana, na Eslovênia. Os usuários podem extrair dados via programação visual ou scripts Python em uma janela de terminal; explorar estatísticas, box plots ou scatter plots; e aprofundar seus dados com árvores de decisão, agrupamento hierárquico, heatmaps e projeções lineares.
A interface gráfica do usuário da Orange permite que os usuários se concentrem na análise exploratória de dados, em vez de codificação. A ferramenta também possui componentes para Machine Learning e complementos que estendem a funcionalidade de mineração de dados de fontes externas para execução de processamento de linguagem natural, mineração de texto, bioinformática, análise de rede e mineração de regras de associação. A Orange suporta Windows, macOS e Linux.
Linguagem de Programação R
É amplamente utilizada para pesquisa em metodologia estatística. As organizações também podem aproveitar um conjunto integrado de software para manipulação de dados, cálculo e exibição gráfica. As principais características estatísticas incluem modelagem linear e não linear, testes estatísticos clássicos, análise de séries temporais, classificação e agrupamento. R roda no Unix, Windows e macOS.
Tableau Public
É um aplicativo de análise e visualização de dados que permite aos usuários publicar dados interativos na web. A versão gratuita do Tableau é limitada a 1 GB de armazenamento de dados e 1 milhão de linhas de dados. A simplicidade e a intuição do Tableau Public tornaram-no uma das ferramentas de análise de dados mais populares.
O Tableau Public pode extrair dados do Planilhas Google, do Microsoft Excel, arquivos CSV, arquivos JSON, arquivos estatísticos, arquivos espaciais, conectores de dados da Web e OData. Os usuários podem gerar gráficos interativos, gráficos e mapas para serem compartilhados em mídias sociais ou incorporados em sites para disponibilidade pública. O Tableau Public está disponível para download no Windows e no macOS.
Trifacta Wrangler
É outro aplicativo projetado para ajudar os analistas de dados a limpar e preparar dados confusos de diversas fontes. Depois que os conjuntos de dados são importados para o Trifacta Wrangler, o aplicativo organizará e estruturará os dados automaticamente. Algoritmos de aprendizado de máquina ajudam a preparar dados para análises mais detalhadas, sugerindo transformações e agregações comuns.
O Trifacta Wrangler pode importar dados do Microsoft Excel, arquivos JSON e arquivos CSV brutos. A ferramenta também faz o perfil dos dados para indicar a porcentagem de linhas com valores ausentes, incompatíveis ou inconsistentes e categoriza visualmente os dados por tipo, como a data ou hora, a string ou o endereço IP associado a cada ponto de dados. O Trifacta Wrangler está limitado a 100 MB de dados e está disponível para download em dispositivos Windows e MacOS.
Fontes Pesquisadas:
https://www.cetax.com.br/data-warehouse/
https://www.computerworld.com.pt/2015/10/20/trifacta-disponibiliza-ferramenta-gratuita-para-big-data/
 https://public.tableau.com/pt-br/s/blog/2018/01/introducing-tableau-public-105
https://public.tableau.com/pt-br/s/data-policy
https://imasters.com.br/devsecops/construcao-de-data-warehouse-dw-e-data-mart-dm
https://www.fiveacts.com.br/tableau-software-como-funciona-e-quais-sao-os-beneficios/
https://universidadedatecnologia.com.br/o-que-e-linguagem-de-programacao/
https://www.ibpad.com.br/blog/comunicacao-digital/o-que-e-programacao-ou-linguagem-em-r/
https://edisciplinas.usp.br/pluginfile.php/4919774/mod_resource/content/1/Orange_slides.pdf
https://dadosedecisoes.com.br/5-ferramentas-open-source-data-science/
https://www.udemy.com/course/orange-r-e-weka-estatistica-data-mining-e-visualizacao/
https://ijnet.org/pt-br/story/como-usar-o-google-refine-na-sua-pr%C3%B3xima-mat%C3%A9ria
http://reporterunesp.jor.br/2016/12/13/open-refine-dados-no-jornalismo/
https://translate.google.com/translate?hl=pt-BR&sl=en&u=https://www.knime.com/knime-analytics-platform&prev=search
https://medium.com/@datalivre/descubra-a-plataforma-de-an%C3%A1lise-de-dados-knime-8218ccbea431