Buscar

Análise univariada de dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Continue navegando


Prévia do material em texto

1. 
Realizar uma análise utilizando uma informação a fim de encontrar padrões voltados a valores relacionados à média, à moda, à variância e à mediana é considerada uma forma de análise, permitindo definir novos padrões. Esse conceito se refere à:
A. 
Análise univariada.
A análise univariada utiliza apenas uma informação para encontrar padrões e é a forma mais simples de análise. A análise bivariada trabalha avaliando duas variáveis. A análise estatística bivariada (duas variáveis) permite observar como duas variáveis se comportam na presença uma da outra. A análise multivariada consiste em um conjunto de métodos estatísticos utilizados em situações em que várias variáveis são medidas simultaneamente em cada elemento amostral. Análise descritiva é considerada a primeira análise para que se possa descrever e resumir os dados, permitindo identificar o seu comportamento. A análise exploratória de dados é uma abordagem à análise de conjuntos de dados de modo a resumir suas características principais, frequentemente com métodos visuais, e engloba todas as análises – univariada, bivariada e multivariada.
2. 
As variáveis têm tipos, como numéricas e categóricas. Ainda dentro das variáveis do tipo numérica, elas se dividem em discreta e contínua. Todavia, as variáveis categóricas se dividem em nominal e ordinal. A variável grau de satisfação, que pode ser ótimo, muito bom, bom e ruim, classifica-se como:
B. 
Categórica ordinal.
A categórica nominal ocorre quando a variável não tem uma ordem natural, a exemplo de nome, sexo. A categórica ordinal ocorre quando as categorias podem ser ordenadas, a exemplo de tamanho. As variáveis numérica discreta e quantitativa discreta se referem ao mesmo tipo de variável e elas assumem valores inteiros, a exemplo da idade. A numérica contínua representa valores no formato de números reais, como altura e peso.
3. 
Ao se realizar um processo no qual se faz uma análise sobre um grande conjunto de dados conhecidos, com diversas variáveis, busca-se diminuir a quantidade dessas variáveis ou agrupar as informações em categorias homogêneas. Esse processo pode ser considerado como sendo:
C. 
Abordagem descritiva.
As análises conclusivas são elaboradas para estudar os dados coletados de uma maneira ainda mais objetiva, pois partem de perguntas muito específicas que deverão ser respondidas por meio do processo analítico. Em uma abordagem descritiva já se conhece o assunto a ser estudado, bem como o segmento desses dados agrupados, diminuindo a quantidade de variáveis em categorias homogêneas. A estatística inferencial utiliza a base de conhecimento ou experiência necessária para desenvolver o raciocínio sobre os dados, de forma a se obter conclusões. A análise estatística é a ciência de coletar, explorar e apresentar grandes quantidades de dados para descobrir padrões e tendências subjacentes. As técnicas úteis para o reconhecimento e a descoberta de padrões em ambientes onde os fenômenos são descritos/baseados em uma grande variedade de dados são a estatística exploratória.
4. 
A linguagem Python contém diferentes tipos de bibliotecas para se trabalhar com data science, entre elas: NumPy, SciPy, Pandas, Matplotlib e Seaborn. Uma delas é uma biblioteca de baixo nível para criar diagramas e gráficos bidimensionais. Com esse pacote, você pode construir gráficos diversos, desde histogramas e gráficos de dispersão a gráficos de coordenadas não cartesianas. Dentre as bibliotecas citadas, a qual se refere essa descrição?
D. 
Matplotlib.
A Numpy permite realizar cálculos sobre matrizes com grande volume de dados e multidimensionais, contendo vários métodos para a realização desses cálculos. A SciPy, uma implementação a partir da biblioteca Numpy, realiza cálculos de probabilidade por meio de métodos algébricos e cálculo integral. Todavia, a biblioteca Pandas, desenvolvida em Python, permite realizar filtros, agrupamentos e combinação de valores para facilitar na análise dos dados. A Matplotlib é uma biblioteca em Python que possibilita a criação de gráficos e diagramas, facilitando a visualização desses dados. Com esse pacote, você pode construir gráficos diversos, desde histogramas e gráficos de dispersão a gráficos de coordenadas não cartesianas. A Seaborn é essencialmente uma API de alto nível baseada na biblioteca Matplotlib. Ela contém configurações padrão mais adequadas para o processamento de gráficos.
5. 
Para cada tipo de informação pode-se ter um melhor formato de visualização, como uma estratégia para auxiliar na análise dos seus valores. Uma empresa do ramo de varejo deseja analisar o comportamento dos preços de seus produtos. Considerando um array composto por um segmento de produtos e seus respectivos preços, tais como: 
Produtos = [‘Vinho Tinto’, ‘Biscoito Importado’,’Azeite de Oliva’,’Conjunto de Copos’,’Jogo de Talheres’, ‘Sabão Liquido’]
Preços    = [ 23.79, 19.49, 21.89, 24.19, 22.59, 24.09]  
Qual seria o melhor gráfico a ser aplicado para realizar tal análise?
E. 
Gráfico de dispersão.
Gráficos de linhas, barras e setores não são indicados na utilização desse cenário, pois os preços têm valores próximos e são do tipo de variável numérica contínua. O gráfico box-plot não deve ser aplicado neste exemplo, pois se utiliza de uma única variável. O gráfico de dispersão permite a visualização de uma possível relação entre o produto e o seu preço, bem como o comportamento entre eles, e facilita no entendimento que, por mais que entre essas variáveis existam medidas muito semelhantes, há discrepâncias entre elas.