Buscar

ANÁLISE EXPLORATÓRIA COM ALGORITMOS DE AGRUPAMENTO

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 3 páginas

Prévia do material em texto

Roberto Carlos da Silva - RA 2022116079 – 31/05/2023
ANÁLISE EXPLORATÓRIA COM ALGORITMOS DE AGRUPAMENTO
Pratique 4
Um dos mais relevantes poluentes do ar atmosférico é o dióxido de enxofre, fórmula química SO2, que tem sua origem principalmente associada a queima de combustíveis fósseis, ou pelos meios de transporte, ou de atividades industriais, ou de calefação, em regiões mais frias.
A base de dados USairpollution do software estatístico R (SOKAL) apresenta dados relativos à concentração de dióxido de enxofre em 41 municípios americanos, ao lado de registros, para cada um dos municípios, da temperatura média anual, do número de indústrias com mais de 20 funcionários, da população, da velocidade média anual dos ventos (que dispersam poluentes), da precipitação pluviométrica anual (que limpa o ar), e da quantidade de dias com chuva no ano.
Selecionamos 5 dessas cidades para uma análise simples de agrupamento hierárquico, cujos dados são exibidos na tabela adiante:
Para esses cinco municípios, rodamos um algoritmo de agrupamento hierárquico, cujo resultado é exibido na figura adiante, na forma de um dendrograma:
Agora que você já compreendeu as funções e objetivos de uma análise de agrupamento, e aprendeu sobre o algoritmo de agrupamento hierárquico, vamos praticar um pouco mais sobre este assunto respondendo às seguintes perguntas:
1) Quantos grupos iniciais de uma só observação há neste dendrograma?
R: Há neste dendrograma 2 grupos iniciais de uma só observação
2) Qual o município que, claramente, se destaca dos demais no dendrograma?
R: Chicago 
3) Na altura (Height) 5, quantos e quais grupos o algoritmo de agrupamento formou?
R: Na altura 5 formou 1 grupo
4) Na altura (Height) 3, quantos e quais grupos o algoritmo de agrupamento formou? 
R: Três grupos: [Chicago], [Houston, Dallas] e [Miami e Memphis]; 
5) O que significam esses grupos formados pelo algoritmo? 
R: É uma estatística usada para classificar elementos em grupos, deforma que elementos dentro de um mesmo grupo (cluster) sejam muito parecidos, e os elementos em diferentes grupos (clusters) sejam distintos entre si e também os níveis de similaridade ou distanciamento das cidades em relação ao poluente SO2 (dióxido de enxofre).
Referências
SOKAL, Robert R.; ROHLF, F. James. Biometry. 2 ed. San Francisco: W. H. Freeman, 1981.

Continue navegando