Baixe o app para aproveitar ainda mais
Prévia do material em texto
Roberto Carlos da Silva - RA 2022116079 – 31/05/2023 ANÁLISE EXPLORATÓRIA COM ALGORITMOS DE AGRUPAMENTO Pratique 4 Um dos mais relevantes poluentes do ar atmosférico é o dióxido de enxofre, fórmula química SO2, que tem sua origem principalmente associada a queima de combustíveis fósseis, ou pelos meios de transporte, ou de atividades industriais, ou de calefação, em regiões mais frias. A base de dados USairpollution do software estatístico R (SOKAL) apresenta dados relativos à concentração de dióxido de enxofre em 41 municípios americanos, ao lado de registros, para cada um dos municípios, da temperatura média anual, do número de indústrias com mais de 20 funcionários, da população, da velocidade média anual dos ventos (que dispersam poluentes), da precipitação pluviométrica anual (que limpa o ar), e da quantidade de dias com chuva no ano. Selecionamos 5 dessas cidades para uma análise simples de agrupamento hierárquico, cujos dados são exibidos na tabela adiante: Para esses cinco municípios, rodamos um algoritmo de agrupamento hierárquico, cujo resultado é exibido na figura adiante, na forma de um dendrograma: Agora que você já compreendeu as funções e objetivos de uma análise de agrupamento, e aprendeu sobre o algoritmo de agrupamento hierárquico, vamos praticar um pouco mais sobre este assunto respondendo às seguintes perguntas: 1) Quantos grupos iniciais de uma só observação há neste dendrograma? R: Há neste dendrograma 2 grupos iniciais de uma só observação 2) Qual o município que, claramente, se destaca dos demais no dendrograma? R: Chicago 3) Na altura (Height) 5, quantos e quais grupos o algoritmo de agrupamento formou? R: Na altura 5 formou 1 grupo 4) Na altura (Height) 3, quantos e quais grupos o algoritmo de agrupamento formou? R: Três grupos: [Chicago], [Houston, Dallas] e [Miami e Memphis]; 5) O que significam esses grupos formados pelo algoritmo? R: É uma estatística usada para classificar elementos em grupos, deforma que elementos dentro de um mesmo grupo (cluster) sejam muito parecidos, e os elementos em diferentes grupos (clusters) sejam distintos entre si e também os níveis de similaridade ou distanciamento das cidades em relação ao poluente SO2 (dióxido de enxofre). Referências SOKAL, Robert R.; ROHLF, F. James. Biometry. 2 ed. San Francisco: W. H. Freeman, 1981.
Compartilhar