Prévia do material em texto
Nome: Fernando Donizetti leite ATIVIDADE PRATIQUE E COMPARTILHE ANÁLISE EXPLORATÓRIA COM ALGORITMOS DE AGRUPAMENTO Um dos mais relevantes poluentes do ar atmosférico é o dióxido de enxofre, fórmula química SO2SO2, que tem sua origem principalmente associada a queima de combustíveis fósseis, ou pelos meios de transporte, ou de atividades industriais, ou de calefação, em regiões mais frias. A base de dados USairpollution do software estatístico R (SOKAL) apresenta dados relativos à concentração de dióxido de enxofre em 41 municípios americanos, ao lado de registros, para cada um dos municípios, da temperatura média anual, do número de indústrias com mais de 20 funcionários, da população, da velocidade média anual dos ventos (que dispersam poluentes), da precipitação pluviométrica anual (que limpa o ar), e da quantidade de dias com chuva no ano. Selecionamos 5 dessas cidades para uma análise simples de agrupamento hierárquico, cujos dados são exibidos na tabela adiante: Para esses cinco municípios, rodamos um algoritmo de agrupamento hierárquico, cujo resultado é exibido na figura adiante, na forma de um dendrograma: Vamos Praticar Agora que você já compreendeu as funções e objetivos de uma análise de agrupamento, e aprendeu sobre o algoritmo de agrupamento hierárquico, vamos praticar um pouco mais sobre este assunto respondendo às seguintes perguntas: 1) Quantos grupos iniciais de uma só observação há neste dendrograma? Resposta: Neste dendrograma temos 2 grupos iniciais de uma só observação 2) Qual o município que, claramente, se destaca dos demais no dendrograma? Resposta: Chicago 3) Na altura (Height) 5, quantos e quais grupos o algoritmo de agrupamento formou? Resposta: Na altura 5 formou 1 grupo 4) Na altura (Height) 3, quantos e quais grupos o algoritmo de agrupamento formou? Resposta: Na altura 3 formaram 2 grupos, são eles: Houston, Dallas, Miami e Memphis 5) O que significam esses grupos formados pelo algoritmo? Resposta: Significa uma demonstração de proximidade ou distância de cada cidade relacionado a emissão do SO2.