Prévia do material em texto
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=3… 1/18
Imprimir
INTRODUÇÃO
A análise de agrupamento é um método estatístico de processamento de dados, que serve para organizar itens
em grupos, ou clusters, com base na similaridade dos elementos. A análise de agrupamento é uma ferramenta
poderosa de mineração de dados para qualquer organização que precise identi�car grupos distintos de clientes,
transações de vendas ou outros tipos de comportamentos. Por exemplo, os provedores de seguros usam a
análise de cluster para detectar sinistros fraudulentos, e os bancos a usam para atribuir a pontuação de crédito.
Espera-se que o aluno consiga visualizar outras aplicações em que a técnica pode ser usada. A persistência é o
que faz a diferença, é o que te leva para o sucesso, ou seja, o ato de persistir é uma das condições da vitória.
Aula 1
MODELOS NÃO SUPERVISIONADOS: ANÁLISE DE
AGRUPAMENTO
A análise de agrupamento é um método estatístico de processamento de dados, que serve para
organizar itens em grupos, ou clusters, com base na similaridade dos elementos.
23 minutos
APRENDIZAGEM NÃO-
SUPERVSIONADA
119 minutos
Aula 1 - Modelos não supervisionados: análise de agrupamento
Aula 2 - Modelos não supervisionados: redes neurais
Aula 3 - Modelos não supervisionados: regras de associação
Aula 4 - Modelos não supervisionados: sistemas de recomendação
Referências
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=3… 2/18
ANÁLISE DE AGRUPAMENTO – CONCEITO E TIPOS
A análise de agrupamento consiste em uma forma de análise exploratória de dados em que as observações são
divididas em diferentes grupos que compartilham características comuns. O objetivo da análise de
agrupamento (também conhecido como clusterização) é construir grupos (ou classes, ou clusters), garantindo a
seguinte propriedade: dentro de um grupo, as observações devem ser tão semelhantes quanto possível,
enquanto as observações pertencentes a grupos diferentes devem ser tão diferentes quanto possível. Segundo
Witten, Frank e Hall (2016), as técnicas de agrupamento se aplicam quando não há classe a ser prevista, mas,
sim, quando as instâncias devem ser divididas em grupos naturais. A Figura 1 apresenta como seria a separação
de grupos com apenas duas features.
Figura 1 | Agrupamentos entre duas variáveis
Fonte: https://ilumeo.com.br/todos-posts/2019/04/03/como-funciona-a-analise-de-cluster. Acesso em: 2 abr. 2022.
O uso mais comum da análise de agrupamento é encontrar grupos baseada nas características. As
características são separadas em grupos, de modo que cada uma seja mais semelhante às outras, formando os
grupos. Em um contexto de pesquisa de mercado, isso pode ser usado para identi�car categorias, como grupos
de idade, faixas de renda, localização urbana, rural ou suburbana. Em marketing, a análise de agrupamento
pode ser usada para segmentação de público, para que diferentes grupos de clientes possam ser direcionados
com as mensagens mais relevantes. Os pesquisadores da área de saúde podem usar a análise de agrupamento
para descobrir se diferentes áreas geográ�cas estão associadas a níveis altos ou baixos de certas doenças, para
que possam investigar possíveis fatores locais que contribuem para problemas de saúde.
VIDEOAULA: ANÁLISE DE AGRUPAMENTO – CONCEITO E TIPO
O vídeo abordará mais conceitos básicos e mostrará os tipos de agrupamentos hierárquico e não hierárquico. O
primeiro é, geralmente, usado quando o número de classes é �xado com antecedência, enquanto o segundo é
usado para um número desconhecido de grupos (HAIR JÚNIOR et al., 2009).
K-MÉDIAS – DEFINIÇÃO E APLICAÇÃO
As análises de agrupamentos podem ser baseadas em pré-classi�cação. No entanto, assume-se que alguns dos
objetos analisados podem fazer parte de alguns grupos. Esta pressuposição de diferentes grupos é baseada em
semelhanças dentro do conjunto de entradas no algoritmo, ou variáveis de agrupamento. Ela é diferente dos
casos da análise discriminante ou detecção automática de interação, em que a variável dependente é usada
para de�nir formalmente grupos de objetos, e a distinção não é feita com base na semelhança do per�l na
própria matriz de dados (MACKAY, 2003).
Um dos algoritmos mais usados é o k-médias (ou k-means), que estabelece a presença de clusters ao encontrar
seus pontos centroides. Um ponto centroide é a média de todas as distâncias de pontos de dados no cluster, ou
seja, do grupo de k-elementos. Avaliando iterativamente a distância euclidiana entre cada ponto no conjunto de
dados, cada um pode ser atribuído a um cluster. As distâncias mais usadas são euclidiana, manhattan e
mahalanobis. Os pontos de centroide são aleatórios para começar e mudarão cada vez que o processo for
realizado. K-means é comumente usado na análise de agrupamento, mas tem uma limitação, por ser útil,
principalmente, para dados escalares (MACKAY, 2003).
Para visualizar o objeto, acesse seu material digital.
https://ilumeo.com.br/todos-posts/2019/04/03/como-funciona-a-analise-de-cluster
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=3… 3/18
VIDEOAULA: K-MÉDIAS – DEFINIÇÃO E APLICAÇÃO
O agrupamento K-means é um método usado para análise de agrupamento, especialmente em mineração de
dados e estatísticas. Ele é um dos algoritmos de aprendizado de máquina não supervisionado mais simples e
popular. Seu objetivo é particionar um conjunto de observações em uma série de clusters (k), resultando no
particionamento dos dados em células de Voronoi. Pode ser considerado um método para descobrir a qual
grupo um determinado objeto realmente pertence. A Figura 2 apresenta uma ilustração sobre o funcionamento
do k-means.
Figura 2 | Processo de agrupamento com K-means
Fonte: elaborada pelo autor.
É usado, principalmente, em estatística e pode ser aplicado a quase qualquer ramo de estudo. Por exemplo, em
marketing, ele pode ser usado para agrupar diferentes dados demográ�cos de pessoas em grupos simples, que
tornam mais fácil para os pro�ssionais de marketing segmentar. Os astrônomos usam para �ltrar grandes
quantidades de dados astronômicos, uma vez que não podem analisar cada objeto um por um, eles precisam
encontrar uma maneira de encontrar estatisticamente pontos de interesse para observação e investigação.
O algoritmo:
1. K pontos são colocados no espaço de dados do objeto, representando o grupo inicial de centroides.
2. Cada objeto ou ponto de dados é atribuído ao k mais próximo.
3. Depois que todos os objetos são atribuídos, as posições dos k centroides são recalculadas.
4. As etapas 2 e 3 são repetidas até que as posições dos centroides não se movam mais.
AGRUPAMENTO ESPECTRAL – DEFINIÇÃO E APLICAÇÃO
O agrupamento espectral usa a abordagem de conectividade para clustering, em que comunidades de nós (ou
seja, pontos de dados) que estão conectados ou imediatamente próximos uns dos outros são identi�cadas em
um grá�co. Os nós são mapeados para um espaço de baixa dimensão que pode ser facilmente segregado para
formar grupos. O agrupamento espectral usa informações dos valores próprios (espectro) de matrizes especiais
(ou seja, matriz de a�nidade, matriz de graus e matriz laplaciana) derivadas do grá�co ou conjunto de dados.
O agrupamento espectral é �exível e nos permite agrupar dados não grá�cos. Não faz suposições sobre a forma
dos clusters. As técnicas de agrupamento, como K-means, assumem que os pontos atribuídos a um
agrupamento são esféricos em torno do centro do agrupamento. Esta é umasuposição forte e pode nem
sempre ser relevante. Nesses casos, o agrupamento espectral ajuda a criar clusters mais precisos. Ele pode
agrupar corretamente observações que realmente pertencem ao mesmo agrupamento, mas estão mais
distantes do que as observações em outros agrupamentos, devido à redução de dimensão. A Figura 3 apresenta
o processo de agrupamento espectral.
Figura 3 | Processo de agrupamento espectral
Fonte: elaborada pelo autor.
Para visualizar o objeto, acesse seu material digital.
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=3… 4/18
VIDEOAULA: AGRUPAMENTO ESPECTRAL – DEFINIÇÃO E APLICAÇÃO
Os pontos de dados no agrupamento espectral devem ser conectados, mas podem não necessariamente ter
limites convexos, ao contrário das técnicas convencionais de grupo, em que o grupo é baseado na compactação
dos pontos de dados. Embora seja computacionalmente pensado para grandes conjuntos de dados, uma vez
que os autovalores e os autovetores precisam ser calculados, e o agrupamento é realizado nesses vetores. Além
disso, para grandes conjuntos de dados, a complexidade aumenta e a precisão diminui signi�cativamente.
As três etapas principais envolvidas no agrupamento espectral são: construir um grá�co de similaridade,
projetar dados em um espaço de dimensão inferior e agrupar os dados. Dado um conjunto de pontos S em um
espaço de dimensão superior, ele pode ser elaborado da seguinte forma:
1. Forme uma matriz de distância.
2. Transforme a matriz de distância em uma matriz de a�nidade A.
3. Calcule a matriz de graus D e a matriz Laplaciana L = D - A.
4. Encontre os autovalores e os autovetores de L.
5. Com os autovetores de k maiores autovalores calculados na etapa anterior, forme uma matriz.
6. Normalize os vetores.
7. Agrupe os pontos de dados no espaço k-dimensional.
ESTUDO DE CASO
O sistema de recomendação é um dos exemplos mais clássicos de análise de agrupamento. Cite dois exemplos,
um para sistema de recomendação e outro que não é, e explique cada um.
RESOLUÇÃO DO ESTUDO DE CASO
1º exemplo: sistema da Net�ix. Ele se baseia em sistema de recomendação, formando grupos de usuários de
acordo com que o que eles assistem, assim, o sistema sempre recomenda �lmes ou séries mais similares aos
usuários.
2º exemplo: �ores. É possível agrupar algumas espécies de acordo com suas características, como largura,
altura e textura da pétala.
Saiba mais
Seguem alguns links de materiais que possam auxiliar no entendimento:
Tutorial de agrupamento espectral: https://arxiv.org/pdf/0711.0189.pdf.
Exemplo de análise de agrupamento: https://www.youtube.com/watch?v=Nv_AZ61Yj-M.
Exemplo de implementação do k-means: https://www.youtube.com/watch?v=6qleqPsrBqI.
Para visualizar o objeto, acesse seu material digital.
Para visualizar o objeto, acesse seu material digital.
INTRODUÇÃO
Aula 2
MODELOS NÃO SUPERVISIONADOS: REDES NEURAIS
As Redes Neurais Arti�ciais (RNAs) são modelos matemáticos inspirados no cérebro humano. Elas
aprendem (ou são treinadas) processando exemplos.
24 minutos
https://arxiv.org/pdf/0711.0189.pdf
https://www.youtube.com/watch?v=Nv_AZ61Yj-M
https://www.youtube.com/watch?v=6qleqPsrBqI
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=3… 5/18
As Redes Neurais Arti�ciais (RNAs) são modelos matemáticos inspirados no cérebro humano. Elas aprendem (ou
são treinadas) processando exemplos. Cada uma contém uma entrada e um resultado conhecido, formando
associações ponderadas entre os dois, que são armazenadas na estrutura de dados da própria rede. Ainda
existe uma classe de redes SOM que se enquadra em não supervisionada, cujos resultados são baseados em
similaridades das entradas. As RNAs têm diversas aplicações que serão vistas nesse curso, das mais básicas às
mais avançadas. Espera-se que o aluno consiga visualizar outras aplicações onde as RNAs podem ser usadas. A
persistência é o que faz a diferença, é o que te leva para o sucesso, ou seja, o ato de persistir é uma das
condições da vitória.
REDES NEURAIS – DEFINIÇÕES
Uma RNA é baseada em um conjunto de nós conectados ou neurônios arti�ciais, que modelam os neurônios
em um cérebro biológico. Em cada conexão, como as sinapses em um cérebro biológico, pode-se transmitir um
sinal a outros neurônios. Um neurônio arti�cial recebe um sinal e, depois, o processa, logo pode sinalizar os
neurônios conectados a ele. O sinal em uma conexão é um valor numérico, e a saída de cada neurônio é
calculada por alguma função não linear da soma de suas entradas (HAYKIN, 2008). A Figura 1 apresenta uma
estrutura básica de uma RNA.
Figura 1 | Estrutura de uma RNA
Fonte: elaborada pelo autor.
Os neurônios têm uma conectividade, que é chamada de pesos, os quais se ajustam à medida que o
aprendizado avança. O peso aumenta ou diminui a força do sinal em uma conexão. Os neurônios podem ter um
limite, de modo que um sinal seja enviado apenas se o sinal agregado cruzar esse limite. Normalmente, os
neurônios são agregados em camadas. Camadas diferentes podem realizar transformações diferentes em suas
entradas. Os sinais viajam da primeira camada (a camada de entrada) até a última camada (a camada de saída),
possivelmente, depois de atravessar as camadas várias vezes (HAYKIN, 2008).
Um exemplo bem prático na perspectiva de redes não supervisionadas pode ser a análise de agrupamento de
tipos de animais. Um dos neurônios da camada de entrada seria algumas características deles. Por exemplo, um
gato possui pelos e patas e mia, então, através dessas características, pode-se agrupar ou descobrir outros
gatos com similaridades desses atributos .
VIDEOAULA: REDES NEURAIS – DEFINIÇÕES
No vídeo, serão abordados conceitos básicos de RNAs, mostrando os elementos que compõem uma estrutura
completa. Os elementos principais são: neurônios, pesos, camadas e funções de ativações. Ainda, será feito um
paralelo com o neurônio biológico, para o aluno ter conhecimento e analise a semelhança entre ambos.
REDES NEURAIS – MODELO MATEMÁTICO
Os primeiros modelos matemáticos de RNAs foram propostos por McCulloch e Pitts (1943), na construção desse
neurônio M-P (essa sigla refere-se às iniciais dos autores), cujo interesse é modelar aspectos ligados ao
processamento da informação em um neurônio biológico. Entende-se por processamento da informação os
caminhos e as etapas pelos quais passam os potenciais de ativação e que trafegam de um neurônio a outro.
As RNAs são compostas por neurônios arti�ciais, que são conceitualmente derivados de neurônios biológicos.
Cada neurônio arti�cial tem entradas e produz uma única saída, que pode ser enviada a vários outros
neurônios. As entradas podem ser os valores de recursos de uma amostra de dados externos, como imagens
Para visualizar o objeto, acesse seu material digital.
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=3… 6/18
ou documentos, ou podem ser as saídas de outros neurônios. As saídas dos neurônios de saída �nal da rede
neural realizam a tarefa, como reconhecer um objeto em uma imagem (SILVA; SPATTI; FLAUZINO, 2010).
Os detalhes dessa modelagem estão no complemento desse bloco, mas, resumindo, para encontrar a saída do
neurônio, primeiro pegamos a soma ponderada de todas as entradas, ponderada pelos pesos das conexões das
entradas para o neurônio. Adicionamos um termo de polarização a essa soma. Essa soma ponderada, às vezes,
é chamada de ativação. Essa soma ponderada é, então, passada por uma função de ativação (geralmente, não
linear)para produzir a saída. As entradas iniciais são dados externos, como imagens e documentos (SILVA;
SPATTI; FLAUZINO, 2010).
VIDEOAULA: REDES NEURAIS – MODELO MATEMÁTICO
A partir de agora, serão mostrados alguns passos para a modelagem de um neurônios simples.
Passo 1: cada ramo da árvore dendrítica de um neurônio biológico é modelado como uma linha ou canal de
transmissão por onde �ui a informação de entrada.
Figura 2 | Camada de entrada de uma RNA
Fonte: adaptada de Haykin (2001).
Passo 2: a força (ou e�ciência) das conexões sinápticas de uma certa árvore dendrítica de um neurônio biológico
é modelada como um fator (peso sináptico), cujo papel é modular o �uxo de sinais passado por uma certa
árvore dendrítica.
Figura 3 | Pesos de uma RNA
Fonte: adaptada de Haykin (2001).
Passo 3: a função do corpo celular de realizar o balanço ou acúmulo energético é modelada por uma operação
de somatória sobre as entradas moduladas pelos pesos sinápticos.
Figura 4 | Operação de somatória de uma RNA
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=3… 7/18
Fonte: adaptada de Haykin (2001).
Passo 4: o axônio é modelado como uma chave ON-OFF, que indica se o neurônio respondeu ao estímulo atual.
Em outras palavras, se houve ou não o envio de um potencial de ação.
Figura 5 | Estímulo de uma RNA
Fonte: adaptada de Haykin (2001).
REDES NEURAIS – APLICAÇÕES
As RNAs possuem diversas aplicações, sendo executadas até os dias atuais, tanto na forma de pesquisa como
nas indústrias. Hoje, elas estão ajudando os humanos a sobreviver às transições da nova era nos setores
educacional, �nanceiro, aeroespacial e automotivo.
As RNAs estão regulando alguns setores-chave, incluindo �nanças, saúde e automotivo. Como esses neurônios
arti�ciais funcionam de forma semelhante ao cérebro humano, eles podem ser usados para reconhecimento de
imagem, reconhecimento de personagem e previsões do mercado de ações (SILVA; SPATTI; FLAUZINO, 2010).
VIDEOAULA: REDES NEURAIS – APLICAÇÕES
Agora, serão apresentadas algumas das aplicações com RNAs.
O trabalho de Souza et al. (2019) tem o objetivo de modelar as trajetórias de um manipulador robótico do tipo
cilíndrico com RNAs em sua área de trabalho. Durante os experimentos, foram testados alguns tipos de
trajetórias comumente usadas nas indústrias. Os resultados mostraram um desempenho muito bom, e foram
comparadas com outros métodos, validando, assim, a pesquisa.
Um outro trabalho é de Jian, Chen e Wang (2010) sobre detecção de sentimentos. O objetivo é identi�car
automaticamente se um determinado trecho de texto expressa uma opinião positiva ou negativa sobre um
tópico de interesse. O trabalho apresenta o ponto de vista que utiliza o modelo baseado em RNAs para
determinar a classi�cação do sentimento do texto. O modelo consiste em características sentimentais, peso de
recurso e base de conhecimento anterior. Durante o processo de treinamento, o modelo faz o julgamento
sentimental correto, corrigindo aqueles que estão errados, para fazer uma previsão mais precisa da polaridade
do sentimento do texto.
Vídeo resumo
Para visualizar o objeto, acesse seu material digital.
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=3… 8/18
ESTUDO DE CASO
De acordo com os conceitos abordados, imaginaremos como referência um conjunto de amigos que pode
gostar de cinema e, no �m do ano, terá o lançamento do �lme Matrix. Sabendo que o exemplo dado é baseado
em sistemas de recomendações, Matrix é um �lme de �cção cienti�ca/ação. Um dos amigos começa a
perguntar aos seus colegas o que gostam de fazer e de assistir, para tentar convencê-los a ir ao cinema. Com
isso, responda à questão na perspectiva das Redes Neurais Arti�ciais, apresentando o que seria uma entrada (
) da rede para esse problema e o que você poderia avaliar como saída ( ).
RESOLUÇÃO DO ESTUDO DE CASO
A resposta mais condizente seria: conforme o conjunto de dados de amigos, poderíamos ver a similaridade de
outros estilos de �lmes (se gostam de �cção cienti�ca/ação) que esses colegas têm, ou qual o hobby deles,
alguns podem ou não gostar de cinema, que seriam as características, ou seja, o . Já a saída poderiam ser
dois grupos: o que vai assistir ao �lme Matrix e aquele que não vai, que seriam os rótulos, ou .
Saiba mais
Seguem alguns links de materiais que possam auxiliar no entendimento. Neles, há conceitos introdutórios
e aplicações acerca das RNAs:
O vídeo apresenta uma introdução básica aos conceitos de rede neural: https://www.youtube.com/watch?
v=bfmFfD2RIcg.
Tutorial sobre a construção RNAs e seu treinamento: https://sites.icmc.usp.br/andre/research/neural/.
Neste site, são apresentadas diversas aplicações das RNAs: https://www.analyticssteps.com/blogs/8-
applications-neural-networks.
Para visualizar o objeto, acesse seu material digital.
xn yn
xn
yn
Para visualizar o objeto, acesse seu material digital.
INTRODUÇÃO
As regras de associação são uma abordagem de mineração de dados usada para explorar e interpretar grandes
conjuntos de dados transacionais para identi�car padrões e regras exclusivas. Durante as transações, esses
padrões de�nem relacionamentos e interações importantes entre diferentes itens. Além disso, esse método é
frequentemente aplicado em estudos de compras de itens em e-commerce, que é utilizado para analisar
hábitos de compra de clientes. As regras de associação ajudam a identi�car e prever comportamentos
transacionais com base nas informações de transações de treinamento que utilizam propriedades bené�cas.
Conforme as de�nições apresentadas, espera-se que o aluno consiga visualizar outras aplicações em que a
técnica poderá ser usada. É importante que o aluno tenha em mente que essas técnicas são comumente
necessárias no seu ambiente de trabalho atual ou futuro, portanto poderá colher bastantes benefícios com o
conhecimento presente.
REGRAS DE ASSOCIAÇÃO – DEFINIÇÃO
Aula 3
MODELOS NÃO SUPERVISIONADOS: REGRAS DE
ASSOCIAÇÃO
As regras de associação são uma abordagem de mineração de dados usada para explorar e
interpretar grandes conjuntos de dados transacionais para identi�car padrões e regras
exclusivas.
27 minutos
https://www.youtube.com/watch?v=bfmFfD2RIcg
https://sites.icmc.usp.br/andre/research/neural/
https://www.analyticssteps.com/blogs/8-applications-neural-networks
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=3… 9/18
As regras de associação são tipos de técnicas de aprendizado não supervisionado que veri�cam a dependência
entre dados, ou seja, tentam encontrar algumas relações ou associações interessantes entre as variáveis do
conjunto de dados (PIATETSKY-SHAPIRO, 1991).
Elas são usadas idealmente para explicar padrões em dados de repositórios de informações aparentemente
independentes, como bancos de dados relacionais e bancos de dados transacionais. Além dos conceitos
abordados, é bastante utilizada também para descobrir correlações entre produtos em dados de transações de
grande escala registrados por sistemas de ponto de vendas em supermercados (AGRAWAL; IMIELIŃSKI; SWAMI,
1993).
Uma das premissas da regra de associação é a ideia de que um ou mais itens juntos são associados a outro que
compartilha algo em comum. Por exemplo, se um cliente comprar cebolas e batatas juntas, é provável que
também compre carne para hambúrguer. Seguindo o padrão da regra de associação, �caria {cebolas, batatas} =
{hambúrguer}. Essas informações podem ser usadas como base para decisões sobre atividades de marketing,por exemplo, preços promocionais ou colocação de produtos. A Figura 1 apresenta a rede de frequência de
conjunto de itens.
Figura 1 | Rede de frequência de conjunto de itens
Fonte: elaborada pelo autor.
A imagem apresenta uma rede de frequência de conjunto de itens, em que a cor da caixa indica quantas
transações contêm a combinação de itens. É importante observar que os níveis mais baixos da rede podem
conter, no máximo, o número mínimo de itens de seus pais.
VIDEOAULA: REGRAS DE ASSOCIAÇÃO – DEFINIÇÃO
No vídeo, serão abordados mais conceitos básicos, as características das regras de associação e algumas
de�nições pertinentes. Esses conceitos podem ser usados como base para tomadas de decisão sobre atividades
de marketing, por exemplo, preços promocionais ou colocação de produtos.
REGRAS DE ASSOCIAÇÃO – APLICAÇÃO 1
É sabido que uma regra de associação tem duas partes: um antecedente (se) e um consequente (então). Um
antecedente é algo encontrado nos dados, e um consequente é um item encontrado em combinação com o
antecedente.
As regras de associação são criadas analisando-se detalhadamente os dados e procurando padrões se/então
frequentes. Então, dependendo dos dois parâmetros a seguir, as relações importantes são observadas:
• Suporte: indica com que frequência a relação se/então aparece no banco de dados.
• Con�ança: fala sobre o número de vezes que essas relações foram consideradas verdadeiras.
Abordaremos o exemplo clássico de cervejas e fraldas. Em uma situação hipotética, jovens que vão às lojas às
sextas-feiras para comprar fraldas têm predisposição a comprar uma garrafa de cerveja também.
VIDEOAULA: REGRAS DE ASSOCIAÇÃO – APLICAÇÃO 1
Para visualizar o objeto, acesse seu material digital.
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=… 10/18
Com base no exemplo da aplicação de fraldas e cervejas, analisaremos a Tabela 1.
Tabela 1 | Transação de itens
Identi�cador Itens comprados
1 cerveja, calabresa, carne, fralda
2 cerveja, fralda
3 cerveja, frango
4 calabresa, carne, cebola
Fonte: elaborada pelo autor.
Logo, será formado o suporte conforme o quão frequentemente um conjunto de itens aparece em um banco
de dados. Isso pode ser visto na Tabela 2.
Tabela 2 | Formação do suporte
Fonte: elaborada pelo autor.
Ainda, a con�ança de uma regra, que foi visto no bloco anterior, representa a sua força e de�ne-se na equação
(1).
Con�ança ( ) .
Então, a con�ança de “cerveja→fraldas” (cervejas e fraldas juntas) se dá por:
Con�ança(cerveja→fraldas) .
Logo, temos:
Con�ança(cerveja→fraldas)= = 0,67 (67%), ou seja, para 67% das transações contendo o item cerveja, a
pessoa compra fralda.
REGRAS DE ASSOCIAÇÃO – APLICAÇÃO 2
Outra aplicação é o consumo de itens de praias. Por exemplo, temos como elementos: maiôs e toalhas de praia
representam o corpo da regra; óculos de sol representam a cabeça da regra. Suporte e con�ança são medidas
de con�abilidade e frequência de ocorrência. As transações são mostradas na Tabela 3.
Tabela 3 | Transações de itens de praia
Conjunto de itens Suporte
{cerveja, fralda} 50%
{calabresa, fralda, cebola} 0%
Identi�cador Itens comprados
1 maiôs, boné, óculos de sol, toalha
2 maiôs, toalha
3 maiôs, bermuda
4 boné, toalha, camisa
Fonte: elaborada pelo autor.
x → y =
Suporte(x U y)
Suporte(x)
(1)
=
Suporte({cerveja, fraudas})
Suporte({cerveja})
0,5
0,75
Para visualizar o objeto, acesse seu material digital.
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=… 11/18
Já a Tabela 4 apresenta a con�ança dos itens de praia mencionados anteriormente.
Tabela 4 | Con�ança dos itens de praia
Conjunto de itens Suporte
{maiôs, toalha, óculos de sol} 25%
{boné, óculos de sol, camisa} 0%
Fonte: elaborada pelo autor.
A ideia é similar à do bloco anterior, mas tem itens a mais na formulação da con�ança de “maiôs,
toalha→óculos de sol” se dá por:
Con�ança(maiôs, toalha→óculos de sol) .
Logo, temos:
Con�ança(maiôs, toalha→óculos de sol) = = 0,5 (50%), ou seja, para 50% das transações contendo os itens
maiôs e toalha, a pessoa compra óculos de sol.
VIDEOAULA: REGRAS DE ASSOCIAÇÃO – APLICAÇÃO 2
Com base na aplicação dessa seção, serão abordados os detalhes das características da regra de associação
• Apoio absoluto
O suporte de regra absoluta é o número de transações que dão suporte à regra de associação em seu banco de
dados de transações.
• Corpo
Uma parte de uma regra de associação. No exemplo a seguir, a associação[Maiôs] + [Toalhas de praia]
representa o corpo da regra de associação.
[Maiôs] + [Toalhas de praia] → [Óculos de sol]
• Con�ança
A con�ança de uma regra de associação é sua força ou con�abilidade. A con�ança é de�nida como a
porcentagem de transações que suportam a regra de todas as transações que suportam o corpo da regra. Uma
transação suporta o corpo da regra se contiver todos os itens do corpo da regra.
No exemplo anterior, a con�ança é de 60%. Isso signi�ca que 60% de todas as transações que contêm maiôs e
toalhas de praia também contêm óculos de sol.
• Cabeça
Uma parte de uma regra de associação. No exemplo a seguir, a associação [Óculos escuros] representa o chefe
da regra de associação.
[Maiôs] + [Toalhas de praia] → [Óculos de sol]
• Elevação
O valor de elevação de uma regra de associação é o fator pelo qual a con�ança excede a con�ança esperada. É
determinado dividindo-se a con�ança da regra pelo suporte da cabeça da regra.
Por exemplo, se a regra de associação [maiôs] + [toalhas de praia] => [óculos de sol] tem um fator de elevação,
maiôs e toalhas de praia têm um efeito muito positivo na compra de óculos de sol, porque um fator de elevação
alto indica uma forte associação entre os itens.
• Apoio, suporte
Uma transação suporta uma regra de associação se a transação contiver o corpo da regra e o cabeçalho da
regra. O suporte de regra é a proporção de transações que suportam a regra de associação e o número total de
transações em seu banco de dados de transações.
No exemplo anterior, pode haver 24 transações entre 100 transações que suportam a regra de associação. Isso
signi�ca que 24 de cada 100 transações contêm pelo menos os itens maiôs, toalhas de praia ou óculos de sol.
=
Suporte({maiôs, toalha})
Suporte({óculos de sol})
0,25
0,5
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=… 12/18
ESTUDO DE CASO
De acordo com a Tabela 5, calcule a con�ança de “leite, suco→biscoitos”?
Tabela 5 | Transações de itens
Identi�cador Itens comprados
1 leite, pão, biscoitos, suco
2 leite, suco
3 leite, ovos
4 Pão, biscoitos, café
5 café, farinha
Fonte: elaborada pelo autor.
RESOLUÇÃO DO ESTUDO DE CASO
Para resolver o problema, primeiramente, tem-se que obter a tabela de con�ança dos itens, que é apresentada
na Tabela 6.
Tabela 6 | Con�ança dos itens
Conjunto de itens Suporte
{leite, suco, biscoitos} 20%
Fonte: elaborada pelo autor.
A ideia é similar ao do bloco anterior, mas tem itens a mais na formulação da con�ança de “leite, suco →
biscoitos”, se dá por:
Con�ança(leite, suco → biscoitos) .
Logo, temos:
Con�ança(leite, suco → biscoitos) = = 0,4 (40%), ou seja, para 40% das transações contendo os itens leite e
suco, a pessoa compra biscoito.
Saiba mais
Seguem alguns links de materiais que possam auxiliar no entendimento. Neles, há conceitos introdutórios
e aplicações acerca das regras de associação.
Neste material, há algumas de�nições básicas de regra de associação: https://www.devmedia.com.br/data-
mining-de-regras-de-associacao/6941.Aqui, há um tutorial completo e explicado de um exemplo de regras de associação:
https://diegonogare.net/2020/05/explicando-o-algoritmo-de-regra-de-associacao/.
Para visualizar o objeto, acesse seu material digital.
=
Suporte({leite, suco})
Suporte({biscoito})
0,2
0,5
Para visualizar o objeto, acesse seu material digital.
Aula 4
MODELOS NÃO SUPERVISIONADOS: SISTEMAS DE
RECOMENDAÇÃO
Os sistemas de recomendação são usados em várias áreas, por exemplo, em serviços de vídeos e
músicas, itens de lojas, entre outros.
https://www.devmedia.com.br/data-mining-de-regras-de-associacao/6941
https://diegonogare.net/2020/05/explicando-o-algoritmo-de-regra-de-associacao/
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=… 13/18
INTRODUÇÃO
Os sistemas de recomendação são usados em várias áreas, por exemplo, em serviços de vídeos e músicas, itens
de lojas, entre outros. Esses sistemas podem operar usando uma única entrada, como música, ou múltiplas
entradas, dentro e entre plataformas, como notícias, livros e consultas de pesquisa. Existem também sistemas
de recomendação populares para tópicos especí�cos, como restaurantes e encontros on-line. De uma forma
muito geral, os sistemas de recomendações são algoritmos que visam sugerir itens relevantes aos usuários.
Além disso, nessa aula, abordaremos conteúdos de detecção de fraudes, segmentação de clientes e detecção
de anomalias.
SISTEMAS DE RECOMENDAÇÃO – DEFINIÇÃO, FILTROS COLABORATIVOS E
SELEÇÃO DE MODELOS
Os sistemas de recomendação são projetados para recomendar itens ao usuário com base nos dados
fornecidos por um usuário e outros fatores que atendem à preferência e ao interesse do usuário (PRANAV;
VIVEK; MANOJ, 2016). Eles descobrem a correspondência entre o usuário e o item e imputam as semelhanças
entre usuários e itens para recomendação. Existem diversos pontos positivos em usar esse tipo de sistema:
• Bene�cia os usuários na localização de itens de seu interesse.
• Produtos que são mais relevantes para os usuários.
• Conteúdo personalizado.
• Ajuda os sites a melhorarem o engajamento ao usuário.
O objetivo de um sistema de recomendação é sugerir itens relevantes aos usuários. Para realizar esta tarefa,
existem duas categorias principais de métodos: métodos de �ltragem colaborativa e métodos baseados em
conteúdo. Antes de nos aprofundarmos nos detalhes de algoritmos especí�cos, discutiremos brevemente esses
dois paradigmas principais.
• Métodos de �ltragem colaborativa
Métodos colaborativos para sistemas de recomendação são métodos que se baseiam exclusivamente nas
interações passadas registradas entre usuários e itens para produzir novas recomendações. Essas interações
são armazenadas na chamada “matriz de interações usuário-item” (FARHIN; VIBHA; MIHIR, 2017). Uma matriz
usuário-item é formada por usuários representados por linhas, já as colunas são representados por itens. As
notas são os elementos que �cam nas posições “linhas X colunas” (usuários X itens).
Figura 1 | Divisão da �ltragem colaborativa
Fonte: elaborada pelo autor.
Então, a ideia principal que rege os métodos colaborativos é que essas interações anteriores entre usuário e
item são su�cientes para detectar usuários semelhantes e/ou itens semelhantes e fazer previsões com base
nessas proximidades estimadas.
A classe de algoritmos de �ltragem colaborativa é dividida em duas subcategorias, que são, geralmente,
chamadas de abordagens baseadas em memória e baseadas em modelos. Abordagens baseadas em memória
trabalham diretamente com valores de interações gravadas, assumindo nenhum modelo, e são essencialmente
baseadas na busca de vizinhos mais próximos (por exemplo, encontrar os usuários mais próximos de um
35 minutos
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=… 14/18
usuário de interesse e sugerir os itens mais populares entre esses vizinhos). Abordagens baseadas em modelo
assumem um modelo “generativo” subjacente que explica as interações usuário-item e tenta descobri-lo para
fazer novas previsões (FARHIN; VIBHA; MIHIR, 2017).
A principal vantagem das abordagens colaborativas é que elas não requerem informações sobre usuários ou
itens e, portanto, podem ser usadas em muitas situações. Além disso, quanto mais usuários interagem com
itens, mais novas recomendações se tornam precisas: para um conjunto �xo de usuários e itens, novas
interações registradas ao longo do tempo trazem novas informações e tornam o sistema cada vez mais e�caz.
• Método baseado em conteúdo
O método ou �ltragem baseado em conteúdo faz recomendações com base nas preferências do usuário para os
recursos do produto. Baseia-se em semelhanças entre as características dos itens. Recomenda itens a um
usuário com base nos itens mais altos avaliados anteriormente pelo mesmo usuário. A lista de recursos sobre
esses itens precisa ser gerada. Seguem algumas características do método presente:
• Cada item terá um per�l de item.
• Uma estrutura de tabela listará essas propriedades.
• Comparar quais e quantos recursos correspondem e coletar pontuações.
• Recomendar item com maior pontuação.
• O código será baseado em um algoritmo, por determinado item, o item mais semelhante será encontrado.
• A melhor correspondência de pontuação será fornecida ao usuário.
• Esse método depende apenas dos recursos do item, e não das preferências do usuário.
Seleção de modelos
Um dos maiores desa�os é selecionar o melhor modelo após a recomendação, pois, às vezes, pode haver
discordância entre os atributos e as métricas. Tem-se também alguns problemas ao avaliar os algoritmos, pois,
como eles dependem do conjunto de dados, pode di�cultar. Outra situação é que os objetivos da avaliação
podem variar.
A maioria dos métodos foca na precisão, por exemplo, nos �ltros colaborativos, usam métodos baseados em
vizinhos, como: similaridade do cosseno, person, vizinho mais próximo, entre outros. Para selecionar o melhor
modelo, usam-se algumas métricas de avaliações, que podem ser divididas em quatro grupos: precisão
preditiva, precisão de classi�cação, precisão de ranking e não precisão.
VIDEOAULA: SISTEMAS DE RECOMENDAÇÃO – DEFINIÇÃO, FILTROS
COLABORATIVOS E SELEÇÃO DE MODELOS
No vídeo, serão abordados conceitos básicos de sistemas de recomendações, como os elementos que a
compõem, ou seja, características pertinentes, como também de�nições de alguns tipos de algoritmos de
sistemas de recomendações. Ainda, serão apresentados alguns exemplos para que o aluno tenha em mente a
usabilidade desses tipos sistemas.
DETECÇÃO DE FRAUDES
A abordagem básica para detecção de fraude com um modelo analítico é identi�car possíveis preditores de
fraude associados a criminosos conhecidos e suas ações no passado. Os modelos de fraude mais poderosos são
os modelos de resposta ao cliente que são construídos com base em dados históricos. Caso a resposta à fraude
possa ser identi�cada, ela pode ser utilizada para caracterizar o comportamento do fraudador no ato de fraude
especí�co e em dados históricos.
As classi�cações supervisionadas são baseadas em alguma medida da verdadeira associação de classe de uma
determinada entidade. De acordo com Bolton e Hand (2002), a modelagem supervisionada tem a desvantagem
de exigir “certeza absoluta” de que cada evento pode ser classi�cado com precisão como fraude ou não fraude.
Além disso, os autores observam que qualquer modelo de fraude pode ser usado para detectar apenas os tipos
de fraude que foram identi�cados anteriormente.
Para visualizar o objeto, acesse seu material digital.
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=…15/18
Métodos não supervisionados de modelagem de fraude dependem da detecção de eventos anormais. Esses
eventos anormais devem ser caracterizados relacionando os eventos a sintomas associados a eventos
fraudulentos no passado. A classi�cação estatística como fraude por métodos não supervisionados não prova
que certos eventos são fraudulentos, mas apenas sugere que esses eventos devem ser considerados,
provavelmente, como fraudes passíveis de investigação adicional.
A análise de links é o método não supervisionado mais comum de detecção de fraudes. O processo de execução
da análise de link é conhecido como descoberta de link, ou Link Discovery (LD). O objetivo é encontrar links
ocultos entre padrões que parecem não estar relacionados. A abordagem é relacionar grupos e atividades a
algum comportamento, como fraude. O LD está relacionado, em um contexto mais amplo, ao recente
surgimento da análise de redes sociais.
VIDEOAULA: DETECÇÃO DE FRAUDES
Na mineração de dados tradicional, as entidades modeladas são variáveis que podem ser correlacionadas
(vinculadas) a outras variáveis em seu efeito sobre uma variável alvo. No LD, as entidades não são variáveis,
mas, sim, relacionamentos entre entidades. O LD avalia a probabilidade de que um determinado padrão em um
conjunto de dados (expressável em uma estrutura de dados grá�ca especí�ca) corresponda a algum padrão de
destino. Nesse sentido, o LD é muito “platônico” em sua busca pela verdade, em comparação com a abordagem
mais aristotélica dos métodos supervisionados de detecção de fraudes.
Alguns estudos importantes com aprendizado não supervisionado no que diz respeito à detecção de fraudes
devem ser mencionados. Por exemplo, Bolton e Hand (2002) usam a Análise de Grupo de Pares e a Análise de
Ponto de Interrupção aplicadas ao comportamento de gastos em contas de cartão de crédito. A Análise de
Grupo de Pares detecta objetos individuais que começam a se comportar de maneira diferente dos objetos aos
quais eram semelhantes anteriormente. Outra ferramenta que os autores desenvolveram para detecção de
fraude comportamental é a Análise de Ponto de Interrupção. Ao contrário da Análise de Grupo de Pares, a
Análise de Ponto de Interrupção opera no nível da conta. Um ponto de interrupção é uma observação em que
um comportamento anômalo para uma determinada conta é detectado. Ambas as ferramentas são aplicadas
no comportamento de gastos em contas de cartão de crédito. Uma combinação de métodos não
supervisionados e supervisionados para detecção de fraudes de cartão de crédito está na moda.
GMENTAÇÃO DE CLIENTES E DETECÇÃO DE ANOMALIAS
Segmentação de clientes
A segmentação de clientes é a prática de dividir os clientes de uma empresa em grupos que re�etem a
semelhança entre os clientes de cada grupo. O objetivo da segmentação de clientes é decidir como se relacionar
com os clientes em cada segmento, a �m de maximizar o valor de cada cliente para o negócio (LINDON et al.,
2009).
Uma abordagem adicional à segmentação de clientes é aproveitar os algoritmos de aprendizado de máquina
para descobrir novos segmentos. Diferente dos modelos de segmentação projetados por pro�ssionais de
marketing, por exemplo, como os descritos anteriormente, a segmentação de clientes de aprendizado de
máquina permite que algoritmos avançados apresentem insights e agrupamentos que os pro�ssionais de
marketing podem ter di�culdade em descobrir por conta própria.
Além disso, os pro�ssionais de marketing que criam um ciclo de feedback entre o modelo de segmentação e os
resultados da campanha terão segmentos de clientes cada vez melhores. Nesses casos, o modelo de
aprendizado de máquina poderá não apenas re�nar sua de�nição de segmentos mas também identi�car se um
subconjunto especí�co do segmento está superando o restante, otimizando o desempenho de marketing.
Detecção de anomalias
A detecção de anomalias (também conhecida como análise de outliers) é uma etapa na mineração de dados que
identi�ca pontos de dados, eventos e/ou observações que se desviam do comportamento normal de um
conjunto de dados. Dados anômalos podem indicar incidentes críticos, como uma falha técnica, ou
oportunidades potenciais, por exemplo, uma mudança no comportamento do consumidor. O aprendizado de
máquina está sendo usado progressivamente para automatizar a detecção de anomalias (HODGE; AUSTIN,
2004).
Para visualizar o objeto, acesse seu material digital.
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=… 16/18
A detecção bem-sucedida de anomalias depende da capacidade de analisar dados de séries temporais com
precisão em tempo real. Os dados de séries temporais são compostos por uma sequência de valores ao longo
do tempo. Isso signi�ca que cada ponto é normalmente um par de dois itens – um carimbo de data/hora para
quando a métrica foi medida e o valor associado a essa métrica naquele momento.
Os dados de séries temporais não são uma projeção em si. Em vez disso, é um registro que contém informações
necessárias para fazer suposições educadas sobre o que pode ser razoavelmente esperado no futuro. Os
sistemas de detecção de anomalias usam essas expectativas para identi�car sinais acionáveis em seus dados,
descobrindo discrepâncias nos principais KPIs (Key Performance Indicator) para alertá-lo sobre os principais
eventos em sua organização (DOKAS et al., 2002).
VIDEOAULA: GMENTAÇÃO DE CLIENTES E DETECÇÃO DE ANOMALIAS
Segmentação de clientes
A segmentação de clientes é o processo de dividir os clientes em grupos com base em características comuns,
para que as empresas possam comercializar para cada grupo de forma e�caz e adequada.
No marketing business-to-business, uma empresa pode segmentar clientes de acordo com uma ampla gama de
fatores, incluindo:
• Indústria.
• Número de empregados.
• Produtos adquiridos anteriormente à empresa.
• Localização.
A segmentação permite que os pro�ssionais de marketing adaptem melhor seus esforços de marketing para
vários subconjuntos de público. Esses esforços podem estar relacionados tanto à comunicação quanto ao
desenvolvimento de produtos.
Detecção de anomalias
Dependendo do seu modelo de negócios e caso de uso, a detecção de anomalias de dados de séries temporais
pode ser usada para métricas valiosas, como:
• Visualizações de página da web.
• Usuários ativos diariamente.
• Instalações de aplicativos móveis.
• Custo por clique.
• Custos de aquisição de clientes.
• Taxa de rejeição.
• Taxa de rotatividade.
• Receita por clique.
• Volume de transações.
• Valor médio do pedido.
A detecção de anomalias de dados de séries temporais deve, primeiro, criar uma linha de base para o
comportamento normal nos KPIs primários. Com essa linha de base compreendida, os sistemas de detecção de
anomalias de dados de séries temporais podem rastrear a sazonalidade – os padrões cíclicos de
comportamento nos principais conjuntos de dados. Uma abordagem manual pode ajudar a identi�car dados
sazonais em um grá�co de dados, mas, quando você precisa escalar para milhares ou milhões de métricas, o
rastreamento de dados de séries temporais e a detecção de anomalias precisam ser automatizados para
fornecer informações comerciais valiosas. A Figura 2 apresenta uma anomalia na temperatura com alguns
picos.
Figura 2 | Anomalia de temperatura
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=… 17/18
Fonte: elaborada pelo autor.
ESTUDO DE CASO
Com base nos assuntos abordados nessa aula e visando a um melhor entendimento do ensino/aprendizagem,
faça uma análise de situações em que possam ser incluídas as aplicações diferentes citadas nos blocos e
justi�car a importânciadelas. Os exemplos são dos seguintes assuntos: sistemas de recomendações para
viagens, detecção de fraude em sites ou APP e detecção de anomalias em aplicações em saúde.
RESOLUÇÃO DO ESTUDO DE CASO
Para sistemas de recomendações, podemos pensar em um aplicativo para reserva de viagens, no qual o
histórico do usuário será a base para tomada de decisão no momento da recomendação. Por exemplo, João
quer viajar para Fernando de Noronha, porém ele quer �car em um resort próximo da praia, com piscina,
academia e café da manhã incluso. O sistema fará uma busca de locais com as mesmas similaridades e, após
isso, será recomendado para o usuário. A importância dessa aplicação ajudará em uma tomada de decisão mais
assertiva e rápida.
Para detecção de fraude, um exemplo seria uma aplicação real em sites de compras, por exemplo, Mercado
Livre, com o login de uma vítima. O fraudador tentaria fazer várias compras em intervalos pequenos e em
lugares que diferem do comum. O sistema correlacionará o histórico dos locais que o usuário costuma comprar,
a velocidade e a quantidade de compras em um intervalo de tempo pequeno. Essas características são de suma
importância para enviar uma alerta de uma possível fraude.
Para detecção de anomalias, um exemplo seria de um eletrocardiograma (ECG). A presença de vários outliers
durante a análise do sinal das medições cardíacas poderia mitigar algum problema de arritmia cardíaca,
realizando, assim, uma prevenção da doença em estado inicial. A detecção de anomalias é uma técnica muito
usada em várias aplicações e tem uma grande importância em sistemas em tempo real.
Saiba mais
Seguem alguns links de materiais que possam auxiliar no entendimento. Neles, há conceitos introdutórios
e aplicações acerca dessa aula.
Vídeo que mostra algumas características básicas e exemplos de sistemas de recomendações:
https://www.youtube.com/watch?v=Eeg1DEeWUjA.
Material explicando na prática como trabalhar com identi�cação de outliers:
https://machinelearningmastery.com/how-to-identify-outliers-in-your-data/.
Material que traz todos os detalhes de detecção de anomalias: https://medium.com/the-data-
dynasty/anomaly-detection-in-google-analytics-a-new-kind-of-alerting-9c31c13e5237.
Para visualizar o objeto, acesse seu material digital.
Para visualizar o objeto, acesse seu material digital.
REFERÊNCIAS
https://www.youtube.com/watch?v=Eeg1DEeWUjA
https://machinelearningmastery.com/how-to-identify-outliers-in-your-data/
https://medium.com/the-data-dynasty/anomaly-detection-in-google-analytics-a-new-kind-of-alerting-9c31c13e5237
02/09/23, 23:00 wlldd_222_u3_mac_lea_ii
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=frederico.sousa%40outlook.com&usuarioNome=FREDERICO+EMANUEL+GUIMARÃES+DE+SOUSA&disciplinaDescricao=&atividadeId=… 18/18
Aula 1
EVERITT, B. S. Cluster analysis. London: Heinemann Educational Books, 1993.
HAIR JÚNIOR, J. F. et al. Análise multivariada de dados. 6. ed. Porto Alegre, RS: Bookman, 2009.
HALKIDI, M.; BATISTAKIS, Y.; VAZIRGIANNIS, M. On clustering validation techniques. Journal of Intelligent
Information Systems, v. 17, p. 107-145, 2001.
HASTIE, T.; TIBSHIRANI, R.; FRIEDMAN, J. The elements of statistical learning. New York: Springer, 2001.
MACKAY, D. An Example Inference Task: Clustering. Information Theory, Inference and Learning Algorithms.
Cambridge: Cambridge University Press, 2003.
SEGARAN, T. Programming Collective Intelligence: building smart Web 2.0 applications. Newton,
Massachusetts: O'Reilly Media, 2007.
WITTEN, I. H.; FRANK, E.; HALL, M. A. Data Mining: practical machine learning tools and techniques. 4. ed.
Burlington, MA: Morgan Kaufmann, 2016.
Aula 2
HAYKIN, S. Redes Neurais: princípios e prática. Porto Alegre, RS: Bookman, 2001.
HAYKIN, S. Redes Neurais e Máquinas de Aprendizagem. 3. ed. Porto Alegre, RS: Bookman, 2008.
JIAN, Z. H. U.; CHEN, X. U.; WANG, H. Sentiment classi�cation using the theory of ANNs. The Journal of China
Universities of Posts and Telecommunications, v. 17, p. 58-62, 2010.
MCCULLOCH, W.; PITTS, W. Um cálculo lógico de ideias imanentes na atividade nervosa. Bulletin of
Mathematical Biophysic, v. 5, p. 115-133, 1943.
SILVA, I. N.; SPATTI, D. H.; FLAUZINO, R. A. Redes neurais arti�ciais para engenharia e ciências aplicadas:
curso prático. São Paulo, SP: Artliber, 2010.
SOUZA, D. et al. Model approach of a robotic manipulator 3DOF using Machine Learning. Journal on Advances
in Theoretical and Applied Informatics, v. 5, p. 1-4, 2019.
Aula 3
AGRAWAL, R.; IMIELIŃSKI, T.; SWAMI, A. Mining association rules between sets of items in large databases. ACM
SIGMOD, v. 22, n. 2, p. 207-216, jun. 1993.
PIATETSKY-SHAPIRO, G. Discovery, analysis, and presentation of strong rules. Cambridge, MA: AAAI/MIT
Press, 1991.
Aula 4
BOLTON, R.; HAND, D. J. Statistical fraud detection: a review. Statistical Science, v. 17, n. 3, p. 235-249, 2002.
DOKAS, P. et al. Data mining for network intrusion detection. [S. l.]: [s. n.], 2002.
FARHIN, M.; VIBHA, P.; MIHIR, P. A review on recommender systems. In: INTERNATIONAL CONFERENCE ON
INNOVATIONS IN INFORMATION, EMBEDDED AND COMMUNICATION SYSTEMS, 4., 2017, Coimbatore. Anais […].
Coimbatore, Índia: IEEE, 2017.
HODGE, V. J.; AUSTIN, J. A Survey of Outlier Detection Methodologies. Arti�cial Intelligence Review, v. 22, p. 85-
126, 2004.
LINDON D. et al. Mercator XXI: teoria e prática do marketing. 12. ed. Lisboa: Dom Quixote, 2009.
PRANAV, W.; VIVEK, K. S.; MANOJ, K. S. A Scientometric Analysis of Research in Recommender Systems. Journal
of Scientometric Research, v. 5, n. 1, p. 71-84, 2016.
10 minutos