Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

Universidade de São Paulo
Escola de Engenharia de Lorena
Um estudo da aplicação de
técnicas de machine learning
em pesquisas de geração de
energia
Grupo 3
Arnon Costa - 10718079
Gabriel Costa - 11014142
Guilherme Lucchesi - 10816047
Philip Silveira - 9910770
Kaique F Amaral - 10407127
Vitor Braz de Almeida - 11014159
2021
1 Introdução/Justificativa/Motivação
A partir de 1990 a técnica de machine learning começou a ser citada
por pesquisadores que trabalham na área de energia, isso se deve ao grande
aumento repentino dos dados gerados por dispositivos ao redor do mundo.
Podemos citar por exemplo satélites, que trabalham na previsão do tempo,
clima e previsão hidrológica. Não é muito dif́ıcil perceber as vantagens em
se trabalhar com machine learning quando se trata de big data.
De acordo com Willian Hsieh, em seu livro Machine learning methods
in the environmental sciences [1], em 2020 podemos chegar a 40 trilhões de
gigabytes de dados no mundo. Isso significa 2,2 milhões de terabytes de novos
dados gerados todos os dias [2]. As técnicas de machine learning são muito
utilizadas quando o ser humano começa a perder a capacidade de análise
dos dados e isso geralmente ocorre quando há uma quantidade muito grande.
Essas técnicas se baseiam na junção da estat́ıstica e da computação.
Tendo isso em vista, percebe-se que a complexidade de determinados
fenômenos requerem o uso de técnicas para a previsão de uma ocorrência de
interesse e também a otimização de processos já existentes.
1.1 O ińıcio da Inteligência Artificial
O conceito de máquinas pensantes não é um tema novo, ele surgiu há mais
de 100 anos e se tornou cada vez mais tanǵıvel à medida que os primeiros
computadores nasciam. Ele começou a penetrar no imaginário dos indiv́ıduos
em virtude do seu aparecimento nas grandes mı́dias de comunicação,filmes
e series americanas dos anos 50 como o Homem de Lata ou Tin Man de o
Magico de OZ e o robô humanoide de Metrópolis. E indo além do imaginário,
ao longo da década de 50 a humanidade teve o privilégio de contar com
inúmeros cientistas, matemáticos e filósofos. O principal desses cientistas
e maior protagonista no surgimento dos primeiros computadores foi Alan
Touring, um jovem britânico conhecimento por sua genialidade, em especial
a genialidade voltada à lógica computacional.
À época, Turing sugeriu em um paper de autoria própria denominado
Computing Machinery and Inteligence que, se humanos podem usar as in-
formações dispońıveis ao seu redor para tomar decisões racionais e resolver
problemas, por que as máquinas não poderiam fazer o mesmo?
Contudo, apesar da incŕıvel visão futurista de Turing, algo ainda impedia
o avanço das máquinas pensantes. Aqui, falamos da década de 50 e até 1949
1
Figura 1: Alan Turing.
Fonte:[3]
os computadores sequer conseguiam armazenar comandos e eram capazes
apenas de executá-los. Ou seja, de uma forma resumida, os computadores
eram capazes de aceitar ordens, porém não eram capazes de repeti-las. Um
outro fator determinante é que, via de regra, toda nova tecnologia é extre-
mamente cara e assim eram as máquinas da época. Por estes motivos, era
natural que apenas apenas aqueles com grandes recursos pudessem desfrutar
da tecnologia naquele momento, tal como grandes empresas ou centros de
pesquisas.
E apesar dos grandes desafios como custo e descrença, 1555 é conside-
rado como o ano onde deu-se o primeiro pontapé na inteligência artificial.
No ano, o conceito foi desenvolvido e aprimorado pelos pesquisadores Allen
Newell, Cliff Shaw e Herbert Simons no projeto denominado Logic Theorist.
O Logic Theorist era um programa financiado pela Corporação de Pesquisa
e Desenvolvimento ou Research and Development Corporation desenvolvido
para similar as capacidades de resolver problemas de um ser humano. Esse
projeto notável foi introduzido no Dartmouth Summer Research Project on
Artificial Intelligence.
1.2 A IA no mundo contemporâneo
Como vimos, a IA teve um ińıcio conturbado. Contudo, devido à redução
dos custos e à evolução nas capacidades de armazenamento e processamento
2
das máquinas, elas se tornaram mais “aplicáveis” e acesśıveis, o que levou a
mais pessoas entenderem como funcionam e quais algoritmos poderiam ser
aplicados na solução computacional de problemas reais.
Com o investimento do setor privado caracterizado por empresas como
IBM, por exemplo, as máquinas pensantes começaram a florescer e finalmente
atender às expectativas. Um dos maiores exemplos ocorreu em 1997 quando
o Deep Blue, um programa de computador desenvolvido pela IBM, venceu a
lenda do xadrez Gary Kasparov em uma partida.
Figura 2: Deep blue.
Fonte:[4]
Hoje vivemos na era da Big Data e somos capazes de coletar e proces-
sar quantidades nunca antes vistas de informações. E como já dissemos, um
dos maiores “amigos” da inteligência artificial é a grande quantidade de in-
formações dispońıveis. Nesse âmbito, as inteligências artificiais floresceram
de forma consistente nos mais diversos setores como tecnologia, mercado fi-
nanceiro, marketing e até mesmo entretenimento.
Agora, apesar de termos supercomputadores a até mesmo computadores
quânticos, passamos a esbarrar em algoritmos cada vez mais complexos que
permitam com que as máquinas sejam finalmente capazes de assimilar a
complexidade do pensamento humano por outra forma além da força bruta
3
de infinitas tentativas e erros. A Lei de Moore prediz que a velocidade e
a velocidade dos computadores, em média, dobra a cada ano que se passa,
porém aparentemente estamos chegando ao ponto de convergência dela.
Atualmente caminhamos a passos largos no tocante às inteligências arti-
ficiais e os sinais para o setor são promissores. Um bom exemplo é ligar para
10 ou 20 companhias e contar em quantas delas o atendimento será realizado
por uma inteligência artificial ou ao menos um algoritmo que simula muito
bem as respostas humanizadas. Agora nos resta esperar para ver o que o
futuro reserva, sejam carros inteligentes, software ou até mesmo androides
que simulem o comportamento e a tomada de decisão de um ser vivo.
1.3 Aplicações de IA: Sistemas de Geração de Energia
Muitos sistemas que tem por objetivo gerar energia tais como: eólica,
solar, geotérmica, entre outras; necessitam de informações ambientais. Neste
contexto, metodologias de predição (forecasting) para condições meteorológicas
são um ponto central para a geração eficiente de energia [1].
Essas previsões de variáveis meteorológicas podem ser aplicadas de tal
forma a possibilitar a visualização de uma área de previsão de NWP (Previsão
numérica do tempo) ampla como um conjunto de mapas de caracteŕısticas
(as variáveis climáticas individuais) tendo uma estrutura espacial (aquela da
geografia subjacente) da mesma forma que os canais RGB de uma imagem
correspondem a mapas de caracteŕısticas com um estrutura bidimensional
[5]. Dessa forma, pode-se realizar a predição referente à quantidade de ener-
gia que será gerada em determinado peŕıodo dentro das condições espaciais
estabelecidas.
2 Objetivos
2.1 Objetivos Gerais
Nesse trabalho exploramos as atuais técnicas de Machine Learning uti-
lizadas em pesquisas relevantes em sistemas de geração de energia e áreas
correlatas assim como as maneiras nas quais essa tecnologia vem sendo em-
pregada, destacando dificuldades inerentes à geração de energia.
4
2.2 Objetivos Espećıficos
A partir dos objetivos gerais descritos acima foram definidos objetivos
espećıficos descritos a seguir:
• Determinar as técnicas de machine learning mais utilizadas por pesqui-
sadores no estudo de sistemas de geração de energia
• Compreender o funcionamento das técnicas mais relevantes
• Explorar a forma com que essas técnicas são empregadas neste contexto
de geração de energia
3 Revisão bibliográfica ou Fundamentação teó-
rica
O ińıcio de redesneurais se deu por volta de 1943 com neurofisiologista
Warren McCulloch e o matemático Walter Pitts. Em seu artigo ”A logical
Calculus of the ideas immanent in nervous activity”[6] eles fazem uma ana-
logia entre o funcionamento eletrônico e o celular. Com o passar do tempo,
houve muitas pesquisas na área, porém, nem todos de muita relevância.
Uma pesquisa de muito destaque, foi o de Franl Rosenblatt em 1959, que
na Universidade de Cornell criou uma rede de múltiplos neurônios do tipo
discriminadores lineares e batizou de perceptron, Rosenblatt é considerado o
pai da neuro computação.
3.1 Redes Neurais Artificiais e Deep Learning
A redes neurais artificiais ou deep learning foi a técnica mais citada dentre
a literatura referente à aplicações em sistemas de energia, por diversos fatores.
Para entendermos esse método é importante conhecer o funcionamento
dos neurônios que trocam informações entre si. Neurônio é uma célula ner-
vosa composta por um corpo celular contendo o núcleo e diversas ramificações
que são chamadas de dendritos e uma longa extensão chamada axônio. Os
neurônios recebem impulsos elétricos por meio das sinapses, que são conec-
tadas nos dendritos de outros neurônios. nós interconectados que funcionam
como os neurônios do cérebro humano.Portanto, as redes neurais, utilizando
algoritmos, podem reconhecer padrões escondidos e correlações em dados
5
brutos, agrupá-los e classificá-los, e – com o tempo – aprender e melhorar
continuamente.
A rede neural é um processador paralelamente distribúıdo constitúıdo de
unidades de processamento simples. Essas unidades armazenam conhecimen-
tos experimentais. O processo para realizar o aprendizado é por meio de um
algoritmo de Machine Learning, cuja função é modificar os pesos da rede
para alcançar um objetivo final. A informação é passada através de cada
camada, com a sáıda da camada anterior fornecendo entrada para a próxima
camada. A primeira camada em uma rede é chamada de camada de entrada,
enquanto a última é chamada de camada de sáıda. Todas as camadas entre
as duas são referidas como camadas ocultas. Cada camada é tipicamente
um algoritmo simples e uniforme contendo um tipo de função de ativação.
Quando temos só uma camada oculta, chamamos de redes neurais, quando
são várias, chamamos de deep learning.
Existem tipos diferentes de redes neurais profundas, cada um deles possui
vantagens e desvantagens, dependendo do uso. Elas serão explicadas deta-
lhadamente no próximo trabalho no tópico de redes neurais e deep learning.
Os tipos são: redes neurais convolucionaais(RNCs), redes neurais recorrente
(RNRs), redes neurais feedforward, redes neurais autoencoder. Resumindo,
uma rede neural simples inclui uma camada de entrada, outra de sáıda (ou
alvo) e, entre elas, uma camada oculta. As camadas são conectadas através
de nós e essas conexões formam uma ”rede” – a rede neural – de nós inter-
conectados e deep learning são várias dessas camadas.
3.2 Support Vector Machines (SVM)
Conhecido por todos os experts em ML, SVM é muito utilizado tanto em
classificação, quanto em regressão. Os resultados da aplicação dessa técnica
são comparáveis e muitas vezes superiores aos obtidos por outros algoritmos
de aprendizado, como as Redes Neurais Artificiais (RNAs) e as árvores de
decisão. O objetivo dele é encontrar um hiperplano que faça uma divisão
(fronteira), que separe os espaços amostrais em áreas similares. Essa linha
busca maximizar a distância entre os pontos mais próximos em relação a cada
uma das classes. Por exemplo na imagem abaixo, não podemos identificar
qual a melhor linha.
6
Figura 3: Gráfico exemplificando a dificuldade de dividir um espaço amostral.
Fonte:[7]
Achar esse plano não é muito fácil, para isso ele utiliza os vetores de
suporte, próximos da reta, que o ajuda a definir a reta desejada, como pode-
mos ver na imagem abaixo, as retas de suporte passam pelos pontos verdes
e azuis:
Figura 4: Exemplificação do uso de vetores suporte.
Fonte:[8]
Se os grupos não forem linearmente separáveis, nós inserimos o conceito
7
de margem fraca, que é permitir alguns erros porém penalizando. O hiper-
parâmetro nesse contexto é o c [9], quanto maior o c, maior a penalização.
3.3 Árvores de Decisão
Esse método supervisionado e não-paramétrico, também é muito utilizado
em tarefas de classificação e regressão. Lembrando que não paramétrico signi-
fica em estat́ıstica que não conhecemos os dados previamente, supervisionado
significa que temos um label. A ideia de árvore de decisão é bem simples,
em termos mais genéricos podemos fazer uma árvore de decisão própria, sem
o aux́ılio do computador. Um fluxograma de decisão de uma empresa é o
seguinte:
Figura 5: Fluxograma de decisão exemplo para uma empresa.
Fonte:[10]
Podemos observar nesta imagem que a árvore é formada por uns retângulos
que são estruturas de dados que armazenam informações, esses retângulos são
chamados de nós, que são responsáveis pelas bifurcações, geralmente essas
divisões são em dois ramos, porém é bom deixar claro que existem algu-
mas sofisticações de algoritmos que não obedecem essa tendência. O nó que
8
apresenta a pergunta , tem uma classificação hierárquica, que possui muita
influência nos métodos que explicarei nos dois próximos tópicos. O nó que
fica no topo da árvore, que é de onde saem os dois primeiros ramos é chamado
de nó raiz, os seus filhos se segmentam , até chegar em um nó que não se
divide mais, esse nó é chamado de nó folha.
Na parte computacional podemos ver mais um exemplo, também genérico,
que é de classificação. Suponha que temos algumas caracteŕısticas de um
objeto como altura, largura e comprimento. Esses dados de objetos distintos
(no exemplo são três) são analisados e formam a figura da esquerda.
Figura 6: Classificação dos dados em três categorias distintas.
Fonte:[11]
Então, queremos montar uma algoritmo de árvore de decisão que consiga
classificar o próximo objeto dos três que tenho. Com base na figura da
esquerda, cada cor significa uma classe de objetos, o algoritmo vai fazer uma
divisão, ali representada pela linha amarela. Agora vamos analisar de novo
e tentar fazer mais subdivisões, da esquerda para a direita, podemos notar
que não é mais necessário fazer divisões nos objetos representados pela cor
amarela, pois já é pura( é importante deixar claro que sempre em árvores de
decisão o objetivo é concentrar classes puras), esse nó (amarelo) chamamos
de nó folha. Portanto,continuando a varredura, na parte direita da linha
amarela, temos que fazer subdivisões.
Então , queremos montar uma algoritmo de árvore de decisão que consiga
classificar o próximo objeto dos três que tenho. Com base na figura da
9
esquerda, cada cor significa uma classe de objetos, o algoritmo vai fazer uma
divisão, ali representada pela linha amarela. Agora vamos analisar de novo
e tentar fazer mais subdivisões, da esquerda para a direita, podemos notar
que não é mais necessário fazer divisões nos objetos representados pela cor
amarela, pois já é pura (é importante deixar claro que sempre em árvores de
decisão o objetivo é concentrar classes puras), esse nó (amarelo) chamamos
de nó folha. Portanto,continuando a varredura, na parte direita da linha
amarela, temos que fazer subdivisões.
Como foi dito, a ideia não é complexa e é fácil de interpretar, porém os
algoritmos de árvore tem muitos problemas e podem sim ficar dif́ıceis. Uma
das tarefas dela também é escolher o preditor usado em cada ponto, uma
das sua peculiaridades é que ela realiza seleção de variáveis, ou seja, se uma
variável não é importante, é automaticamente exclúıda. A profundidade da
árvore também é controlada por ela, mas nós podemos interferir para evitar
o sobre-ajuste.
Existem muitas técnicas para a criação dessas árvores,uma das mais
encontradas na literatura é o CART (classification and regression tree). Ele
procura entre todos os valores de todos os preditores aqueles que apresentam
a melhor divisão em dois grupos. Em regressão ele minimiza a soma dos
erros quadráticos dos dois grupos e em classificação ele permite maior pureza
entre os dois grupos dando alguns pesos nessas divisões. É continuada até
certo limites, esses limites podem ser: número mı́nimo de amostra e se não
consegue mais diminuir a pureza.
Como um dos principais problemas desse tipo de técnica é o sobre-ajuste,
nós temos como solução o bagging(bootstrap aggregation), que seleciona
amostras aleatórias dos dados de treino. Lembrando que tem que ser com
reposição esse sorteio. O resultado final no caso de regressão é a média e
no caso de classificação é por voto, por isso temos o peso. O problema do
bagging é o limite computacional, porque geralmente são várias árvores, cada
uma tomando regras diferentes e o resultado ser a média. Com essa instabi-
lidade na acurácia que as árvores oferecem, podemos ser criativos e sortear
preditores em cada nó, mas isso veremos na próxima técnica.
3.4 Random Forest
Para evitar o overfitting geralmente gerado pelas árvores de decisões gran-
des, foi criado uma técnica que sorteia os preditores depois combina as árvores
geralmente treinado pelo método bagging (a ideia principal do método bag-
10
ging é que a combinação de modelos de predição aumente o resultado geral).
Por essa floresta aleatória ser um esemble, possui excelentes resultados mesmo
sem ajustes de hiper- parâmetros. E também um dos algoritmos mais utiliza-
dos, devido à sua simplicidade é o fato de que pode ser utilizado para tarefas
de classificação e também de regressão. O algoritmo de floresta aleatória
adiciona aleatoriedade extra ao modelo, quando está criando as árvores. Ao
invés de procurar pela melhor caracteŕıstica ao fazer a partição de nodos,
ele busca a melhor caracteŕıstica em um subconjunto aleatório das carac-
teŕısticas. Este processo cria uma grande diversidade, o que geralmente leva
a geração de modelos melhores.
Figura 7: Simplificação do modelo Random Forest demonstrando como
ocorre a adição de aleatoriedade.
Fonte:[12]
Em resumo, o algoritmo de florestas aleatórias cria várias árvores de de-
cisão e as combina para obter uma predição com maior acurácia e mais
estável. Além disso ela é uma ferramenta (geralmente) rápida, simples e
flex́ıvel, embora apresente algumas limitações.
11
3.5 Gradient Boosted Trees
Um método que recentemente vem ganhando popularidade por causa dos
resultados em competições como o Kaggle. O prinćıpio por trás dos algo-
ritmos gradient boosted é basicamente a combinação do resultado de vários
classificadores fracos, se combinando para formar uma espécie de comitê forte
de decisão, ou seja combina predições de modelos fracos para construir um
comitê poderoso, responsável pela predição final. Então, há o treinamento
de modelos sequenciais , cada um tentando corrigir o anterior por meio do
ajuste de reśıduos.
3.6 Importância do trabalho com dados para a Geração
de Energia
O uso de dados para a geração e energia é de suma importância prin-
cipalmente para realizar previsões do tempo e monitoramento de condições
dos maquinários. Abaixo estão listados os dois métodos mais utilizados nos
casos citados acima.
3.6.1 Numerical Weather Prediction (NWP)
O modelo NWP se tornou uma ferramenta essencial para a ciência am-
biental, sendo utilizado principalmente na previsão climática. São equações
da mecânica dos fluidos que são empregadas para descreverem o comporta-
mento da atmosfera. O modelo de previsão numérica do tempo, não é linear
e não apresenta uma solução anaĺıtica, sendo assim, é necessário utilizar
procedimentos numéricos, em função do tempo, que possibilitem o cálculo
de parâmetros caracteŕısticos da atmosfera, levando em consideração valores
já observados e conhecidos pela meteorologia. Tal método é empregado na
geração de energia eólica e solar, por exemplo [13].
3.6.2 Condition monitoring - CM
O monitoramento de condição envolve observar componente de um ma-
quinário como uma turbina eólica, e evidenciar mudanças no modo opera-
cional que podem indicar falhas no maquinário. Esse método se baseia em
análises de medições e caracteŕısticas espećıficas da operação como: medição
de deformação, emissões acústicas, termografia e análise e vibração. Com
os avanços nos recursos computacionais como gerenciamento de big data e
12
machine learning, foi posśıvel expandir o poder anaĺıtico desse método, tor-
nando fact́ıvel utilizar diferentes tipos de dados para facilitar informações e
confiabilidade para uma tomada de decisão eficaz [15].
4 Metodologia
Com o objetivo de determinar as técnicas mais utilizadas dentre o con-
texto de geração de energia, realizamos um grande levantamento de dados
utilizando a plataforma do portal de periódicos da capes em que foram usadas
palavras chaves para pesquisas como por exemplo: energy, machine learning,
renewable energy, wind energy, solar energy, gas, artificial intelligence e ou-
tras. Não é dif́ıcil perceber que muitos artigos não eram necessariamente
de produção de energia, portanto, foram coletados inicialmente só os arti-
gos que tinham essas palavras chaves para que em seguida fossem separados
aqueles que tratavam de geração de energia. A segunda etapa consistiu na
descrição das técnicas de M.L, para isso foi foi utilizado o livro ”Introduction
to Machine Learning with Python: A Guide for Data ”[14] .
Em seguida, foi feito um dataframe utilizando a bibilioteca pandas do
python, para termos uma base de dados e podermos classificar as categorias.
A classificação foi feita em python dentro do editor jupyter, usamos laços e
expressões regulares para podermos contar quantas vezes uma determinada
técnica foi citada, também utilizamos o matplotlib para plotar os gráficos.
Essa etapa foi muito importante para o passo seguinte, que era a classificação
das técnicas.
A seguir fizemos uma revisão. Novamente foi utilizado o portal de periódico
da capes para refazer o levantamento, adicionando assim mais alguns artigos.
A classificação consistiu em ler cada artigo (115) e ir adicionando cada artigo
em um editor de texto (google docs) compartilhado com o nosso grupo. Em
cada artigo adicionado a este drive havia o ano, a classificação, local, e qual
área da energia é pesquisada.
13
5 Resultados esperados
5.1 Como Machine Learning é utilizado em sistemas
de geração de energia
Por meio dos artigos analisados, observando o NWP foram utilizados
aplicações de DNN (deep neural networks) que tratam de deep learning e re-
des neurais, como por exemplo na geração de energia eólica. Foram utilizadas
redes neurais artificiais na previsão da geração de aerogeradores de um par-
que nos Estados Unidos, onde empregou-se medições de torres e comparou-se
o desempenho com os resultados da curva de potência do fabricante. Além
disso, Von Bremen utilizou as redes neurais para tentar prever a geração de
um parque eólico no mar. As redes neurais utilizaram a velocidade do vento
de modelos NWP [13].
Ademais, foi proposto um esquema de previsão de geração eólica testado
em um parque chinês, onde empregou-se redes neurais artificias. A geração
era prevista diretamente pela rede neural com um horizonte de 24 horas e
resolução temporal de 15 minutos. Eles também fizeram um teste sobre os
dados de velocidade obtidos pelo modelo NWP antes desses alimentarem a
rede neural. O sistema proposto foi considerado com uma boa performance
de previsão de geração eólica [13].
Por meio dos artigos, também foi posśıvel perceber a importância da
utilização de dados e machine learning no método de CM, no qual foi empre-
gado diversos procedimentosde aprendizado de máquina como Boosting Tree
Algorithms (BTAs), Support Vector Machine (SVMs) em turbinas eólicas.
Os procedimentos de ML foram utilizados principalmente com o objetivo de
discriminar posśıveis falhas em diferentes ńıveis granularidade [15].
Temos ainda que o SVM é um dos modelos mais populares na previsão
de geração eólica. SVM é frequentemente usado para conjuntos de dados
complexos. Eles realizam classificação linear/não linear ou regressões, en-
contrando hiperplanos de limite de decisão que melhor separa as classes.
Tal como acontece com outras classes de algoritmos de aprendizagem,
o SVM pode ser usados como classificadores (onde uma variável nominal é
prevista) ou regressores (onde uma variável numérica é prevista). Os SVMs
sempre encontram o mı́nimo global ao realizar a otimização no conjunto de
treinamento. Além disso, os SVMs podem ser lentos e o treinamento em
grandes conjuntos de dados continua sendo um desafio.[13]
14
5.2 Ranking das técnicas mais utilizadas
Para criar ranking com as técnicas de machine learning mais utilizadas
na área de energia para determinadas aplicações, o pesquisador utiliza várias
técnicas e algoritmos distintos, e pega o melhor resultado. É extremamente
importante testar diversas técnicas para um problema, pois para cada pro-
blema uma técnica diferente pode ser mais eficaz, embora algumas sempre
se destacam mais que as outras.
De acordo com as publicações analisadas, criou-se um ranking das técnicas
mais utilizadas na área de energia. É notória a supremacia das redes neurais e
deep learning, apesar de não ser a recomendada para iniciantes essas técnicas
são muito precisas e permitem uma boa descrição de sistemas complexos,
não-lineares e com diversos parâmetros e variáveis.
Além disso, é importante esclarecer que muitas técnicas foram deixa-
das de lado, algumas por não serem muitas vezes citadas, outras por falta
de coerência, pois todas essas que citamos são técnicas de aprendizado su-
pervisionado. Foram analisadas 115 publicações, entre as quais 102 foram
identificadas as técnicas, porém esse número ainda está crescendo. A figura
abaixo mostra a relação:
Figura 8: Ranking das técnicas de ML nos artigos analisados.
Fonte: Autoria própria
Relevante ressaltar que além de Redes Neurais ou Deep Learning e SVM
15
serem as técnicas mais utilizadas dentre os artigos analisados, frequentemente
estas eram utilizadas em conjunto, complementando o modelo final para uma
melhor eficiência e acurácia.
6 Conclusão
De acordo com o exposto, percebemos que a utilização das técnicas de
machine learning vem sendo empregada amplamente em diversos páıses em
sistemas de geração de energia.
As previsões referentes à condições climáticas como o os modelos de NWP
são essenciais para sistemas como geração de energia solar, onde a incidência
solar e temperatura ambiente são essenciais para a modelagem do sistema e
projeções de produção futura.
Ademais, no contexto da engenharia, previsões poderiam gerar insights
sobre melhoramento de equipamentos e estruturas visando maior produtivi-
dade e menor custo, como no Condition Monitoring (CM). Tais previsões são
úteis em sistemas como de energia eólica onde é necessário o monitoramento
das pás e da haste para que se evite o mal funcionamento do equipamento e
gastos em reparos que poderiam ser evitados.
Ao realizar o ranking das técnicas mais utilizadas em artigos relevantes
na àrea de geração de energia, pode-se determinar que as Redes Neurais ou
Deep Learning e SVM são as técnicas empregadas mais amplamente e que
parecem retornar bons modelos. Além destas, todas as principais técnicas de
ML foram descritas ao longo deste trabalho permitindo uma boa compreensão
do funcionamento das mesmas.
Por fim, pode-se explorar tópicos como NWP, CM e predição de ener-
gia gerada; nos quais ficou evidente a necessidade do emprego de técnicas
numéricas computacionais tais como de Machine Learning citadas ao longo
deste trabalho, devido à grande quantidade de dados, diversos parâmetros,
caracteŕısticas não-lineares e outros motivos.
Referências
[1] HSIEH, William Wei. Machine Learning Methods in the Environmental
Sciences: neural networks and kernels. New York: Cambridge University
Press, 2009. 1, 4
16
[2] Willian W. Hsieh. Machine learning methods in the environmental sci-
ences, Cambridge University Press, 2018. 1
[3] 17 fatos e curiosidades sobre a vida de Alan Turing. Dispońıvel em:
https://revistagalileu.globo.com/Cultura/noticia/2018/06/17-fatos-e-
curiosidades-sobre-vida-do-alan-turing.html. Acesso em: 13 jun. 2021.
2
[4] Deep Blue. HOW IBM’s Deep Blue Beat World Champion Chess Player
Garry Kasparov. IEE SPECTRUM. Acesso em 03 Jun 2021, Dsi-
pońıvel em ¡ https://spectrum.ieee.org/the-institute/ieee-history/how-
ibms-deep-blue-beat-world-champion-chess-player-garry-kasparov 3
[5] Dı́az–Vico, D., Torres–Barrán, A., Omari, A. et al. Deep Neural
Networks for Wind and Solar Energy Prediction. Neural Process Lett
46, 829–844 (2017). https://doi.org/10.1007/s11063-017-9613-7 4
[6] Warren S. MucCulloch e Walter Pitts. A logical Calculus of the ideas im-
manent in nervous activity - Bulletin of Mathematical Biophysics (1943).
5
[7] SUPPORT Vector Machine — Introduction to Machine Learning
Algorithms. Dispońıvel em: https://towardsdatascience.com/support-
vector-machine-introduction-to-machine-learning-algorithms-
934a444fca47. Acesso em: 12 jun. 2021. 7
[8] VISUALIZING the effect of hyperparameters on Support Vector Ma-
chines. Dispońıvel em: https://towardsdatascience.com/visualizing-the-
effect-of-hyperparameters-on-support-vector-machines-b9eef6f7357b.
Acesso em: 2 jun. 2021. 7
[9] UMA INTRODUÇÃO às Support Vec-
tor Machines. [S. l.], 2007. Dispońıvel em:
https://pdfs.semanticscholar.org/8469/81890b81ae5d9ff5cedfcdbd99150a8bde13.pdf.
Acesso em: 10 jun. 2021. 8
[10] APRENDA A Fazer A Árvore De Decisão Para Facilitar A Tomada
De Decisões. Dispońıvel em: https://cromasolutions.com.br/aprenda-
a-fazer-a-arvore-de-decisao-para-facilitar-a-tomada-de-decisoes/. Acesso
em: 15 jun. 2021. 8
17
[11] SKLEARN [U+5B66][U+4E60][U+4E4B][U+5206][U+7C7B][U+6811].
Dispońıvel em: https://www.cnblogs.com/zhoukui/p/8883409.html.
Acesso em: 13 jun. 2021. 9
[12] RANDOM forest. Dispońıvel em: https://en.wikipedia.org/wiki/Random forest.
Acesso em: 15 jun. 2021. 11
[13] FARIAS, João Gabriel de. MACHINE LEARNING APLICADO À
PREVISÃO DE GERAÇÃO DE ENERGIA EÓLICA COM DIFEREN-
TES MODELOS DE PREVISÃO NUMÉRICA DO TEMPO. 2020. 158
f. Tese (Doutorado) - Curso de Programa de Pós-Graduação em Enge-
nharia Mecânica, Universidade Federal de Santa Catarina, Florianópolis,
2020. 12, 14
[14] Sarah Guido Andreas C. Müller. Introduction to Machine Learning with
Python: A Guide for Data Scientists. O’REILLY, 2015. 13
[15] STETCO, Adrian; DINMOHAMMADI, Fateme; ZHAO, Xingyu;
ROBU, Valentin; FLYNN, David; BARNES, Mike; KEANE, John; NE-
NADIC, Goran. Machine learning methods for wind turbine condition
monitoring: a review. Renewable Energy, [S.L.], v. 133, p. 620-635, abr.
2019. Elsevier BV. http://dx.doi.org/10.1016/j.renene.2018.10.047. 13,
14
18
	Introdução/Justificativa/Motivação
	O início da Inteligência Artificial
	A IA no mundo contemporâneo
	Aplicações de IA: Sistemas de Geração de Energia
	Objetivos
	Objetivos Gerais
	Objetivos Específicos
	Revisão bibliográfica ou Fundamentação teórica
	Redes Neurais Artificiais e Deep Learning
	Support Vector Machines (SVM)
	Árvores de Decisão
	Random Forest
	Gradient Boosted Trees
	Importância do trabalho com dados para a Geração de Energia
	Numerical Weather Prediction (NWP)
	Condition monitoring - CM
	Metodologia
	Resultados esperados
	Como Machine Learning é utilizado em sistemas de geração de energia
	Ranking das técnicas mais utilizadas
	Conclusão

Mais conteúdos dessa disciplina