Prévia do material em texto
Universidade de São Paulo Escola de Engenharia de Lorena Um estudo da aplicação de técnicas de machine learning em pesquisas de geração de energia Grupo 3 Arnon Costa - 10718079 Gabriel Costa - 11014142 Guilherme Lucchesi - 10816047 Philip Silveira - 9910770 Kaique F Amaral - 10407127 Vitor Braz de Almeida - 11014159 2021 1 Introdução/Justificativa/Motivação A partir de 1990 a técnica de machine learning começou a ser citada por pesquisadores que trabalham na área de energia, isso se deve ao grande aumento repentino dos dados gerados por dispositivos ao redor do mundo. Podemos citar por exemplo satélites, que trabalham na previsão do tempo, clima e previsão hidrológica. Não é muito dif́ıcil perceber as vantagens em se trabalhar com machine learning quando se trata de big data. De acordo com Willian Hsieh, em seu livro Machine learning methods in the environmental sciences [1], em 2020 podemos chegar a 40 trilhões de gigabytes de dados no mundo. Isso significa 2,2 milhões de terabytes de novos dados gerados todos os dias [2]. As técnicas de machine learning são muito utilizadas quando o ser humano começa a perder a capacidade de análise dos dados e isso geralmente ocorre quando há uma quantidade muito grande. Essas técnicas se baseiam na junção da estat́ıstica e da computação. Tendo isso em vista, percebe-se que a complexidade de determinados fenômenos requerem o uso de técnicas para a previsão de uma ocorrência de interesse e também a otimização de processos já existentes. 1.1 O ińıcio da Inteligência Artificial O conceito de máquinas pensantes não é um tema novo, ele surgiu há mais de 100 anos e se tornou cada vez mais tanǵıvel à medida que os primeiros computadores nasciam. Ele começou a penetrar no imaginário dos indiv́ıduos em virtude do seu aparecimento nas grandes mı́dias de comunicação,filmes e series americanas dos anos 50 como o Homem de Lata ou Tin Man de o Magico de OZ e o robô humanoide de Metrópolis. E indo além do imaginário, ao longo da década de 50 a humanidade teve o privilégio de contar com inúmeros cientistas, matemáticos e filósofos. O principal desses cientistas e maior protagonista no surgimento dos primeiros computadores foi Alan Touring, um jovem britânico conhecimento por sua genialidade, em especial a genialidade voltada à lógica computacional. À época, Turing sugeriu em um paper de autoria própria denominado Computing Machinery and Inteligence que, se humanos podem usar as in- formações dispońıveis ao seu redor para tomar decisões racionais e resolver problemas, por que as máquinas não poderiam fazer o mesmo? Contudo, apesar da incŕıvel visão futurista de Turing, algo ainda impedia o avanço das máquinas pensantes. Aqui, falamos da década de 50 e até 1949 1 Figura 1: Alan Turing. Fonte:[3] os computadores sequer conseguiam armazenar comandos e eram capazes apenas de executá-los. Ou seja, de uma forma resumida, os computadores eram capazes de aceitar ordens, porém não eram capazes de repeti-las. Um outro fator determinante é que, via de regra, toda nova tecnologia é extre- mamente cara e assim eram as máquinas da época. Por estes motivos, era natural que apenas apenas aqueles com grandes recursos pudessem desfrutar da tecnologia naquele momento, tal como grandes empresas ou centros de pesquisas. E apesar dos grandes desafios como custo e descrença, 1555 é conside- rado como o ano onde deu-se o primeiro pontapé na inteligência artificial. No ano, o conceito foi desenvolvido e aprimorado pelos pesquisadores Allen Newell, Cliff Shaw e Herbert Simons no projeto denominado Logic Theorist. O Logic Theorist era um programa financiado pela Corporação de Pesquisa e Desenvolvimento ou Research and Development Corporation desenvolvido para similar as capacidades de resolver problemas de um ser humano. Esse projeto notável foi introduzido no Dartmouth Summer Research Project on Artificial Intelligence. 1.2 A IA no mundo contemporâneo Como vimos, a IA teve um ińıcio conturbado. Contudo, devido à redução dos custos e à evolução nas capacidades de armazenamento e processamento 2 das máquinas, elas se tornaram mais “aplicáveis” e acesśıveis, o que levou a mais pessoas entenderem como funcionam e quais algoritmos poderiam ser aplicados na solução computacional de problemas reais. Com o investimento do setor privado caracterizado por empresas como IBM, por exemplo, as máquinas pensantes começaram a florescer e finalmente atender às expectativas. Um dos maiores exemplos ocorreu em 1997 quando o Deep Blue, um programa de computador desenvolvido pela IBM, venceu a lenda do xadrez Gary Kasparov em uma partida. Figura 2: Deep blue. Fonte:[4] Hoje vivemos na era da Big Data e somos capazes de coletar e proces- sar quantidades nunca antes vistas de informações. E como já dissemos, um dos maiores “amigos” da inteligência artificial é a grande quantidade de in- formações dispońıveis. Nesse âmbito, as inteligências artificiais floresceram de forma consistente nos mais diversos setores como tecnologia, mercado fi- nanceiro, marketing e até mesmo entretenimento. Agora, apesar de termos supercomputadores a até mesmo computadores quânticos, passamos a esbarrar em algoritmos cada vez mais complexos que permitam com que as máquinas sejam finalmente capazes de assimilar a complexidade do pensamento humano por outra forma além da força bruta 3 de infinitas tentativas e erros. A Lei de Moore prediz que a velocidade e a velocidade dos computadores, em média, dobra a cada ano que se passa, porém aparentemente estamos chegando ao ponto de convergência dela. Atualmente caminhamos a passos largos no tocante às inteligências arti- ficiais e os sinais para o setor são promissores. Um bom exemplo é ligar para 10 ou 20 companhias e contar em quantas delas o atendimento será realizado por uma inteligência artificial ou ao menos um algoritmo que simula muito bem as respostas humanizadas. Agora nos resta esperar para ver o que o futuro reserva, sejam carros inteligentes, software ou até mesmo androides que simulem o comportamento e a tomada de decisão de um ser vivo. 1.3 Aplicações de IA: Sistemas de Geração de Energia Muitos sistemas que tem por objetivo gerar energia tais como: eólica, solar, geotérmica, entre outras; necessitam de informações ambientais. Neste contexto, metodologias de predição (forecasting) para condições meteorológicas são um ponto central para a geração eficiente de energia [1]. Essas previsões de variáveis meteorológicas podem ser aplicadas de tal forma a possibilitar a visualização de uma área de previsão de NWP (Previsão numérica do tempo) ampla como um conjunto de mapas de caracteŕısticas (as variáveis climáticas individuais) tendo uma estrutura espacial (aquela da geografia subjacente) da mesma forma que os canais RGB de uma imagem correspondem a mapas de caracteŕısticas com um estrutura bidimensional [5]. Dessa forma, pode-se realizar a predição referente à quantidade de ener- gia que será gerada em determinado peŕıodo dentro das condições espaciais estabelecidas. 2 Objetivos 2.1 Objetivos Gerais Nesse trabalho exploramos as atuais técnicas de Machine Learning uti- lizadas em pesquisas relevantes em sistemas de geração de energia e áreas correlatas assim como as maneiras nas quais essa tecnologia vem sendo em- pregada, destacando dificuldades inerentes à geração de energia. 4 2.2 Objetivos Espećıficos A partir dos objetivos gerais descritos acima foram definidos objetivos espećıficos descritos a seguir: • Determinar as técnicas de machine learning mais utilizadas por pesqui- sadores no estudo de sistemas de geração de energia • Compreender o funcionamento das técnicas mais relevantes • Explorar a forma com que essas técnicas são empregadas neste contexto de geração de energia 3 Revisão bibliográfica ou Fundamentação teó- rica O ińıcio de redesneurais se deu por volta de 1943 com neurofisiologista Warren McCulloch e o matemático Walter Pitts. Em seu artigo ”A logical Calculus of the ideas immanent in nervous activity”[6] eles fazem uma ana- logia entre o funcionamento eletrônico e o celular. Com o passar do tempo, houve muitas pesquisas na área, porém, nem todos de muita relevância. Uma pesquisa de muito destaque, foi o de Franl Rosenblatt em 1959, que na Universidade de Cornell criou uma rede de múltiplos neurônios do tipo discriminadores lineares e batizou de perceptron, Rosenblatt é considerado o pai da neuro computação. 3.1 Redes Neurais Artificiais e Deep Learning A redes neurais artificiais ou deep learning foi a técnica mais citada dentre a literatura referente à aplicações em sistemas de energia, por diversos fatores. Para entendermos esse método é importante conhecer o funcionamento dos neurônios que trocam informações entre si. Neurônio é uma célula ner- vosa composta por um corpo celular contendo o núcleo e diversas ramificações que são chamadas de dendritos e uma longa extensão chamada axônio. Os neurônios recebem impulsos elétricos por meio das sinapses, que são conec- tadas nos dendritos de outros neurônios. nós interconectados que funcionam como os neurônios do cérebro humano.Portanto, as redes neurais, utilizando algoritmos, podem reconhecer padrões escondidos e correlações em dados 5 brutos, agrupá-los e classificá-los, e – com o tempo – aprender e melhorar continuamente. A rede neural é um processador paralelamente distribúıdo constitúıdo de unidades de processamento simples. Essas unidades armazenam conhecimen- tos experimentais. O processo para realizar o aprendizado é por meio de um algoritmo de Machine Learning, cuja função é modificar os pesos da rede para alcançar um objetivo final. A informação é passada através de cada camada, com a sáıda da camada anterior fornecendo entrada para a próxima camada. A primeira camada em uma rede é chamada de camada de entrada, enquanto a última é chamada de camada de sáıda. Todas as camadas entre as duas são referidas como camadas ocultas. Cada camada é tipicamente um algoritmo simples e uniforme contendo um tipo de função de ativação. Quando temos só uma camada oculta, chamamos de redes neurais, quando são várias, chamamos de deep learning. Existem tipos diferentes de redes neurais profundas, cada um deles possui vantagens e desvantagens, dependendo do uso. Elas serão explicadas deta- lhadamente no próximo trabalho no tópico de redes neurais e deep learning. Os tipos são: redes neurais convolucionaais(RNCs), redes neurais recorrente (RNRs), redes neurais feedforward, redes neurais autoencoder. Resumindo, uma rede neural simples inclui uma camada de entrada, outra de sáıda (ou alvo) e, entre elas, uma camada oculta. As camadas são conectadas através de nós e essas conexões formam uma ”rede” – a rede neural – de nós inter- conectados e deep learning são várias dessas camadas. 3.2 Support Vector Machines (SVM) Conhecido por todos os experts em ML, SVM é muito utilizado tanto em classificação, quanto em regressão. Os resultados da aplicação dessa técnica são comparáveis e muitas vezes superiores aos obtidos por outros algoritmos de aprendizado, como as Redes Neurais Artificiais (RNAs) e as árvores de decisão. O objetivo dele é encontrar um hiperplano que faça uma divisão (fronteira), que separe os espaços amostrais em áreas similares. Essa linha busca maximizar a distância entre os pontos mais próximos em relação a cada uma das classes. Por exemplo na imagem abaixo, não podemos identificar qual a melhor linha. 6 Figura 3: Gráfico exemplificando a dificuldade de dividir um espaço amostral. Fonte:[7] Achar esse plano não é muito fácil, para isso ele utiliza os vetores de suporte, próximos da reta, que o ajuda a definir a reta desejada, como pode- mos ver na imagem abaixo, as retas de suporte passam pelos pontos verdes e azuis: Figura 4: Exemplificação do uso de vetores suporte. Fonte:[8] Se os grupos não forem linearmente separáveis, nós inserimos o conceito 7 de margem fraca, que é permitir alguns erros porém penalizando. O hiper- parâmetro nesse contexto é o c [9], quanto maior o c, maior a penalização. 3.3 Árvores de Decisão Esse método supervisionado e não-paramétrico, também é muito utilizado em tarefas de classificação e regressão. Lembrando que não paramétrico signi- fica em estat́ıstica que não conhecemos os dados previamente, supervisionado significa que temos um label. A ideia de árvore de decisão é bem simples, em termos mais genéricos podemos fazer uma árvore de decisão própria, sem o aux́ılio do computador. Um fluxograma de decisão de uma empresa é o seguinte: Figura 5: Fluxograma de decisão exemplo para uma empresa. Fonte:[10] Podemos observar nesta imagem que a árvore é formada por uns retângulos que são estruturas de dados que armazenam informações, esses retângulos são chamados de nós, que são responsáveis pelas bifurcações, geralmente essas divisões são em dois ramos, porém é bom deixar claro que existem algu- mas sofisticações de algoritmos que não obedecem essa tendência. O nó que 8 apresenta a pergunta , tem uma classificação hierárquica, que possui muita influência nos métodos que explicarei nos dois próximos tópicos. O nó que fica no topo da árvore, que é de onde saem os dois primeiros ramos é chamado de nó raiz, os seus filhos se segmentam , até chegar em um nó que não se divide mais, esse nó é chamado de nó folha. Na parte computacional podemos ver mais um exemplo, também genérico, que é de classificação. Suponha que temos algumas caracteŕısticas de um objeto como altura, largura e comprimento. Esses dados de objetos distintos (no exemplo são três) são analisados e formam a figura da esquerda. Figura 6: Classificação dos dados em três categorias distintas. Fonte:[11] Então, queremos montar uma algoritmo de árvore de decisão que consiga classificar o próximo objeto dos três que tenho. Com base na figura da esquerda, cada cor significa uma classe de objetos, o algoritmo vai fazer uma divisão, ali representada pela linha amarela. Agora vamos analisar de novo e tentar fazer mais subdivisões, da esquerda para a direita, podemos notar que não é mais necessário fazer divisões nos objetos representados pela cor amarela, pois já é pura( é importante deixar claro que sempre em árvores de decisão o objetivo é concentrar classes puras), esse nó (amarelo) chamamos de nó folha. Portanto,continuando a varredura, na parte direita da linha amarela, temos que fazer subdivisões. Então , queremos montar uma algoritmo de árvore de decisão que consiga classificar o próximo objeto dos três que tenho. Com base na figura da 9 esquerda, cada cor significa uma classe de objetos, o algoritmo vai fazer uma divisão, ali representada pela linha amarela. Agora vamos analisar de novo e tentar fazer mais subdivisões, da esquerda para a direita, podemos notar que não é mais necessário fazer divisões nos objetos representados pela cor amarela, pois já é pura (é importante deixar claro que sempre em árvores de decisão o objetivo é concentrar classes puras), esse nó (amarelo) chamamos de nó folha. Portanto,continuando a varredura, na parte direita da linha amarela, temos que fazer subdivisões. Como foi dito, a ideia não é complexa e é fácil de interpretar, porém os algoritmos de árvore tem muitos problemas e podem sim ficar dif́ıceis. Uma das tarefas dela também é escolher o preditor usado em cada ponto, uma das sua peculiaridades é que ela realiza seleção de variáveis, ou seja, se uma variável não é importante, é automaticamente exclúıda. A profundidade da árvore também é controlada por ela, mas nós podemos interferir para evitar o sobre-ajuste. Existem muitas técnicas para a criação dessas árvores,uma das mais encontradas na literatura é o CART (classification and regression tree). Ele procura entre todos os valores de todos os preditores aqueles que apresentam a melhor divisão em dois grupos. Em regressão ele minimiza a soma dos erros quadráticos dos dois grupos e em classificação ele permite maior pureza entre os dois grupos dando alguns pesos nessas divisões. É continuada até certo limites, esses limites podem ser: número mı́nimo de amostra e se não consegue mais diminuir a pureza. Como um dos principais problemas desse tipo de técnica é o sobre-ajuste, nós temos como solução o bagging(bootstrap aggregation), que seleciona amostras aleatórias dos dados de treino. Lembrando que tem que ser com reposição esse sorteio. O resultado final no caso de regressão é a média e no caso de classificação é por voto, por isso temos o peso. O problema do bagging é o limite computacional, porque geralmente são várias árvores, cada uma tomando regras diferentes e o resultado ser a média. Com essa instabi- lidade na acurácia que as árvores oferecem, podemos ser criativos e sortear preditores em cada nó, mas isso veremos na próxima técnica. 3.4 Random Forest Para evitar o overfitting geralmente gerado pelas árvores de decisões gran- des, foi criado uma técnica que sorteia os preditores depois combina as árvores geralmente treinado pelo método bagging (a ideia principal do método bag- 10 ging é que a combinação de modelos de predição aumente o resultado geral). Por essa floresta aleatória ser um esemble, possui excelentes resultados mesmo sem ajustes de hiper- parâmetros. E também um dos algoritmos mais utiliza- dos, devido à sua simplicidade é o fato de que pode ser utilizado para tarefas de classificação e também de regressão. O algoritmo de floresta aleatória adiciona aleatoriedade extra ao modelo, quando está criando as árvores. Ao invés de procurar pela melhor caracteŕıstica ao fazer a partição de nodos, ele busca a melhor caracteŕıstica em um subconjunto aleatório das carac- teŕısticas. Este processo cria uma grande diversidade, o que geralmente leva a geração de modelos melhores. Figura 7: Simplificação do modelo Random Forest demonstrando como ocorre a adição de aleatoriedade. Fonte:[12] Em resumo, o algoritmo de florestas aleatórias cria várias árvores de de- cisão e as combina para obter uma predição com maior acurácia e mais estável. Além disso ela é uma ferramenta (geralmente) rápida, simples e flex́ıvel, embora apresente algumas limitações. 11 3.5 Gradient Boosted Trees Um método que recentemente vem ganhando popularidade por causa dos resultados em competições como o Kaggle. O prinćıpio por trás dos algo- ritmos gradient boosted é basicamente a combinação do resultado de vários classificadores fracos, se combinando para formar uma espécie de comitê forte de decisão, ou seja combina predições de modelos fracos para construir um comitê poderoso, responsável pela predição final. Então, há o treinamento de modelos sequenciais , cada um tentando corrigir o anterior por meio do ajuste de reśıduos. 3.6 Importância do trabalho com dados para a Geração de Energia O uso de dados para a geração e energia é de suma importância prin- cipalmente para realizar previsões do tempo e monitoramento de condições dos maquinários. Abaixo estão listados os dois métodos mais utilizados nos casos citados acima. 3.6.1 Numerical Weather Prediction (NWP) O modelo NWP se tornou uma ferramenta essencial para a ciência am- biental, sendo utilizado principalmente na previsão climática. São equações da mecânica dos fluidos que são empregadas para descreverem o comporta- mento da atmosfera. O modelo de previsão numérica do tempo, não é linear e não apresenta uma solução anaĺıtica, sendo assim, é necessário utilizar procedimentos numéricos, em função do tempo, que possibilitem o cálculo de parâmetros caracteŕısticos da atmosfera, levando em consideração valores já observados e conhecidos pela meteorologia. Tal método é empregado na geração de energia eólica e solar, por exemplo [13]. 3.6.2 Condition monitoring - CM O monitoramento de condição envolve observar componente de um ma- quinário como uma turbina eólica, e evidenciar mudanças no modo opera- cional que podem indicar falhas no maquinário. Esse método se baseia em análises de medições e caracteŕısticas espećıficas da operação como: medição de deformação, emissões acústicas, termografia e análise e vibração. Com os avanços nos recursos computacionais como gerenciamento de big data e 12 machine learning, foi posśıvel expandir o poder anaĺıtico desse método, tor- nando fact́ıvel utilizar diferentes tipos de dados para facilitar informações e confiabilidade para uma tomada de decisão eficaz [15]. 4 Metodologia Com o objetivo de determinar as técnicas mais utilizadas dentre o con- texto de geração de energia, realizamos um grande levantamento de dados utilizando a plataforma do portal de periódicos da capes em que foram usadas palavras chaves para pesquisas como por exemplo: energy, machine learning, renewable energy, wind energy, solar energy, gas, artificial intelligence e ou- tras. Não é dif́ıcil perceber que muitos artigos não eram necessariamente de produção de energia, portanto, foram coletados inicialmente só os arti- gos que tinham essas palavras chaves para que em seguida fossem separados aqueles que tratavam de geração de energia. A segunda etapa consistiu na descrição das técnicas de M.L, para isso foi foi utilizado o livro ”Introduction to Machine Learning with Python: A Guide for Data ”[14] . Em seguida, foi feito um dataframe utilizando a bibilioteca pandas do python, para termos uma base de dados e podermos classificar as categorias. A classificação foi feita em python dentro do editor jupyter, usamos laços e expressões regulares para podermos contar quantas vezes uma determinada técnica foi citada, também utilizamos o matplotlib para plotar os gráficos. Essa etapa foi muito importante para o passo seguinte, que era a classificação das técnicas. A seguir fizemos uma revisão. Novamente foi utilizado o portal de periódico da capes para refazer o levantamento, adicionando assim mais alguns artigos. A classificação consistiu em ler cada artigo (115) e ir adicionando cada artigo em um editor de texto (google docs) compartilhado com o nosso grupo. Em cada artigo adicionado a este drive havia o ano, a classificação, local, e qual área da energia é pesquisada. 13 5 Resultados esperados 5.1 Como Machine Learning é utilizado em sistemas de geração de energia Por meio dos artigos analisados, observando o NWP foram utilizados aplicações de DNN (deep neural networks) que tratam de deep learning e re- des neurais, como por exemplo na geração de energia eólica. Foram utilizadas redes neurais artificiais na previsão da geração de aerogeradores de um par- que nos Estados Unidos, onde empregou-se medições de torres e comparou-se o desempenho com os resultados da curva de potência do fabricante. Além disso, Von Bremen utilizou as redes neurais para tentar prever a geração de um parque eólico no mar. As redes neurais utilizaram a velocidade do vento de modelos NWP [13]. Ademais, foi proposto um esquema de previsão de geração eólica testado em um parque chinês, onde empregou-se redes neurais artificias. A geração era prevista diretamente pela rede neural com um horizonte de 24 horas e resolução temporal de 15 minutos. Eles também fizeram um teste sobre os dados de velocidade obtidos pelo modelo NWP antes desses alimentarem a rede neural. O sistema proposto foi considerado com uma boa performance de previsão de geração eólica [13]. Por meio dos artigos, também foi posśıvel perceber a importância da utilização de dados e machine learning no método de CM, no qual foi empre- gado diversos procedimentosde aprendizado de máquina como Boosting Tree Algorithms (BTAs), Support Vector Machine (SVMs) em turbinas eólicas. Os procedimentos de ML foram utilizados principalmente com o objetivo de discriminar posśıveis falhas em diferentes ńıveis granularidade [15]. Temos ainda que o SVM é um dos modelos mais populares na previsão de geração eólica. SVM é frequentemente usado para conjuntos de dados complexos. Eles realizam classificação linear/não linear ou regressões, en- contrando hiperplanos de limite de decisão que melhor separa as classes. Tal como acontece com outras classes de algoritmos de aprendizagem, o SVM pode ser usados como classificadores (onde uma variável nominal é prevista) ou regressores (onde uma variável numérica é prevista). Os SVMs sempre encontram o mı́nimo global ao realizar a otimização no conjunto de treinamento. Além disso, os SVMs podem ser lentos e o treinamento em grandes conjuntos de dados continua sendo um desafio.[13] 14 5.2 Ranking das técnicas mais utilizadas Para criar ranking com as técnicas de machine learning mais utilizadas na área de energia para determinadas aplicações, o pesquisador utiliza várias técnicas e algoritmos distintos, e pega o melhor resultado. É extremamente importante testar diversas técnicas para um problema, pois para cada pro- blema uma técnica diferente pode ser mais eficaz, embora algumas sempre se destacam mais que as outras. De acordo com as publicações analisadas, criou-se um ranking das técnicas mais utilizadas na área de energia. É notória a supremacia das redes neurais e deep learning, apesar de não ser a recomendada para iniciantes essas técnicas são muito precisas e permitem uma boa descrição de sistemas complexos, não-lineares e com diversos parâmetros e variáveis. Além disso, é importante esclarecer que muitas técnicas foram deixa- das de lado, algumas por não serem muitas vezes citadas, outras por falta de coerência, pois todas essas que citamos são técnicas de aprendizado su- pervisionado. Foram analisadas 115 publicações, entre as quais 102 foram identificadas as técnicas, porém esse número ainda está crescendo. A figura abaixo mostra a relação: Figura 8: Ranking das técnicas de ML nos artigos analisados. Fonte: Autoria própria Relevante ressaltar que além de Redes Neurais ou Deep Learning e SVM 15 serem as técnicas mais utilizadas dentre os artigos analisados, frequentemente estas eram utilizadas em conjunto, complementando o modelo final para uma melhor eficiência e acurácia. 6 Conclusão De acordo com o exposto, percebemos que a utilização das técnicas de machine learning vem sendo empregada amplamente em diversos páıses em sistemas de geração de energia. As previsões referentes à condições climáticas como o os modelos de NWP são essenciais para sistemas como geração de energia solar, onde a incidência solar e temperatura ambiente são essenciais para a modelagem do sistema e projeções de produção futura. Ademais, no contexto da engenharia, previsões poderiam gerar insights sobre melhoramento de equipamentos e estruturas visando maior produtivi- dade e menor custo, como no Condition Monitoring (CM). Tais previsões são úteis em sistemas como de energia eólica onde é necessário o monitoramento das pás e da haste para que se evite o mal funcionamento do equipamento e gastos em reparos que poderiam ser evitados. Ao realizar o ranking das técnicas mais utilizadas em artigos relevantes na àrea de geração de energia, pode-se determinar que as Redes Neurais ou Deep Learning e SVM são as técnicas empregadas mais amplamente e que parecem retornar bons modelos. Além destas, todas as principais técnicas de ML foram descritas ao longo deste trabalho permitindo uma boa compreensão do funcionamento das mesmas. Por fim, pode-se explorar tópicos como NWP, CM e predição de ener- gia gerada; nos quais ficou evidente a necessidade do emprego de técnicas numéricas computacionais tais como de Machine Learning citadas ao longo deste trabalho, devido à grande quantidade de dados, diversos parâmetros, caracteŕısticas não-lineares e outros motivos. Referências [1] HSIEH, William Wei. Machine Learning Methods in the Environmental Sciences: neural networks and kernels. New York: Cambridge University Press, 2009. 1, 4 16 [2] Willian W. Hsieh. Machine learning methods in the environmental sci- ences, Cambridge University Press, 2018. 1 [3] 17 fatos e curiosidades sobre a vida de Alan Turing. Dispońıvel em: https://revistagalileu.globo.com/Cultura/noticia/2018/06/17-fatos-e- curiosidades-sobre-vida-do-alan-turing.html. Acesso em: 13 jun. 2021. 2 [4] Deep Blue. HOW IBM’s Deep Blue Beat World Champion Chess Player Garry Kasparov. IEE SPECTRUM. Acesso em 03 Jun 2021, Dsi- pońıvel em ¡ https://spectrum.ieee.org/the-institute/ieee-history/how- ibms-deep-blue-beat-world-champion-chess-player-garry-kasparov 3 [5] Dı́az–Vico, D., Torres–Barrán, A., Omari, A. et al. Deep Neural Networks for Wind and Solar Energy Prediction. Neural Process Lett 46, 829–844 (2017). https://doi.org/10.1007/s11063-017-9613-7 4 [6] Warren S. MucCulloch e Walter Pitts. A logical Calculus of the ideas im- manent in nervous activity - Bulletin of Mathematical Biophysics (1943). 5 [7] SUPPORT Vector Machine — Introduction to Machine Learning Algorithms. Dispońıvel em: https://towardsdatascience.com/support- vector-machine-introduction-to-machine-learning-algorithms- 934a444fca47. Acesso em: 12 jun. 2021. 7 [8] VISUALIZING the effect of hyperparameters on Support Vector Ma- chines. Dispońıvel em: https://towardsdatascience.com/visualizing-the- effect-of-hyperparameters-on-support-vector-machines-b9eef6f7357b. Acesso em: 2 jun. 2021. 7 [9] UMA INTRODUÇÃO às Support Vec- tor Machines. [S. l.], 2007. Dispońıvel em: https://pdfs.semanticscholar.org/8469/81890b81ae5d9ff5cedfcdbd99150a8bde13.pdf. Acesso em: 10 jun. 2021. 8 [10] APRENDA A Fazer A Árvore De Decisão Para Facilitar A Tomada De Decisões. Dispońıvel em: https://cromasolutions.com.br/aprenda- a-fazer-a-arvore-de-decisao-para-facilitar-a-tomada-de-decisoes/. Acesso em: 15 jun. 2021. 8 17 [11] SKLEARN [U+5B66][U+4E60][U+4E4B][U+5206][U+7C7B][U+6811]. Dispońıvel em: https://www.cnblogs.com/zhoukui/p/8883409.html. Acesso em: 13 jun. 2021. 9 [12] RANDOM forest. Dispońıvel em: https://en.wikipedia.org/wiki/Random forest. Acesso em: 15 jun. 2021. 11 [13] FARIAS, João Gabriel de. MACHINE LEARNING APLICADO À PREVISÃO DE GERAÇÃO DE ENERGIA EÓLICA COM DIFEREN- TES MODELOS DE PREVISÃO NUMÉRICA DO TEMPO. 2020. 158 f. Tese (Doutorado) - Curso de Programa de Pós-Graduação em Enge- nharia Mecânica, Universidade Federal de Santa Catarina, Florianópolis, 2020. 12, 14 [14] Sarah Guido Andreas C. Müller. Introduction to Machine Learning with Python: A Guide for Data Scientists. O’REILLY, 2015. 13 [15] STETCO, Adrian; DINMOHAMMADI, Fateme; ZHAO, Xingyu; ROBU, Valentin; FLYNN, David; BARNES, Mike; KEANE, John; NE- NADIC, Goran. Machine learning methods for wind turbine condition monitoring: a review. Renewable Energy, [S.L.], v. 133, p. 620-635, abr. 2019. Elsevier BV. http://dx.doi.org/10.1016/j.renene.2018.10.047. 13, 14 18 Introdução/Justificativa/Motivação O início da Inteligência Artificial A IA no mundo contemporâneo Aplicações de IA: Sistemas de Geração de Energia Objetivos Objetivos Gerais Objetivos Específicos Revisão bibliográfica ou Fundamentação teórica Redes Neurais Artificiais e Deep Learning Support Vector Machines (SVM) Árvores de Decisão Random Forest Gradient Boosted Trees Importância do trabalho com dados para a Geração de Energia Numerical Weather Prediction (NWP) Condition monitoring - CM Metodologia Resultados esperados Como Machine Learning é utilizado em sistemas de geração de energia Ranking das técnicas mais utilizadas Conclusão