Prévia do material em texto
Machine Learning: principais conceitos e tendências 2 PROIBIDA A REPRODUÇÃO TOTAL OU PARCIAL, SEM AUTORIZAÇÃO. Lei nº 9610/98 – Lei de Direitos Autorais 3 O Machine Learning (aprendizado de máquina, em tradução para o português) é uma subárea da inteligência artificial (IA) que se concentra no desenvolvimento de algoritmos e modelos que permitem que os computadores aprendam e tomem decisões com base em dados, sem serem explicitamente programados. Ao invés de seguir regras predefinidas, os modelos de Machine Learning são treinados em grandes conjuntos de dados para reconhecer padrões e, assim, fazer previsões ou tomar decisões com base nesses padrões. De forma didática, Homem (2020, p. 19) faz a seguinte analogia: Uma criança aprende a identificar um brinquedo, por exemplo, uma vez que a mesma é exposta ao objeto várias vezes e, assim, consegue identificar padrões que o caracteriza. Um modelo de aprendizagem, por sua vez, é exposto a um conjunto de dados robusto e utiliza os exemplos ali contidos para identificar padrões relevantes à tarefa que lhe é destinada. Crescimento e impacto do Machine Learning na sociedade Aumento da Automação: Espera-se que haja um maior foco na automação do ciclo de vida do Machine Learning, desde a preparação e limpeza dos dados até o treinamento, avaliação e implantação de modelos. Isso inclui o uso de técnicas como AutoML (Machine Learning Automático) e MLOps (Operações de Machine Learning) para simplificar e acelerar o processo de desenvolvimento de modelos. Interpretabilidade e Ética: À medida que os modelos de Machine Learning e Deep Learning se tornam mais complexos e são aplicados em áreas críticas, a interpretabilidade e a ética se tornam preocupações importantes. Haverá um foco crescente no desenvolvimento de métodos para explicar e entender as decisões dos modelos, bem como garantir a justiça, transparência e privacidade nos sistemas de IA. Aprendizado Federado: O aprendizado federado é uma técnica que permite treinar modelos em dados distribuídos em várias localidades, mantendo a privacidade dos dados sensíveis. Essa abordagem promissora pode permitir avanços significativos em áreas como saúde, finanças e Internet das Coisas (IoT), onde a colaboração em dados sensíveis é necessária. Explicabilidade em Deep Learning: O desenvolvimento de métodos para aumentar a explicabilidade das redes neurais profundas é uma área de pesquisa em crescimento. Entender como as redes neurais tomam decisões e fornecer explicações confiáveis é fundamental para a adoção de modelos de Deep Learning em domínios críticos, como saúde e justiça. Aprendizado por Transferência e Meta-aprendizado: A aplicação de técnicas de aprendizado por transferência e meta-aprendizado está ganhando destaque. Essas abordagens permitem que os modelos aproveitem o conhecimento adquirido em tarefas anteriores para melhorar o desempenho em novas tarefas, levando a uma melhor eficiência de treinamento e generalização. Aumento da Integração de Domínio Específico: À medida que o Machine Learning e o Deep Learning se tornam mais maduros, haverá um aumento na integração de técnicas e algoritmos de domínio específico. Isso inclui o desenvolvimento de modelos personalizados para áreas como medicina, finanças, 4 manufatura e agricultura, levando a soluções mais adaptadas e eficazes para problemas específicos. Avanços em Hardware Especializado: O desenvolvimento de hardware especializado, como GPUs, TPUs e FPGAs, continua a impulsionar o desempenho e a eficiência dos modelos de Machine Learning e Deep Learning. O surgimento de novas arquiteturas e tecnologias, como computação quântica e neuroprocessadores, também pode abrir caminho para avanços ainda mais significativos. Essas são apenas algumas das tendências emergentes em Machine Learning e Deep Learning. O campo continua a evoluir rapidamente, e é provável que haja muitos outros avanços e descobertas emocionantes nos próximos anos, impulsionando a aplicação e a adoção Tipos de Aprendizado Segundo Ludermir (2021), existem três principais tipos de aprendizado de máquina: Aprendizado Supervisionado: Nesse tipo de aprendizado, os modelos são treinados usando pares de entrada e saída rotulados. Ludermir destaca (2021, p. 88): "O objetivo do algoritmo é construir um classificador que possa determinar corretamente a classe de novos exemplos ainda não rotulados. Para rótulos de classe discretos, esse problema é chamado de classificação e para valores contínuos como regressão"; este é o tipo mais comum de Machine Learning. Segundo Homem (2020), os problemas de classificação envolvem a seleção de um rótulo específico entre várias opções, como identificar a presença de um gato em uma imagem, enquanto a regressão tem como objetivo prever um valor numérico dentro de um intervalo contínuo, como determinar o preço de uma casa com base em sua idade, tamanho e outros parâmetros. Aprendizado Não Supervisionado: Aqui, os modelos são treinados em dados de entrada não rotulados e o objetivo é descobrir padrões ou estruturas ocultas nos dados Após a determinação desses padrões, os modelos fazem agrupamentos; "em geral, é necessária uma análise para determinar o que cada agrupamento significa no contexto problema sendo analisado" (LURDERMIR, 2021, p. 89). O aprendizado não supervisionado é comumente usado para tarefas como segmentação de clientes, agrupamento de documentos e redução de dimensionalidade. Aprendizado por Reforço: Nesse tipo de aprendizado, os modelos aprendem por meio de interações com um ambiente. O modelo toma ações em um ambiente e recebe feedback em forma de recompensas ou penalidades. O objetivo é aprender uma política que maximize as recompensas ao longo do tempo. O aprendizado por reforço é usado em jogos, robótica e otimização de processos. Principais Conceitos de Machine Learning Aprendizagem de máquina, também conhecida como machine learning, é, portaanto, um campo que tem ganhado cada vez mais destaque e aplicação nas mais diversas áreas. Essa abordagem tem se mostrado extremamente promissora e está revolucionando a forma como lidamos com problemas complexos e tomamos decisões; neste contexto, é 5 fundamental compreender alguns dos principais conceitos relacionados à aprendizagem de máquina para aproveitar todo o seu potencial e explorar as inúmeras oportunidades que essa área proporciona. A seguir, alguns destes conceitos serão esmiuçados: Conjunto de dados: uma massa de informações utilizadas para ensinar as máquinas. Devem ser divididos em três grupos: treinamento, validação e teste, que constituem as fases da aprendizagem. No treinamento, a mesma massa de dados é apresentada à máquina, enquanto nas fases de validação e testes, dados diferentes são apresentandos, afim de comprovar o aprendizado do sistema. Pré-processamento de Dados: no processo de aprendizagem, é necessário garantir uma qualidade dos dados selecionados para o processo. Por isso, deve-se fazer uma limpeza e formatação dos dados, isto, é padronizar, evitar erros, selecionar e extrair as informação. Avaliação e Seleção de Modelos: a partir do pré-procesamente, é possível realizar o treinamento e teste das máquinas. Estas etapas constituem-se de validação cruzada (Cross-validation) das informações, métricas de avaliação dos modelos, otimização de hiperparâmetros (Grid Search, Random Search, etc.) e técnicas de regularização (Regularization) destas informações. Por meio destes testes, é possível verificar se a máquina pode ser utilizada para a resoução de problemas. Tendências em Machine Learning Ao se discutir as tendências da aprendizagem de máquinas, é importante mencionar o Deep Learning, uma subárea do Machine Learning que se concentra no treinamento de redes neurais artificiais profundas, utilizando "uma grande quantidade de dados e obtém diferentes interpretações para realizar a classificação desses dados" (HAMAGUTI; BREVE, 2022, p. 3). Esta é uma abordagem que permite explorar múltiplas camadas de processamento de informações não-lineares usando técnicasde Machine Learning, dessa forma capacitando os algoritmos a aprenderem vários níveis de representação e abstração, o que proporciona uma compreensão mais significativa dos dados. Por isso, enquanto o Machine Learning possui diversas etapas de aprendizagem, como a extração e classificação de características, "o Deep Learning consegue aprender e classificar em uma única etapa" (HAMAGUTI; BREVE, 2022, p. 5). 6 Figura 1 - Relação entre a inteligência Artificial, o Machine Learning e o Deep Learning Fonte: HAMAGUTI; BREVE, 2022. Destaca-se que as redes neurais profundas, previamente mencionadas pois é a partir destas que funciona o modelo deep learning, são modelos compostos por múltiplas camadas de neurônios aritificiais interconectados, que são capazes de aprender representações hierárquicas dos dados como o cérebro humano. Assim como acontece nos neurônios humanos, nos neurônios artificiais "existem os estímulos de entrada, as ligações sinápticas e as saídas" (HAMAGUTI; BREVE, 2022, p. 5). Mesmo que estes neurônios não sejam tão complexos quanto os humanos, são capazes de lidar com problemas mais complicados, como o reconhecimento de imagem, processamento de linguagem natural e compreensão de fala. O Deep Learning é especialmente eficaz quando há grandes quantidades de dados disponíveis para treinamento. Ele usa algoritmos de retropropagação para ajustar os pesos das conexões entre os neurônios, permitindo que a rede neural aprenda a partir dos dados e faça previsões ou tomem decisões com base neles. Por isso, este tem alcançado resultados impressionantes em várias tarefas, superando outras abordagens de Machine Learning em termos de desempenho. No entanto, esses modelos geralmente exigem um grande poder computacional e conjuntos de dados significativos para treinamento. Desafios em Machine Learning A disponibilidade e qualidade dos dados são desafios cruciais em machine learning. Para que os modelos sejam eficazes, é essencial ter acesso a conjuntos de dados abrangentes e representativos. No entanto, muitas vezes os dados disponíveis são limitados em quantidade ou qualidade, o que pode resultar em modelos enviesados, imprecisos ou com desempenho insatisfatório. 7 Além disso, é fundamental garantir a qualidade dos dados, evitando ruídos, inconsistências ou viéses que possam comprometer a precisão e confiabilidade dos resultados. Outro desafio importante é lidar com o viés e a equidade em modelos de machine learning. Os modelos de aprendizagem de máquina são alimentados com dados históricos, que podem refletir preconceitos e desigualdades existentes na sociedade. Isso pode levar a decisões discriminatórias ou injustas, perpetuando os vieses presentes nos dados de treinamento. É essencial desenvolver estratégias e técnicas para mitigar esses viéses e garantir a equidade nos resultados produzidos pelos modelos de machine learning, promovendo a justiça e a igualdade em sua aplicação. A privacidade e a segurança dos dados também representam um desafio significativo em machine learning. O treinamento de modelos de aprendizagem de máquina muitas vezes requer o acesso a grandes quantidades de dados sensíveis e pessoais. É necessário implementar medidas robustas para proteger esses dados contra ameaças de vazamento, ataques cibernéticos e mau uso. Além disso, é importante considerar a ética e a legislação relacionadas à privacidade dos dados, garantindo o consentimento adequado e a conformidade com as regulamentações vigentes. A interpretabilidade de modelos complexos é outro desafio enfrentado em machine learning. À medida que os modelos se tornam mais complexos, como redes neurais profundas, sua capacidade de tomar decisões com base em padrões complexos aumenta, mas sua interpretabilidade diminui. Compreender como os modelos chegam a determinadas decisões pode ser crucial em áreas como medicina e direito, onde a explicação dos resultados é essencial. Desenvolver métodos e técnicas para tornar os modelos mais interpretáveis e transparentes é um desafio ativo na área de machine learning. Por fim, a escalabilidade e a eficiência computacional são desafios relevantes em machine learning. À medida que a quantidade de dados e a complexidade dos modelos aumentam, é necessário garantir que os algoritmos e as infraestruturas de computação possam lidar eficientemente com essas demandas. O treinamento e a inferência dos modelos podem exigir recursos computacionais significativos, e a capacidade de dimensionar e otimizar o desempenho dos sistemas de machine learning é fundamental para aproveitar todo o potencial dessa tecnologia em larga escala. Ética em Machine Learning Os desafiosdiscutidos alinham-se diretamente às questões éticas que envolvem o aprendizado em máquinas, se entrelaçando em alguns aspectos. Destaca-se que é fundamental abordar essas questões de forma responsável e consciente. Uma das questões éticas fundamentais está relacionada à coleta e uso de dados. Os algoritmos de machine learning dependem de conjuntos de dados para aprender e tomar decisões. No entanto, a coleta indiscriminada ou invasiva de dados pode levantar preocupações de privacidade e segurança. É essencial que a coleta de dados seja feita de forma transparente e legal, com o consentimento adequado dos indivíduos envolvidos. 8 Além disso, é importante garantir que os dados sejam utilizados de maneira ética e responsável, respeitando os direitos e a dignidade dos indivíduos. Outro ponto crítico é o viés e a discriminação em algoritmos de machine learning. Os modelos de aprendizagem de máquina podem ser influenciados pelos vieses presentes nos dados de treinamento, o que pode levar a resultados discriminatórios ou injustos. Por exemplo, se um modelo é treinado com dados históricos que refletem desigualdades sociais, ele pode perpetuar essas desigualdades em suas decisões. É fundamental desenvolver técnicas e abordagens para mitigar o viés e garantir a equidade nos resultados produzidos pelos modelos de machine learning, evitando a discriminação e promovendo a justiça. A responsabilidade tanto dos desenvolvedores quanto dos usuários de modelos de machine learning é outro aspecto ético importante. Os desenvolvedores têm a responsabilidade de criar algoritmos que sejam éticos e justos, levando em consideração as possíveis consequências negativas de suas aplicações. Eles devem ser transparentes sobre o funcionamento dos modelos, as limitações e os possíveis vieses envolvidos. Por sua vez, os usuários dos modelos de machine learning devem ser responsáveis em sua utilização, garantindo que os resultados sejam interpretados corretamente e que não sejam tomadas decisões injustas ou discriminatórias com base nos resultados gerados pelos algoritmos. O machine learning representa uma revolução na forma como as máquinas podem aprender e tomar decisões com base em dados. Ao compreender os principais conceitos, é possível aproveitar o potencial dessa tecnologia em diversas áreas. Além disso, é importante estar ciente das tendências em constante evolução nesse campo. Avanços como deep learning, aprendizado por reforço e processamento de linguagem natural abrem novas possibilidades. No entanto, também é crucial considerar questões éticas relacionadas à coleta de dados, viés e responsabilidade dos desenvolvedores e usuários. À medida que o machine learning continua a se expandir e impactar nossa sociedade, é essencial manter-se atualizado, explorar suas aplicações com responsabilidade e buscar abordagens éticas para garantir que essa tecnologia seja utilizada para o benefício de todos. 9 Referências CERRI, Ricardo; CARVALHO, André Carlos Ponce de Leon Ferreira de. APRENDIZADO DE MÁQUINA: BREVE INTRODUÇÃO E APLICAÇÕES. Cadernos de Ciência & Tecnologia, Brasília, v. 34, n. 3, p. 297-313, dez. 2017. HAMAGUTI, Érika Kayoko; BREVE, Fabricio Aparecido. Introdução Sobre Machine Learning e Deep Learning. In: XI Jornada Científica e Tecnológica (Jornacitec) 2022, 2022, Botucatu – SP. Anais eletrônicos da Jornacitec, 2022. HOMEM,William Ludovico. Apostila de Machine Learning. PROGRAMA DE EDUCAÇÃO TUTORIAL ENGENHARIA MECÂNICA, 2020. LUDERMIR, Teresa Bernarda. Inteligência Artificial e Aprendizado de Máquina: estado atual e tendências. Estudos Avançados, [S.L.], v. 35, n. 101, p. 85-94, abr. 2021.