Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

<p>WBA0873_v1.0</p><p>APRENDIZAGEM EM FOCO</p><p>PROCESSAMENTO DE</p><p>LINGUAGEM NATURAL</p><p>2</p><p>APRESENTAÇÃO DA DISCIPLINA</p><p>Autoria: Ariel da Silva Dias</p><p>Leitura crítica: Rafael Albuquerque Pinto</p><p>Na década de 1950, Alan Turing realizou um experimento mental</p><p>chamado Jogo da Imitação. Naquela oportunidade, começava a</p><p>traçar as primeiras linhas daquilo que hoje conhecemos como</p><p>inteligência artificial.</p><p>Atualmente, muitos procedimentos repetitivos e cansativos que</p><p>eram feitos por humanos passaram a ser realizados por máquinas.</p><p>Com isso, essas pessoas ocuparam outros espaços, realizando</p><p>atividades que exijam mais de seu intelecto e de suas habilidades.</p><p>Entre as diversas ferramentas de inteligência artificial, o</p><p>Processamento de Linguagem Natural (PLN) se destaca devido a sua</p><p>versatilidade e flexibilidade. Ele pode ser aplicado em diversas áreas,</p><p>como filtros de e-mail, motores de busca on-line, predição de texto,</p><p>classificação de feedback do cliente, chatbots, entre outros.</p><p>Pense na quantidade de texto que você lê no dia a dia: mensagens,</p><p>e-mails, correspondências, cardápios, páginas web, entre outros.</p><p>Agora, vamos para outro sentido, que é da fala. Conversamos com</p><p>outras pessoas, seja por voz ou por sinais, como LIBRAS; assim, voz,</p><p>textos e sinais são como nós nos comunicamos. Dada a importância</p><p>desse tipo de comunicação, precisamos ter métodos e técnicas</p><p>computacionais para permitir que o computador também possa</p><p>compreender e raciocinar com dados de entradas como fala ou</p><p>texto. E esse é o estudo do PLN.</p><p>Desse modo, esta disciplina tem como objetivo estudar os principais</p><p>conceitos, técnicas e ferramentas relacionadas ao PLN, bem como</p><p>3</p><p>apresentar suas aplicações e implicações em diversos cenários. Bons</p><p>estudos!</p><p>INTRODUÇÃO</p><p>Olá, aluno (a)! A Aprendizagem em Foco visa destacar, de maneira</p><p>direta e assertiva, os principais conceitos inerentes à temática</p><p>abordada na disciplina. Além disso, também pretende provocar</p><p>reflexões que estimulem a aplicação da teoria na prática</p><p>profissional. Vem conosco!</p><p>Introdução ao PLN</p><p>______________________________________________________________</p><p>Autoria: Ariel da Silva Dias</p><p>Leitura crítica: Rafael Albuquerque Pinto</p><p>TEMA 1</p><p>5</p><p>DIRETO AO PONTO</p><p>A mineração de texto busca extrair informações úteis e importantes</p><p>de formatos de documentos heterogêneos, como páginas da web,</p><p>e-mails, postagens em mídias sociais, entre outros. Isso geralmente</p><p>é feito por meio da identificação de padrões em textos, como</p><p>tendências no uso de palavras e estrutura sintática.</p><p>Se por um lado a mineração de dados lida com dados estruturados</p><p>– dados altamente formatados, como em bancos de dados SQL</p><p>(Structured Query Language) –, a mineração de texto lida com dados</p><p>textuais não estruturados, ou seja, texto que não é predefinido</p><p>ou organizado de nenhuma forma (como nos exemplos de mídia</p><p>social). As tecnologias de mineração de texto têm muitas aplicações,</p><p>entre as quais podem ser usadas para fazer ligações entre</p><p>clientes potenciais e produtos para fins de marketing. Empresas e</p><p>governos também podem destacar relacionamentos que você pode</p><p>considerar pessoais.</p><p>A mineração de texto pode ser dividida em cinco etapas:</p><p>Figura 1 – Etapas da mineração de texto</p><p>Fonte: elaborada pelo autor.</p><p>A partir da Figura 1, temos as seguintes descrições para cada etapa:</p><p>6</p><p>• Etapa 1: os dados são coletados a partir de diferentes fontes,</p><p>como sites, e-mails, comentários de clientes, arquivo de</p><p>documento etc. Dependendo da aplicação, esse processo pode</p><p>ser totalmente automatizado ou orientado pelo minerador</p><p>(responsável pela mineração de texto).</p><p>• Etapa 2: são realizadas a identificação e a extração de</p><p>conteúdo, fazendo:</p><p>• Limpeza de texto: remoção de qualquer informação</p><p>desnecessária.</p><p>• Tokenização: para o computador, uma frase é um</p><p>conjunto de caracteres; logo, ele não é capaz de identificar</p><p>palavras. O objetivo da tokenização é dividir a frase (ou o</p><p>texto como um todo) em partes significativas.</p><p>• Extração de características: processo de caracterizar o</p><p>texto para obter medidas quantitativas, como a frequência</p><p>de uma certa palavra em um texto.</p><p>• Etapa 3: criação de um índice para os termos mais frequentes.</p><p>Com isso, o acesso a esses termos fica mais rápido, pois sua</p><p>localização é conhecida.</p><p>• Etapa 4: após todo o processamento, é hora de minerar.</p><p>Desse modo, são aplicados algoritmos para identificar as</p><p>relações entre diferentes termos, a vinculação destes com um</p><p>dicionário ou termos específicos.</p><p>• Etapa 5: a mineração produz um dado bruto, o qual pode ser</p><p>analisado e avaliado pelo minerador.</p><p>Resumidamente, a mineração de texto é responsável por sintetizar</p><p>grandes quantidades de conteúdo de texto em informações de fácil</p><p>7</p><p>compreensão, além de permitir entender o que as pessoas estão</p><p>realmente dizendo sobre seus produtos e serviços, por exemplo.</p><p>Até recentemente, a mineração de dados era a abordagem</p><p>dominante na maioria das empresas, pois elas tinham maior</p><p>controle sobre seus dados estruturados. Entretanto, as coisas estão</p><p>mudando rapidamente. Os volumes de dados estão crescendo</p><p>aceleradamente e a maior parte deles é desestruturado. Sendo</p><p>assim, de olho nesse volume expressivo de dados que os clientes</p><p>estão produzindo, as organizações sabem que devem ser capazes</p><p>de usar a mineração de texto se quiserem liberar o valor bloqueado</p><p>no conteúdo e nas comunicações não estruturadas. Dessa forma,</p><p>a análise de sentimento a partir desses dados não estruturados se</p><p>tornou um importante caso de uso comercial da mineração de texto,</p><p>pois revela as opiniões e preocupações de clientes e parceiros ao</p><p>rastrear e analisar o conteúdo social.</p><p>Existem vários exemplos no mundo real em que a mineração de</p><p>texto pode ser usada para recuperar os dados. Por exemplo, várias</p><p>plataformas de mídia social e mecanismos de pesquisa, incluindo</p><p>o Google, usam técnicas de mineração de texto para ajudar os</p><p>usuários a encontrarem suas pesquisas. E isso ajuda a saber o que</p><p>os usuários estão procurando.</p><p>PARA SABER MAIS</p><p>A primeira fase do Processamento de Linguagem Natural (PLN) na</p><p>década de 1950 foi focada na tradução automática, para a qual os</p><p>computadores usavam cartões perfurados de papel para traduzir</p><p>do russo para o inglês. Porém, atualmente, a tradução automática é</p><p>uma oferta rotineira e as técnicas de processamento de linguagem</p><p>natural floresceram e ficaram ainda mais poderosas.</p><p>8</p><p>Empresas de todos os portes, das menores até as multinacionais,</p><p>usam PLN em chatbots de Inteligência Artificial (IA) para criar ótimas</p><p>experiências para seus clientes durante interações de conversação,</p><p>personalização de respostas com base no que sabem sobre eles,</p><p>entre outras técnicas, tudo para facilitar as transações reais entre</p><p>cliente e empresa. O resultado é o engajamento sob medida, que</p><p>cria experiências notáveis para os usuários finais.</p><p>Nesse contexto, são apresentados a seguir alguns exemplos do uso</p><p>do PLN:</p><p>• Atendimento e suporte ao cliente: os chatbots com PNL</p><p>estão ajudando os clientes a localizarem pontos turísticos e</p><p>mercados mais próximos, a tomarem decisões sobre qual tipo</p><p>de produto pedir no aplicativo de delivery, entre outras coisas,</p><p>atuando como um substituto para o atendimento ao cliente.</p><p>• Permitindo transações: em uma conversa com chatbot, o</p><p>cliente pode, por exemplo, solicitar informações sobre os</p><p>filmes em cartaz no cinema, reservar um ingresso e ainda</p><p>comprar uma pipoca.</p><p>• Análise de sentimento: como os clientes estão avaliando sua</p><p>marca? A forma mais direta é ir onde seu cliente está: mídias</p><p>sociais, contatos no call center, entre outros. Desse modo, é</p><p>possível utilizar o PLN para monitorar o que seu cliente está</p><p>falando e analisar esse feedback.</p><p>• Análise de texto livre: existem muitas fontes valiosas de</p><p>dados e os textos livres são uma dessas fontes, como os</p><p>registros médicos de pacientes, artigos on-line, postagens em</p><p>redes sociais, entre outros.</p><p>Com esses exemplos, observe que o PLN libera o potencial da</p><p>análise de dados, anteriormente</p><p>oculto em trechos de texto,</p><p>9</p><p>à medida que os modelos de linguagem continuam a evoluir.</p><p>Conjuntos maiores de dados, como avaliações de clientes, agora</p><p>podem ser analisados com algoritmos de aprendizado de máquina.</p><p>Além disso, outras áreas podem ser beneficiadas com o PLN, como a</p><p>saúde e a educação.</p><p>TEORIA EM PRÁTICA</p><p>No cenário competitivo atual, as empresas precisam continuar a</p><p>melhorar a experiência do cliente, pois, caso contrário, estarão</p><p>fadadas a serem abandonadas por eles. Considere o seguinte caso:</p><p>uma faculdade, ciente de seu papel social, está preocupada em criar</p><p>um recurso para atender a seus alunos deficientes auditivos em sala</p><p>de aula. Esse recurso deverá ser uma aplicação mobile que facilite a</p><p>vida desses alunos</p><p>Reflita sobre o problema apresentado e sobre os conceitos e as</p><p>técnicas relacionados ao PLN. Como você responderia a solicitação</p><p>dessa faculdade que deseja criar essa ferramenta? Qual alternativa</p><p>pode ser oferecida para o desenvolvimento desse recurso utilizando</p><p>o PLN?</p><p>Para conhecer a resolução comentada proposta pelo professor,</p><p>acesse a videoaula deste Teoria em Prática no ambiente de</p><p>aprendizagem.</p><p>10</p><p>LEITURA FUNDAMENTAL</p><p>Prezado aluno, as indicações a seguir podem estar disponíveis</p><p>em algum dos parceiros da nossa Biblioteca Virtual (faça o log</p><p>in por meio do seu AVA), e outras podem estar disponíveis em</p><p>sites acadêmicos (como o SciELO), repositórios de instituições</p><p>públicas, órgãos públicos, anais de eventos científicos ou</p><p>periódicos científicos, todos acessíveis pela internet.</p><p>Isso não significa que o protagonismo da sua jornada de</p><p>autodesenvolvimento deva mudar de foco. Reconhecemos</p><p>que você é a autoridade máxima da sua própria vida e deve,</p><p>portanto, assumir uma postura autônoma nos estudos e na</p><p>construção da sua carreira profissional.</p><p>Por isso, nós o convidamos a explorar todas as possibilidades da</p><p>nossa Biblioteca Virtual e além! Sucesso!</p><p>Indicação 1</p><p>No Capítulo 1 do livro indicado, o autor apresenta uma introdução</p><p>sobre o aprendizado de máquinas, tratando sobre aprendizados</p><p>supervisionado e não supervisionado. Ambos os aprendizados são</p><p>utilizados em PLN, sendo, por isso, uma leitura recomendada.</p><p>FACELI, K. et al. Inteligência Artificial: uma abordagem de</p><p>aprendizado de máquina. Rio de Janeiro: LTC, 2021.</p><p>Indicações de leitura</p><p>11</p><p>Indicação 2</p><p>No livro indicado, os autores escrevem, entre as páginas 89 e 116, os</p><p>principais conceitos em relação às análises léxica e semântica. Trata-</p><p>se de uma leitura recomendada e complementar ao conteúdo visto</p><p>neste Tema.</p><p>MARTINS, J. et al. Processamentos de linguagem natural. Porto</p><p>Alegre: Sagah, 2020. p. 89-116.</p><p>QUIZ</p><p>Prezado aluno, as questões do Quiz têm como propósito a</p><p>verificação de leitura dos itens Direto ao Ponto, Para Saber</p><p>Mais, Teoria em Prática e Leitura Fundamental, presentes neste</p><p>Aprendizagem em Foco.</p><p>Para as avaliações virtuais e presenciais, as questões serão</p><p>elaboradas a partir de todos os itens do Aprendizagem em Foco</p><p>e dos slides usados para a gravação das videoaulas, além de</p><p>questões de interpretação com embasamento no cabeçalho</p><p>da questão.</p><p>1. A mineração de ___________ pode levar o conceito de mineração</p><p>de ___________ a um estágio adiante, sintetizando grandes</p><p>quantidades de conteúdo em informações de fácil compreensão,</p><p>o que permite entender o que os clientes estão dizendo sobre</p><p>uma empresa. A ____________ se tornou um importante caso de</p><p>uso comercial da mineração de ________, pois revela as opiniões</p><p>e preocupações de clientes e parceiros ao rastrear e analisar o</p><p>conteúdo social.</p><p>12</p><p>Assinale a alternativa que completa corretamente as lacunas.</p><p>a. Texto; dados; análise de sentimento; texto.</p><p>b. Dados; texto; análise de dados; texto.</p><p>c. Dados; texto; análise de sentimento; dados.</p><p>d. Texto; dados; análise de dados; texto.</p><p>e. Dados; dados; análise de dados; dados.</p><p>2. Após uma frase ser analisada para extrair ___________</p><p>e entender a __________, a análise ____________ conclui o</p><p>significado da frase em uma forma livre de contexto como</p><p>uma frase independente. O significado inferido pode não</p><p>ser a intenção real do significado implícito.</p><p>Assinale a alternativa que completa corretamente as</p><p>lacunas.</p><p>a. A entidade; sintaxe; semântica.</p><p>b. Os tokens; expressão; léxica.</p><p>c. Os tokens; sintaxe; sintática.</p><p>d. A entidade; oração; sintática.</p><p>e. Os tokens; sintaxe; léxica.</p><p>GABARITO</p><p>Questão 1 - Resposta A</p><p>Resolução: A mineração de texto possui uma gama de funções</p><p>para transformar dados não estruturados (conteúdo social)</p><p>em dados que possam ser utilizados em uma tomada de</p><p>decisão, com objetivo, por exemplo, de analisar sentimentos</p><p>13</p><p>em uma ação comercial. A mineração de dados trabalha com</p><p>dados estruturados, que são de fácil recuperação, enquanto a</p><p>mineração de texto trabalha com dados não estruturados, os</p><p>quais podem vir de qualquer fonte. Então, a mineração de texto</p><p>está um passo além da mineração de dados.</p><p>Questão 2 - Resposta A</p><p>Resolução: O PLN possui componentes que permitem o</p><p>computador compreender a linguagem. Primeiramente a</p><p>frase é analisada morfologicamente e lexicamente, o objetivo</p><p>é verificar se a palavra está bem formatada e se pertence a</p><p>linguagem. Em seguida, é realizada a análise sintática. Este</p><p>tipo de análise é ideal para verificar a estrutura da frase. Logo</p><p>após, é realizada a análise semântica para compreender o real</p><p>significado da frase.</p><p>Técnicas de pré-processamento de</p><p>texto</p><p>______________________________________________________________</p><p>Autoria: Ariel da Silva Dias</p><p>Leitura crítica: Rafael Albuquerque Pinto</p><p>TEMA 2</p><p>15</p><p>DIRETO AO PONTO</p><p>O pré-processamento de texto é responsável por normalizá-lo, ou</p><p>seja, por convertê-lo em uma forma padrão mais conveniente antes</p><p>de transformá-lo em recursos para modelagem de nível superior.</p><p>Desse modo, essa etapa é responsável por converter a linguagem</p><p>entendível por humanos em uma linguagem legível para máquinas.</p><p>De modo geral, estamos interessados em pegar algum corpo de</p><p>texto e realizar sobre ele alguns tipos de análises e transformações</p><p>básicas, a fim de ficarmos com artefatos que serão muito mais</p><p>úteis para a realização de alguma tarefa analítica mais significativa</p><p>posteriormente. Essa tarefa adicional seria nosso trabalho principal</p><p>de mineração de texto ou processamento de linguagem natural.</p><p>Existem três componentes principais de pré-processamento</p><p>de texto: tokenização, dividida em tokenização de sentença e</p><p>tokenização de palavra; normalização morfológica, responsável</p><p>pela tarefa de stemming e pela lematização; e remoção de ruído,</p><p>responsável pela remoção de palavras indesejadas e/ou pontuações.</p><p>Além disso, de acordo com Tabassum (2020), existem ao menos</p><p>seis etapas para o pré-processamento de texto, iniciando-se pela</p><p>segmentação de sentença, conforme pode ser observado na Figura</p><p>1 a seguir.</p><p>16</p><p>Figura 1 – Etapas do pré-processamento de texto</p><p>Fonte: elaborada pelo autor.</p><p>Analisando a Figura 1, temos a seguinte definição para cada uma das</p><p>etapas:</p><p>• Segmentação de sentença (ou tokenização de sentença): é</p><p>sugerida como sendo a primeira etapa no processamento de</p><p>texto. Isso geralmente é realizado com base em pontuações</p><p>como “.”, “?”, “!”, pois tendem a marcar os limites das frases.</p><p>• Remoção pontuações: como o nome indica, é a etapa</p><p>responsável por remover pontuações como ponto, virgula,</p><p>ponto e vírgula, entre outros. Geralmente é realizada com a</p><p>etapa de tokenização ou segmentação de palavra.</p><p>• Tokenização: junto com a segmentação de sentença, a</p><p>tokenização é crucial no pré-processamento de texto, sendo</p><p>também conhecida como segmentação de palavra. Trata-se</p><p>de uma técnica usada para separar palavras por meio de um</p><p>caractere de espaço exclusivo. Dependendo do aplicativo, a</p><p>tokenização de palavras também pode tokenizar expressões</p><p>com várias palavras, como Rio de Janeiro.</p><p>17</p><p>• Remoção de stopwords: a maioria absoluta dos dados textuais</p><p>com os quais você trabalhará terá palavras não muito úteis</p><p>para</p><p>o computador. Essas palavras, chamadas de stopwords</p><p>ou apalavras irrelevantes, são úteis na fala humana, mas não</p><p>têm muito a contribuir para a análise de dados. Assim, nesta</p><p>etapa, a remoção de stopwords ajuda a eliminar ruídos durante</p><p>a análise de dados.</p><p>• Stemming: a derivação ou o stemming tem o objetivo de</p><p>verificar a origem ou a raiz de uma palavra e, em muitos casos,</p><p>usar essa raiz no lugar da própria palavra. Entre os algoritmos</p><p>mais populares, está o Algoritmo de Porter.</p><p>• Lematização: esta etapa é responsável por retornar a forma</p><p>base da palavra, o que ocorre por meio da análise morfológica</p><p>da palavra.</p><p>A ordem das etapas apresentadas não é necessariamente uma</p><p>sequência fixa e estruturada. Porém, de acordo com Tabassum</p><p>(2020), essa sequência produz um melhor resultado diante de outras</p><p>sequências. O mais importante é que as técnicas sejam aplicadas no</p><p>pré-processamento de texto.</p><p>Referências bibliográficas</p><p>TABASSUM, A.; PATIL, R. A survey on text pre-processing & feature</p><p>extraction techniques in natural language processing. 2020. Disponível</p><p>em: https://www.irjet.net/archives/V7/i6/IRJET-V7I6913.pdf. Acesso em: 1 maio</p><p>2021.</p><p>PARA SABER MAIS</p><p>N-gramas são um conjunto de palavras simultâneas dentro de</p><p>uma determinada janela em uma sentença. Ao calculá-los, você</p><p>18</p><p>normalmente avança uma palavra (embora possa avançar X palavras</p><p>em cenários mais avançados). N-gramas de textos são amplamente</p><p>usados em tarefas de mineração de texto e processamento de</p><p>linguagem natural.</p><p>Por exemplo, para a frase “A ligeira raposa marrom ataca o cão</p><p>preguiçoso.”, considerando N=2 (um bigrama), então teremos os</p><p>seguintes n-gramas:</p><p>• A ligeira.</p><p>• Ligeira raposa.</p><p>• Raposa marrom.</p><p>• Marrom ataca.</p><p>• Ataca o.</p><p>• O cão.</p><p>• Cão preguiçoso.</p><p>Nesse caso, para N=2, temos 7 n-gramas. Observe que mudamos de</p><p>“a ligeira” para “ligeira raposa”, em seguida de “ligeira raposa” para</p><p>“raposa marrom”. Então deslocamos uma janela do tamanho 2 pela</p><p>sentença para gerar o bigrama.</p><p>Agora, em relação a mesma sentença, considere N=3 (um trigrama):</p><p>• A ligeira raposa.</p><p>• Ligeira raposa marrom.</p><p>• Raposa marrom ataca.</p><p>19</p><p>• Marrom ataca o.</p><p>• Ataca o cão.</p><p>• O cão preguiçoso.</p><p>Portanto, para N=3, temos 6 n-gramas. Quando N=1, isso é referido</p><p>como um unigrama e são essencialmente as palavras individuais de</p><p>uma frase.</p><p>Para calcular o n-grama, podemos utilizar a fórmula:</p><p>Ngrama=X-(N-1) = 7 - 2 = 5</p><p>Em que X é igual ao número de palavras da sentença.</p><p>Então, aplicando os valores de N=2 e N=3 do exemplo anterior, os</p><p>respectivos valores de n-grama, considerando X = 8 (oito palavras na</p><p>sentença), temos:</p><p>• N-grama = 8 - (2 - 1) = 8 - 1 = 7.</p><p>• N-grama = 8 - (3 - 1) = 8 - 2 = 6.</p><p>No Python, você pode utilizar o NLTK e importar a biblioteca de</p><p>n-gramas, ou, então, pode desenvolver manualmente, realizando a</p><p>tokenização da sentença para, em seguida, apresentar os tokens.</p><p>Por exemplo, se N=2, então apresenta os tokens de 2 em 2. Se N=3,</p><p>apresenta os tokens de 3 em 3.</p><p>TEORIA EM PRÁTICA</p><p>Você atua como analista de dados em uma empresa responsável por</p><p>gerenciar os espaços públicos das cidades do estado de São Paulo.</p><p>20</p><p>Você atualmente está em um projeto que visa implantar serviço de</p><p>lazer em todas essas cidades; entretanto, existe uma limitação: o</p><p>parque só será construído se a densidade demográfica for maior do</p><p>que 110 pessoas por quilômetro quadrado (110 hab/km²). Observe</p><p>então que, para construí-lo, você e sua equipe precisam saber a</p><p>quantidade de pessoas por quilômetro quadrado dessas cidades.</p><p>Sem a necessidade de neste momento implementar códigos, reflita</p><p>sobre as ferramentas disponíveis para análise de texto e os recursos</p><p>disponíveis que você conhece até o momento:</p><p>Como você e sua equipe podem obter os dados da densidade</p><p>demográfica dos munícipios paulistas? Com base em todos esses</p><p>dados, como poderia ser validado em quais municípios haverá ou</p><p>não o parque? Quais ferramentas você utilizaria para obter essas</p><p>informações?</p><p>Para conhecer a resolução comentada proposta pelo professor,</p><p>acesse a videoaula deste Teoria em Prática no ambiente de</p><p>aprendizagem.</p><p>LEITURA FUNDAMENTAL</p><p>Prezado aluno, as indicações a seguir podem estar disponíveis</p><p>em algum dos parceiros da nossa Biblioteca Virtual (faça o log</p><p>in por meio do seu AVA), e outras podem estar disponíveis em</p><p>sites acadêmicos (como o SciELO), repositórios de instituições</p><p>públicas, órgãos públicos, anais de eventos científicos ou</p><p>periódicos científicos, todos acessíveis pela internet.</p><p>Indicações de leitura</p><p>21</p><p>Isso não significa que o protagonismo da sua jornada de</p><p>autodesenvolvimento deva mudar de foco. Reconhecemos</p><p>que você é a autoridade máxima da sua própria vida e deve,</p><p>portanto, assumir uma postura autônoma nos estudos e na</p><p>construção da sua carreira profissional.</p><p>Por isso, nós o convidamos a explorar todas as possibilidades da</p><p>nossa Biblioteca Virtual e além! Sucesso!</p><p>Indicação 1</p><p>O artigo indicado discute algumas técnicas utilizadas em PLN e que</p><p>são aplicadas na saúde e na educação. No sistema educacional,</p><p>a gramática é útil para melhorar as habilidades dos alunos; já</p><p>no sistema de saúde, o maior desafio é a falta de acesso aos</p><p>prontuários.</p><p>DEVI, N.; PONNUSAMY, R. A Systematic Survey of Natural Language</p><p>Processing (NLP) Approaches in Different Systems. IJCSE, v. 4, n. 7,</p><p>p. 192-198, 2016. Disponível em: https://www.ijcseonline.org/pdf_</p><p>paper_view.php?paper_id=1108&33-IJCSE-%2001753-16.pdf. Acesso</p><p>em: 5 maio 2021.</p><p>Indicação 2</p><p>No Capítulo 3 do livro indicado, o autor apresenta as principais</p><p>técnicas para trabalhar com o texto bruto. Compreenda em</p><p>profundidade as técnicas de tokenização e stopwords utilizando</p><p>Python e NLTK.</p><p>BEYSOLOW, T. Applied Natural Language Processing with Python.</p><p>San Francisco: Apress, 2018. p. 43-75.</p><p>22</p><p>QUIZ</p><p>Prezado aluno, as questões do Quiz têm como propósito a</p><p>verificação de leitura dos itens Direto ao Ponto, Para Saber</p><p>Mais, Teoria em Prática e Leitura Fundamental, presentes neste</p><p>Aprendizagem em Foco.</p><p>Para as avaliações virtuais e presenciais, as questões serão</p><p>elaboradas a partir de todos os itens do Aprendizagem em Foco</p><p>e dos slides usados para a gravação das videoaulas, além de</p><p>questões de interpretação com embasamento no cabeçalho</p><p>da questão.</p><p>1. Stemming é o processo de reduzir a _________ das palavras</p><p>usando um processo heurístico bruto que corta suas pontas</p><p>na esperança de transformá-las corretamente em sua forma</p><p>_________. Existem diferentes algoritmos para realizar o stemming,</p><p>entre eles o mais comum é o Algoritmo de ___________. Já a</p><p>Lematização, por sua vez, é responsável por retornar a forma</p><p>__________ da palavra.</p><p>Assinale a seguir a alternativa que completa corretamente as</p><p>lacunas.</p><p>a. Raiz; base; Inflexão; reduzida.</p><p>b. Complexidade; Base; Porter; raiz.</p><p>c. Inflexão; base; Porter; raiz.</p><p>d. Complexidade; Raiz; Porter; base.</p><p>e. Inflexão; raiz; Porter; base.</p><p>2. Em poucas palavras, pré-processar um texto significa</p><p>colocá-lo em uma forma que seja possível prever e</p><p>23</p><p>analisar o seu conteúdo para uma determinada tarefa. A</p><p>execução correta das etapas de processamento de texto é</p><p>a garantia de sucesso no levantamento de informações ou,</p><p>então, ocorre o pior pesadelo para um analista, pois não</p><p>conseguirá obter as informações desejadas.</p><p>Marque a alternativa que apresenta, segundo o conteúdo</p><p>estudado, a sequência ideal para o pré-processamento de</p><p>texto.</p><p>a. Segmentação de sentença; stemming; lematização;</p><p>tokenização; remoção de pontuações; remoção de stopwords.</p><p>b. Segmentação de sentença; remoção de pontuações;</p><p>tokenização; remoção de stopwords; stemming; lematização.</p><p>c. Segmentação de sentença; tokenização; remoção de</p><p>stopwords; stemming; lematização; remoção de pontuações.</p><p>d. Segmentação de sentença; remoção de stopwords; stemming;</p><p>lematização; remoção de pontuações; tokenização.</p><p>e. Segmentação de sentença; lematização; stemming; remoção de</p><p>stopwords; remoção de pontuações; tokenização.</p><p>GABARITO</p><p>Questão</p><p>1 - Resposta E</p><p>Resolução: O stemming é um processo de derivação que tem o</p><p>objetivo de retornar a raiz de uma palavra. Entre os algoritmos</p><p>existentes, o mais popular é o Algoritmo de Porter. Por outro</p><p>lado, a lematização retorna a forma base da palavra por meio</p><p>da análise morfológica.</p><p>24</p><p>Questão 2 - Resposta B</p><p>Resolução: A primeira etapa é a segmentação de sentença ou</p><p>a tokenização da sentença, cujo objetivo é definir as sentenças</p><p>de um texto. A segunda etapa é a remoção de pontuações, na</p><p>qual são removidos os pontos de interrogação, virgulas, entre</p><p>outros. A terceira etapa é a tokenização ou segmentação de</p><p>palavras, cujo objetivo é separar as palavras por meio de um</p><p>caractere de espaço. A quarta etapa é a remoção das palavras</p><p>indesejáveis ou stopwords. Em seguida, são realizadas as</p><p>etapas de stemming, cujo objetivo é encontrar a raiz de uma</p><p>palavra. Por último, o ocorre a lematização, que retorna a</p><p>forma base da palavra.</p><p>Processamento de texto</p><p>______________________________________________________________</p><p>Autoria: Ariel da Silva Dias</p><p>Leitura crítica: Rafael Albuquerque Pinto</p><p>TEMA 3</p><p>26</p><p>DIRETO AO PONTO</p><p>Em Processamento de Linguagem Natural (PLN), há uma hierarquia</p><p>de lentes por meio das quais podemos extrair significado – de</p><p>palavras a sentenças, de parágrafos a documentos. No nível</p><p>do documento, uma das maneiras mais úteis de entender o</p><p>texto é analisando seus tópicos. O processo de aprendizagem,</p><p>reconhecimento e extração desses tópicos em uma coleção de</p><p>documentos é chamado de modelagem de tópicos.</p><p>A LSA (Latent Semantic Analysis ou Análise Semântica Latente) é uma</p><p>das técnicas fundamentais na modelagem de tópicos. Seu objetivo</p><p>principal é pegar uma matriz do que temos – documentos e termos</p><p>– e decompor em uma matriz separada de documento-tópico e em</p><p>uma outra matriz de tópico-termo.</p><p>A primeira etapa dessa técnica é gerar a matriz documento-termo.</p><p>Desse modo, dado m (que é a quantidade de documentos) e n</p><p>(que representa a quantidade de palavras em nosso vocabulário),</p><p>podemos construir uma matriz A m x n, em que cada linha</p><p>representa um documento e cada coluna representa uma palavra.</p><p>Na versão mais simples do LSA, cada entrada pode ser</p><p>simplesmente uma contagem bruta do número de vezes que</p><p>a j-ésima palavra apareceu no i-ésimo documento. Na prática,</p><p>entretanto, as contagens brutas não funcionam muito bem, porque</p><p>não levam em consideração o significado de cada palavra no</p><p>documento. Por exemplo, a palavra “nuclear” provavelmente nos</p><p>informa mais sobre o(s) tópico(s) de um determinado documento do</p><p>que a palavra “teste”.</p><p>Sendo assim, os modelos LSA geralmente substituem as contagens</p><p>brutas na matriz do termo do documento por uma pontuação tf-</p><p>idf, que é um método para calcular o peso das palavras com base</p><p>27</p><p>na frequência com que ocorrem. Em outras palavras, ele pertence a</p><p>um grupo específico de algoritmos que calculam o peso estatístico</p><p>de um determinado termo. Como pode parecer um pouco confuso,</p><p>vamos analisar mais a fundo.</p><p>TF, ou frequência do termo, verifica a frequência com que o termo</p><p>aparece no documento em relação à quantidade de conteúdo</p><p>dentro dele. Já IDF, ou frequência de documento invertida, calcula a</p><p>razão inversa do número de documentos em que a palavra ocorreu</p><p>e compara com todos os documentos do conjunto. A melhor parte</p><p>é que ele também pode determinar palavras populares dentro dos</p><p>tópicos, então os resultados são adequados para a área em que</p><p>você está trabalhando.</p><p>A Figura 1 apresenta a equação TF-IDF. Observe que esta é o</p><p>resultado da multiplicação da função de TF pela função IDF.</p><p>Figura 1 – TF-IDF</p><p>Fonte: elaborada pelo autor.</p><p>Graças ao TF-IDF, é possível descobrir palavras que são relevantes</p><p>em termos do contexto de uma expressão particular. Isso é perfeito</p><p>para otimizar totalmente as páginas, bem como construir tópicos</p><p>relevantes para obter melhores resultados de SEO (Search Engine</p><p>Otimization ou otimização para mecanismos de busca). Além disso, o</p><p>TF-IDF permite que você classifique as palavras da mais importante</p><p>para a menos importante, o que significa que você pode ter uma</p><p>ideia clara do escopo das palavras para o tópico selecionado.</p><p>28</p><p>Para obter os melhores e mais eficazes resultados da análise TF-IDF,</p><p>são necessários:</p><p>• Um grande conjunto de documentos em uma coleção ou</p><p>corpus para análises valiosas.</p><p>• Um banco de dados com IDF pré-calculado para cada termo, a</p><p>fim de obter resultados valiosos rapidamente.</p><p>Na modelagem de tópicos, o LSA é usado principalmente para</p><p>pesquisa de conceito e categorização automatizada de documentos.</p><p>No entanto, também é usada em engenharia de software</p><p>(para entender o código-fonte), publicações (resumo de texto),</p><p>mecanismos de otimização de pesquisa e outros aplicativos.</p><p>PARA SABER MAIS</p><p>Word embeddings, ou incorporação de palavras, é um tipo de</p><p>aprendizado sem supervisão que tem sido bem-sucedido em muitas</p><p>tarefas de PLN, sendo frequentemente visto como algo semelhante</p><p>a uma bala de prata. Na verdade, em muitas arquiteturas de PLN, o</p><p>word embedding substitui, quase que completamente, os recursos de</p><p>distribuição tradicionais como LSA.</p><p>Esse aprendizado usa vetores one-hot, ou seja, se você tiver 10</p><p>mil palavras em seu vocabulário, poderá representar cada palavra</p><p>como um vetor 1x10 mil. Por exemplo, vamos supor que em nosso</p><p>vocabulário há apenas quatro palavras: Banana, Morango, Cidade e</p><p>Campinas. Podemos representar essas palavras da seguinte forma:</p><p>• Banana [1, 0, 0, 0].</p><p>• Morango [0, 1, 0, 0].</p><p>29</p><p>• Cidade [0, 0, 1, 0].</p><p>• Campinas [0, 0, 0, 1].</p><p>Observe que o tamanho do vetor depende diretamente do</p><p>vocabulário. Se ele possui quatro palavras, então o vetor terá quatro</p><p>posições; por outro lado, se tiver 10 mil palavras, o vetor para cada</p><p>palavra terá 10 mil posições! No entanto, isso acaba sendo um</p><p>problema, afinal o vetor pode ser enorme, gerando um desperdício</p><p>de espaço em memória, além de aumentar exponencialmente a</p><p>complexidade do algoritmo.</p><p>Outro problema é que esses embeddings serão ligados intimamente</p><p>a suas aplicações. Desse modo, se retirarmos ou adicionarmos uma</p><p>nova palavra no vocabulário, será necessário treinar novamente</p><p>todo o modelo. Ou seja, para adicionarmos mais uma palavra em</p><p>nosso vocabulário apresentado anteriormente, seria necessário</p><p>adicionar uma posição a mais no vetor para cada uma das palavras,</p><p>ou seja, teríamos que treinar novamente o modelo!</p><p>Por fim, todo o propósito da criação de embedding é capturar</p><p>o significado contextual ou semântico das palavras, o que essa</p><p>representação não consegue fazer. Não há correlação entre palavras</p><p>com significado ou uso semelhante.</p><p>Uma solução seria utilizar os modelos CBOW (Continuous Bag of</p><p>Words Model) ou Skip-gram, usados para aprender as representações</p><p>de palavras subjacentes para cada palavra de entrada utilizando-se</p><p>de redes neurais. Assim:</p><p>• CBOW: tende a prever a probabilidade de uma palavra em</p><p>um contexto. Um contexto pode ser uma única palavra ou um</p><p>grupo de palavras.</p><p>30</p><p>• Skip-gram: segue a mesma topologia do CBOW, porém seu</p><p>objetivo é prever o contexto de uma palavra.</p><p>Um dos melhores exemplos de um aplicativo de PLN é o recurso de</p><p>previsão da próxima palavra de um teclado de smartphone, recurso</p><p>que bilhões de pessoas usam centenas de vezes todos os dias.</p><p>TEORIA EM PRÁTICA</p><p>A LYCA é uma empresa com mais de dez anos no mercado e todas</p><p>as suas vendas se concentram na internet, sem a existência de lojas</p><p>físicas. Com quase 1 milhão de acessos diários, está enfrentando</p><p>um grande problema: muitos consumidores acessam seu</p><p>e-commerce, colocam o produto no carrinho, porém não concluem</p><p>a compra, abandonando-o. No ano passado, ela contabilizou esse</p><p>montante de desistência de compras e o valor ultrapassou os R$</p><p>20 milhões! A empresa procurou você para ajudar a entender esse</p><p>comportamento dos clientes e fazer com que as desistências se</p><p>revertam em vendas.</p><p>Reflita sobre o caso apresentado pela empresa. Considerando os</p><p>conceitos</p><p>sobre PLN, como você responderia à solicitação dessa</p><p>empresa? Qual ou quais soluções você apresentaria?</p><p>Para conhecer a resolução comentada proposta pelo professor,</p><p>acesse a videoaula deste Teoria em Prática no ambiente de</p><p>aprendizagem.</p><p>31</p><p>LEITURA FUNDAMENTAL</p><p>Prezado aluno, as indicações a seguir podem estar disponíveis</p><p>em algum dos parceiros da nossa Biblioteca Virtual (faça o log</p><p>in por meio do seu AVA), e outras podem estar disponíveis em</p><p>sites acadêmicos (como o SciELO), repositórios de instituições</p><p>públicas, órgãos públicos, anais de eventos científicos ou</p><p>periódicos científicos, todos acessíveis pela internet.</p><p>Isso não significa que o protagonismo da sua jornada de</p><p>autodesenvolvimento deva mudar de foco. Reconhecemos</p><p>que você é a autoridade máxima da sua própria vida e deve,</p><p>portanto, assumir uma postura autônoma nos estudos e na</p><p>construção da sua carreira profissional.</p><p>Por isso, nós o convidamos a explorar todas as possibilidades da</p><p>nossa Biblioteca Virtual e além! Sucesso!</p><p>Indicação 1</p><p>No Capítulo 5 do livro indicado, os autores realizam um estudo com</p><p>o objetivo de apresentar a anatomia de um mecanismo de busca,</p><p>desde o ciclo de desenvolvimento até o processo de otimização de</p><p>buscas. Trata-se de um assunto relevante para o tópico estudado,</p><p>merecendo muita atenção.</p><p>TURBAN, E.; DELEN, D.; SHARDA, R. Business Intelligence e Análise</p><p>de Dados para gestão de negócio. 4. ed. Porto Alegre: Bookman,</p><p>2019. p. 346-351.</p><p>Indicações de leitura</p><p>32</p><p>Indicação 2</p><p>No livro indicado, entre as páginas 117 e 204, os autores apresentam</p><p>os principais conceitos e técnicas da representação vetorial de</p><p>textos, explicando e demonstrando com exemplos as técnicas de</p><p>Bag of Words, TF-IDF e word embeddings. Em seguida, trazem um</p><p>exemplo em python sobre a utilização de word embedding. Trata-</p><p>se de uma leitura ideal para a conclusão do estudo deste Tema,</p><p>contribuindo fortemente para seu processo de aprendizagem.</p><p>MARTINS, J. et al. Processamento de Linguagem Natural. Porto</p><p>Alegre: Sagah, 2020. p. 117-204.</p><p>QUIZ</p><p>Prezado aluno, as questões do Quiz têm como propósito a</p><p>verificação de leitura dos itens Direto ao Ponto, Para Saber</p><p>Mais, Teoria em Prática e Leitura Fundamental, presentes neste</p><p>Aprendizagem em Foco.</p><p>Para as avaliações virtuais e presenciais, as questões serão</p><p>elaboradas a partir de todos os itens do Aprendizagem em Foco</p><p>e dos slides usados para a gravação das videoaulas, além de</p><p>questões de interpretação com embasamento no cabeçalho</p><p>da questão.</p><p>1. Um dos métodos de modelagem de tópicos é o _________. Ele</p><p>é responsável por calcular a _________ com que as palavras</p><p>ocorrem nos documentos e presume que ___________</p><p>semelhantes conterão aproximadamente a mesma</p><p>distribuição de frequências de __________ para certos grupos de</p><p>palavras.</p><p>33</p><p>Assinale a alternativa que completa corretamente as lacunas.</p><p>a. LSA; frequência; documentos; palavras.</p><p>b. Word embedding; regularidade; textos; tópicos.</p><p>c. LSA; regularidade; textos; palavras.</p><p>d. LSA; frequência; textos; palavras.</p><p>e. Word embedding; frequência; documentos; tópicos.</p><p>2. Em word embedding, um _________ de palavras codifica a</p><p>relação ____________ entre ____________. Trata-se de um</p><p>conceito muito importante de incorporação de palavras</p><p>que, ao contrário de BoW, representa apenas ___________.</p><p>Assinale a alternativa que completa corretamente as</p><p>lacunas.</p><p>a. Conjunto; semântica; documentos; zero ou um.</p><p>b. Vetor; direta; documentos; a relação direta.</p><p>c. Vetor; semântica; palavras; zero ou um.</p><p>d. Conjunto; direta; documentos; zero ou um.</p><p>e. Vetor; direta; palavras; a relação direta.</p><p>GABARITO</p><p>Questão 1 - Resposta A</p><p>Resolução: O LSA é um método de modelagem de tópicos</p><p>que contabiliza a frequência com que certas palavras ocorrem</p><p>em documentos. Ele considera que documentos semelhantes</p><p>conterão a mesma frequência de palavras para certos grupos</p><p>de palavras.</p><p>34</p><p>Questão 2 - Resposta C</p><p>Resolução: Word embeddings são representações densas de</p><p>palavras em um espaço vetorial de baixa dimensão. O vetor</p><p>realiza a codificação semântica entre as palavras dentro de um</p><p>contexto, representando os valores entre zero e um.</p><p>Modelos PLN</p><p>______________________________________________________________</p><p>Autoria: Ariel da Silva Dias</p><p>Leitura crítica: Rafael Albuquerque Pinto</p><p>TEMA 4</p><p>36</p><p>DIRETO AO PONTO</p><p>Nos últimos anos, todos nós temos nos beneficiados da Inteligência</p><p>Artificial (IA) diariamente, seja em um sistema de recomendação de</p><p>música, visualização de mapas do Google ou Waze, entre outros.</p><p>Entretanto, como ainda existe muita confusão entre o conceito de IA</p><p>e suas ramificações, como Machine Learning e Deep Learning, vamos</p><p>entender todos esses conceitos. Nesse sentido, a Figura 1 ilustra a</p><p>relação entre eles, bem como a cronologia de acontecimentos.</p><p>Figura 1 – Linha do tempo da Inteligência Artificial</p><p>Fonte: elaborada pelo autor</p><p>Observe pela figura que, desde o final da primeira metade do</p><p>século XX, o ramo de Inteligência Artificial evoluiu muito. Em seus</p><p>momentos áureos, viu nascer o ramo de Machine Learning, o qual</p><p>usa algoritmos matemáticos para permitir que os algoritmos</p><p>aprendam. Indo um pouco além, ele representa a interseção da</p><p>Ciência da Computação com as teorias da Estatística, atuando no</p><p>reconhecimento de padrões presentes nos dados (HAYKIN, 2007).</p><p>Resumidamente, podemos inferir que o Machine Learning é o ramo</p><p>de IA para quando os computadores aprendem a partir de dados,</p><p>37</p><p>sendo principalmente utilizado para realizar tarefas específicas.</p><p>Em geral, esse processo de aprendizagem pode ser supervisionado</p><p>ou não supervisionado, dependendo dos dados que estão sendo</p><p>usados para alimentar os algoritmos (HAYKIN, 2007). Observe</p><p>então que o Machine Learning é uma técnica (e não apenas baseado</p><p>em algoritmos) que possibilita utilizar os conceitos de Inteligência</p><p>Artificial lá da década de 1950.</p><p>Já no início do século XXI, nasceu o ramo da IA denominado Deep</p><p>Learning, que é baseado em Machine Learning, porém, em vez de</p><p>utilizar algoritmos de regressão e árvores de decisão, utiliza redes</p><p>neurais. Seus algoritmos podem ser descritos então como uma</p><p>evolução do Machine Learning, afinal ele tenta simular a maneira</p><p>como o cérebro humano aprende e tira conclusões.</p><p>Desse modo, é possível observar que tanto Machine Learning quanto</p><p>Deep Learning têm o mesmo propósito: simular ou imitar o modo</p><p>como o cérebro humano aprende. Porém, a diferença reside no</p><p>tipo de algoritmo utilizado em cada uma das técnicas. Além disso, o</p><p>Deep Learning exige uma quantidade muito grande de dados, o que</p><p>significa que, ao construir um sistema que identificará um cachorro</p><p>da raça Poodle em um conjunto de fotos, é necessário que a base de</p><p>dados de aprendizagem possua milhões de imagens, pois, somente</p><p>assim, o algoritmo aprenderá o que é um Poodle.</p><p>Outra característica inerente ao Deep Learning é o poder</p><p>computacional que ele exige. Por necessitar relacionar diversos</p><p>tipos de dados e efetuar muitos cálculos, esse tipo de algoritmo</p><p>consome muito os recursos computacionais, principalmente o</p><p>processador. Entretanto, devido ao avanço tecnológico e ao conceito</p><p>de Infraestrutura como Serviço em computação em nuvem, o tempo</p><p>de treinamento de uma rede neural diminuiu consideravelmente.</p><p>38</p><p>Por fim, ao falarmos sobre Machine Learning, estamos considerando</p><p>algoritmos simples que utilizam regressão linear e árvore de</p><p>decisão. Já o Deep Learning é baseado em redes neurais artificiais.</p><p>A Inteligência Artificial tem muitas aplicações excelentes que estão</p><p>mudando o mundo da tecnologia. Embora a criação de um sistema</p><p>de IA tão inteligente quanto os humanos continue sendo um sonho,</p><p>o Machine Learning já permite que o computador nos supere em</p><p>cálculos, reconhecimento de padrões e detecção de anomalias.</p><p>Em um modo mais avançado, o Deep Learning utiliza-se de redes</p><p>neurais e necessita de um conjunto de dados bem maior, o que gera</p><p>resultados melhores quando comparados com o Machine Learning</p><p>(HAYKIN,</p><p>2007).</p><p>Referências bibliográficas</p><p>HAYKIN, S. Redes Neurais: princípios e práticas. Porto Alegre: Bookman. 2007.</p><p>PARA SABER MAIS</p><p>A Inteligência Artificial começou a ser descrita em 1956, em</p><p>uma conferência de Ciência da Computação em Dartmouth. Em</p><p>sua essência, tratava-se de uma tentativa de modelar como o</p><p>cérebro humano funciona e, com base nesse conhecimento, criar</p><p>computadores mais avançados. Os cientistas esperavam que não</p><p>demorasse muito para entender como funciona a mente humana</p><p>e digitalizá-la, afinal a conferência reuniu algumas das mentes mais</p><p>brilhantes da época para uma sessão intensiva de brainstorming de</p><p>dois meses.</p><p>Por um lado, o resultado dessa conferência não foi tão positivo</p><p>quanto o esperado, e, desse modo, os cientistas concluíram que,</p><p>com a tecnologia da época, não era possível imitar o cérebro por</p><p>39</p><p>meio de programação. Entretanto, por outro, houve bons resultados</p><p>também. Eles entenderam que os principais fatores que tornam</p><p>uma máquina inteligente são: aprender (para interagir com</p><p>ambientes mutáveis e espontâneos), processamento de linguagem</p><p>natural (para interação homem-máquina) e criatividade (para</p><p>resolver alguns problemas da humanidade).</p><p>Atualmente o conceito de Inteligência Artificial pode ser dividido em</p><p>três categorias:</p><p>• IA Fraca: ideal para realizar tarefas específicas. Por exemplo,</p><p>em 1996, o computador Deep Blue derrotou o grande</p><p>xadrezista Garry Kasparov. Tratava-se de uma máquina</p><p>desenvolvida para um fim específico: ganhar de Kasparov</p><p>(lenda xadrezista) no Xadrez. Logo, ela máquina não podia se</p><p>passar por humano, pois não podia atuar em outro campo fora</p><p>de suas capacidades pré-programadas.</p><p>• IA Forte: este é o ponto desejado de uma inteligência artificial,</p><p>a qual está mais próxima do humano. Por exemplo, você pode</p><p>entrar em contato com uma pizzaria e solicitar uma pizza sem</p><p>sequer falar com um humano, realizando toda a interação com</p><p>um chatbot. Outro exemplo são as assistentes como a Siri da</p><p>Apple ou o Google Assistente, os quais podem manter uma</p><p>conversa.</p><p>• Superinteligência: esta é a palavra que vem à mente de</p><p>muitas pessoas ao pensar em IA, a qual muitas vezes é</p><p>tida como sinônimo de um ser inteligente, sábio, criativo e</p><p>com habilidades sociais. Porém, os cientistas de hoje estão</p><p>distantes de tornar uma máquina emocionalmente autônoma,</p><p>criativa e sábia.</p><p>Para tornar um sistema inteligente, devemos seguir o chamado</p><p>método de criação de IA, que consiste em: estudar como as</p><p>40</p><p>máquinas podem raciocinar, podendo formular deduções e</p><p>induções (raciocínio de máquina); desenvolver e controlar androides</p><p>inteligentes (robótica); e compreender os algoritmos capazes de dar</p><p>autonomia para que modelos computacionais executem tarefas</p><p>específicas (Machine Learning). Em um processo de desenvolvimento</p><p>de um modelo inteligente, é possível considerar a combinação de</p><p>dois ou três desses métodos, ou então utilizá-los individualmente.</p><p>TEORIA EM PRÁTICA</p><p>Existem enormes quantidades de dados sendo produzidos pela</p><p>atual “Era do Big Data”, e certamente veremos, já nos próximos</p><p>anos, inovações que ainda não podemos compreender. De acordo</p><p>com especialistas, algumas dessas inovações provavelmente serão</p><p>aplicativos de Deep Learning.</p><p>Reflita sobre os conceitos de Machine Learning e Deep Learning em</p><p>processos de análise de dados e relacione com o vasto número</p><p>de dados que são produzidos diariamente. Agora, estando no</p><p>papel de gerente de uma grande empresa, você sugere utilizar</p><p>técnicas de Inteligência Artificial, mais especificamente Machine</p><p>Learning e Deep Learning, para uma tomada de decisão estratégica</p><p>para o atendimento ao cliente. Seu superior então lhe questiona:</p><p>o que Machine Learning e Deep Learning podem significar para o</p><p>atendimento ao cliente? Qual seria sua resposta?</p><p>Para conhecer a resolução comentada proposta pelo professor,</p><p>acesse a videoaula deste Teoria em Prática no ambiente de</p><p>aprendizagem.</p><p>41</p><p>LEITURA FUNDAMENTAL</p><p>Prezado aluno, as indicações a seguir podem estar disponíveis</p><p>em algum dos parceiros da nossa Biblioteca Virtual (faça o log</p><p>in por meio do seu AVA), e outras podem estar disponíveis em</p><p>sites acadêmicos (como o SciELO), repositórios de instituições</p><p>públicas, órgãos públicos, anais de eventos científicos ou</p><p>periódicos científicos, todos acessíveis pela internet.</p><p>Isso não significa que o protagonismo da sua jornada de</p><p>autodesenvolvimento deva mudar de foco. Reconhecemos</p><p>que você é a autoridade máxima da sua própria vida e deve,</p><p>portanto, assumir uma postura autônoma nos estudos e na</p><p>construção da sua carreira profissional.</p><p>Por isso, nós o convidamos a explorar todas as possibilidades da</p><p>nossa Biblioteca Virtual e além! Sucesso!</p><p>Indicação 1</p><p>No artigo indicado, os autores iniciam realizando uma revisão sobre</p><p>Machine Learning e Deep Learning, categorizando e exemplificando</p><p>esses ramos da Inteligência Artificial. Em seguida, apresentam sua</p><p>aplicação na detecção de anomalias em rede de computadores,</p><p>em uma proposta para a construção de um ambiente cibernético</p><p>seguro.</p><p>XIN, Y. et al. Machine Learning and Deep Learning Methods</p><p>for Cybersecurity. EE Access, [s.l.], v. 6, p. 35.365-35.381,</p><p>2018. Disponível em: https://ieeexplore.ieee.org/abstract/</p><p>document/8359287. Acesso em: 26 maio 2021.</p><p>Indicações de leitura</p><p>42</p><p>Indicação 2</p><p>No livro indicado, nas páginas 111 a 122, os autores apresentam os</p><p>principais conceitos relacionados a redes neurais artificiais. Trata-</p><p>se de uma introdução completa, abordando principalmente as</p><p>estruturas de uma rede neural e caracterizando-as, bem como os</p><p>principais algoritmos de redes neurais artificiais.</p><p>SILVA, F. et al. Inteligência Artificial. Porto Alegre: SAGAH, 2019. p.</p><p>111-122.</p><p>QUIZ</p><p>Prezado aluno, as questões do Quiz têm como propósito a</p><p>verificação de leitura dos itens Direto ao Ponto, Para Saber</p><p>Mais, Teoria em Prática e Leitura Fundamental, presentes neste</p><p>Aprendizagem em Foco.</p><p>Para as avaliações virtuais e presenciais, as questões serão</p><p>elaboradas a partir de todos os itens do Aprendizagem em Foco</p><p>e dos slides usados para a gravação das videoaulas, além de</p><p>questões de interpretação com embasamento no cabeçalho</p><p>da questão.</p><p>1. Enquanto os algoritmos de ______________ tradicionais possuem</p><p>uma estrutura bastante simples, como regressão linear ou</p><p>uma ____________, o ____________ é baseado em ____________, que</p><p>é como um cérebro humano, complexo e interligado.</p><p>Assinale a alternativa que completa adequadamente as</p><p>lacunas:</p><p>43</p><p>a. Machine Learning; árvore de decisão; Deep Learning; rede</p><p>neural.</p><p>b. Deep Learning; rede neural; Machine Learning; árvore de</p><p>decisão.</p><p>c. Machine Learning; rede neural; Deep Learning; árvore de</p><p>decisão.</p><p>d. Deep Learning; árvore de decisão; Machine Learning; rede</p><p>neural.</p><p>e. Deep Learning; rede neural; Machine Learning; rede neural.</p><p>2. A Inteligência Artificial (IA) é a base de todo aprendizado de</p><p>computador e o futuro de todas as decisões complexas, pois,</p><p>por meio do emprego de técnicas e ferramentas, é possível</p><p>interpretar dados para uma tomada estratégica mais certeira,</p><p>se comparada a uma análise humana.</p><p>Sobre inteligência artificial forte, assinale a alternativa correta.</p><p>a. Trata-se de um conjunto de programas de computador que</p><p>produz resultados considerados semelhantes à inteligência</p><p>humana, entregando aquilo que foi solicitado.</p><p>b. É a incorporação das capacidades intelectuais humanas, como</p><p>fazer planos para o futuro com base em conhecimentos e</p><p>experiências, dentro de um computador.</p><p>c. Em IA, o conceito de IA Forte corresponde ao estudo de</p><p>faculdades mentais, por intermédio do computador, e como o</p><p>uso de modelos mentais implementados em um computador</p><p>é denominado.</p><p>d. Denominamos a construção da inteligência focada em um</p><p>problema, ou domínio específico, assim como nossos próprios</p><p>cérebros humanos, como sendo IA Forte.</p><p>44</p><p>e. Entre os exemplos de IA Forte, podemos citar tecnologias,</p><p>como reconhecimento de imagem e fala, chatbots com IA ou,</p><p>até</p><p>mesmo, carros autônomos.</p><p>GABARITO</p><p>Questão 1 - Resposta A</p><p>Resolução: Os algoritmos de Machine Learning são baseados</p><p>em regressão linear e em árvores de decisão. Por outro lado,</p><p>o Deep Learning, um ramo do Machine Learning, requer menos</p><p>intervenção humana e é baseado em redes neurais, as quais</p><p>são próximas ao cérebro humano.</p><p>Questão 2 - Resposta B</p><p>Resolução: A IA forte está focada na criação de máquinas</p><p>inteligentes que possam executar com êxito qualquer tarefa</p><p>intelectual que um ser humano pode desempenhar. Além disso,</p><p>existem aspectos auxiliares que acompanham esses requisitos</p><p>principais, como a capacidade de raciocinar, resolver quebra-</p><p>cabeças, representar conhecimento e planejar. Observe então</p><p>que IA Forte não é para um fim específico, como chatbots,</p><p>carros autônomos, entre outros.</p><p>BONS ESTUDOS!</p><p>Apresentação da disciplina</p><p>Introdução</p><p>TEMA 1</p><p>Direto ao ponto</p><p>Para saber mais</p><p>Teoria em prática</p><p>Leitura fundamental</p><p>Quiz</p><p>Gabarito</p><p>TEMA 2</p><p>Direto ao ponto</p><p>Para saber mais</p><p>Teoria em prática</p><p>Leitura fundamental</p><p>Quiz</p><p>Gabarito</p><p>TEMA 3</p><p>Direto ao ponto</p><p>Para saber mais</p><p>Teoria em prática</p><p>Leitura fundamental</p><p>Quiz</p><p>Gabarito</p><p>TEMA 4</p><p>Direto ao ponto</p><p>Para saber mais</p><p>Teoria em prática</p><p>Quiz</p><p>Gabarito</p><p>Inicio 2:</p><p>Botão TEMA 4:</p><p>Botão TEMA 1:</p><p>Botão TEMA 2:</p><p>Botão TEMA 3:</p><p>Botão TEMA 9:</p><p>Inicio :</p>

Mais conteúdos dessa disciplina