Aprendizagem em Foco (PDF para download)

Exatas

Vladimir Carlos Alves

em 25/10/2024

Conteúdos escolhidos para você

123 pág.

Inteligência Artificial na Educação

UNINASSAU

18 pág.

PROCESSAMENTO DE LINGUAGEM NATURAL

UAM

25 pág.

Inteligência Artificial no Contexto do Serviço Público

UNB

149 pág.

ChatGPT para o dia a dia

UCAM

51 pág.

Visão geral de PLN

ESTÁCIO

Perguntas dessa disciplina

Pergunta 1 A Engenharia de Prompt transforma a interação com as IAs Generativas de um simples diálogo para uma colaboração cocriativa. Os prompts mais

O avanço das Inteligências Artificiais Generativas (IAs Generativas) transformou o panorama acadêmico, oferecendo novas formas de interagir com o conh

Questão 1 | MATEMATICA INSTRUMENTAL - DIGITAL A vantagem de utilizar um gráfico ao invés de uma tabela está na possibilidade de uma rápida impressão v

FAEL

O mundo mediado por algoritmos Sistemas lógicos que sustentam os programas de computador têm impacto crescente no cotidiano Bruno de Pierro – Revis...

Olá, estudante do curso de Biblioteconomia. A atividade proposta corresponde ao M.A.P.A. (Material de Avaliação Prática da Aprendizagem). O objetiv...

Material

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Conteúdos escolhidos para você

123 pág.

Inteligência Artificial na Educação

UNINASSAU

18 pág.

PROCESSAMENTO DE LINGUAGEM NATURAL

UAM

25 pág.

Inteligência Artificial no Contexto do Serviço Público

UNB

149 pág.

ChatGPT para o dia a dia

UCAM

51 pág.

Visão geral de PLN

ESTÁCIO

Perguntas dessa disciplina

Pergunta 1 A Engenharia de Prompt transforma a interação com as IAs Generativas de um simples diálogo para uma colaboração cocriativa. Os prompts mais

O avanço das Inteligências Artificiais Generativas (IAs Generativas) transformou o panorama acadêmico, oferecendo novas formas de interagir com o conh

Questão 1 | MATEMATICA INSTRUMENTAL - DIGITAL A vantagem de utilizar um gráfico ao invés de uma tabela está na possibilidade de uma rápida impressão v

FAEL

O mundo mediado por algoritmos Sistemas lógicos que sustentam os programas de computador têm impacto crescente no cotidiano Bruno de Pierro – Revis...

Olá, estudante do curso de Biblioteconomia. A atividade proposta corresponde ao M.A.P.A. (Material de Avaliação Prática da Aprendizagem). O objetiv...

Prévia do material em texto

<p>WBA0873_v1.0</p><p>APRENDIZAGEM EM FOCO</p><p>PROCESSAMENTO DE</p><p>LINGUAGEM NATURAL</p><p>2</p><p>APRESENTAÇÃO DA DISCIPLINA</p><p>Autoria: Ariel da Silva Dias</p><p>Leitura crítica: Rafael Albuquerque Pinto</p><p>Na década de 1950, Alan Turing realizou um experimento mental</p><p>chamado Jogo da Imitação. Naquela oportunidade, começava a</p><p>traçar as primeiras linhas daquilo que hoje conhecemos como</p><p>inteligência artificial.</p><p>Atualmente, muitos procedimentos repetitivos e cansativos que</p><p>eram feitos por humanos passaram a ser realizados por máquinas.</p><p>Com isso, essas pessoas ocuparam outros espaços, realizando</p><p>atividades que exijam mais de seu intelecto e de suas habilidades.</p><p>Entre as diversas ferramentas de inteligência artificial, o</p><p>Processamento de Linguagem Natural (PLN) se destaca devido a sua</p><p>versatilidade e flexibilidade. Ele pode ser aplicado em diversas áreas,</p><p>como filtros de e-mail, motores de busca on-line, predição de texto,</p><p>classificação de feedback do cliente, chatbots, entre outros.</p><p>Pense na quantidade de texto que você lê no dia a dia: mensagens,</p><p>e-mails, correspondências, cardápios, páginas web, entre outros.</p><p>Agora, vamos para outro sentido, que é da fala. Conversamos com</p><p>outras pessoas, seja por voz ou por sinais, como LIBRAS; assim, voz,</p><p>textos e sinais são como nós nos comunicamos. Dada a importância</p><p>desse tipo de comunicação, precisamos ter métodos e técnicas</p><p>computacionais para permitir que o computador também possa</p><p>compreender e raciocinar com dados de entradas como fala ou</p><p>texto. E esse é o estudo do PLN.</p><p>Desse modo, esta disciplina tem como objetivo estudar os principais</p><p>conceitos, técnicas e ferramentas relacionadas ao PLN, bem como</p><p>3</p><p>apresentar suas aplicações e implicações em diversos cenários. Bons</p><p>estudos!</p><p>INTRODUÇÃO</p><p>Olá, aluno (a)! A Aprendizagem em Foco visa destacar, de maneira</p><p>direta e assertiva, os principais conceitos inerentes à temática</p><p>abordada na disciplina. Além disso, também pretende provocar</p><p>reflexões que estimulem a aplicação da teoria na prática</p><p>profissional. Vem conosco!</p><p>Introdução ao PLN</p><p>______________________________________________________________</p><p>Autoria: Ariel da Silva Dias</p><p>Leitura crítica: Rafael Albuquerque Pinto</p><p>TEMA 1</p><p>5</p><p>DIRETO AO PONTO</p><p>A mineração de texto busca extrair informações úteis e importantes</p><p>de formatos de documentos heterogêneos, como páginas da web,</p><p>e-mails, postagens em mídias sociais, entre outros. Isso geralmente</p><p>é feito por meio da identificação de padrões em textos, como</p><p>tendências no uso de palavras e estrutura sintática.</p><p>Se por um lado a mineração de dados lida com dados estruturados</p><p>– dados altamente formatados, como em bancos de dados SQL</p><p>(Structured Query Language) –, a mineração de texto lida com dados</p><p>textuais não estruturados, ou seja, texto que não é predefinido</p><p>ou organizado de nenhuma forma (como nos exemplos de mídia</p><p>social). As tecnologias de mineração de texto têm muitas aplicações,</p><p>entre as quais podem ser usadas para fazer ligações entre</p><p>clientes potenciais e produtos para fins de marketing. Empresas e</p><p>governos também podem destacar relacionamentos que você pode</p><p>considerar pessoais.</p><p>A mineração de texto pode ser dividida em cinco etapas:</p><p>Figura 1 – Etapas da mineração de texto</p><p>Fonte: elaborada pelo autor.</p><p>A partir da Figura 1, temos as seguintes descrições para cada etapa:</p><p>6</p><p>• Etapa 1: os dados são coletados a partir de diferentes fontes,</p><p>como sites, e-mails, comentários de clientes, arquivo de</p><p>documento etc. Dependendo da aplicação, esse processo pode</p><p>ser totalmente automatizado ou orientado pelo minerador</p><p>(responsável pela mineração de texto).</p><p>• Etapa 2: são realizadas a identificação e a extração de</p><p>conteúdo, fazendo:</p><p>• Limpeza de texto: remoção de qualquer informação</p><p>desnecessária.</p><p>• Tokenização: para o computador, uma frase é um</p><p>conjunto de caracteres; logo, ele não é capaz de identificar</p><p>palavras. O objetivo da tokenização é dividir a frase (ou o</p><p>texto como um todo) em partes significativas.</p><p>• Extração de características: processo de caracterizar o</p><p>texto para obter medidas quantitativas, como a frequência</p><p>de uma certa palavra em um texto.</p><p>• Etapa 3: criação de um índice para os termos mais frequentes.</p><p>Com isso, o acesso a esses termos fica mais rápido, pois sua</p><p>localização é conhecida.</p><p>• Etapa 4: após todo o processamento, é hora de minerar.</p><p>Desse modo, são aplicados algoritmos para identificar as</p><p>relações entre diferentes termos, a vinculação destes com um</p><p>dicionário ou termos específicos.</p><p>• Etapa 5: a mineração produz um dado bruto, o qual pode ser</p><p>analisado e avaliado pelo minerador.</p><p>Resumidamente, a mineração de texto é responsável por sintetizar</p><p>grandes quantidades de conteúdo de texto em informações de fácil</p><p>7</p><p>compreensão, além de permitir entender o que as pessoas estão</p><p>realmente dizendo sobre seus produtos e serviços, por exemplo.</p><p>Até recentemente, a mineração de dados era a abordagem</p><p>dominante na maioria das empresas, pois elas tinham maior</p><p>controle sobre seus dados estruturados. Entretanto, as coisas estão</p><p>mudando rapidamente. Os volumes de dados estão crescendo</p><p>aceleradamente e a maior parte deles é desestruturado. Sendo</p><p>assim, de olho nesse volume expressivo de dados que os clientes</p><p>estão produzindo, as organizações sabem que devem ser capazes</p><p>de usar a mineração de texto se quiserem liberar o valor bloqueado</p><p>no conteúdo e nas comunicações não estruturadas. Dessa forma,</p><p>a análise de sentimento a partir desses dados não estruturados se</p><p>tornou um importante caso de uso comercial da mineração de texto,</p><p>pois revela as opiniões e preocupações de clientes e parceiros ao</p><p>rastrear e analisar o conteúdo social.</p><p>Existem vários exemplos no mundo real em que a mineração de</p><p>texto pode ser usada para recuperar os dados. Por exemplo, várias</p><p>plataformas de mídia social e mecanismos de pesquisa, incluindo</p><p>o Google, usam técnicas de mineração de texto para ajudar os</p><p>usuários a encontrarem suas pesquisas. E isso ajuda a saber o que</p><p>os usuários estão procurando.</p><p>PARA SABER MAIS</p><p>A primeira fase do Processamento de Linguagem Natural (PLN) na</p><p>década de 1950 foi focada na tradução automática, para a qual os</p><p>computadores usavam cartões perfurados de papel para traduzir</p><p>do russo para o inglês. Porém, atualmente, a tradução automática é</p><p>uma oferta rotineira e as técnicas de processamento de linguagem</p><p>natural floresceram e ficaram ainda mais poderosas.</p><p>8</p><p>Empresas de todos os portes, das menores até as multinacionais,</p><p>usam PLN em chatbots de Inteligência Artificial (IA) para criar ótimas</p><p>experiências para seus clientes durante interações de conversação,</p><p>personalização de respostas com base no que sabem sobre eles,</p><p>entre outras técnicas, tudo para facilitar as transações reais entre</p><p>cliente e empresa. O resultado é o engajamento sob medida, que</p><p>cria experiências notáveis para os usuários finais.</p><p>Nesse contexto, são apresentados a seguir alguns exemplos do uso</p><p>do PLN:</p><p>• Atendimento e suporte ao cliente: os chatbots com PNL</p><p>estão ajudando os clientes a localizarem pontos turísticos e</p><p>mercados mais próximos, a tomarem decisões sobre qual tipo</p><p>de produto pedir no aplicativo de delivery, entre outras coisas,</p><p>atuando como um substituto para o atendimento ao cliente.</p><p>• Permitindo transações: em uma conversa com chatbot, o</p><p>cliente pode, por exemplo, solicitar informações sobre os</p><p>filmes em cartaz no cinema, reservar um ingresso e ainda</p><p>comprar uma pipoca.</p><p>• Análise de sentimento: como os clientes estão avaliando sua</p><p>marca? A forma mais direta é ir onde seu cliente está: mídias</p><p>sociais, contatos no call center, entre outros. Desse modo, é</p><p>possível utilizar o PLN para monitorar o que seu cliente está</p><p>falando e analisar esse feedback.</p><p>• Análise de texto livre: existem muitas fontes valiosas de</p><p>dados e os textos livres são uma dessas fontes, como os</p><p>registros médicos de pacientes, artigos on-line, postagens em</p><p>redes sociais, entre outros.</p><p>Com esses exemplos, observe que o PLN libera o potencial da</p><p>análise de dados, anteriormente</p><p>oculto em trechos de texto,</p><p>9</p><p>à medida que os modelos de linguagem continuam a evoluir.</p><p>Conjuntos maiores de dados, como avaliações de clientes, agora</p><p>podem ser analisados com algoritmos de aprendizado de máquina.</p><p>Além disso, outras áreas podem ser beneficiadas com o PLN, como a</p><p>saúde e a educação.</p><p>TEORIA EM PRÁTICA</p><p>No cenário competitivo atual, as empresas precisam continuar a</p><p>melhorar a experiência do cliente, pois, caso contrário, estarão</p><p>fadadas a serem abandonadas por eles. Considere o seguinte caso:</p><p>uma faculdade, ciente de seu papel social, está preocupada em criar</p><p>um recurso para atender a seus alunos deficientes auditivos em sala</p><p>de aula. Esse recurso deverá ser uma aplicação mobile que facilite a</p><p>vida desses alunos</p><p>Reflita sobre o problema apresentado e sobre os conceitos e as</p><p>técnicas relacionados ao PLN. Como você responderia a solicitação</p><p>dessa faculdade que deseja criar essa ferramenta? Qual alternativa</p><p>pode ser oferecida para o desenvolvimento desse recurso utilizando</p><p>o PLN?</p><p>Para conhecer a resolução comentada proposta pelo professor,</p><p>acesse a videoaula deste Teoria em Prática no ambiente de</p><p>aprendizagem.</p><p>10</p><p>LEITURA FUNDAMENTAL</p><p>Prezado aluno, as indicações a seguir podem estar disponíveis</p><p>em algum dos parceiros da nossa Biblioteca Virtual (faça o log</p><p>in por meio do seu AVA), e outras podem estar disponíveis em</p><p>sites acadêmicos (como o SciELO), repositórios de instituições</p><p>públicas, órgãos públicos, anais de eventos científicos ou</p><p>periódicos científicos, todos acessíveis pela internet.</p><p>Isso não significa que o protagonismo da sua jornada de</p><p>autodesenvolvimento deva mudar de foco. Reconhecemos</p><p>que você é a autoridade máxima da sua própria vida e deve,</p><p>portanto, assumir uma postura autônoma nos estudos e na</p><p>construção da sua carreira profissional.</p><p>Por isso, nós o convidamos a explorar todas as possibilidades da</p><p>nossa Biblioteca Virtual e além! Sucesso!</p><p>Indicação 1</p><p>No Capítulo 1 do livro indicado, o autor apresenta uma introdução</p><p>sobre o aprendizado de máquinas, tratando sobre aprendizados</p><p>supervisionado e não supervisionado. Ambos os aprendizados são</p><p>utilizados em PLN, sendo, por isso, uma leitura recomendada.</p><p>FACELI, K. et al. Inteligência Artificial: uma abordagem de</p><p>aprendizado de máquina. Rio de Janeiro: LTC, 2021.</p><p>Indicações de leitura</p><p>11</p><p>Indicação 2</p><p>No livro indicado, os autores escrevem, entre as páginas 89 e 116, os</p><p>principais conceitos em relação às análises léxica e semântica. Trata-</p><p>se de uma leitura recomendada e complementar ao conteúdo visto</p><p>neste Tema.</p><p>MARTINS, J. et al. Processamentos de linguagem natural. Porto</p><p>Alegre: Sagah, 2020. p. 89-116.</p><p>QUIZ</p><p>Prezado aluno, as questões do Quiz têm como propósito a</p><p>verificação de leitura dos itens Direto ao Ponto, Para Saber</p><p>Mais, Teoria em Prática e Leitura Fundamental, presentes neste</p><p>Aprendizagem em Foco.</p><p>Para as avaliações virtuais e presenciais, as questões serão</p><p>elaboradas a partir de todos os itens do Aprendizagem em Foco</p><p>e dos slides usados para a gravação das videoaulas, além de</p><p>questões de interpretação com embasamento no cabeçalho</p><p>da questão.</p><p>1. A mineração de ___________ pode levar o conceito de mineração</p><p>de ___________ a um estágio adiante, sintetizando grandes</p><p>quantidades de conteúdo em informações de fácil compreensão,</p><p>o que permite entender o que os clientes estão dizendo sobre</p><p>uma empresa. A ____________ se tornou um importante caso de</p><p>uso comercial da mineração de ________, pois revela as opiniões</p><p>e preocupações de clientes e parceiros ao rastrear e analisar o</p><p>conteúdo social.</p><p>12</p><p>Assinale a alternativa que completa corretamente as lacunas.</p><p>a. Texto; dados; análise de sentimento; texto.</p><p>b. Dados; texto; análise de dados; texto.</p><p>c. Dados; texto; análise de sentimento; dados.</p><p>d. Texto; dados; análise de dados; texto.</p><p>e. Dados; dados; análise de dados; dados.</p><p>2. Após uma frase ser analisada para extrair ___________</p><p>e entender a __________, a análise ____________ conclui o</p><p>significado da frase em uma forma livre de contexto como</p><p>uma frase independente. O significado inferido pode não</p><p>ser a intenção real do significado implícito.</p><p>Assinale a alternativa que completa corretamente as</p><p>lacunas.</p><p>a. A entidade; sintaxe; semântica.</p><p>b. Os tokens; expressão; léxica.</p><p>c. Os tokens; sintaxe; sintática.</p><p>d. A entidade; oração; sintática.</p><p>e. Os tokens; sintaxe; léxica.</p><p>GABARITO</p><p>Questão 1 - Resposta A</p><p>Resolução: A mineração de texto possui uma gama de funções</p><p>para transformar dados não estruturados (conteúdo social)</p><p>em dados que possam ser utilizados em uma tomada de</p><p>decisão, com objetivo, por exemplo, de analisar sentimentos</p><p>13</p><p>em uma ação comercial. A mineração de dados trabalha com</p><p>dados estruturados, que são de fácil recuperação, enquanto a</p><p>mineração de texto trabalha com dados não estruturados, os</p><p>quais podem vir de qualquer fonte. Então, a mineração de texto</p><p>está um passo além da mineração de dados.</p><p>Questão 2 - Resposta A</p><p>Resolução: O PLN possui componentes que permitem o</p><p>computador compreender a linguagem. Primeiramente a</p><p>frase é analisada morfologicamente e lexicamente, o objetivo</p><p>é verificar se a palavra está bem formatada e se pertence a</p><p>linguagem. Em seguida, é realizada a análise sintática. Este</p><p>tipo de análise é ideal para verificar a estrutura da frase. Logo</p><p>após, é realizada a análise semântica para compreender o real</p><p>significado da frase.</p><p>Técnicas de pré-processamento de</p><p>texto</p><p>______________________________________________________________</p><p>Autoria: Ariel da Silva Dias</p><p>Leitura crítica: Rafael Albuquerque Pinto</p><p>TEMA 2</p><p>15</p><p>DIRETO AO PONTO</p><p>O pré-processamento de texto é responsável por normalizá-lo, ou</p><p>seja, por convertê-lo em uma forma padrão mais conveniente antes</p><p>de transformá-lo em recursos para modelagem de nível superior.</p><p>Desse modo, essa etapa é responsável por converter a linguagem</p><p>entendível por humanos em uma linguagem legível para máquinas.</p><p>De modo geral, estamos interessados em pegar algum corpo de</p><p>texto e realizar sobre ele alguns tipos de análises e transformações</p><p>básicas, a fim de ficarmos com artefatos que serão muito mais</p><p>úteis para a realização de alguma tarefa analítica mais significativa</p><p>posteriormente. Essa tarefa adicional seria nosso trabalho principal</p><p>de mineração de texto ou processamento de linguagem natural.</p><p>Existem três componentes principais de pré-processamento</p><p>de texto: tokenização, dividida em tokenização de sentença e</p><p>tokenização de palavra; normalização morfológica, responsável</p><p>pela tarefa de stemming e pela lematização; e remoção de ruído,</p><p>responsável pela remoção de palavras indesejadas e/ou pontuações.</p><p>Além disso, de acordo com Tabassum (2020), existem ao menos</p><p>seis etapas para o pré-processamento de texto, iniciando-se pela</p><p>segmentação de sentença, conforme pode ser observado na Figura</p><p>1 a seguir.</p><p>16</p><p>Figura 1 – Etapas do pré-processamento de texto</p><p>Fonte: elaborada pelo autor.</p><p>Analisando a Figura 1, temos a seguinte definição para cada uma das</p><p>etapas:</p><p>• Segmentação de sentença (ou tokenização de sentença): é</p><p>sugerida como sendo a primeira etapa no processamento de</p><p>texto. Isso geralmente é realizado com base em pontuações</p><p>como “.”, “?”, “!”, pois tendem a marcar os limites das frases.</p><p>• Remoção pontuações: como o nome indica, é a etapa</p><p>responsável por remover pontuações como ponto, virgula,</p><p>ponto e vírgula, entre outros. Geralmente é realizada com a</p><p>etapa de tokenização ou segmentação de palavra.</p><p>• Tokenização: junto com a segmentação de sentença, a</p><p>tokenização é crucial no pré-processamento de texto, sendo</p><p>também conhecida como segmentação de palavra. Trata-se</p><p>de uma técnica usada para separar palavras por meio de um</p><p>caractere de espaço exclusivo. Dependendo do aplicativo, a</p><p>tokenização de palavras também pode tokenizar expressões</p><p>com várias palavras, como Rio de Janeiro.</p><p>17</p><p>• Remoção de stopwords: a maioria absoluta dos dados textuais</p><p>com os quais você trabalhará terá palavras não muito úteis</p><p>para</p><p>o computador. Essas palavras, chamadas de stopwords</p><p>ou apalavras irrelevantes, são úteis na fala humana, mas não</p><p>têm muito a contribuir para a análise de dados. Assim, nesta</p><p>etapa, a remoção de stopwords ajuda a eliminar ruídos durante</p><p>a análise de dados.</p><p>• Stemming: a derivação ou o stemming tem o objetivo de</p><p>verificar a origem ou a raiz de uma palavra e, em muitos casos,</p><p>usar essa raiz no lugar da própria palavra. Entre os algoritmos</p><p>mais populares, está o Algoritmo de Porter.</p><p>• Lematização: esta etapa é responsável por retornar a forma</p><p>base da palavra, o que ocorre por meio da análise morfológica</p><p>da palavra.</p><p>A ordem das etapas apresentadas não é necessariamente uma</p><p>sequência fixa e estruturada. Porém, de acordo com Tabassum</p><p>(2020), essa sequência produz um melhor resultado diante de outras</p><p>sequências. O mais importante é que as técnicas sejam aplicadas no</p><p>pré-processamento de texto.</p><p>Referências bibliográficas</p><p>TABASSUM, A.; PATIL, R. A survey on text pre-processing & feature</p><p>extraction techniques in natural language processing. 2020. Disponível</p><p>em: https://www.irjet.net/archives/V7/i6/IRJET-V7I6913.pdf. Acesso em: 1 maio</p><p>2021.</p><p>PARA SABER MAIS</p><p>N-gramas são um conjunto de palavras simultâneas dentro de</p><p>uma determinada janela em uma sentença. Ao calculá-los, você</p><p>18</p><p>normalmente avança uma palavra (embora possa avançar X palavras</p><p>em cenários mais avançados). N-gramas de textos são amplamente</p><p>usados em tarefas de mineração de texto e processamento de</p><p>linguagem natural.</p><p>Por exemplo, para a frase “A ligeira raposa marrom ataca o cão</p><p>preguiçoso.”, considerando N=2 (um bigrama), então teremos os</p><p>seguintes n-gramas:</p><p>• A ligeira.</p><p>• Ligeira raposa.</p><p>• Raposa marrom.</p><p>• Marrom ataca.</p><p>• Ataca o.</p><p>• O cão.</p><p>• Cão preguiçoso.</p><p>Nesse caso, para N=2, temos 7 n-gramas. Observe que mudamos de</p><p>“a ligeira” para “ligeira raposa”, em seguida de “ligeira raposa” para</p><p>“raposa marrom”. Então deslocamos uma janela do tamanho 2 pela</p><p>sentença para gerar o bigrama.</p><p>Agora, em relação a mesma sentença, considere N=3 (um trigrama):</p><p>• A ligeira raposa.</p><p>• Ligeira raposa marrom.</p><p>• Raposa marrom ataca.</p><p>19</p><p>• Marrom ataca o.</p><p>• Ataca o cão.</p><p>• O cão preguiçoso.</p><p>Portanto, para N=3, temos 6 n-gramas. Quando N=1, isso é referido</p><p>como um unigrama e são essencialmente as palavras individuais de</p><p>uma frase.</p><p>Para calcular o n-grama, podemos utilizar a fórmula:</p><p>Ngrama=X-(N-1) = 7 - 2 = 5</p><p>Em que X é igual ao número de palavras da sentença.</p><p>Então, aplicando os valores de N=2 e N=3 do exemplo anterior, os</p><p>respectivos valores de n-grama, considerando X = 8 (oito palavras na</p><p>sentença), temos:</p><p>• N-grama = 8 - (2 - 1) = 8 - 1 = 7.</p><p>• N-grama = 8 - (3 - 1) = 8 - 2 = 6.</p><p>No Python, você pode utilizar o NLTK e importar a biblioteca de</p><p>n-gramas, ou, então, pode desenvolver manualmente, realizando a</p><p>tokenização da sentença para, em seguida, apresentar os tokens.</p><p>Por exemplo, se N=2, então apresenta os tokens de 2 em 2. Se N=3,</p><p>apresenta os tokens de 3 em 3.</p><p>TEORIA EM PRÁTICA</p><p>Você atua como analista de dados em uma empresa responsável por</p><p>gerenciar os espaços públicos das cidades do estado de São Paulo.</p><p>20</p><p>Você atualmente está em um projeto que visa implantar serviço de</p><p>lazer em todas essas cidades; entretanto, existe uma limitação: o</p><p>parque só será construído se a densidade demográfica for maior do</p><p>que 110 pessoas por quilômetro quadrado (110 hab/km²). Observe</p><p>então que, para construí-lo, você e sua equipe precisam saber a</p><p>quantidade de pessoas por quilômetro quadrado dessas cidades.</p><p>Sem a necessidade de neste momento implementar códigos, reflita</p><p>sobre as ferramentas disponíveis para análise de texto e os recursos</p><p>disponíveis que você conhece até o momento:</p><p>Como você e sua equipe podem obter os dados da densidade</p><p>demográfica dos munícipios paulistas? Com base em todos esses</p><p>dados, como poderia ser validado em quais municípios haverá ou</p><p>não o parque? Quais ferramentas você utilizaria para obter essas</p><p>informações?</p><p>Para conhecer a resolução comentada proposta pelo professor,</p><p>acesse a videoaula deste Teoria em Prática no ambiente de</p><p>aprendizagem.</p><p>LEITURA FUNDAMENTAL</p><p>Prezado aluno, as indicações a seguir podem estar disponíveis</p><p>em algum dos parceiros da nossa Biblioteca Virtual (faça o log</p><p>in por meio do seu AVA), e outras podem estar disponíveis em</p><p>sites acadêmicos (como o SciELO), repositórios de instituições</p><p>públicas, órgãos públicos, anais de eventos científicos ou</p><p>periódicos científicos, todos acessíveis pela internet.</p><p>Indicações de leitura</p><p>21</p><p>Isso não significa que o protagonismo da sua jornada de</p><p>autodesenvolvimento deva mudar de foco. Reconhecemos</p><p>que você é a autoridade máxima da sua própria vida e deve,</p><p>portanto, assumir uma postura autônoma nos estudos e na</p><p>construção da sua carreira profissional.</p><p>Por isso, nós o convidamos a explorar todas as possibilidades da</p><p>nossa Biblioteca Virtual e além! Sucesso!</p><p>Indicação 1</p><p>O artigo indicado discute algumas técnicas utilizadas em PLN e que</p><p>são aplicadas na saúde e na educação. No sistema educacional,</p><p>a gramática é útil para melhorar as habilidades dos alunos; já</p><p>no sistema de saúde, o maior desafio é a falta de acesso aos</p><p>prontuários.</p><p>DEVI, N.; PONNUSAMY, R. A Systematic Survey of Natural Language</p><p>Processing (NLP) Approaches in Different Systems. IJCSE, v. 4, n. 7,</p><p>p. 192-198, 2016. Disponível em: https://www.ijcseonline.org/pdf_</p><p>paper_view.php?paper_id=1108&33-IJCSE-%2001753-16.pdf. Acesso</p><p>em: 5 maio 2021.</p><p>Indicação 2</p><p>No Capítulo 3 do livro indicado, o autor apresenta as principais</p><p>técnicas para trabalhar com o texto bruto. Compreenda em</p><p>profundidade as técnicas de tokenização e stopwords utilizando</p><p>Python e NLTK.</p><p>BEYSOLOW, T. Applied Natural Language Processing with Python.</p><p>San Francisco: Apress, 2018. p. 43-75.</p><p>22</p><p>QUIZ</p><p>Prezado aluno, as questões do Quiz têm como propósito a</p><p>verificação de leitura dos itens Direto ao Ponto, Para Saber</p><p>Mais, Teoria em Prática e Leitura Fundamental, presentes neste</p><p>Aprendizagem em Foco.</p><p>Para as avaliações virtuais e presenciais, as questões serão</p><p>elaboradas a partir de todos os itens do Aprendizagem em Foco</p><p>e dos slides usados para a gravação das videoaulas, além de</p><p>questões de interpretação com embasamento no cabeçalho</p><p>da questão.</p><p>1. Stemming é o processo de reduzir a _________ das palavras</p><p>usando um processo heurístico bruto que corta suas pontas</p><p>na esperança de transformá-las corretamente em sua forma</p><p>_________. Existem diferentes algoritmos para realizar o stemming,</p><p>entre eles o mais comum é o Algoritmo de ___________. Já a</p><p>Lematização, por sua vez, é responsável por retornar a forma</p><p>__________ da palavra.</p><p>Assinale a seguir a alternativa que completa corretamente as</p><p>lacunas.</p><p>a. Raiz; base; Inflexão; reduzida.</p><p>b. Complexidade; Base; Porter; raiz.</p><p>c. Inflexão; base; Porter; raiz.</p><p>d. Complexidade; Raiz; Porter; base.</p><p>e. Inflexão; raiz; Porter; base.</p><p>2. Em poucas palavras, pré-processar um texto significa</p><p>colocá-lo em uma forma que seja possível prever e</p><p>23</p><p>analisar o seu conteúdo para uma determinada tarefa. A</p><p>execução correta das etapas de processamento de texto é</p><p>a garantia de sucesso no levantamento de informações ou,</p><p>então, ocorre o pior pesadelo para um analista, pois não</p><p>conseguirá obter as informações desejadas.</p><p>Marque a alternativa que apresenta, segundo o conteúdo</p><p>estudado, a sequência ideal para o pré-processamento de</p><p>texto.</p><p>a. Segmentação de sentença; stemming; lematização;</p><p>tokenização; remoção de pontuações; remoção de stopwords.</p><p>b. Segmentação de sentença; remoção de pontuações;</p><p>tokenização; remoção de stopwords; stemming; lematização.</p><p>c. Segmentação de sentença; tokenização; remoção de</p><p>stopwords; stemming; lematização; remoção de pontuações.</p><p>d. Segmentação de sentença; remoção de stopwords; stemming;</p><p>lematização; remoção de pontuações; tokenização.</p><p>e. Segmentação de sentença; lematização; stemming; remoção de</p><p>stopwords; remoção de pontuações; tokenização.</p><p>GABARITO</p><p>Questão</p><p>1 - Resposta E</p><p>Resolução: O stemming é um processo de derivação que tem o</p><p>objetivo de retornar a raiz de uma palavra. Entre os algoritmos</p><p>existentes, o mais popular é o Algoritmo de Porter. Por outro</p><p>lado, a lematização retorna a forma base da palavra por meio</p><p>da análise morfológica.</p><p>24</p><p>Questão 2 - Resposta B</p><p>Resolução: A primeira etapa é a segmentação de sentença ou</p><p>a tokenização da sentença, cujo objetivo é definir as sentenças</p><p>de um texto. A segunda etapa é a remoção de pontuações, na</p><p>qual são removidos os pontos de interrogação, virgulas, entre</p><p>outros. A terceira etapa é a tokenização ou segmentação de</p><p>palavras, cujo objetivo é separar as palavras por meio de um</p><p>caractere de espaço. A quarta etapa é a remoção das palavras</p><p>indesejáveis ou stopwords. Em seguida, são realizadas as</p><p>etapas de stemming, cujo objetivo é encontrar a raiz de uma</p><p>palavra. Por último, o ocorre a lematização, que retorna a</p><p>forma base da palavra.</p><p>Processamento de texto</p><p>______________________________________________________________</p><p>Autoria: Ariel da Silva Dias</p><p>Leitura crítica: Rafael Albuquerque Pinto</p><p>TEMA 3</p><p>26</p><p>DIRETO AO PONTO</p><p>Em Processamento de Linguagem Natural (PLN), há uma hierarquia</p><p>de lentes por meio das quais podemos extrair significado – de</p><p>palavras a sentenças, de parágrafos a documentos. No nível</p><p>do documento, uma das maneiras mais úteis de entender o</p><p>texto é analisando seus tópicos. O processo de aprendizagem,</p><p>reconhecimento e extração desses tópicos em uma coleção de</p><p>documentos é chamado de modelagem de tópicos.</p><p>A LSA (Latent Semantic Analysis ou Análise Semântica Latente) é uma</p><p>das técnicas fundamentais na modelagem de tópicos. Seu objetivo</p><p>principal é pegar uma matriz do que temos – documentos e termos</p><p>– e decompor em uma matriz separada de documento-tópico e em</p><p>uma outra matriz de tópico-termo.</p><p>A primeira etapa dessa técnica é gerar a matriz documento-termo.</p><p>Desse modo, dado m (que é a quantidade de documentos) e n</p><p>(que representa a quantidade de palavras em nosso vocabulário),</p><p>podemos construir uma matriz A m x n, em que cada linha</p><p>representa um documento e cada coluna representa uma palavra.</p><p>Na versão mais simples do LSA, cada entrada pode ser</p><p>simplesmente uma contagem bruta do número de vezes que</p><p>a j-ésima palavra apareceu no i-ésimo documento. Na prática,</p><p>entretanto, as contagens brutas não funcionam muito bem, porque</p><p>não levam em consideração o significado de cada palavra no</p><p>documento. Por exemplo, a palavra “nuclear” provavelmente nos</p><p>informa mais sobre o(s) tópico(s) de um determinado documento do</p><p>que a palavra “teste”.</p><p>Sendo assim, os modelos LSA geralmente substituem as contagens</p><p>brutas na matriz do termo do documento por uma pontuação tf-</p><p>idf, que é um método para calcular o peso das palavras com base</p><p>27</p><p>na frequência com que ocorrem. Em outras palavras, ele pertence a</p><p>um grupo específico de algoritmos que calculam o peso estatístico</p><p>de um determinado termo. Como pode parecer um pouco confuso,</p><p>vamos analisar mais a fundo.</p><p>TF, ou frequência do termo, verifica a frequência com que o termo</p><p>aparece no documento em relação à quantidade de conteúdo</p><p>dentro dele. Já IDF, ou frequência de documento invertida, calcula a</p><p>razão inversa do número de documentos em que a palavra ocorreu</p><p>e compara com todos os documentos do conjunto. A melhor parte</p><p>é que ele também pode determinar palavras populares dentro dos</p><p>tópicos, então os resultados são adequados para a área em que</p><p>você está trabalhando.</p><p>A Figura 1 apresenta a equação TF-IDF. Observe que esta é o</p><p>resultado da multiplicação da função de TF pela função IDF.</p><p>Figura 1 – TF-IDF</p><p>Fonte: elaborada pelo autor.</p><p>Graças ao TF-IDF, é possível descobrir palavras que são relevantes</p><p>em termos do contexto de uma expressão particular. Isso é perfeito</p><p>para otimizar totalmente as páginas, bem como construir tópicos</p><p>relevantes para obter melhores resultados de SEO (Search Engine</p><p>Otimization ou otimização para mecanismos de busca). Além disso, o</p><p>TF-IDF permite que você classifique as palavras da mais importante</p><p>para a menos importante, o que significa que você pode ter uma</p><p>ideia clara do escopo das palavras para o tópico selecionado.</p><p>28</p><p>Para obter os melhores e mais eficazes resultados da análise TF-IDF,</p><p>são necessários:</p><p>• Um grande conjunto de documentos em uma coleção ou</p><p>corpus para análises valiosas.</p><p>• Um banco de dados com IDF pré-calculado para cada termo, a</p><p>fim de obter resultados valiosos rapidamente.</p><p>Na modelagem de tópicos, o LSA é usado principalmente para</p><p>pesquisa de conceito e categorização automatizada de documentos.</p><p>No entanto, também é usada em engenharia de software</p><p>(para entender o código-fonte), publicações (resumo de texto),</p><p>mecanismos de otimização de pesquisa e outros aplicativos.</p><p>PARA SABER MAIS</p><p>Word embeddings, ou incorporação de palavras, é um tipo de</p><p>aprendizado sem supervisão que tem sido bem-sucedido em muitas</p><p>tarefas de PLN, sendo frequentemente visto como algo semelhante</p><p>a uma bala de prata. Na verdade, em muitas arquiteturas de PLN, o</p><p>word embedding substitui, quase que completamente, os recursos de</p><p>distribuição tradicionais como LSA.</p><p>Esse aprendizado usa vetores one-hot, ou seja, se você tiver 10</p><p>mil palavras em seu vocabulário, poderá representar cada palavra</p><p>como um vetor 1x10 mil. Por exemplo, vamos supor que em nosso</p><p>vocabulário há apenas quatro palavras: Banana, Morango, Cidade e</p><p>Campinas. Podemos representar essas palavras da seguinte forma:</p><p>• Banana [1, 0, 0, 0].</p><p>• Morango [0, 1, 0, 0].</p><p>29</p><p>• Cidade [0, 0, 1, 0].</p><p>• Campinas [0, 0, 0, 1].</p><p>Observe que o tamanho do vetor depende diretamente do</p><p>vocabulário. Se ele possui quatro palavras, então o vetor terá quatro</p><p>posições; por outro lado, se tiver 10 mil palavras, o vetor para cada</p><p>palavra terá 10 mil posições! No entanto, isso acaba sendo um</p><p>problema, afinal o vetor pode ser enorme, gerando um desperdício</p><p>de espaço em memória, além de aumentar exponencialmente a</p><p>complexidade do algoritmo.</p><p>Outro problema é que esses embeddings serão ligados intimamente</p><p>a suas aplicações. Desse modo, se retirarmos ou adicionarmos uma</p><p>nova palavra no vocabulário, será necessário treinar novamente</p><p>todo o modelo. Ou seja, para adicionarmos mais uma palavra em</p><p>nosso vocabulário apresentado anteriormente, seria necessário</p><p>adicionar uma posição a mais no vetor para cada uma das palavras,</p><p>ou seja, teríamos que treinar novamente o modelo!</p><p>Por fim, todo o propósito da criação de embedding é capturar</p><p>o significado contextual ou semântico das palavras, o que essa</p><p>representação não consegue fazer. Não há correlação entre palavras</p><p>com significado ou uso semelhante.</p><p>Uma solução seria utilizar os modelos CBOW (Continuous Bag of</p><p>Words Model) ou Skip-gram, usados para aprender as representações</p><p>de palavras subjacentes para cada palavra de entrada utilizando-se</p><p>de redes neurais. Assim:</p><p>• CBOW: tende a prever a probabilidade de uma palavra em</p><p>um contexto. Um contexto pode ser uma única palavra ou um</p><p>grupo de palavras.</p><p>30</p><p>• Skip-gram: segue a mesma topologia do CBOW, porém seu</p><p>objetivo é prever o contexto de uma palavra.</p><p>Um dos melhores exemplos de um aplicativo de PLN é o recurso de</p><p>previsão da próxima palavra de um teclado de smartphone, recurso</p><p>que bilhões de pessoas usam centenas de vezes todos os dias.</p><p>TEORIA EM PRÁTICA</p><p>A LYCA é uma empresa com mais de dez anos no mercado e todas</p><p>as suas vendas se concentram na internet, sem a existência de lojas</p><p>físicas. Com quase 1 milhão de acessos diários, está enfrentando</p><p>um grande problema: muitos consumidores acessam seu</p><p>e-commerce, colocam o produto no carrinho, porém não concluem</p><p>a compra, abandonando-o. No ano passado, ela contabilizou esse</p><p>montante de desistência de compras e o valor ultrapassou os R$</p><p>20 milhões! A empresa procurou você para ajudar a entender esse</p><p>comportamento dos clientes e fazer com que as desistências se</p><p>revertam em vendas.</p><p>Reflita sobre o caso apresentado pela empresa. Considerando os</p><p>conceitos</p><p>sobre PLN, como você responderia à solicitação dessa</p><p>empresa? Qual ou quais soluções você apresentaria?</p><p>Para conhecer a resolução comentada proposta pelo professor,</p><p>acesse a videoaula deste Teoria em Prática no ambiente de</p><p>aprendizagem.</p><p>31</p><p>LEITURA FUNDAMENTAL</p><p>Prezado aluno, as indicações a seguir podem estar disponíveis</p><p>em algum dos parceiros da nossa Biblioteca Virtual (faça o log</p><p>in por meio do seu AVA), e outras podem estar disponíveis em</p><p>sites acadêmicos (como o SciELO), repositórios de instituições</p><p>públicas, órgãos públicos, anais de eventos científicos ou</p><p>periódicos científicos, todos acessíveis pela internet.</p><p>Isso não significa que o protagonismo da sua jornada de</p><p>autodesenvolvimento deva mudar de foco. Reconhecemos</p><p>que você é a autoridade máxima da sua própria vida e deve,</p><p>portanto, assumir uma postura autônoma nos estudos e na</p><p>construção da sua carreira profissional.</p><p>Por isso, nós o convidamos a explorar todas as possibilidades da</p><p>nossa Biblioteca Virtual e além! Sucesso!</p><p>Indicação 1</p><p>No Capítulo 5 do livro indicado, os autores realizam um estudo com</p><p>o objetivo de apresentar a anatomia de um mecanismo de busca,</p><p>desde o ciclo de desenvolvimento até o processo de otimização de</p><p>buscas. Trata-se de um assunto relevante para o tópico estudado,</p><p>merecendo muita atenção.</p><p>TURBAN, E.; DELEN, D.; SHARDA, R. Business Intelligence e Análise</p><p>de Dados para gestão de negócio. 4. ed. Porto Alegre: Bookman,</p><p>2019. p. 346-351.</p><p>Indicações de leitura</p><p>32</p><p>Indicação 2</p><p>No livro indicado, entre as páginas 117 e 204, os autores apresentam</p><p>os principais conceitos e técnicas da representação vetorial de</p><p>textos, explicando e demonstrando com exemplos as técnicas de</p><p>Bag of Words, TF-IDF e word embeddings. Em seguida, trazem um</p><p>exemplo em python sobre a utilização de word embedding. Trata-</p><p>se de uma leitura ideal para a conclusão do estudo deste Tema,</p><p>contribuindo fortemente para seu processo de aprendizagem.</p><p>MARTINS, J. et al. Processamento de Linguagem Natural. Porto</p><p>Alegre: Sagah, 2020. p. 117-204.</p><p>QUIZ</p><p>Prezado aluno, as questões do Quiz têm como propósito a</p><p>verificação de leitura dos itens Direto ao Ponto, Para Saber</p><p>Mais, Teoria em Prática e Leitura Fundamental, presentes neste</p><p>Aprendizagem em Foco.</p><p>Para as avaliações virtuais e presenciais, as questões serão</p><p>elaboradas a partir de todos os itens do Aprendizagem em Foco</p><p>e dos slides usados para a gravação das videoaulas, além de</p><p>questões de interpretação com embasamento no cabeçalho</p><p>da questão.</p><p>1. Um dos métodos de modelagem de tópicos é o _________. Ele</p><p>é responsável por calcular a _________ com que as palavras</p><p>ocorrem nos documentos e presume que ___________</p><p>semelhantes conterão aproximadamente a mesma</p><p>distribuição de frequências de __________ para certos grupos de</p><p>palavras.</p><p>33</p><p>Assinale a alternativa que completa corretamente as lacunas.</p><p>a. LSA; frequência; documentos; palavras.</p><p>b. Word embedding; regularidade; textos; tópicos.</p><p>c. LSA; regularidade; textos; palavras.</p><p>d. LSA; frequência; textos; palavras.</p><p>e. Word embedding; frequência; documentos; tópicos.</p><p>2. Em word embedding, um _________ de palavras codifica a</p><p>relação ____________ entre ____________. Trata-se de um</p><p>conceito muito importante de incorporação de palavras</p><p>que, ao contrário de BoW, representa apenas ___________.</p><p>Assinale a alternativa que completa corretamente as</p><p>lacunas.</p><p>a. Conjunto; semântica; documentos; zero ou um.</p><p>b. Vetor; direta; documentos; a relação direta.</p><p>c. Vetor; semântica; palavras; zero ou um.</p><p>d. Conjunto; direta; documentos; zero ou um.</p><p>e. Vetor; direta; palavras; a relação direta.</p><p>GABARITO</p><p>Questão 1 - Resposta A</p><p>Resolução: O LSA é um método de modelagem de tópicos</p><p>que contabiliza a frequência com que certas palavras ocorrem</p><p>em documentos. Ele considera que documentos semelhantes</p><p>conterão a mesma frequência de palavras para certos grupos</p><p>de palavras.</p><p>34</p><p>Questão 2 - Resposta C</p><p>Resolução: Word embeddings são representações densas de</p><p>palavras em um espaço vetorial de baixa dimensão. O vetor</p><p>realiza a codificação semântica entre as palavras dentro de um</p><p>contexto, representando os valores entre zero e um.</p><p>Modelos PLN</p><p>______________________________________________________________</p><p>Autoria: Ariel da Silva Dias</p><p>Leitura crítica: Rafael Albuquerque Pinto</p><p>TEMA 4</p><p>36</p><p>DIRETO AO PONTO</p><p>Nos últimos anos, todos nós temos nos beneficiados da Inteligência</p><p>Artificial (IA) diariamente, seja em um sistema de recomendação de</p><p>música, visualização de mapas do Google ou Waze, entre outros.</p><p>Entretanto, como ainda existe muita confusão entre o conceito de IA</p><p>e suas ramificações, como Machine Learning e Deep Learning, vamos</p><p>entender todos esses conceitos. Nesse sentido, a Figura 1 ilustra a</p><p>relação entre eles, bem como a cronologia de acontecimentos.</p><p>Figura 1 – Linha do tempo da Inteligência Artificial</p><p>Fonte: elaborada pelo autor</p><p>Observe pela figura que, desde o final da primeira metade do</p><p>século XX, o ramo de Inteligência Artificial evoluiu muito. Em seus</p><p>momentos áureos, viu nascer o ramo de Machine Learning, o qual</p><p>usa algoritmos matemáticos para permitir que os algoritmos</p><p>aprendam. Indo um pouco além, ele representa a interseção da</p><p>Ciência da Computação com as teorias da Estatística, atuando no</p><p>reconhecimento de padrões presentes nos dados (HAYKIN, 2007).</p><p>Resumidamente, podemos inferir que o Machine Learning é o ramo</p><p>de IA para quando os computadores aprendem a partir de dados,</p><p>37</p><p>sendo principalmente utilizado para realizar tarefas específicas.</p><p>Em geral, esse processo de aprendizagem pode ser supervisionado</p><p>ou não supervisionado, dependendo dos dados que estão sendo</p><p>usados para alimentar os algoritmos (HAYKIN, 2007). Observe</p><p>então que o Machine Learning é uma técnica (e não apenas baseado</p><p>em algoritmos) que possibilita utilizar os conceitos de Inteligência</p><p>Artificial lá da década de 1950.</p><p>Já no início do século XXI, nasceu o ramo da IA denominado Deep</p><p>Learning, que é baseado em Machine Learning, porém, em vez de</p><p>utilizar algoritmos de regressão e árvores de decisão, utiliza redes</p><p>neurais. Seus algoritmos podem ser descritos então como uma</p><p>evolução do Machine Learning, afinal ele tenta simular a maneira</p><p>como o cérebro humano aprende e tira conclusões.</p><p>Desse modo, é possível observar que tanto Machine Learning quanto</p><p>Deep Learning têm o mesmo propósito: simular ou imitar o modo</p><p>como o cérebro humano aprende. Porém, a diferença reside no</p><p>tipo de algoritmo utilizado em cada uma das técnicas. Além disso, o</p><p>Deep Learning exige uma quantidade muito grande de dados, o que</p><p>significa que, ao construir um sistema que identificará um cachorro</p><p>da raça Poodle em um conjunto de fotos, é necessário que a base de</p><p>dados de aprendizagem possua milhões de imagens, pois, somente</p><p>assim, o algoritmo aprenderá o que é um Poodle.</p><p>Outra característica inerente ao Deep Learning é o poder</p><p>computacional que ele exige. Por necessitar relacionar diversos</p><p>tipos de dados e efetuar muitos cálculos, esse tipo de algoritmo</p><p>consome muito os recursos computacionais, principalmente o</p><p>processador. Entretanto, devido ao avanço tecnológico e ao conceito</p><p>de Infraestrutura como Serviço em computação em nuvem, o tempo</p><p>de treinamento de uma rede neural diminuiu consideravelmente.</p><p>38</p><p>Por fim, ao falarmos sobre Machine Learning, estamos considerando</p><p>algoritmos simples que utilizam regressão linear e árvore de</p><p>decisão. Já o Deep Learning é baseado em redes neurais artificiais.</p><p>A Inteligência Artificial tem muitas aplicações excelentes que estão</p><p>mudando o mundo da tecnologia. Embora a criação de um sistema</p><p>de IA tão inteligente quanto os humanos continue sendo um sonho,</p><p>o Machine Learning já permite que o computador nos supere em</p><p>cálculos, reconhecimento de padrões e detecção de anomalias.</p><p>Em um modo mais avançado, o Deep Learning utiliza-se de redes</p><p>neurais e necessita de um conjunto de dados bem maior, o que gera</p><p>resultados melhores quando comparados com o Machine Learning</p><p>(HAYKIN,</p><p>2007).</p><p>Referências bibliográficas</p><p>HAYKIN, S. Redes Neurais: princípios e práticas. Porto Alegre: Bookman. 2007.</p><p>PARA SABER MAIS</p><p>A Inteligência Artificial começou a ser descrita em 1956, em</p><p>uma conferência de Ciência da Computação em Dartmouth. Em</p><p>sua essência, tratava-se de uma tentativa de modelar como o</p><p>cérebro humano funciona e, com base nesse conhecimento, criar</p><p>computadores mais avançados. Os cientistas esperavam que não</p><p>demorasse muito para entender como funciona a mente humana</p><p>e digitalizá-la, afinal a conferência reuniu algumas das mentes mais</p><p>brilhantes da época para uma sessão intensiva de brainstorming de</p><p>dois meses.</p><p>Por um lado, o resultado dessa conferência não foi tão positivo</p><p>quanto o esperado, e, desse modo, os cientistas concluíram que,</p><p>com a tecnologia da época, não era possível imitar o cérebro por</p><p>39</p><p>meio de programação. Entretanto, por outro, houve bons resultados</p><p>também. Eles entenderam que os principais fatores que tornam</p><p>uma máquina inteligente são: aprender (para interagir com</p><p>ambientes mutáveis e espontâneos), processamento de linguagem</p><p>natural (para interação homem-máquina) e criatividade (para</p><p>resolver alguns problemas da humanidade).</p><p>Atualmente o conceito de Inteligência Artificial pode ser dividido em</p><p>três categorias:</p><p>• IA Fraca: ideal para realizar tarefas específicas. Por exemplo,</p><p>em 1996, o computador Deep Blue derrotou o grande</p><p>xadrezista Garry Kasparov. Tratava-se de uma máquina</p><p>desenvolvida para um fim específico: ganhar de Kasparov</p><p>(lenda xadrezista) no Xadrez. Logo, ela máquina não podia se</p><p>passar por humano, pois não podia atuar em outro campo fora</p><p>de suas capacidades pré-programadas.</p><p>• IA Forte: este é o ponto desejado de uma inteligência artificial,</p><p>a qual está mais próxima do humano. Por exemplo, você pode</p><p>entrar em contato com uma pizzaria e solicitar uma pizza sem</p><p>sequer falar com um humano, realizando toda a interação com</p><p>um chatbot. Outro exemplo são as assistentes como a Siri da</p><p>Apple ou o Google Assistente, os quais podem manter uma</p><p>conversa.</p><p>• Superinteligência: esta é a palavra que vem à mente de</p><p>muitas pessoas ao pensar em IA, a qual muitas vezes é</p><p>tida como sinônimo de um ser inteligente, sábio, criativo e</p><p>com habilidades sociais. Porém, os cientistas de hoje estão</p><p>distantes de tornar uma máquina emocionalmente autônoma,</p><p>criativa e sábia.</p><p>Para tornar um sistema inteligente, devemos seguir o chamado</p><p>método de criação de IA, que consiste em: estudar como as</p><p>40</p><p>máquinas podem raciocinar, podendo formular deduções e</p><p>induções (raciocínio de máquina); desenvolver e controlar androides</p><p>inteligentes (robótica); e compreender os algoritmos capazes de dar</p><p>autonomia para que modelos computacionais executem tarefas</p><p>específicas (Machine Learning). Em um processo de desenvolvimento</p><p>de um modelo inteligente, é possível considerar a combinação de</p><p>dois ou três desses métodos, ou então utilizá-los individualmente.</p><p>TEORIA EM PRÁTICA</p><p>Existem enormes quantidades de dados sendo produzidos pela</p><p>atual “Era do Big Data”, e certamente veremos, já nos próximos</p><p>anos, inovações que ainda não podemos compreender. De acordo</p><p>com especialistas, algumas dessas inovações provavelmente serão</p><p>aplicativos de Deep Learning.</p><p>Reflita sobre os conceitos de Machine Learning e Deep Learning em</p><p>processos de análise de dados e relacione com o vasto número</p><p>de dados que são produzidos diariamente. Agora, estando no</p><p>papel de gerente de uma grande empresa, você sugere utilizar</p><p>técnicas de Inteligência Artificial, mais especificamente Machine</p><p>Learning e Deep Learning, para uma tomada de decisão estratégica</p><p>para o atendimento ao cliente. Seu superior então lhe questiona:</p><p>o que Machine Learning e Deep Learning podem significar para o</p><p>atendimento ao cliente? Qual seria sua resposta?</p><p>Para conhecer a resolução comentada proposta pelo professor,</p><p>acesse a videoaula deste Teoria em Prática no ambiente de</p><p>aprendizagem.</p><p>41</p><p>LEITURA FUNDAMENTAL</p><p>Prezado aluno, as indicações a seguir podem estar disponíveis</p><p>em algum dos parceiros da nossa Biblioteca Virtual (faça o log</p><p>in por meio do seu AVA), e outras podem estar disponíveis em</p><p>sites acadêmicos (como o SciELO), repositórios de instituições</p><p>públicas, órgãos públicos, anais de eventos científicos ou</p><p>periódicos científicos, todos acessíveis pela internet.</p><p>Isso não significa que o protagonismo da sua jornada de</p><p>autodesenvolvimento deva mudar de foco. Reconhecemos</p><p>que você é a autoridade máxima da sua própria vida e deve,</p><p>portanto, assumir uma postura autônoma nos estudos e na</p><p>construção da sua carreira profissional.</p><p>Por isso, nós o convidamos a explorar todas as possibilidades da</p><p>nossa Biblioteca Virtual e além! Sucesso!</p><p>Indicação 1</p><p>No artigo indicado, os autores iniciam realizando uma revisão sobre</p><p>Machine Learning e Deep Learning, categorizando e exemplificando</p><p>esses ramos da Inteligência Artificial. Em seguida, apresentam sua</p><p>aplicação na detecção de anomalias em rede de computadores,</p><p>em uma proposta para a construção de um ambiente cibernético</p><p>seguro.</p><p>XIN, Y. et al. Machine Learning and Deep Learning Methods</p><p>for Cybersecurity. EE Access, [s.l.], v. 6, p. 35.365-35.381,</p><p>2018. Disponível em: https://ieeexplore.ieee.org/abstract/</p><p>document/8359287. Acesso em: 26 maio 2021.</p><p>Indicações de leitura</p><p>42</p><p>Indicação 2</p><p>No livro indicado, nas páginas 111 a 122, os autores apresentam os</p><p>principais conceitos relacionados a redes neurais artificiais. Trata-</p><p>se de uma introdução completa, abordando principalmente as</p><p>estruturas de uma rede neural e caracterizando-as, bem como os</p><p>principais algoritmos de redes neurais artificiais.</p><p>SILVA, F. et al. Inteligência Artificial. Porto Alegre: SAGAH, 2019. p.</p><p>111-122.</p><p>QUIZ</p><p>Prezado aluno, as questões do Quiz têm como propósito a</p><p>verificação de leitura dos itens Direto ao Ponto, Para Saber</p><p>Mais, Teoria em Prática e Leitura Fundamental, presentes neste</p><p>Aprendizagem em Foco.</p><p>Para as avaliações virtuais e presenciais, as questões serão</p><p>elaboradas a partir de todos os itens do Aprendizagem em Foco</p><p>e dos slides usados para a gravação das videoaulas, além de</p><p>questões de interpretação com embasamento no cabeçalho</p><p>da questão.</p><p>1. Enquanto os algoritmos de ______________ tradicionais possuem</p><p>uma estrutura bastante simples, como regressão linear ou</p><p>uma ____________, o ____________ é baseado em ____________, que</p><p>é como um cérebro humano, complexo e interligado.</p><p>Assinale a alternativa que completa adequadamente as</p><p>lacunas:</p><p>43</p><p>a. Machine Learning; árvore de decisão; Deep Learning; rede</p><p>neural.</p><p>b. Deep Learning; rede neural; Machine Learning; árvore de</p><p>decisão.</p><p>c. Machine Learning; rede neural; Deep Learning; árvore de</p><p>decisão.</p><p>d. Deep Learning; árvore de decisão; Machine Learning; rede</p><p>neural.</p><p>e. Deep Learning; rede neural; Machine Learning; rede neural.</p><p>2. A Inteligência Artificial (IA) é a base de todo aprendizado de</p><p>computador e o futuro de todas as decisões complexas, pois,</p><p>por meio do emprego de técnicas e ferramentas, é possível</p><p>interpretar dados para uma tomada estratégica mais certeira,</p><p>se comparada a uma análise humana.</p><p>Sobre inteligência artificial forte, assinale a alternativa correta.</p><p>a. Trata-se de um conjunto de programas de computador que</p><p>produz resultados considerados semelhantes à inteligência</p><p>humana, entregando aquilo que foi solicitado.</p><p>b. É a incorporação das capacidades intelectuais humanas, como</p><p>fazer planos para o futuro com base em conhecimentos e</p><p>experiências, dentro de um computador.</p><p>c. Em IA, o conceito de IA Forte corresponde ao estudo de</p><p>faculdades mentais, por intermédio do computador, e como o</p><p>uso de modelos mentais implementados em um computador</p><p>é denominado.</p><p>d. Denominamos a construção da inteligência focada em um</p><p>problema, ou domínio específico, assim como nossos próprios</p><p>cérebros humanos, como sendo IA Forte.</p><p>44</p><p>e. Entre os exemplos de IA Forte, podemos citar tecnologias,</p><p>como reconhecimento de imagem e fala, chatbots com IA ou,</p><p>até</p><p>mesmo, carros autônomos.</p><p>GABARITO</p><p>Questão 1 - Resposta A</p><p>Resolução: Os algoritmos de Machine Learning são baseados</p><p>em regressão linear e em árvores de decisão. Por outro lado,</p><p>o Deep Learning, um ramo do Machine Learning, requer menos</p><p>intervenção humana e é baseado em redes neurais, as quais</p><p>são próximas ao cérebro humano.</p><p>Questão 2 - Resposta B</p><p>Resolução: A IA forte está focada na criação de máquinas</p><p>inteligentes que possam executar com êxito qualquer tarefa</p><p>intelectual que um ser humano pode desempenhar. Além disso,</p><p>existem aspectos auxiliares que acompanham esses requisitos</p><p>principais, como a capacidade de raciocinar, resolver quebra-</p><p>cabeças, representar conhecimento e planejar. Observe então</p><p>que IA Forte não é para um fim específico, como chatbots,</p><p>carros autônomos, entre outros.</p><p>BONS ESTUDOS!</p><p>Apresentação da disciplina</p><p>Introdução</p><p>TEMA 1</p><p>Direto ao ponto</p><p>Para saber mais</p><p>Teoria em prática</p><p>Leitura fundamental</p><p>Quiz</p><p>Gabarito</p><p>TEMA 2</p><p>Direto ao ponto</p><p>Para saber mais</p><p>Teoria em prática</p><p>Leitura fundamental</p><p>Quiz</p><p>Gabarito</p><p>TEMA 3</p><p>Direto ao ponto</p><p>Para saber mais</p><p>Teoria em prática</p><p>Leitura fundamental</p><p>Quiz</p><p>Gabarito</p><p>TEMA 4</p><p>Direto ao ponto</p><p>Para saber mais</p><p>Teoria em prática</p><p>Quiz</p><p>Gabarito</p><p>Inicio 2:</p><p>Botão TEMA 4:</p><p>Botão TEMA 1:</p><p>Botão TEMA 2:</p><p>Botão TEMA 3:</p><p>Botão TEMA 9:</p><p>Inicio :</p>

Aprendizagem em Foco (PDF para download)

Exatas

Ferramentas de estudo

Conteúdos escolhidos para você

Inteligência Artificial na Educação

PROCESSAMENTO DE LINGUAGEM NATURAL

Inteligência Artificial no Contexto do Serviço Público

ChatGPT para o dia a dia

Visão geral de PLN

Perguntas dessa disciplina

Pergunta 1 A Engenharia de Prompt transforma a interação com as IAs Generativas de um simples diálogo para uma colaboração cocriativa. Os prompts mais

O avanço das Inteligências Artificiais Generativas (IAs Generativas) transformou o panorama acadêmico, oferecendo novas formas de interagir com o conh

Questão 1 | MATEMATICA INSTRUMENTAL - DIGITAL A vantagem de utilizar um gráfico ao invés de uma tabela está na possibilidade de uma rápida impressão v

O mundo mediado por algoritmos Sistemas lógicos que sustentam os programas de computador têm impacto crescente no cotidiano Bruno de Pierro – Revis...

Olá, estudante do curso de Biblioteconomia. A atividade proposta corresponde ao M.A.P.A. (Material de Avaliação Prática da Aprendizagem). O objetiv...

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Conteúdos escolhidos para você

Inteligência Artificial na Educação

PROCESSAMENTO DE LINGUAGEM NATURAL

Inteligência Artificial no Contexto do Serviço Público

ChatGPT para o dia a dia

Visão geral de PLN

Perguntas dessa disciplina

Pergunta 1 A Engenharia de Prompt transforma a interação com as IAs Generativas de um simples diálogo para uma colaboração cocriativa. Os prompts mais

O avanço das Inteligências Artificiais Generativas (IAs Generativas) transformou o panorama acadêmico, oferecendo novas formas de interagir com o conh

Questão 1 | MATEMATICA INSTRUMENTAL - DIGITAL A vantagem de utilizar um gráfico ao invés de uma tabela está na possibilidade de uma rápida impressão v

O mundo mediado por algoritmos Sistemas lógicos que sustentam os programas de computador têm impacto crescente no cotidiano Bruno de Pierro – Revis...

Olá, estudante do curso de Biblioteconomia. A atividade proposta corresponde ao M.A.P.A. (Material de Avaliação Prática da Aprendizagem). O objetiv...

Mais conteúdos dessa disciplina