Logo Passei Direto
Buscar
Questão 2/10 - Natural Language Processing
No estudo sobre NLP é muito importante compreender os conceitos básicos de gramática da linguagem em análise. A gramática é um conjunto finito de regras que especificam uma linguagem, na qual as palavras são organizadas em uma estrutura lógica, de forma a expressar um significado. Neste contexto, analise as afirmativas abaixo e assinale a correta.

a) É possível utilizar uma GLC (gramática livre de contexto) criada a partir de 4 ou 5 frases curtas para analisar qualquer sentença gramaticalmente correta na mesma língua a qual pertence a GLC.
b) É possível utilizar uma GLC (gramática livre de contexto) criada a partir de uma linguagem para analisar qualquer sentença gramaticalmente correta de outra linguagem, desde que sejam de mesma finalidade, como linguagens de programação ou linguagens de comunicação falada.
c) É possível utilizar apenas uma GLC (gramática livre de contexto) suficientemente grande para encontrar o contexto de textos diversos, desde que estes pertençam a mesma linguagem usada na criação da GLC.
d) É possível utilizar uma GLC (gramática livre de contexto) suficientemente grande para analisar qualquer sentença gramaticalmente correta na mesma língua a qual pertence a GLC.
e) Uma GLC (gramática livre de contexto) possui dados estatísticos referentes a cada palavra em um determinado texto.
User badge image
Desafios para Aprender

há 2 anos

Respostas

User badge image

Ed Verified user icon

há 2 anos

Analisando as afirmativas apresentadas: a) É possível utilizar uma GLC (gramática livre de contexto) criada a partir de 4 ou 5 frases curtas para analisar qualquer sentença gramaticalmente correta na mesma língua a qual pertence a GLC. - Isso não é verdade, pois uma GLC precisa ser mais abrangente para cobrir a variedade de sentenças gramaticalmente corretas em uma língua. b) É possível utilizar uma GLC (gramática livre de contexto) criada a partir de uma linguagem para analisar qualquer sentença gramaticalmente correta de outra linguagem, desde que sejam de mesma finalidade, como linguagens de programação ou linguagens de comunicação falada. - Isso não é correto, pois as regras de uma GLC são específicas para a linguagem para a qual foi criada. c) É possível utilizar apenas uma GLC (gramática livre de contexto) suficientemente grande para encontrar o contexto de textos diversos, desde que estes pertençam a mesma linguagem usada na criação da GLC. - Isso não é totalmente preciso, pois uma GLC pode ser suficientemente abrangente para cobrir diferentes textos na mesma língua, mas não é uma regra absoluta. d) É possível utilizar uma GLC (gramática livre de contexto) suficientemente grande para analisar qualquer sentença gramaticalmente correta na mesma língua a qual pertence a GLC. - Esta afirmativa está correta, uma GLC bem elaborada e abrangente pode sim analisar qualquer sentença gramaticalmente correta na mesma língua. e) Uma GLC (gramática livre de contexto) possui dados estatísticos referentes a cada palavra em um determinado texto. - Isso não é verdade, pois uma GLC trata das regras de formação de frases e não de dados estatísticos referentes a palavras. Portanto, a alternativa correta é: d) É possível utilizar uma GLC (gramática livre de contexto) suficientemente grande para analisar qualquer sentença gramaticalmente correta na mesma língua a qual pertence a GLC.

Essa resposta te ajudou?

0
Dislike0

Experimente
o Premium! 🤩

Libere respostas sem pagar

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Essa pergunta também está no material:

Mais perguntas desse material

Questão 1/10 - Natural Language Processing
Para a aprendizagem da gramática probabilística, as sentenças deverão estar em um formato específico. Assinale a alternativa CORRETA que corresponde a esse formato:

a) Devem estar em formato de lista com cada sentença como um elemento da lista, sem que seja necessário fazer o processamento das listas em árvores sintáticas.
b) As sentenças devem estar divididas (splitted) em palavras e depois devem ser construídas as árvores de análise.
c) Deve existir uma figura ChartParser para cada sentença.
d) Devem estar armazenadas em uma lista de homologações.
e) A gramática probabilística não precisa de preparação das sentenças para existir.

Questão 4/10 - Natural Language Processing
Uma gramática livre de contexto determinística (GLCD) e uma gramática livre de contexto probabilística (GLCP) podem ser construídas por meio de aprendizagem utilizando conjuntos distintos de dados previamente tratados. Uma GLCP é criada a partir de uma_______________________________. Marque a alternativa abaixo que complete corretamente a afirmativa.

a) análise sintática de um corpus obrigatoriamente anotado e que utilize como base um GLCD, criado a partir de um corpus não anotado através da contagem de palavras e suas ocorrências nas sentenças.
b) contagem de palavras e suas ocorrências nas sentenças de um texto ou corpus não anotado, tendo como base uma análise sintática executada com uma GLCD criada a partir de um corpus anotado que pode ser igual ou diferente do corpus em análise.
c) GLCD em conjunto com uma análise probabilística de cada termo de cada sentença. Este processo só é possível com a utilização de corpus e textos anotados, tanto para a criação do GLCP quanto para o GLCD.
d) rede neural recorrente (RNN) previamente treinada com as probabilidades de surgimento de cada palavra na linguagem do corpus em análise. Esta RNN identifica cada palavra e gera a GLCP.
e) estratégia de pré-treinamento intensivo de camadas para criação de uma RNA (rede neural artificial) com base em um corpus anotado. Este processo tem como resultado uma rede neural treinada que pode identificar qual a próxima palavra com maior probabilidade em um texto.

Até a década de 1980, os métodos com caráter determinísticos para PLN eram predominantes, porém no início dos anos 1990 ocorre uma reorientação fundamental na forma como os PLN eram realizados. Sabendo que esta alteração no foco das metodologias ocorreu entre 1980 e 1990, assinale a alternativa que apresenta corretamente qual foi esta nova abordagem adotada.
A nova abordagem foi focada em uma análise mais criteriosa com métodos de caráter determinístico, no qual o uso de probabilidades era raramente utilizado, focando o PLN na busca de resultados o mais precisos possível.
A partir da década de 1990, a abordagem para PLN passou a ser menos determinística e bastante focada no rigor gramatical envolvido nos textos. O uso de corpora (grandes quantidades de textos) era fundamental, pois como eles não possuíam as anotações referentes as respostas corretas, os métodos de PLN tinham a oportunidade de identificar e criar estas anotações de resposta.
Até a década de 1990 o modelo probabilístico era bastante utilizado, porém após a publicação do livro “Estruturas Sintáticas” de Noam Chomsky em 1957, onde o autor questiona a utilidade dos modelos de linguagem probabilísticos, muitos pesquisadores passaram a utilizar modelos determinísticos, o que culminou na substituição dos modelos probabilísticos na década de 1990. Este tipo de modelo não estatístico (determinístico) é o predominante até os dias de hoje em PLN.
Neste período ocorreu a mudança para uma abordagem de aproximações simples e robustas, com avaliação de sentenças de forma menos rigorosa e forte uso de probabilidades com a ascensão dos métodos de Machine Learning.
O PLN passa por uma reorientação fundamental entre as décadas de 1980 e 1990, na qual as técnicas de contagens de palavras e criação de modelos de Machine Learning deixam de ser amplamente utilizados e passamos a utilizar modelos determinísticos baseados em corpora (grandes corpos de textos anotados) que permitiram o treinamento de algoritmos genéticos com base nas respostas anotadas no corpora. Isto marcou o fim da utilização de redes neurais como método de PLN.
A
B
C
D
E

A biblioteca NLYK nos permite usar o método chomsky_normal_form(). Sobre a forma normal de Chomsky, analise a asserção-razão abaixo: Toda gramática na forma normal de Chomsky é uma GLC (Gramática Livre de Contexto). Gramática livre de contexto é a gramática que possui todas as suas regras de formação na forma , no qual todas as regras de produção independem do contexto do símbolo não terminal e o lado esquerdo, quando for um único símbolo não terminal, poderá sempre ser substituído pelo lado direito. Assinale a alternativa que corresponda à análise CORRETA sobre esta asserção-razão.
A primeira afirmativa está correta, mas a segunda está errada.
A primeira afirmativa está errada, mas a segunda está correta.
As duas estão corretas, mas uma não possui correlação nenhuma com a outra.
As duas afirmativas estão corretas e a segunda justifica a primeira.
As duas afirmativas estão incorretas.
A
B
C
D
E

Para modelos pequenos, a elaboração de uma gramática consistente demandará uma engenharia que pode se dar em um tempo razoável. No entanto, para gramáticas que pretendam atender a um largo contexto de sentenças possíveis, tal atividade pode ser muito custosa. Neste sentido, assinale V para VERDADEIRO e F para FALSO sobre as afirmativas abaixo: Modelos probabilísticos de linguagem baseiam-se em uma distribuição calculada a partir de um conjunto de textos para uma palavra ou frase. Uma das vantagens de se utilizar um modelo probabilístico é que não são necessários dados anotados para o treinamento de um algoritmo de aprendizagem. Um modelo probabilístico não é dependente da ocorrência das palavras em um corpus. Uma gramática construída a partir de um modelo probabilístico permite que as probabilidades associadas às regras possam ser utilizadas para escolha da interpretação mais provável. Selecione a alternativa que contém a sequência correta.
V F V V
V F F V
V V F F
F V V F
F V F V
A
B
C
D
E

Mais conteúdos dessa disciplina