Buscar

Esses avanços se refletem nos modelos GPT

Prévia do material em texto

Esses avanços se refletem nos modelos GPT-2 e GPT-3, que são a base do ChatGPT. O GPT-3 (ou terceira versão do transformador generativo pré-treinado) é large language models (LLM), um modelo de IA criado a partir de redes neurais artificiais, ou seja, um método de aprendizagem de máquina e treinado com uma enorme quantidade de dados. Para além destes modelos, em março deste ano, tivemos mais uma evolução do GPT realizado por parte da OpenAI. Chegamos ao GPT-4, que utiliza a abordagem de aprendizado profundo (ou deep learning), mas também o aprendizado por reforço e promete revolucionar a maneira como as pessoas interagem com a tecnologia, uma vez que pode entender e gerar respostas para textos e imagens, e em testes acadêmicos e profissionais, ele teve um desempenho comparável ao de um humano. De maneira resumida, o GPT-4 é um modelo de linguagem natural avançado que aprende com muitos dados e ajuda de especialistas de diferentes áreas, possibilitando que ele gere respostas precisas e seguras. No universo da IA, os LLMs já atuam há alguns anos, com sistemas de tradução, correção gramatical e até mesmo completes mais potentes. Esses e outros casos de uso mais famosos ainda vivem em um nível de “assistente de escrita”, por isso, é preciso extrair os resultados mais adequados a cada nova demanda. Para se ter uma ideia da dimensão desses avanços, o tamanho dos LLMs tem aumentado dez vezes a cada ano

Continue navegando