De onde o ChatGPT tira as informações?
autor:
Alveni Lisboa | 30 de Maio de 2023
fonte: Site CANALTECH
Encontrei um bom artigo para entendermos facilmente sobre as fontes de informações do ChatGPT. Abaixo o texto na íntegra com a devida referência ao CANALTECH pela sua publicação original.
O ChatGPT precisa de fontes de informações para dar respostas e executar as ações solicitadas por quem o utiliza.
São variadas as fontes usadas pelo ChatGPT e isso é compreensível.
Como a inteligência artificial generativa é treinada a partir de modelos (GPT-3.5 e GPT-4 são os mais recentes), quanto mais ampla for a base de informações, mais conteúdo disponível o robô terá para se desenvolver.
10 fontes de dados do ChatGPT:
1️. Conteúdo da web em geral
O ChatGPT agora pode pesquisar na web com o Bing (Navegador Edge)
Originalmente, o ChatGPT não conseguia acessar a sites da internet em tempo real, mas isso mudou a partir do modelo GPT-4.
Recentemente, foi anunciada a integração do chatbot com o buscador Bing, o que permite ter acesso a boa parte do conteúdo da internet.
Mesmo assim, ele já conseguia analisar notícias, sites referenciais, fóruns, algumas redes sociais e até documentos.
Atualmente, tudo que esteja hospedado na web pode servir como origem de informações da IA, fato que pode levar a uma incrível expansão do conhecimento nos próximos meses.
2️. Wikipedia
Se até o Google usa a Wikipedia como fonte, por que o ChatGPT não o faria?
Os artigos da Enciclopédia Livre são uma das principais fontes de dados do chatbot, principalmente em perguntas mais diretas.
Aliás, o site é um dos maiores ameaçados com a chegada das IAs (Inteligências Artificiais), afinal suas informações são extraídas por qualquer chatbot de IA sem qualquer compensação.
3. Artigos acadêmicos
Bing e Google possuem mecanismos de indexação de artigos científicos e acadêmicos publicados em periódicos ou repositórios de universidades.
É claro que o ChatGPT também foi treinado neste tipo de fonte mais qualificada, porque isso permite discorrer com mais autoridade em assuntos técnicos.
4️. Dados estruturados
O ChatGPT é bom em matemática e em lógica de programação por um motivo simples: treinamento em dados estruturados.
Isso significa que o modelo de linguagem usado por ele recebeu exaustiva quantidade de tabelas e banco de dados e assim consegue fornecer respostas organizadas ou até tabuladas como no Excel.
5. Perguntas e respostas
As pessoas fazem muitas perguntas a buscadores na tentativa de obter respostas instantâneas.
Esse tipo de treinamento também foi feito de maneira separada no ChatGPT para a tecnologia compreender essa característica humana.
A IA consegue entender bem os contextos e apresentar respostas de maneira natural, como se fosse produzida de maneira coerente por uma pessoa.
6. Livros
O ChatGPT foi treinado em uma vasta coleção de livros sobre os mais diversos tópicos. Isso inclui desde títulos clássicos de literatura até complexos materiais didáticos de cursos de pós-graduação.
Esse viés mais técnico do chatbot permite apresentar conceitos complexos, resumir fatos e criar narrativas fundamentadas, como fazem os autores.
7️. Idiomas estrangeiros
Enquanto o Bard é limitado apenas ao inglês, o ChatGPT consegue entender e responder a dúvidas em vários idiomas — inclusive o português.
Isso se deve ao acesso aos chamados “dados multilíngues”, que usam bancos de dados similares aos de tradutores online, mas com a importante dosagem de aprendizado de máquina.
8️. Dados de conversas
Já notou como o ChatGPT consegue interagir com as pessoas como se houvesse alguém do outro lado?
Essa capacidade vem do acesso da IA a dados de conversação, como diálogos, entrevistas de jornalistas e conversas humanas.
Esta origem de informações ajuda o modelo a entender o fluxo da comunicação e a dinâmica de conversas, mesmo em idiomas diferentes.
9️. Posts de redes sociais
Conteúdos de certas redes sociais entram na base de dados do ChatGPT.
O Twitter é a principal ferramenta usada pela IA, já que os posts podem ser localizados até por buscadores. Vídeos, GIFs e fotos ainda não são interpretados pelo chatbot, mas descrições e textos alternativos podem ser fontes de informação para o treinamento.
10. Manuais, análises e avaliações
O ChatGPT consegue comparar produtos para apresentar vantagens e desvantagens.
Como ele sabe disso se nunca experimentou nada?
Com base em informações dos próprios usuários: reviews de sites especializados, avaliações feitas em e-commerce e manuais técnicos dos sites oficiais são alguns exemplos.
Quanto mais análises você envia para esses locais, mais treinamento o ChatGPT receberá nos produtos.
Espero ter te ajudado a entender sobre o assunto. Além de estar te encorajando a novos conhecimentos!
Até o próximo artigo, seniortechs!
Abraços da Gal Rosa
CLIQUE E ASSINE!
Comments