Category: OpenAI

OpenAI estaria preparando IA para executar tarefas no computador

OpenAI estaria preparando IA para executar tarefas no computador

OpenAI é mais uma empresa a apostar em agentes de IA para realizar tarefas (Imagem: Vitor Pádua / Tecnoblog)

A OpenAI, desenvolvedora do ChatGPT, estaria preparando o lançamento de uma nova inteligência artificial, capaz de usar um computador de maneira independente. Com isso, ela poderia, por exemplo, reservar passagens de avião e escrever códigos.

As informações foram obtidas pela Bloomberg junto a duas pessoas com conhecimento do assunto. A IA tem, segundo elas, o codinome “Operator”. Em uma reunião com funcionários na quarta-feira (11), a OpenAI teria anunciado planos de lançar a ferramenta em janeiro de 2025, ainda em fase de preview.

Sam Altman já falou sobre agentes (Imagem: Vitor Pádua / Tecnoblog)

A matéria da Bloomberg reforça declarações de executivos da OpenAI. Recentemente, o CEO Sam Altman participou de um Ask Me Anything do Reddit, em que usuários podem fazer perguntas a uma pessoa famosa. Em uma das respostas, Altman disse que o próximo grande avanço da IA seriam os agentes. Em outro evento, Kevin Well, chefe de produto da empresa, declarou que 2025 será o ano em que os sistemas agentes se tornarão populares.

OpenAI segue passos de Anthropic e Google

O interesse por agentes de IA, que vão além de responder a perguntas, escrever textos e gerar imagens, parece ser a mais nova tendência do setor. Em outubro, a Anthropic anunciou que a próxima versão do Claude será capaz entender o que está na tela, controlar o mouse e digitar. Isso vai depender do uso de uma API por desenvolvedores.

Outra empresa que estaria preparando uma ferramenta parecida é o Google. De acordo com uma reportagem do site The Information, a gigante das buscas deve apresentar sua solução já em dezembro de 2024.

Setor de IA está com dificuldades

As notícias de agentes capazes de realizar mais tarefas vêm em um momento em que as ferramentas de IA generativa dos últimos anos parecem ter estagnado.

Em uma reportagem da Reuters, Ilya Sutskever, cofundador da OpenAI que deixou a empresa, disse que o método de treinar modelos de IA com quantidades enormes de dados sem filtro, esperando que a máquina encontre padrões, chegou ao seu limite.

Outra reportagem, da Bloomberg, afirma que OpenAI, Google e Anthropic estão tendo retornos menores e custos mais altos para criar seus próximos modelos. Além disso, os produtos em desenvolvimento não estariam atendendo às expectativas internas.

Com informações: Bloomberg, TechCrunch, The Verge
OpenAI estaria preparando IA para executar tarefas no computador

OpenAI estaria preparando IA para executar tarefas no computador
Fonte: Tecnoblog

ChatGPT ganha buscador para concorrer com Google e Bing

ChatGPT ganha buscador para concorrer com Google e Bing

ChatGPT, da OpenAI, terá ferramentas e conteúdo para encarar outros buscadores (Imagem: Vitor Pádua / Tecnoblog)

A OpenAI começou a liberar o buscador web para o ChatGPT. Os assinantes dos planos pagos ChatGPT Plus e Team terão acesso ao recurso a partir desta quinta-feira (dia 31/10), bem como os que estavam inscritos na lista de espera do SearchGPT. Usuários dos planos gratuitos, corporativos e educacionais receberão a novidade nas próximas semanas.

O buscador funciona na web, nos apps para smartphone e para desktop. Ele vai entrar em cena automaticamente, de acordo com o que for pedido pelo usuário, caso a ferramenta julgar que é relevante trazer informações atualizadas. Mesmo assim, também dá para fazer buscas manualmente, tocando no ícone de pesquisa.

Busca será ativada automaticamente, mas usuário poderá fazer uma pesquisa manual (Imagem: Divulgação / OpenAI)

Como o ChatGPT vai fazer pesquisas?

No post sobre o anúncio, a OpenAI diz que seu buscador permite fazer perguntas de um jeito mais natural e conversacional, sem precisar de muito esforço e várias pesquisas. A desenvolvedora também diz que o ChatGPT considerará o contexto da conversa para chegar à melhor resposta.

Para trazer as melhores informações, a OpenAI fez parcerias com provedores de conteúdo. Eles aparecem quando o usuário faz perguntas sobre previsão do tempo, ações, esportes, mapas e notícias.

Neste último caso, sites como Reuters, Financial Times e Associated Press, com quem a OpenAI fechou acordos de licenciamento de conteúdo nos últimos meses, servem como fontes.

Parceiros fornecerão informações de previsão do tempo, ações e notícias (Imagem: Divulgação / OpenAI)

Apesar de trazer as respostas resumidas, o ChatGPT também mostrará de que sites foram retiradas as informações. As páginas aparecerão em uma área lateral, na interface web e de desktop.

Google já usa IA, e Meta pode ser a próxima

Sinônimo de pesquisa na web nas últimas décadas, o Google vem investindo em inteligência artificial para não perder terreno. É o caso das chamadas AI Overviews, resumos gerados por IA com as principais informações encontradas sobre a pesquisa do usuário.

Do outro lado, até quem nunca se interessou muito pode entrar nesta área. A Meta estaria preparando um buscador, de acordo com fontes ouvidas pelo site The Information, para a Meta AI, presente no Facebook, Instagram e WhatsApp.

Com informações: OpenAI, The Verge, Ars Technica
ChatGPT ganha buscador para concorrer com Google e Bing

ChatGPT ganha buscador para concorrer com Google e Bing
Fonte: Tecnoblog

Novo modelo de IA da OpenAI chega em dezembro, diz site

Novo modelo de IA da OpenAI chega em dezembro, diz site

OpenAI pode lançar um LLM mais potente em dezembro e abandonar a nomenclatura GPT nos modelos de IA (Imagem: Vitor Pádua / Tecnoblog)

A OpenAI pode lançar um novo modelo de IA, que seria altamente mais potente que o GPT-4, em dezembro. A informação foi apurada pelo The Verge em contato com uma fonte próxima do caso. O novo LLM, que pode se chamar Orion, não estrearia diretamente no ChatGPT, mas seria liberado para empresas parceiras criarem programas com ele antes de ser liberado para o público.

Em outros momentos, um funcionário da OpenAI chegou a comentar que o sucessor do GPT-4 teria até 100 vezes mais capacidade computacional. Vale lembrar que o GPT-4o é uma atualização do GPT-4, não uma nova geração. Já o GPT o1 é um LLM voltado para a resolução de problemas matemáticos.

Quem serão os primeiros a usar o Orion?

Microsoft deve estrear o Orion no Azure já no mesmo de novembro (Imagem: Vitor Pádua / Tecnoblog)

Segundo outra fonte ouvida pelo The Verge, a OpenAI fornecerá o Orion para que empresas criem seus produtos e recursos com o LLM. E sim, a Microsoft, maior investidora da OpenAI, será uma das primeiras a estrear o Orion. A fonte afirma que a big tech já trabalha em integrar o LLM no Azure já em novembro.

O treinamento do Orion, segundo apurou o site, terminou em setembro. Neste mesmo mês, Sam Altman, CEO da OpenAI, publicou uma mensagem nada misteriosa no X. Altman escreveu um “poema” no qual diz estar empolgado para ver as constelações de inverno ascenderem aos céus.

Bem, a constelação de Orion fica mais visível durante o mês de janeiro, inverno no hemisfério norte. Ainda que a fonte afirme que o lançamento do LLM será realizado em dezembro, a chegada em janeiro não seria nada fora da curva. Ou a estreia do Orion pode acontecer em dezembro nas empresas parceiras e em janeiro no ChatGPT.

Com informações: The Verge
Novo modelo de IA da OpenAI chega em dezembro, diz site

Novo modelo de IA da OpenAI chega em dezembro, diz site
Fonte: Tecnoblog

OpenAI apresenta o1, modelo de IA com raciocínio lógico aprimorado

OpenAI apresenta o1, modelo de IA com raciocínio lógico aprimorado

OpenAI o1 inaugura uma nova série de modelos de IA da empresa (Imagem: Vitor Pádua / Tecnoblog)

A OpenAI lançou, nesta quinta-feira (dia 12/09), o modelo de inteligência artificial o1, prometendo que ele será melhor em resolver problemas envolvendo matemática, conhecimentos científicos e linguagens de programação.

O o1 é o modelo conhecido anteriormente pelo codinome interno “Strawberry”. Havia uma grande expectativa para o lançamento desta IA.

Segundo a OpenAI, o o1 foi treinado para pensar por mais tempo nas questões apresentadas antes de respondê-las, “como uma pessoa faria”, nas palavras usadas no comunicado. Por isso, ele deve ser capaz de tentar diferentes estratégias e reconhecer erros.

o1 supera GPT-4o em matemática e ciências

Um resultado disso é que o o1 se saiu muito melhor que o GPT-4o em um teste qualificatório para a Olimpíada Internacional de Matemática. Enquanto o GPT-4o conseguiu resolver corretamente apenas 13% dos problemas, o o1 acertou 83%.

Vale lembrar que, há cerca de um mês, o Google DeepMind afirmou que os modelos AlphaProof e AlphaGeometry 2 combinados resolveram quatro dos seis problemas da prova final da Olimpíada Internacional de Matemática de 2024, o suficiente para conseguir uma medalha de prata.

Voltando ao o1, a OpenAI diz que o novo modelo tem desempenho similar ao de estudantes de doutorado em tarefas envolvendo física, química e biologia.

Mesmo assim, a empresa reconhece que não foi possível resolver completamente o problema das alucinações — termo do jargão da IA para quando uma ferramenta cria uma resposta bem escrita e articulada, mas que, na verdade, é falsa ou incorreta.

Novo modelo ainda tem limitações

Apesar de superar o GPT-4o nestas tarefas envolvendo raciocínio lógico, o o1 ainda fica devendo muitos recursos encontrados no ChatGPT e em ferramentas do tipo.

O novo modelo só aceita entradas em texto, sem processar imagens ou documentos. Ele também não é capaz de buscar informações em tempo real na internet, nem se sai tão bem na hora de responder sobre fatos conhecidos.

Outra diferença é que o o1 é mais lento que o GPT-4o. Ele pode levar até 30 segundos para devolver uma resposta. Depois, o modelo apresenta os passos que o levaram até a solução.

Apenas para assinantes

A OpenAI vai disponibilizar duas versões do novo modelo: o1-preview e o1-mini, este segundo dedicado a geração de códigos de programação.

Usuários dos planos Plus e Team poderão, a partir desta quinta (12), acessar os dois novos modelos por meio do ChatGPT. Para assinantes Enterprise e Edu, as novas ferramentas chegam na semana que vem.

O o1-preview terá limite de 30 mensagens semanais; com o o1-mini, este número é um pouco maior, com 50 mensagens. A OpenAI diz que planeja oferecer o o1-mini para usuários gratuitos do ChatGPT.

Com informações: OpenAI, The Verge, TechCrunch, Axios
OpenAI apresenta o1, modelo de IA com raciocínio lógico aprimorado

OpenAI apresenta o1, modelo de IA com raciocínio lógico aprimorado
Fonte: Tecnoblog

O que a Meta ganha com a Llama livre?

O que a Meta ganha com a Llama livre?

A abordagem da Meta na corrida da inteligência artificial é bem diferente da adotada por outras grandes empresas de tecnologia. Enquanto OpenAI, Google, Anthropic e outras oferecem modelos fechados, a Big Tech de Mark Zuckerberg abraçou o código aberto (pelo menos em parte), oferecendo seu LLM, o Llama, de graça. Com isso, toda uma comunidade de desenvolvedores se beneficia… mas como é que esse investimento volta para a Meta?

O que a Meta ganha com a Llama livre? (Imagem: Vitor Pádua/Tecnoblog)

É sobre isso que conversamos no episódio de hoje, com participação do especialista em finanças Rodrigo Fernandes. Será que existe uma estratégia bem delineada por trás da decisão da Meta? E o que ela significa para o mercado como um todo? Para acompanhar essa discussão, dá o play e vem com a gente!

Participantes

Thiago Mobilon

Josué de Oliveira

Rodrigo Fernandes

Citado no episódio

Comentário do Luiz Eduardo, lido na Caixa Postal

Mande seu recado

Grupos da Caixa Postal do Tecnocast:

Telegram: t.me/caixapostaltecnocast

WhatsApp: tbnet.me/caixapostaltecnocast

Você pode mandar comentários (inclusive em áudio, vai que você aparece no Tecnocast?), dúvidas, críticas e sugestões. Participe!Se preferir, você pode se comunicar conosco pela Comunidade e através do e-mail tecnocast@tecnoblog.net.

Entre também nos Canais do TB no WhatsApp

Canal do Tecnoblog

Canal do Achados do TB

Créditos

Produção: Josué de Oliveira

Edição e sonorização: Maremoto

Arte da capa: Vitor Pádua

O que a Meta ganha com a Llama livre?

O que a Meta ganha com a Llama livre?
Fonte: Tecnoblog

ChatGPT libera gerador de imagens Dall-E 3 para todo mundo

ChatGPT libera gerador de imagens Dall-E 3 para todo mundo

Usuários não pagantes do ChatGPT poderão criar apenas duas imagens por dia (Imagem: Vitor Pádua / Tecnoblog)

A OpenAI disponibilizou o gerador de imagens Dall-E 3 para todos os usuários do ChatGPT, inclusive aqueles que não assinam o plano Plus. A ferramenta de inteligência artificial, porém, será limitada a duas imagens por dia para cada pessoa.

Até agora, ele só estava disponível para quem paga o Plus, que custa US$ 20 mensais (cerca de R$ 110, em conversão direta). Estes usuários continuarão tendo a vantagem de limites maiores, que permitem criar até 50 imagens por dia.

We’re rolling out the ability for ChatGPT Free users to create up to two images per day with DALL·E 3. Just ask ChatGPT to create an image for a slide deck, personalize a card for a friend, or show you what something looks like. pic.twitter.com/3csFTscA5I— OpenAI (@OpenAI) August 8, 2024

O Dall-E 3 no ChatGPT foi anunciado inicialmente há quase um ano, em setembro de 2023. Segundo a OpenAI, este modelo oferece mais fidelidade aos pedidos dos usuários. Além disso, ele deve lidar melhor com mãos e textos, dois problemas comuns a ferramentas deste tipo.

Com o novo modelo de IA, o ChatGPT é capaz de oferecer assistência, caso o usuário não saiba exatamente o que deseja. O chatbot também pode pedir mais informações e detalhes para gerar uma imagem.

Desenhos complexos e com textos devem ficar melhores no Dall-E 3 (Imagem: Divulgação / OpenAI)

Microsoft tem Dall-E 3 com limites maiores

Apesar de novo para os usuários não pagantes do ChatGPT, o Dall-E 3 já está disponível no Copilot da Microsoft. Por lá, é possível criar até 15 imagens por dia.

Não é a primeira vez que a Microsoft “se adianta” e coloca um modelo desenvolvido pela OpenAI em uma ferramenta para todos os usuários. O GPT-4, por exemplo, já é usado para geração de textos do Copilot, mas só está disponível para assinantes do ChatGPT Plus e clientes corporativos. Clientes gratuitos do assistente usam o GPT-4o Mini, mais limitado.

A Microsoft é uma das maiores investidoras da OpenAI, tendo colocado cerca de US$ 13 bilhões na startup. A desenvolvedora do ChatGPT começou como uma organização sem fins lucrativos, mas criou uma empresa com lucro limitado, como forma de facilitar a captação de recursos. Com seu investimento, a Microsoft tem direito a uma parte deste lucro.

Com informações: The Verge, ZDNet
ChatGPT libera gerador de imagens Dall-E 3 para todo mundo

ChatGPT libera gerador de imagens Dall-E 3 para todo mundo
Fonte: Tecnoblog

OpenAI alerta para risco de “apego emocional” à voz do ChatGPT

OpenAI alerta para risco de “apego emocional” à voz do ChatGPT

OpenAI alerta para risco de “apego emocional” à voz do ChatGPT (imagem: Vitor Pádua/Tecnoblog)

A OpenAI tem uma interface de voz baseada em inteligência artificial (IA) que é muito parecida com a fala de uma pessoa real. Tão parecida que a organização publicou um alerta inusitado: a tecnologia pode levar usuários do ChatGPT a se apegarem emocionalmente ao chatbot.

Ficção virando realidade?

Tecnologias de IA têm sido associadas a riscos de diversas naturezas, como “roubo” de empregos, violação de direitos autorais na geração de conteúdo e comprometido de dados sensíveis do usuário.

O risco de um humano se apegar emocionalmente a uma tecnologia de IA parecia coisa de ficção, no entanto. Talvez a obra que mais bem retrate esse cenário é o filme Ela (Her), em que Theodore (Joaquin Phoenix) passa a conversar com uma inteligência artificial até se apaixonar por ela.

No caso da OpenAI, o aviso aparece na lista de riscos do modelo de linguagem GPT-4o. Além do possível apego emocional à voz do ChatGPT, a lista inclui pontos como risco de disseminação de desinformação e auxílio no desenvolvimento de armas químicas ou biológicas.

Presumivelmente, o ponto sobre apego emocional foi incluído na lista devido à possibilidade de o usuário sofrer abalos de natureza psicológica, dado que o contato “homem-máquina” não têm as qualidades das relações humanas.

Além disso, a pessoa pode tomar decisões precipitadas ou prejudiciais por conta da confiança desmedida que têm na interação via voz com a IA.

Não por acaso, quando a interface da OpenAI foi revelada, em maio, muitos usuários notaram que a tecnologia pronunciava frases de modo excessivamente “flertador”.

Cena do filme Her (imagem: divulgação/Warner Bros)

Possível risco às interações humanas

O alerta sobre a tecnologia de voz é descrito no tópico “Anthropomorphization and emotional reliance” (“Antropomorfização e Confiança Emocional”) na página da OpenAI.

Em linhas gerais, a organização afirma ter encontrado sinais de socialização com a IA durante a fase de testes da tecnologia. Esses sinais parecem ser benignos, mas os efeitos desse comportamento no longo prazo ainda não podem ser mensurados, e isso exige mais investigação sobre o assunto.

Um trecho do documento diz o seguinte:

A socialização no estilo humano com um modelo de IA pode produzir externalidades que impactam as interações entre pessoas. Por exemplo, usuários podem criar relacionamentos sociais com a IA, reduzindo a sua necessidade de interação humana — isso potencialmente beneficia indivíduos solitários, mas pode afetar relacionamentos [humanos] saudáveis.

Como tudo isso é muito novo, vale a máxima advinda das bebidas alcóolicas: aprecie com moderação.

Com informações: Wired
OpenAI alerta para risco de “apego emocional” à voz do ChatGPT

OpenAI alerta para risco de “apego emocional” à voz do ChatGPT
Fonte: Tecnoblog

OpenAI consegue detectar textos do ChatGPT, mas não quer liberar ferramenta

OpenAI consegue detectar textos do ChatGPT, mas não quer liberar ferramenta

OpenAI está tentando novas formas de marcar textos gerados pelo ChatGPT (Imagem: Vitor Pádua / Tecnoblog)

A OpenAI tem uma ferramenta para colocar “marcas d’água” em textos gerados pelo ChatGPT e detectá-los posteriormente, com precisão de 99,9%. O método é baseado em mudar como o modelo de linguagem prevê e escolhe as palavras seguintes, criando um padrão que possa ser identificado, sem afetar a qualidade das respostas.

As informações foram reveladas inicialmente pelo The Wall Street Journal, no domingo (4). A OpenAI confirmou a existência da ferramenta ao TechCrunch, além de atualizar um blog post publicado em maio sobre funcionalidades de marcação e detecção.

Professores estão entre os maiores interessados em detectar textos gerados por IA (Imagem: Emerson Alecrim / Tecnoblog)

No texto, a empresa diz estar testando métodos menos controversos. Um deles seria aplicar metadados — esta possibilidade está nos primeiros passos e ainda não é possível dizer se ela vai funcionar bem. Mesmo assim, ela seria assinada criptograficamente, o que impediria falsos positivos (a ferramenta nunca iria apontar incorretamente que um texto foi criado pelo ChatGPT, caso ele não tenha sido).

A OpenAI chegou a liberar uma ferramenta de detecção, mas ela era muito ruim, com precisão de apenas 26%. A própria empresa desistiu do recurso.

OpenAI teme estigmatização do ChatGPT

Apesar de a ferramenta existir, a OpenAI debate internamente se seria conveniente lançá-la neste momento, segundo o WSJ. Um problema é que ela pode ser burlada: basta pedir para outro modelo de linguagem reescrever o texto criado pelo ChatGPT. Uma ferramenta de tradução também é suficiente para descaracterizar a marcação.

A empresa também demonstra outra preocupação: isso poderia ter consequências ruins para quem usa o ChatGPT, devido aos estigmas que envolvem a inteligência artificial. A companhia acredita que pessoas que não têm o inglês como idioma principal e usam o assistente na hora de escrever poderiam ser prejudicadas.

Isso traria problemas para a própria OpenAI. Segundo a empresa, quase 30% dos entrevistados sobre este assunto disseram que usariam menos o ChatGPT se um sistema do tipo fosse implementado.

Apesar da relutância, um sistema para detectar o uso de IA poderia ser útil para professores, por exemplo. Além disso, em uma pesquisa encomendada pela OpenAI, cerca de 80% dos entrevistados apoiam a criação de uma ferramenta para identificar textos gerados pela tecnologia.

Com informações: The Verge, TechCrunch
OpenAI consegue detectar textos do ChatGPT, mas não quer liberar ferramenta

OpenAI consegue detectar textos do ChatGPT, mas não quer liberar ferramenta
Fonte: Tecnoblog

Microsoft e Apple se afastam de conselho da OpenAI para evitar problemas

Microsoft e Apple se afastam de conselho da OpenAI para evitar problemas

OpenAI recebeu investimentos da Microsoft e fechou parceria com a Apple (Imagem: Vitor Pádua / Tecnoblog)

A Microsoft deixou seu assento de observadora no conselho da OpenAI, posto que obteve em novembro de 2023, e a Apple recusou posição semelhante, que faria parte do acordo para colocar o ChatGPT nos iPhones. Segundo o Financial Times, o motivo do movimento é o crescente escrutínio de governos em todo o mundo sobre os investimentos de gigantes da tecnologia em startups de inteligência artificial.

A União Europeia e o Reino Unido, por exemplo, investigam a relação entre a Microsoft e a OpenAI: elas querem saber se a gigante de Redmond é dona ou exerce controle da desenvolvedora do ChatGPT. A Microsoft investiu mais de US$ 13 bilhões e tem direito a parte dos lucros da OpenAI, até um certo limite. Em seu site, a startup de IA diz ser totalmente independente e comandada pela OpenAI Nonprofit, organização sem fins lucrativos.

Tecnologias da OpenAI ajudaram a impulsionar ferramentas de IA da Microsoft (Foto: Thássius Veloso/Tecnoblog)

Já a Comissão Federal de Comércio dos Estados Unidos (FTC, na sigla em inglês) está examinado os investimentos feitos por Microsoft, Amazon e Google. Uma fonte ligada ao FTC disse ao Financial Times que a saída do conselho não deve resolver as preocupações da agência.

OpenAI fará reuniões com quem não está no conselho

Em uma carta escrita pelo conselheiro Keith Dolliver, a Microsoft diz que o assento de observadora no conselho da OpenAI não é mais necessário, já que a empresa viu “progresso significativo do novo conselho e está confiante nos rumos da companhia”.

A empresa comandada por Satya Nadella tinha esta posição desde novembro de 2023, quando Sam Altman, CEO e cofundador da OpenAI, foi demitido abruptamente e readmitido em um intervalo de menos de duas semanas.

Já o posto de observadora da Apple seria ocupado por Phil Schiller, líder da App Store e dos eventos, de acordo com informações publicadas pela Bloomberg na semana passada. Agora, de acordo com o Financial Times, isso não vai mais acontecer.

Segundo o jornal, apesar deste afastamento, o contato permanecerá: a OpenAI fará reuniões regulares com Microsoft e Apple, além de investidores como Thrive Capital e Khosla Ventures.

Com informações: Financial Times
Microsoft e Apple se afastam de conselho da OpenAI para evitar problemas

Microsoft e Apple se afastam de conselho da OpenAI para evitar problemas
Fonte: Tecnoblog

OpenAI quer usar IA para ajudar humanos que treinam IA

OpenAI quer usar IA para ajudar humanos que treinam IA

CriticGPT supera o próprio ChatGPT na hora de revisar códigos (Imagem: Vitor Pádua / Tecnoblog)

A OpenAI revelou um novo modelo de inteligência artificial chamado CriticGPT. Ele é baseado no GPT-4, mas com outra especialidade: encontrar erros em códigos gerados pelo ChatGPT. A ideia é que ele ajude humanos na tarefa de treinar modelos de IA.

Pode parecer estranho, mas a empresa explica: seus modelos são treinados usando uma técnica chamada aprendizado por reforço com feedback humano (ou RLHF, na sigla em inglês). Nesta técnica, humanos avaliam as respostas dadas por modelos de IA. A ideia é aperfeiçoar o modelo, para que os resultados sejam mais úteis em situações reais e mais próximos ao desejado por humanos.

Novo modelo ajuda treinadores humanos a encontrar e explicar erros (Imagem: Kevin Ku / Unsplash)

Quando o ChatGPT gera um código, estes humanos, chamados treinadores de IA, revisam a resposta e apontam os erros, para que o modelo “aprenda” o que fazer. O problema é que humanos também podem errar e não perceber o que está incorreto em uma resposta.

O CriticGPT pode ajudar nisso. A ferramenta encontra erros nos códigos gerados pelo ChatGPT e escreve uma crítica (daí seu nome) explicando o problema.

CriticGPT explica onde ChatGPT errou (Imagem: Divulgação / OpenAI)

Segundo a OpenAI, treinadores de IA preferiram as críticas feitas por outros treinadores com ajuda do CriticGPT em 60% dos casos, em comparação com críticas feitas apenas por humanos.

A empresa diz que a “parceria” resulta em avaliações mais compreensivas dos que as feitas apenas por humanos e em menos alucinações que as feitas só pela IA.

Feedback humano também ajudou CriticGPT

Um ponto curioso é que o próprio CriticGPT foi desenvolvido usando RLHF. Os treinadores de IA colocaram manualmente erros em códigos criados pelo ChatGPT e escreveram avaliações como explicando os problemas, como se tivessem sido descobertos por eles.

Depois, estes funcionários verificavam várias avaliações feitas pelo CriticGPT e escolhiam a melhor, como forma de reforçar para o modelo o que ele deveria fazer.

CriticGPT ajuda, mas pode alucinar e ver erro onde não existe (Imagem: Vitor Pádua / Tecnoblog)

O próprio ChatGPT poderia ser usado para avaliar os códigos, mas o modelo especializado se sai melhor na tarefa. Treinadores de IA consideraram a crítica do CriticGPT melhor que a do ChatGPT em 63% dos casos. Para eles, a nova IA produz menos reclamações inúteis e menos alucinações.

Apesar das vantagens, o CriticGPT não é perfeito. A OpenAI admite que ele também pode alucinar, levando os treinadores a cometer erros. Além disso, o modelo foi treinado com respostas curtas e códigos com apenas um erro — para tarefas mais complexas, novos métodos serão necessários.

Com informações: OpenAI, Ars Technica
OpenAI quer usar IA para ajudar humanos que treinam IA

OpenAI quer usar IA para ajudar humanos que treinam IA
Fonte: Tecnoblog