OpenAI apresenta o1, modelo de IA com raciocínio lógico aprimorado

OpenAI apresenta o1, modelo de IA com raciocínio lógico aprimorado

OpenAI o1 inaugura uma nova série de modelos de IA da empresa (Imagem: Vitor Pádua / Tecnoblog)

A OpenAI lançou, nesta quinta-feira (dia 12/09), o modelo de inteligência artificial o1, prometendo que ele será melhor em resolver problemas envolvendo matemática, conhecimentos científicos e linguagens de programação.

O o1 é o modelo conhecido anteriormente pelo codinome interno “Strawberry”. Havia uma grande expectativa para o lançamento desta IA.

Segundo a OpenAI, o o1 foi treinado para pensar por mais tempo nas questões apresentadas antes de respondê-las, “como uma pessoa faria”, nas palavras usadas no comunicado. Por isso, ele deve ser capaz de tentar diferentes estratégias e reconhecer erros.

o1 supera GPT-4o em matemática e ciências

Um resultado disso é que o o1 se saiu muito melhor que o GPT-4o em um teste qualificatório para a Olimpíada Internacional de Matemática. Enquanto o GPT-4o conseguiu resolver corretamente apenas 13% dos problemas, o o1 acertou 83%.

Vale lembrar que, há cerca de um mês, o Google DeepMind afirmou que os modelos AlphaProof e AlphaGeometry 2 combinados resolveram quatro dos seis problemas da prova final da Olimpíada Internacional de Matemática de 2024, o suficiente para conseguir uma medalha de prata.

Voltando ao o1, a OpenAI diz que o novo modelo tem desempenho similar ao de estudantes de doutorado em tarefas envolvendo física, química e biologia.

Mesmo assim, a empresa reconhece que não foi possível resolver completamente o problema das alucinações — termo do jargão da IA para quando uma ferramenta cria uma resposta bem escrita e articulada, mas que, na verdade, é falsa ou incorreta.

Novo modelo ainda tem limitações

Apesar de superar o GPT-4o nestas tarefas envolvendo raciocínio lógico, o o1 ainda fica devendo muitos recursos encontrados no ChatGPT e em ferramentas do tipo.

O novo modelo só aceita entradas em texto, sem processar imagens ou documentos. Ele também não é capaz de buscar informações em tempo real na internet, nem se sai tão bem na hora de responder sobre fatos conhecidos.

Outra diferença é que o o1 é mais lento que o GPT-4o. Ele pode levar até 30 segundos para devolver uma resposta. Depois, o modelo apresenta os passos que o levaram até a solução.

Apenas para assinantes

A OpenAI vai disponibilizar duas versões do novo modelo: o1-preview e o1-mini, este segundo dedicado a geração de códigos de programação.

Usuários dos planos Plus e Team poderão, a partir desta quinta (12), acessar os dois novos modelos por meio do ChatGPT. Para assinantes Enterprise e Edu, as novas ferramentas chegam na semana que vem.

O o1-preview terá limite de 30 mensagens semanais; com o o1-mini, este número é um pouco maior, com 50 mensagens. A OpenAI diz que planeja oferecer o o1-mini para usuários gratuitos do ChatGPT.

Com informações: OpenAI, The Verge, TechCrunch, Axios
OpenAI apresenta o1, modelo de IA com raciocínio lógico aprimorado

OpenAI apresenta o1, modelo de IA com raciocínio lógico aprimorado
Fonte: Tecnoblog