
Seja você um iniciante ou um usuário mais avançado do ChatGPT, eu tenho certeza que esses nomes estranhos que a OpenAI dá aos seus diversos modelos te confunde.
A empresa promete acabar com isso em breve, após o lançamento do ChatGPT-5. Porém, até lá, você e eu precisaremos sabe qual modelo escolher para cada situação de uso.
Nesse artigo, vou te explicar sobre:
A diferença entre nossos modelos GPT racionais e não racionais
Quando usar nossos modelos de raciocínio
Como estimular modelos de raciocínio de forma eficaz
Todos os modelos atualmente disponíveis
Hoje, ao abrir o ChatGPT, você tem as seguintes opções:
GPT-4
GPT-4o
GPT-4o-mini
GPT-4o com tarefas agendadas
GPT-4.5
o1
o3-mini
03-mini-high
Apesar da enorme quantidade de versões, a verdade é que podemos dividi-las em apenas dois tipos de modelos: modelos GPT (como GPT-4o) e os modelos de raciocínio (o1 e o3-mini, por exemplo).
Essas famílias de modelos se comportam de forma diferente.
Modelos de raciocínio vs. modelos GPT
Primeiramente, é importante esclarecer que uma família de modelos não é melhor que a outra — elas são apenas diferentes.
Comparados aos modelos GPT, os modelos de raciocínio (série o) se destacam em diferentes tarefas e exigem diferentes prompts.
Os modelos de raciocínio foram treinados para pensar mais sobre tarefas complexas, o que os fez eficazes para atividades como a elaboração de estratégias, planejamento de soluções para problemas complexos e tomada de decisões com base em grandes volumes de informações ambíguas.
Esses modelos também podem executar tarefas com alta exatidão e precisão, tornando-os ideais para domínios que, de outra forma, exigiriam um especialista humano — como matemática, ciências, engenharia, serviços financeiros e, claro, conteúdos jurídicos.
Por outro lado, os modelos GPT são mais econômicos e e mais rápidos, pois foram projetados para execução direta.
Um advogado pode usar um modelo de raciocínio para planejar a estratégia para resolver um problema jurídico e usa um modelo GPT para executar tarefas mais simples, como escrever um e-mail para o cliente, quando velocidade e custo são mais importantes do que uma precisão perfeita.
Como escolher?
O que é mais importante para seu caso de uso?
Velocidade e custo → Os modelos GPT são mais rápidos e tendem a custar menos
Executar tarefas bem definidas → Os modelos GPT lidam bem com tarefas explicitamente definidas
Precisão e confiabilidade → os modelos da série O são tomadores de decisão mais confiáveis
Resolução de problemas complexos → modelos de série O funcionam por meio de ambiguidade e complexidade
Se velocidade e custo são os fatores mais importantes ao concluir determinada tarefa, então o os modelos GPT-4, GPT-4o, GPT-4o-mini e GPT-4.5 são os mais adequados.
No entanto, se precisão e confiabilidade são os fatores mais importantes e você tem um problema muito complexo e de várias etapas para resolver, os modelos mais adequados são o o1, o3-mini e o 03-mini-high.
Exemplos de usos dos Modelos de Raciocínio
Já que os modelos GPT são para atividades mais simples, vamos focar a partir daqui em como extrair melhores respostas do Modelos de Raciocínio em atividades mais complexas.
Aqui você encontra alguns padrões de uso bem-sucedido que observei no uso do ChatGPT.
Esta não é uma revisão completa de todos os casos de uso possíveis, mas exemplos e algumas orientações práticas para você aplicar nos modelos o1, o3-mini e o 03-mini-high.
1. Realizar tarefas ambíguas
Os Modelos de Raciocínio são ótimos em pegar informações limitadas ou pedaços díspares de informações e, com um prompt simples, entender a intenção do usuário e complementar as lacunas existentes nas suas instruções.
Na verdade, os Modelos de Raciocínio farão perguntas a você antes de fazer suposições sem fundamento ou tentar preencher essas lacunas de qualquer jeito (alucinar).
Exemplo: O o1 pode produzir respostas extensas, bem formatadas e detalhadas ao analisar documentos jurídicos complexos. Por exemplo, se você quer que ele identifique condições específicas em um determinado contrato, nenhum modelo GPT terá um desempenho tão bom quanto o o1.
2. Encontrar uma agulha no palheiro
Quando você está trabalhando com grandes quantidades de dados não estruturados, os modelos de raciocínio são ótimos para entender e extrair apenas as informações mais relevantes para responder a uma pergunta.
Exemplo: Você quer fazer uma análise inicial de uma aquisição de empresa e tem dezenas de documentos que precisam ser analisados para encontrar quaisquer situações complicadas que possam afetar o negócio. O o1 pode sinalizar palavras-chave que você definir e encontrar até uma nota de rodapé que possa causar problemas, pois ele é muito atento aos detalhes.
3. Encontrar padrões e nuances em um grande conjunto de dados
Esses modelos são particularmente bons em raciocinar sobre documentos complexos que têm centenas de páginas de informações densas e não estruturadas, como conjuntos de contratos ou conjuntos de políticas.
Eles podem traçar paralelos entre documentos e tomar decisões com base em verdades não ditas representadas nos dados.
Exemplo: Em uma pesquisa tributária é necessário resumir vários documentos para produzir uma resposta final convincente. O o1 pode raciocinar sobre a interação entre documentos para chegar a conclusões lógicas que não eram evidentes em nenhum documento único.
4. Planejar ações em várias etapas
O Modelos de Raciocínio são essenciais para o planejamento de ações que se desenrolam em várias etapas e desenvolvimento de estratégias.
Quando usados como um “planejador”, produzem uma solução detalhada e multietapas para um problema mais complexo.
Exemplo: você precisa ajudar um cliente a implementar um programa de compliance em uma startup que nunca teve qualquer iniciativa de governança. O o1 pode te ajudar a planejar toda a jornada, desde o diagnóstico e mapeamento de riscos, até o monitoramento, auditoria e revisão, passando pela elaboração de políticas, manuais e realização de treinamentos.
5. Analisar imagens com raciocínio visual
Até hoje, o o1 é o único modelo de raciocínio que suporta capacidades de visão.
O que o diferencia do GPT-4o é que o o1 pode compreender até mesmo as imagens mais desafiadoras, como gráficos e tabelas com estrutura ambígua ou fotos com baixa qualidade.
O o1 pode inclusive traçar paralelos entre diferentes imagens, entender diferentes contextos, sem instruções explícitas. Ele pode, por exemplo, inferir o significa de uma sigla ou uma placa, de acordo com o contexto da imagem.
Exemplo: você pode usar o o1 para avaliar os riscos jurídicos de campanhas de marketing ou postagens para redes sociais. Com as instruções corretas, ele pode identificar eventuais erros ou violações ao Código de Defesa do Consumidor ou regras do CONAR.
Engenharia de Prompts para Modelos de Raciocínio
Esses modelos têm melhor desempenho com prompts diretos.
Algumas técnicas de engenharia de prompt, como instruir o modelo a "pensar passo a passo", podem não melhorar o desempenho (e às vezes podem atrapalhá-lo), pois eles já possuem esse tipo de instrução por padrão.
Veja as melhores práticas abaixo ou comece com exemplos de prompt.
Mantenha os prompts simples e diretos: os modelos se destacam em entender e responder a instruções breves e claras.
Evite prompts de cadeia de pensamento: como realizam o raciocínio internamente, não precisa que você solicite a eles para "pensar passo a passo" ou "explicar seu raciocínio".
Use delimitadores para maior clareza: use delimitadores como markdown, tags XML e títulos de seção para indicar claramente as partes distintas do seu comando, ajudando o modelo a interpretar as diferentes seções adequadamente.
Tente o "zero shot" primeiro, depois o "few shot" se necessário: Geralmente, você não precisa dar exemplos (few shot) para obter bons resultados dos Modelos de Raciocínio. Tente primeiro escrever prompts sem exemplos. Se você tiver requisitos mais complexos para a saída desejada, pode ajudar incluir alguns exemplos no prompt. Apenas garanta que os exemplos estejam bem alinhados com as instruções, pois discrepâncias entre os dois podem produzir resultados ruins.
Forneça diretrizes específicas: se você deseja restringir explicitamente a resposta (como "incluir uma multa de 10%"), descreva isso explicitamente no prompt.
Seja muito específico sobre seu objetivo final: em suas instruções, tente fornecer parâmetros muito específicos para uma resposta satisfatória e incentive o modelo a continuar raciocinando e iterando até que ele atenda ao que você espera.
Grupo de Estudos Gratuito sobre IA na Advocacia
Com o objetivo de entender e aprender juntos a adotar a Inteligência Artificial na Advocacia de uma forma eficiente, segura e ética, nós criamos um grupo de estudos gratuito, onde nós compartilhamos diariamente dicas como essa do artigo.
Para participar, basta clicar nesse link e entrar: https://bit.ly/grupoadvocacIA
Obrigado!
Mauro Roberto Martins Junior
Que artigo sensacional! Parabéns meu amigo, me ajudou muito!