A OpenAI apresentou, nesta quinta-feira (23/01), o Operator, um agente de inteligência artificial que pode “entrar na web e realizar tarefas por você”, conforme descrito pela desenvolvedora do ChatGPT. A ferramenta é capaz de realizar atividades como fazer compras, reservar restaurantes, preencher formulários e até comprar ingressos para shows.
Do ponto de vista técnico, o Operator combina as habilidades de “visão” do GPT-4 com um raciocínio avançado, melhorado por meio de aprendizado por reforço. Isso permite que a IA “entenda” o que está sendo exibido na tela e execute as tarefas como se estivesse usando teclado e mouse.
Na interface do Operator, à esquerda, o usuário solicita que o agente encontre e reserve o melhor city tour de um dia em Roma no TripAdvisor. Após a solicitação, o Operator responde e exibe uma lista das ações realizadas para concluir a reserva. À direita, um navegador mostra a página do TripAdvisor aberta, com detalhes sobre Roma.
O que o Operator pode fazer?
Entre as possibilidades que o CEO da OpenAI, Sam Altman, apresentou, estão tarefas como “encontrar ingressos para o próximo show na Sphere” e “localizar um restaurante com um ótimo happy hour para seis pessoas na próxima quarta-feira”.
Em uma demonstração, o Operator recebeu uma foto de uma lista de compras de supermercado escrita à mão, entrou no Instacart e fez a compra de todos os itens.
Apesar de seu potencial, o Operator pode eventualmente travar, e, nesses casos, o usuário precisará assumir o controle. Além disso, o humano tem a opção de interromper a ação a qualquer momento. A IA também não será capaz de preencher informações sensíveis, como dados de pagamento, login e senha, e sempre pedirá confirmação antes de realizar ações como reservas, envio de e-mails e outras tarefas importantes.
A OpenAI está colaborando com empresas como Uber, DoorDash, Instacart e outras para garantir que o Operator seja capaz de resolver problemas reais, mas sempre respeitando as normas e diretrizes estabelecidas.
Atualmente, o Operator está disponível apenas como um “preview de pesquisa” nos Estados Unidos e está restrito a assinantes do ChatGPT Pro, que custa US$ 200 por mês (aproximadamente R$ 1.200).
O crescimento da IA agêntica
A chamada “IA agêntica” (ou agentic AI, em inglês) está ganhando destaque no setor de tecnologia, e mais assistentes desse tipo devem surgir nos próximos meses. Empresas como Google e Microsoft já estão desenvolvendo suas próprias soluções nesse campo.
Durante o evento Unpacked, realizado nesta quarta-feira (23/01), a Samsung anunciou que sua linha de smartphones Galaxy S25 contará com o assistente Gemini, do Google, para realizar tarefas em diversos aplicativos, como YouTube e Samsung Notes.
Fontes: The Verge, New York Times e Axios.
Achou útil essa informação? Compartilhe com seus amigos!
Deixe-nos a sua opinião aqui nos comentários