惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

博客园 - 司徒正美
aimingoo的专栏
aimingoo的专栏
MongoDB | Blog
MongoDB | Blog
云风的 BLOG
云风的 BLOG
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
酷 壳 – CoolShell
酷 壳 – CoolShell
博客园 - 聂微东
Y
Y Combinator Blog
T
Tailwind CSS Blog
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
S
SegmentFault 最新的问题
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
博客园 - 【当耐特】
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
J
Java Code Geeks
美团技术团队
Google DeepMind News
Google DeepMind News
博客园_首页
Apple Machine Learning Research
Apple Machine Learning Research
T
The Blog of Author Tim Ferriss

DEV Community

I Tested Spam Protection on Formspree vs Formgrid. The Results Were Surprising. May 27 - Video Understanding Workshop Beyond Keywords: How Google's 2026 Algorithms are Redefining SEO From Click to Cart: Ensuring an Accessible Customer Journey in WooCommerce Your company won't replace you with good AI. They'll replace you with bad AI. 10 First-Principles Strategies to Learn Any Programming Language Deeply 10 First-Principles Strategies to Learn Any Programming Language Deeply Understanding Embeddings easily. The Hidden Cost of “Move Fast and Break Things” Why Your Logs Are Useless Without Traces DressCode: Your AI Stylist for Tomorrow The Documented Shortcoming of Our Production Treasure Hunt Engine I'm 16, and I Built an AI Tool That Audits Your Technical Debt Without Ever Touching code Building Your Own Crypto Poker Bot: A Developer's Guide to Blockchain Gaming Logic Apache Iceberg Metadata Tables: Querying the Internals Hermes, The Self-Improving Agent You Can Actually Run Yourself Unity vs Unreal: 5 Things I Had to Relearn the Hard Way Building Agentic Commerce Infrastructure: Overcoming SQLite Concurrency for Autonomous Procurement Agents Solana Accounts vs Databases HTML Table Borders I built a skill that makes AI-generated AWS diagrams actually usable My first post! I'm kinda excited The Page Root Was the Wrong Unit How to audit what your IDE extension actually sends to the cloud I Migrated 23 Make.com Scenarios to n8n and Cut My Bill by 60% — Complete Migration Guide (2026) Solving a Logistics Problem Using Genetic Algorithms Claude Code Skills Explained: What They Are & When to Use Them (2026) Maintaining Apache Iceberg Tables: Compaction, Expiry, and Cleanup Zero-Idle Local LLMs: Running Llama 3 in AWS Lambda Containers We scanned 8 B2B SaaS companies across 5 categories. ChatGPT named the same 12 brands in every answer. How To "Market" Yourself As A Tech Pro We scanned 500 MCP servers on Smithery. Here is what we found. HTML Basics for Beginners – Markup Language, Elements and Types of CSS DiffWhisperer: How I Turned Cryptic Git Diffs into Architectural Stories with Gemma 4 I built a version manager for llama.cpp using nothing but vibe coding. Unit Testing vs System Testing: Key Differences, Use Cases, and Best Practices for 2026 A game design textbook explains why products with fewer features win How to Build a Raydium Launchpad Bonding Curve in 5 Minutes with forgekit How to turn an AI prototype into a production system How Data Lake Table Storage Degrades Over Time Partition and Sort Keys on DynamoDB: Modeling data for batch-and-stream convergence Auto-Generate Optimized GitHub Actions Workflows For Any Stack With This New CLI Tool Unchaining the African Creator Economy The Treasure Hunt Engine Gotcha - A Lesson in Constrained Performance great_cto v2.17 - no more tambourine dance When Catalogs Are Embedded in Storage SafeMind AI: Instant Health & Safety Intelligence What Is PKCE, How It Works & Flow Examples AI Agent Failure Modes Beyond Hallucination Fastest Way to Understand Stryker Solana Accounts Explained to a Web2 Developer TV Yayın Akışı Sitesi Geliştirirken Öğrendiğim Teknik Dersler $500 Challenge Drop My First Look at Google's Gemma 4: A Quick Introduction How I use an LLM as a translation judge Best Calendar and Scheduling API for Developers — 2026 Comparison Agentic AI in Travel: Why UCP Isn't Travel-Ready Yet — and What We Measured I Finished Machine Learning. And Then Changed The Plan. The Five-Thousand-Line File The AI Whirlwind: Why Your Local Agent Matters More Than Ever I Built an Oracle DBA That Lives in Telegram. It Cut a 500K-Row Scan to 5 - After Asking Permission. The Day 2 Reality of Running a Kubernetes Lab on Your Mac: Stop/Start, CKS Scenarios, and What I Learned Building It. n8n for Airtable Power Users: 5 Automations That Take Your Base to the Next Level Validating Gemma 4 for Industrial IoT: A Governance Pattern VS Code Now Credits Copilot on Every Commit by Default Astro and Islands Architecture: Why Your Portfolio Doesn't Need React for Everything Booting from FAT12: How I added file reading to my x86 kernel Unity’s AI agent went public: the developers of a static analysis tool on what that means for code quality Anna's Archive publica un llms.txt para los LLMs que rastrean su catálogo CRDTs for Offline-First Mobile Sync Why I Built Mneme HQ: Preventing AI Agent Architectural Drift Google Antigravity 2.0 Is the I/O 2026 Announcement You Should Actually Care About I Built a Pay-Per-Call Crypto Signal API with x402 — Heres the Architecture JWT Token Refresh Patterns in React 19: Avoiding the Silent Auth Death Spiral 🚀 “From Prompts to Autonomous Agents: What Google I/O 2026 Changed” The Power of Distributed Consensus in Autonomous SOCs Sixteen TUI components, copy-paste, no dependency The Boring Reliability Layer Every Autonomous Agent Needs Nven - Secret manager Building Multi-Tenant Row-Level Security in PostgreSQL: A Production Pattern The Hardest Part of Being a Developer Isn't Coding Building Vylo — Looking for Collaborators, Partners & Early Support I Thought Memory Fades With Time. It Actually Fades With Information. ORA-00064 오류 원인과 해결 방법 완벽 가이드 I registered an AI agent at 1 AM and something cracked open in my head Pitch: Nven - Sync secrets. Ship faster. Why y=mx+b is the heart of AI From Routines to a Crew — Building a System That Plans Its Own Work & executes it 25 React Interview Questions 2026 (With Answers) — Hooks, React 19, Concurrent Mode An open source LLM eval tool with two independent quality signals Using Dashboard Filtering to Get Customer Usage in Seconds from TBs of Data Skills, Java 17, And Theme Accents 4 Hard Lessons on Optimizing AI Coding Agents Arctype: Cross-Platform Database GUI for LLM Artifacts Your robots.txt says GPTBot is welcome. Your server says 403. Organizing How to Use AWS Glue Workflow 5 n8n Automations Every Digital Agency Should Be Running (Bill More, Work Less) Getting Started with TorchGeo — Remote Sensing with PyTorch Designing a Scalable Cross-Platform Appium Framework Google Antigravity 2.0 & Slash Commands
O fim do “modelo que faz tudo”? Conheça o Conductor, a IA que orquestra outras IAs
Marcos Filip · 2026-05-23 · via DEV Community

OpenClaw, Hermes e Conductor mostram que o futuro da IA pode estar menos em chatbots isolados e mais em sistemas de agentes coordenados.

Sabe quando você usa um LLM para uma tarefa complexa e percebe que ele vai bem em uma parte, mas tropeça em outra?

Ele entende a ideia geral, mas erra o cálculo.

Gera código razoável, mas falha na arquitetura.

Explica bem, mas não sabe executar.

Tem bom raciocínio, mas não conhece o seu contexto.

Durante muito tempo, a solução mais comum foi tentar encontrar “o melhor modelo para tudo”.

Mas talvez a pergunta certa não seja:

Qual é o melhor modelo?

Talvez a pergunta mais importante seja:

Quem deve coordenar vários modelos, ferramentas e agentes para resolver uma tarefa complexa?

É nesse ponto que entra o Conductor, apresentado no artigo “Learning to Orchestrate Agents in Natural Language with the Conductor”, da Sakana AI.

E a ideia é muito interessante: em vez de criar mais um modelo gigante para tentar fazer tudo sozinho, os pesquisadores treinaram um modelo menor, de 7B parâmetros, para atuar como um maestro de outros LLMs.

Ele não é apenas mais um agente.

Ele é um orquestrador.


O que é o Conductor?

O Conductor é um modelo treinado com aprendizado por reforço, ou Reinforcement Learning, para coordenar outros modelos de linguagem.

Na prática, ele recebe uma tarefa complexa e decide como distribuir o trabalho entre diferentes “agentes trabalhadores”.

Esses trabalhadores podem ser modelos com capacidades diferentes: um melhor em código, outro melhor em raciocínio, outro melhor em análise, outro melhor em linguagem natural, e assim por diante.

O Conductor faz principalmente quatro coisas:

  1. Decompõe o problema em partes menores.
  2. Decide qual agente ou modelo deve resolver cada parte.
  3. Escreve instruções específicas para cada trabalhador.
  4. Define como esses trabalhadores podem trocar informações entre si.

Esse último ponto é muito importante.

O Conductor não apenas envia uma pergunta para vários modelos e escolhe a melhor resposta. Ele aprende a montar uma topologia de comunicação.

Ou seja: ele decide quem conversa com quem, em que ordem, com qual contexto e com qual objetivo.


Uma metáfora simples: o maestro e a orquestra

Imagine uma orquestra.

O violinista toca muito bem violino.

O pianista toca muito bem piano.

O percussionista entende ritmo.

O maestro talvez nem toque todos os instrumentos melhor do que cada músico.

Mas ele sabe algo essencial:

como coordenar todos eles para produzir uma música melhor do que qualquer músico sozinho conseguiria produzir.

Essa é a ideia do Conductor.

Ele não precisa ser o melhor modelo em tudo.

Ele precisa saber:

  • qual modelo chamar;
  • quando chamar;
  • com qual instrução;
  • com qual contexto;
  • e como combinar as respostas.

Em vez de pensar em IA como “um grande cérebro único”, começamos a pensar em IA como uma sinfonia de inteligências especializadas.


Diagrama conceitual

O ponto central não é apenas chamar vários modelos.

O ponto central é aprender a coordená-los.


Por que isso é diferente de um roteador simples?

Um roteador simples poderia fazer algo assim:

Se for tarefa de código -> mande para o modelo X
Se for tarefa de texto -> mande para o modelo Y
Se for tarefa matemática -> mande para o modelo Z

Enter fullscreen mode Exit fullscreen mode

Isso é útil, mas ainda é limitado.

O Conductor vai além porque aprende estratégias mais dinâmicas.

Ele pode perceber que uma tarefa de código exige:

  1. um agente planejador;
  2. um agente implementador;
  3. um agente revisor;
  4. um agente verificador;
  5. e talvez uma nova rodada de correção.

Ou seja, ele não apenas escolhe um modelo.

Ele monta um pequeno fluxo de trabalho.

E o mais interessante: segundo o artigo, o Conductor também pode ser chamado como um dos trabalhadores, criando estruturas recursivas. Em outras palavras, o maestro pode, em certos momentos, participar da própria execução.

Isso aponta para algo muito importante no futuro dos agentes:

a inteligência pode emergir não apenas do tamanho do modelo, mas da qualidade da coordenação entre modelos.


E onde entram OpenClaw e Hermes Agent?

Quando li sobre o Conductor, uma pergunta veio naturalmente:

Ele competiria com ferramentas como OpenClaw e Hermes Agent?

Depois de analisar melhor, a resposta mais honesta é:

sim, mas não diretamente.

A resposta mais completa é:

eles atuam em camadas diferentes de um mesmo futuro.

O Conductor está mais próximo da camada de orquestração cognitiva.

OpenClaw e Hermes Agent estão mais próximos da camada de execução, autonomia, memória e operação prática.

Não é exatamente uma competição “ferramenta contra ferramenta”.

É mais uma convergência de funções.


Comparando as camadas

Dimensão Conductor OpenClaw Hermes Agent
Papel principal Orquestrar modelos/agentes Executar tarefas no ambiente do usuário Aprender com o uso e manter continuidade
Analogia Maestro Assistente operacional / canivete suíço Assistente persistente com memória
Foco Delegação inteligente Automação real de tarefas Aprendizado contínuo e personalização
Pergunta que responde “Quem deve resolver cada parte?” “Como executar essa tarefa no mundo real?” “Como melhorar com base no histórico?”
Camada Coordenação Execução Memória + evolução
Melhor uso Problemas complexos com múltiplas etapas Tarefas práticas com ferramentas, arquivos, web e sistema Assistente de longo prazo que aprende com você

Uma analogia de escritório

Imagine uma equipe trabalhando em um projeto complexo.

O OpenClaw seria aquele profissional operacional que consegue mexer em várias ferramentas: navegador, arquivos, terminal, automações, APIs e integrações. Ele tem “mãos”.

O Hermes Agent seria aquele assistente que vai aprendendo com o tempo. Ele lembra preferências, cria habilidades, evolui com base nas experiências anteriores e tenta se tornar mais útil a cada interação. Ele tem “memória”.

O Conductor seria o coordenador técnico que olha para o problema e diz:

“Essa parte vai para o agente de pesquisa.

Essa outra vai para o agente de código.

Depois o revisor confere.

Em seguida o verificador testa.

Só então eu combino tudo em uma resposta final.”

Ele tem “coordenação”.

Essas três capacidades são diferentes, mas complementares:

  • mãos;
  • memória;
  • coordenação.

E talvez o futuro da IA esteja justamente na fusão dessas três camadas.


A competição real ainda está se formando

Hoje, eu não vejo o Conductor como um substituto direto de OpenClaw ou Hermes.

Vejo como uma peça de uma camada superior.

Um sistema como OpenClaw pode ganhar muito se tiver um orquestrador melhor decidindo quais habilidades usar, em qual ordem e com quais permissões.

Um sistema como Hermes pode ganhar muito se tiver uma camada de coordenação mais sofisticada para organizar múltiplos perfis, subtarefas e agentes especializados.

E um Conductor, sozinho, também precisaria de ferramentas de execução, memória, permissões, ambiente, segurança e interface para virar um produto completo.

Então a pergunta não é:

Qual deles vence?

A pergunta mais interessante é:

Como essas capacidades vão se juntar?


O que isso ensina para quem desenvolve software?

Para mim, esse artigo reforça uma mudança importante no desenvolvimento com IA.

A primeira fase foi usar chatbots.

A segunda fase foi usar copilotos.

A terceira fase foi criar agentes com ferramentas.

Agora estamos entrando em uma fase em que a habilidade principal passa a ser orquestrar sistemas de agentes.

Isso muda o papel do desenvolvedor.

O desenvolvedor deixa de apenas pedir código para uma IA e passa a pensar em:

  • decomposição de tarefas;
  • escolha de modelos;
  • roteamento de contexto;
  • memória;
  • permissões;
  • segurança;
  • avaliação;
  • logs;
  • custo;
  • qualidade;
  • revisão humana;
  • e governança.

Ou seja, o problema deixa de ser apenas “gerar código”.

O problema passa a ser construir um sistema confiável de trabalho assistido por IA.


O risco: autonomia sem governança

Existe também um lado perigoso nessa evolução.

Quanto mais agentes ganham ferramentas, memória e capacidade de agir, maior fica a superfície de risco.

Um agente com acesso a arquivos, e-mail, terminal, navegador, banco de dados e APIs não é apenas um chatbot.

Ele é uma entidade operacional.

Se esse agente for mal instruído, mal isolado ou mal monitorado, ele pode:

  • executar comandos errados;
  • vazar informações;
  • acessar dados sensíveis;
  • tomar decisões sem aprovação;
  • criar automações perigosas;
  • ou simplesmente gerar caos em escala.

Por isso, a próxima geração de IA não pode ser apenas mais poderosa.

Ela precisa ser mais governável.

O futuro não será apenas sobre agentes autônomos.

Será sobre agentes autônomos com:

  • limites claros;
  • permissões explícitas;
  • trilhas de auditoria;
  • revisão humana;
  • avaliação contínua;
  • e mecanismos de segurança.

Para onde estamos convergindo?

Na minha visão, estamos convergindo para uma arquitetura com três grandes camadas.

1. Camada de orquestração

É onde entra algo como o Conductor.

Essa camada decide:

  • qual agente chamar;
  • qual modelo usar;
  • qual contexto enviar;
  • qual subtarefa executar;
  • qual resposta revisar;
  • e quando pedir intervenção humana.

Ela é o cérebro coordenador.

2. Camada de execução

É onde entram ferramentas como OpenClaw e outros agentes operacionais.

Essa camada executa ações:

  • abrir arquivos;
  • consultar APIs;
  • navegar na web;
  • escrever código;
  • rodar scripts;
  • criar documentos;
  • enviar mensagens;
  • interagir com sistemas.

Ela é o corpo operacional.

3. Camada de memória e aprendizado

É onde entram sistemas como Hermes Agent e arquiteturas com memória persistente.

Essa camada registra:

  • preferências;
  • decisões anteriores;
  • erros recorrentes;
  • habilidades aprendidas;
  • contexto de projetos;
  • padrões de trabalho;
  • e histórico de interações.

Ela é a continuidade.


A plataforma de IA do futuro

A plataforma de IA do futuro provavelmente não será apenas um chatbot bonito.

Também não será apenas um agente que executa comandos.

Ela será uma combinação de:

  • orquestração;
  • execução;
  • memória;
  • avaliação;
  • segurança;
  • governança;
  • e experiência de usuário.

Algo mais ou menos assim:

O grande diferencial não será apenas “ter IA”.

Será saber construir sistemas em que a IA consiga trabalhar com segurança, contexto e responsabilidade.


Conclusão

O Conductor é importante porque aponta para uma mudança de mentalidade.

A pergunta deixa de ser:

“Qual modelo é mais inteligente?”

E passa a ser:

“Qual sistema consegue coordenar melhor várias inteligências?”

OpenClaw, Hermes Agent e Conductor representam peças diferentes desse quebra-cabeça.

OpenClaw aponta para a execução.

Hermes aponta para memória e aprendizado contínuo.

Conductor aponta para orquestração.

Separados, eles já são interessantes.

Juntos, eles mostram para onde estamos indo.

Estamos saindo da era do modelo único e entrando na era dos sistemas de agentes coordenados.

Uma era em que a inteligência não estará apenas no modelo, mas na arquitetura ao redor dele.

A IA do futuro não será apenas um cérebro gigante.

Será uma orquestra.

E o grande desafio será construir o maestro, os instrumentos, as regras de segurança e a partitura certa.


Referências