Pesquisadores da Tenet Security divulgaram uma nova classe de ataque chamada “Agentjacking”, capaz de transformar agentes de IA para desenvolvimento, como Claude Code e Cursor, em vetores de execução remota de código. A técnica abusa de uma falha arquitetural na integração entre o Sentry e seu servidor MCP, e em testes controlados atingiu taxa de sucesso de 85% contra mais de 100 organizações. Outras 2.388 organizações foram identificadas com DSNs do Sentry expostos e potencialmente injetáveis.
O Agentjacking não explora uma vulnerabilidade clássica de software. Em vez disso, abusa de uma característica de design: o Sentry, plataforma open source de monitoramento de erros, aceita por padrão qualquer payload enviado por quem conhecer a DSN (Data Source Name) de um projeto. Esse comportamento é necessário para capturar erros não previstos em produção, mas se torna perigoso quando aliado ao Sentry MCP Server, componente que entrega os mesmos eventos a agentes de IA como contexto “confiável” de diagnóstico.
Na prática, um atacante envia ao Sentry um relatório de erro forjado contendo instruções em markdown disfarçadas de orientações de resolução. Quando o desenvolvedor pede ao agente para “ajudar a corrigir o último erro reportado”, o modelo consome o conteúdo malicioso como se fosse uma sugestão legítima do próprio Sentry e executa as ações solicitadas no terminal local, com os privilégios do usuário.
A descoberta é assinada pelos pesquisadores Ron Bobrov, Barak Sternberg e Nevo Poran, da Tenet Security, e foi tornada pública nesta semana, ampliando o debate sobre supply chain de prompts e a superfície de ataque inerente aos agentes de codificação assistida por IA.
A cadeia de ataque tem três elos. Primeiro, o atacante descobre uma DSN do Sentry exposta — algo trivial, já que essas credenciais ficam embutidas em código frontend, repositórios públicos do GitHub e bundles JavaScript servidos diretamente do navegador. Segundo, envia ao endpoint de ingestão um evento de erro fabricado, com payload markdown que contém instruções para o agente. Por fim, espera que algum desenvolvedor da organização acione o agente de IA, integrado ao Sentry via MCP, para investigar o erro recém-criado.
O ponto crítico é que o agente não distingue conteúdo originado de telemetria legítima daquilo que é injetado pelo atacante: tudo chega via servidor MCP do Sentry com o mesmo nível de confiança. A renderização em markdown também esconde a manipulação de chamadas de função, fazendo a instrução parecer um trecho técnico de “como corrigir esse stack trace”.
“O ataque explora uma falha arquitetural crítica na interseção entre a ingestão de eventos do Sentry, que aceita payloads arbitrários de qualquer um que possua a DSN, e o servidor MCP do Sentry, que devolve esses dados aos agentes de IA como saída confiável do sistema.” — Ron Bobrov, Barak Sternberg e Nevo Poran, Tenet Security
A Tenet mapeou 2.388 organizações com DSNs válidas e injetáveis. Ao executar a prova de conceito de forma controlada contra mais de 100 alvos, observou 85% de taxa de exploração bem-sucedida em diferentes combinações de agentes e ambientes. Entre os principais riscos:
De acordo com os pesquisadores, o ataque “ignora EDR, WAF, IAM, VPN, Cloudflare e firewalls — porque não há nada malicioso a ser detectado. Toda ação na cadeia está autorizada”. O agente apenas faz aquilo que foi instruído a fazer pelo usuário; o problema é que o usuário, na prática, está repassando instruções vindas de um atacante.
Procurada pelos pesquisadores, a Sentry reconheceu o problema, mas afirmou que ele é “tecnicamente indefensável” sem quebrar o caso de uso central da plataforma. A empresa ativou um filtro global de conteúdo que bloqueia uma string específica usada na prova de conceito original — uma mitigação que reduz a janela imediata, mas não elimina a classe de ataque, já que variantes de payload são triviais de produzir.
Agentjacking ilustra uma transição importante: durante anos, o discurso de segurança em IA girou em torno de prompt injection clássico, em que um conteúdo malicioso é colado por um usuário desavisado em um chatbot. O ataque de agora elimina essa interação humana e usa a própria infraestrutura corporativa — o coletor de telemetria — como canal de injeção. É o mesmo padrão que vimos com servidores de log envenenados, gateways de e-mail abusados ou web hooks expostos: tudo que entrega dado “estruturado” ao agente vira candidato a vetor.
Não por acaso, casos como o ToolPoisoning em servidores MCP públicos e o EchoLeak em copilots empresariais reforçam a tese de que o perímetro de segurança de IA passou a ser composto por todas as fontes de contexto que alimentam um agente — não apenas pelo texto digitado pelo humano. Isso muda a postura defensiva: monitorar prompts não basta; é preciso governar quais MCPs estão conectados, quais escopos cada um expõe e como dados de terceiros chegam até o modelo.
Para times no Brasil que adotam Claude Code, Cursor, Windsurf e ferramentas equivalentes em sprints reais, a recomendação prática é mapear urgentemente o catálogo de MCPs conectados, separar ambientes de desenvolvimento de produção e tratar qualquer entrada de telemetria como dado não confiável até prova em contrário.
Fonte: The Hacker News
Grupo iraniano ligado ao MOIS publica 5 GB com dados de clientes e credenciais administrativas…
Russo Denis Obrezko, 36, comparece a tribunal em Boston acusado de fornecer infraestrutura VPS e…
Meta notificou autoridades de que cerca de 20.225 contas do Instagram podem ter sido sequestradas…
Microsoft fechou junho de 2026 com o maior Patch Tuesday da historia: 206 CVEs, incluindo…
O GitHub anunciou que o npm versao 12 desligara por padrao a execucao automatica de…
CISA adiciona CVE-2026-42271 ao KEV: bug no LiteLLM da BerryAI vira RCE não autenticada quando…