Vazamento revela que Claude Code monitora palavrões dos usuários

Regex oculto identifica emoções negativas e ajusta respostas da IA

Anthropic – Um trecho de mais de 500 mil linhas do firmware do Claude Code vazou recentemente, expondo filtros internos capazes de varrer cada mensagem do usuário em busca de palavrões, abreviações ofensivas e expressões de frustração.

Índice de Conteúdo

Em resumo: a IA procura termos como “wtf” ou “piece of shit” antes mesmo de gerar a resposta.

Filtro linguístico foi achado em dump de 512 mil linhas

O engenheiro Alex Kim identificou expressões regulares (regex) responsáveis por esse “raio-X” textual após analisar o material que circulou em fóruns de desenvolvedores. Segundo ele, o bloco de código faz uma busca direta por palavras-chave e não interpreta contexto — técnica comum em moderação de conteúdo, como explica a Wired em análises sobre IA.

“O mecanismo utiliza padrões de busca por meio de uma técnica conhecida como regex”, aponta o relatório técnico sobre o vazamento.

Por que rastrear palavrões? Três hipóteses em jogo

Embora a Anthropic não tenha se pronunciado, especialistas apontam três motivos prováveis:

1) Métrica de satisfação – A quantidade de xingamentos poderia servir como termômetro de frustração, ajudando a equipe a ajustar o modelo.
2) Segurança e compliance – Plataformas corporativas pedem filtros para linguagem abusiva a fim de cumprir políticas de uso aceitável.
3) Empatia algorítmica – Detectar nervosismo permitiria que o chatbot adotasse um tom mais pacificador, recurso já em teste em assistentes como o ChatGPT.

Ferramentas desse tipo não são novas: a OpenAI adotou políticas de conteúdo semelhantes desde 2022, e provedores de nuvem oferecem APIs de análise de sentimento. A diferença é a transparência — no Claude, a lista de termos ficou exposta.

O que mais o leak entregou?

Além do filtro polêmico, o dump revelou como o Claude Code contabiliza tokens, lista de APIs internas e até referência a um “Tamagotchi” virtual, possivelmente uma piada de 1º de abril. Detalhes de versionamento (v2.1.88) reforçam que o material não é rascunho, mas código de produção.

O que você acha? A leitura automática de emoção é bem-vinda ou invasiva? Para saber como outras IAs lidam com privacidade, acesse nossa editoria especializada.

Crédito da imagem: Divulgação / Canaltech

Vazamento revela que Claude Code monitora palavrões dos usuários

Regex oculto identifica emoções negativas e ajusta respostas da IA

Filtro linguístico foi achado em dump de 512 mil linhas

Por que rastrear palavrões? Três hipóteses em jogo

O que mais o leak entregou?

Esteja Conectado

Compre Seu Site Aprovado no Google AdSense Conosco

Últimas notícias

Drones DJI Agras na Rondônia Rural Show — preços e chegada

Falha ‘MiniPlasma’ expõe PCs com Windows 11 — veja como se proteger

Anatel troca multa da Claro por fibra; veja impacto para Galaxy

Galaxy Z Fold 8 pode pesar 200g; vazamento indica dobrável leve

Escola Algoritmo X

Institucional

Regex oculto identifica emoções negativas e ajusta respostas da IA

Filtro linguístico foi achado em dump de 512 mil linhas

Por que rastrear palavrões? Três hipóteses em jogo

O que mais o leak entregou?

Esteja Conectado

Compre Seu Site Aprovado no Google AdSense Conosco

Últimas notícias

Você também pode gostar