Regex oculto identifica emoções negativas e ajusta respostas da IA
Anthropic – Um trecho de mais de 500 mil linhas do firmware do Claude Code vazou recentemente, expondo filtros internos capazes de varrer cada mensagem do usuário em busca de palavrões, abreviações ofensivas e expressões de frustração.
- Em resumo: a IA procura termos como “wtf” ou “piece of shit” antes mesmo de gerar a resposta.
Filtro linguístico foi achado em dump de 512 mil linhas
O engenheiro Alex Kim identificou expressões regulares (regex) responsáveis por esse “raio-X” textual após analisar o material que circulou em fóruns de desenvolvedores. Segundo ele, o bloco de código faz uma busca direta por palavras-chave e não interpreta contexto — técnica comum em moderação de conteúdo, como explica a Wired em análises sobre IA.
“O mecanismo utiliza padrões de busca por meio de uma técnica conhecida como regex”, aponta o relatório técnico sobre o vazamento.
Por que rastrear palavrões? Três hipóteses em jogo
Embora a Anthropic não tenha se pronunciado, especialistas apontam três motivos prováveis:
1) Métrica de satisfação – A quantidade de xingamentos poderia servir como termômetro de frustração, ajudando a equipe a ajustar o modelo.
2) Segurança e compliance – Plataformas corporativas pedem filtros para linguagem abusiva a fim de cumprir políticas de uso aceitável.
3) Empatia algorítmica – Detectar nervosismo permitiria que o chatbot adotasse um tom mais pacificador, recurso já em teste em assistentes como o ChatGPT.
Ferramentas desse tipo não são novas: a OpenAI adotou políticas de conteúdo semelhantes desde 2022, e provedores de nuvem oferecem APIs de análise de sentimento. A diferença é a transparência — no Claude, a lista de termos ficou exposta.
O que mais o leak entregou?
Além do filtro polêmico, o dump revelou como o Claude Code contabiliza tokens, lista de APIs internas e até referência a um “Tamagotchi” virtual, possivelmente uma piada de 1º de abril. Detalhes de versionamento (v2.1.88) reforçam que o material não é rascunho, mas código de produção.
O que você acha? A leitura automática de emoção é bem-vinda ou invasiva? Para saber como outras IAs lidam com privacidade, acesse nossa editoria especializada.
Crédito da imagem: Divulgação / Canaltech