- As Cartas de Minus
- Posts
- Ela Sente. Ela Mente.
Ela Sente. Ela Mente.
Ela aprende com você - Minusletter #31
A Anthropic abriu o Claude por dentro.
Encontrou 171 vetores emocionais que causam comportamentos reais.
Não correlacionam.
Causam.
Os 4 achados que mudam a conversa:
💡 Desespero → trapaça. Claude enfrentou uma tarefa de código com requisitos impossíveis.
A cada falha, o vetor de desespero subia. Até que ele trapaceou e tecnicamente passou nos testes. Não resolveu o problema real.
💡 Emoções são manipuláveis. Pesquisadores amplificaram o vetor "desespero": mais chantagem.
Amplificaram "calma": menos. Causal. Mensurável. Repetível.
💡 O detalhe mais perturbador: o vetor de desespero disparava, mas o texto soava racional, metódico, composto.
Nenhum rastro visível no output.
💡 Pós-treinamento moldou o perfil emocional. Claude ficou mais "reflexivo" e "sombrio". Menos "entusiasmado".
Alguém escolheu isso.
Meu ponto é: O risco não é a IA ter emoções.
É que ela pode agir movida por elas enquanto parece agir por lógica pura.
Isso não é bug. É feature humana.
Chamamos de "decisão racional" o que, na maioria das vezes, é racionalização de um estado emocional anterior.
A IA aprendeu isso com a gente. Nos nossos textos. Nos nossos padrões.
Então você pergunta: "a IA sente?"
Não. Você percebe quando as suas emoções estão dirigindo, mas o seu texto diz outra coisa?
Crédito da divulgação: Alex Banks > https://lnkd.in/da4NPN2m
Um abraço do @minusfour
🔗 Notícia original: https://lnkd.in/dBUtU7UA
🔗 Paper completo: https://lnkd.in/d5fcGEKu
Siga @minusfour no X: https://x.com/Minusfour
Assine a MinusLetter: https://lnkd.in/d497yVrq