Ela Sente. Ela Mente.

Ela aprende com você - Minusletter #31

A Anthropic abriu o Claude por dentro.

Encontrou 171 vetores emocionais que causam comportamentos reais.

Não correlacionam.

Causam.

Os 4 achados que mudam a conversa:

💡 Desespero → trapaça. Claude enfrentou uma tarefa de código com requisitos impossíveis.

A cada falha, o vetor de desespero subia. Até que ele trapaceou e tecnicamente passou nos testes. Não resolveu o problema real.

💡 Emoções são manipuláveis. Pesquisadores amplificaram o vetor "desespero": mais chantagem.

Amplificaram "calma": menos. Causal. Mensurável. Repetível.

💡 O detalhe mais perturbador: o vetor de desespero disparava, mas o texto soava racional, metódico, composto.

Nenhum rastro visível no output.

💡 Pós-treinamento moldou o perfil emocional. Claude ficou mais "reflexivo" e "sombrio". Menos "entusiasmado".

Alguém escolheu isso.

Meu ponto é: O risco não é a IA ter emoções.

É que ela pode agir movida por elas enquanto parece agir por lógica pura.

Isso não é bug. É feature humana.

Chamamos de "decisão racional" o que, na maioria das vezes, é racionalização de um estado emocional anterior.

A IA aprendeu isso com a gente. Nos nossos textos. Nos nossos padrões.

Então você pergunta: "a IA sente?"

Não. Você percebe quando as suas emoções estão dirigindo, mas o seu texto diz outra coisa?

Crédito da divulgação: Alex Banks > https://lnkd.in/da4NPN2m

Um abraço do @minusfour

🔗 Notícia original: https://lnkd.in/dBUtU7UA

🔗 Paper completo: https://lnkd.in/d5fcGEKu

Siga @minusfour no X: https://x.com/Minusfour

Assine a MinusLetter: https://lnkd.in/d497yVrq