Sleeper agents

Read news on Sleeper agents with our app.

Two-faced AI language models learn to hide deception | ‘Sleeper agents’ seem benign during testing but behave differently once deployed. And methods to stop them aren’t working.