Home » AI Glossary

Jailbreak

What is Jailbreak? Techniques to bypass AI safety restrictions, making models output content they should refuse. Unlike Prompt Injection, j — Judy AI Lab AI Glossary

security beginner

What is Jailbreak?

Techniques to bypass AI safety restrictions, making models output content they should refuse. Unlike Prompt Injection, jailbreaking typically leverages the model’s reasoning ability to ‘persuade’ it to break rules. AI vendors continuously update defenses, but it’s an ongoing arms race.

What is Jailbreak?#

Related Terms

Get new posts by email:

What is Jailbreak?