什麼是對抗攻擊?

對 AI 模型的輸入做微小但精心設計的修改,讓模型產出完全不同的結果。在圖像辨識中,加入人眼看不見的噪點就能讓 AI 把熊貓認成長臂猿。在文字模型中,同義字替換就可能繞過安全檢測。