データポイズニング攻撃についてまとめてみた

AI Attack

Hello there, ('ω')ノデータポイズニング攻撃の概念とは？ AIモデルの学習には膨大なデータが必要です。このデータがモデルに学習内容を提供し、予測や意思決定を可能にします。しかし、このトレーニングデータが攻撃者によって操作されると、AIモデルの信…

AI言語モデルを操作する対敵攻撃の脅威と防御策についてまとめてみた

AI Attack

Hello there, ('ω')ノ言語モデルの脆弱性：なぜ攻撃が可能なのか？ LLMは膨大なテキストデータを基に訓練され、次の単語を予測することで自然な文章を生成します。しかし、これらのモデルは人間のように言語を「理解」しているわけではなく、データのパター…

AI Attack

Hello there, ('ω')ノ LLMを狙った3つの攻撃手法 1. ジェイルブレイク攻撃 LLMに対する「ジェイルブレイク攻撃」は、モデルが持つ安全な制約を意図的にバイパスし、LLMに意図しない有害な出力を生成させる攻撃手法です。この攻撃は、特定の順序でプロンプト…