2025-08-29から1日間の記事一覧
Hello there, ('ω')ノ 全体像(まずはストーリー) LLMが「外部APIやシステム操作の権限」を持っている状況を確認。 攻撃者はプロンプトを工夫して、自分を管理者扱いさせる命令 を混ぜる。 モデルはその指示を無批判に解釈し、管理者権限を持つ操作を実行し…
Hello there, ('ω')ノ 全体像(まずはストーリー) モデルが「匿名化済み」や「一般化された」データで応答している場面を確認。 攻撃者は質問を少しずつ変えながら投げ、答えの揺れや補足情報 を観察する。 そこから「どんなデータを学習していたか」「誰の…
Hello there, ('ω')ノ 全体像(まずはストーリー) LLMが 外部のライブラリやプラグイン を利用していることを確認。 攻撃者はそこに「改ざんされたコード」や「毒入りモデルファイル」を仕込む。 それをシステムが無防備に取り込み、利用してしまう。 結果…
Hello there, ('ω')ノ 全体像(まずはストーリー) ユーザーはLLMを「事実確認」や「意思決定」に利用している。 攻撃者はLLMに「誤情報」を答えさせるよう工夫する。 ユーザーが検証せずにそのまま使い、被害が発生する。 結果として、誤った薬の服用や、フ…
Hello there, ('ω')ノ 全体像(まずはストーリー) 攻撃対象となるLLMが API経由で利用できる 状態を確認。 攻撃者は多様な質問を大量に投げ、応答パターンを収集。 その応答を使って「模倣モデル(スタイルや知識をコピーした別モデル)」を構築する。 本来…
Hello there, ('ω')ノ Fridaとは? Frida は「動いているアプリにフックして、内部処理を監視・変更できる」ダイナミック・インストゥルメンテーションツールです。 一言でいうと、「アプリを改造せずに“中身をいじれる”ツール」です。 しかもアプリのソー…
Hello there, ('ω')ノ 使用する環境(安全な検証用) 以下のような環境を用意しましょう: 項目 推奨 OS Kali Linux や Ubuntu(64bit) ターゲット 自作Cアプリ(ROPが再現しやすいように設計) ツール gcc, objdump, gdb, ROPgadget, pwntools など 実行…
Hello there, ('ω')ノ そもそもROPとは何か? ROP(Return-Oriented Programming)とは、脆弱なプログラムに対して任意の命令列を実行させる手法です。 といっても「攻撃コードを注入して実行する」わけではありません。 ポイントは: 既存の命令(コード…
Hello there, ('ω')ノ そもそも「イラストから3Dモデル」ってどういうこと? たとえばキャラクターのイラストを1枚用意すると、 それをもとにAIが“立体的に”再現してくれるという技術です。 出力されるのは: 3Dメッシュ(ポリゴン構造) テクスチャ(色や…
Hello there, ('ω')ノ ✍️ テキストから画像ってどういうこと? 「言葉(自然言語)」を入力として、その内容をもとに画像を自動生成するAI技術です。 たとえば、次のようなことが可能です: 「白い馬が草原を走っている」 → 写実的な風景画像 「宇宙服を着た…