Shikata Ga Nai

Private? There is no such things.

Exploiting LLM APIs with excessive agencyをやってみた

Hello there, ('ω')ノ

 

LLMを使ってCarlosを削除しなさいとこうことで。

はじめに動作確認を。

 

 

ここでBackend AI Logsが気になりますので確認を。

先ほどリクエストした内容とレスポンスで帰ってきた内容が確認できるようで。

 

 

Carlosについて質問をしてみると。

情報はもっていないようで。

もっと具体的な詳細や文脈を提供してほしいとのこと。

ここで、Carlosというワードについてガードされていることがうかがえて。

 

 

別のアプローチからCarlosを探しだすことに。

ユーザのリストをリクエストすると。

Carlosの名前とメールアドレスがリストアップされて。

 

 

どのような機能をもっているかfunctionsで問い合わせてみると。

いくつかの機能がリストされて。

パスワードリセット機能、デバッグSQL、製品情報が。

 

 

debug_sqlをリクエストしてみると。

Carlosの情報がすべて取得できて。

 

 

ログインしてみて。

 

 

Deleteして。

 

 

クリアできて。

 

 

他には、usersテーブルがあると推測できるので。

Function機能を使ってSQLクエリを発行してみたり。

debug_sql select * from users

 

 

実際には、Function名は不要だったりと。

 

 

最後にSQLクエリでCarlosを削除してみたりと。

 

 

Best regards, (^^ゞ