Shikata Ga Nai

Private? There is no such things.

LLM

Kali Linux をコンテナ化した MCP サーバを作って Claude から操作する

Hello there, ('ω')ノ AI が外部ツールを直接操作できたら便利だと思いませんか? ポイントは以下の3つです。 MCP(Model Context Protocol)で AI とツールをつなぐ Kali Linux を Docker コンテナで安全に扱う Claude Desktop から侵入テストを実行させる …

『はじめてのLLM設計 第1巻:LLMのしくみと設計の考え方』を出版しました!

LLM

Hello there, ('ω')ノ このたび、新しい書籍 『はじめてのLLM設計 第1巻:LLMのしくみと設計の考え方』 を出版いたしました。 https://www.amazon.co.jp/dp/B0FT6PS3NR/ref=sr_1_2?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&crid=23INKUC9WX5C1&dib=…

第84回:社内で使えるLLMシステム構築のまとめ

LLM

Hello there, ('ω')ノ ✅ スタート地点に立つ前に考えるべき3つの視点 LLM導入は技術的な挑戦であると同時に、ビジネス的・組織的なプロジェクトでもあります。 成功の鍵は、以下の視点を最初から組み込むことです。 視点 質問例 ビジネス価値 何の業務にどう…

第83回:運用ログの活用と継続的改善

LLM

Hello there, ('ω')ノ ~AIも“育てる”時代へ:ログから見える失敗と成長のヒント~ AIエージェントが本番環境で動き始めると、必ずこうした声が上がります: 「なんでこんな応答をしたのか分からない」 「昨日はうまくいったのに今日は失敗している」 「ユー…

第82回:AIエージェントのテストとデバッグ戦略

LLM

Hello there, ('ω')ノ ~「ちゃんと動くか?」を確認できなければ、安心して任せられない~ どんなに賢く設計されたAIでも、テストしなければ「そのうち壊れる危うい仕組み」にしかなりません。 特にエージェント型LLMでは、自然言語・外部ツール・判断ロジ…

第81回:LangGraphによる状態管理と分岐設計の実例

LLM

Hello there, ('ω')ノ ~LLMを“迷わず動かす”ための次世代ワークフロー技術~ 多くの企業がLLMを実務で活用する中で、こんな課題に直面しています: 処理フローの途中で“戻る”や“スキップ”がうまくできない 途中で止まった時、どこで止まったか分からない チ…

第80回:エージェントAIの倫理と安全性

LLM

Hello there, ('ω')ノ ~AIが「自分で判断する」時代に、私たちが守るべきルールとは?~ 自律的に動くAIエージェントは、便利で強力です。 しかし同時に、 意図しない行動をとる 有害な情報を拡散する 偏った判断を下す 情報漏洩のリスクがある といった問…

第79回:意思決定と行動の制御ロジック

LLM

Hello there, ('ω')ノ ~AIが「何をすべきか」を自分で考え、正しく動くために~ 「AIに仕事を任せたら、見当違いなことをし始めた」 「1ステップ前に戻るべきなのに、勝手に完了処理をしてしまった」 ──こうした問題は、AIの“意思決定ロジック”が不明確だっ…

第78回:記憶や状態管理の導入方法

LLM

Hello there, ('ω')ノ ~会話を忘れない、タスクを途中で投げ出さないAIのつくり方~ LLMに対してこんな不満を持ったことはありませんか? 「さっき言ったこと、もう忘れてるの?」 「前の話と矛盾してない?」 「やりかけの作業、また最初から?」 こうした…

第77回:目標設定と計画:自律的に動く仕組み

LLM

Hello there, ('ω')ノ ~「ゴールまでの道筋」をAIに考えさせるには?~ 従来のLLMは、入力されたプロンプトに対して一度だけ応答するというものでした。 一方、エージェント的AIではこう考えます: 「目的を達成するには、どんな手順を踏むべきか?」 つま…

第76回:エージェント的AIとは?LLMの新しい活用形態

LLM

Hello there, ('ω')ノ ~AIが“考えて動く”時代へ:プロンプトだけではない次のステップ~ 従来のLLM活用は、 ユーザーがプロンプトを送る AIが文章で返す それを人間が読む・使う という「1回限りの質問回答型」でした。 しかし最近は、 AIが“自分で目的を判…

第75回:人手による評価とその工夫点

LLM

Hello there, ('ω')ノ ~最終的に判断するのは「人」だからこそ、設計が重要~ AIの回答が完璧でも、「使えなければ意味がない」。 RAGでは、検索精度や生成品質に加えて、「現場の目線で有効だったか?」を人間がチェックすることが重要です。 ✅ なぜ人手評…

第74回:RAGシステムの評価方法:何をどう測る?

LLM

Hello there, ('ω')ノ ~「それっぽく答えてる」だけじゃない、定量的な検証のすすめ~ RAGは検索+生成を組み合わせた仕組みです。 したがって、評価も検索精度(Retrieval)と生成精度(Generation)の両方に目を向ける必要があります。 ✅ なぜ評価が難し…

第73回:大規模ナレッジとの連携で注意すべきこと

LLM

Hello there, ('ω')ノ ~情報が多すぎて混乱する前に考えておくべき設計と運用~ 「AIに社内のナレッジを読ませれば、業務が自動化される!」 ……そう思って、大量のドキュメントを詰め込んでみたものの── なぜか的外れな回答が増える どこを見て答えているか…

第72回:あいまいな質問に対応するには?

LLM

Hello there, ('ω')ノ ~「質問がはっきりしない」からこそ、AI設計がものを言う~ 「それって、どういう意味で聞いてるの?」 人間同士でもよくあるこんな場面。AIにとってもこれは大きな壁です。 とくにRAGを活用するような業務AIでは、次のような質問がよ…

第71回:高度なRAG戦略:反復・適応的な検索とは?

LLM

Hello there, ('ω')ノ ~1回きりじゃ終わらない、AIの“調べ直し力”を育てる~ 従来のRAGは、「質問 → 検索 → 文章生成」という一発検索・一発生成が基本です。 しかし、業務で使っているとこう思うことがあります: 「もう少し違う観点の情報も欲しかった」 …

第70回:グラフ構造を使った知識活用(Graph RAG)

LLM

Hello there, ('ω')ノ ~LLMが“知識のつながり”を理解するための新しい土台~ 従来のRAGでは、「質問 → 関連情報の検索 → 回答生成」という直線的な流れが基本でした。 しかし、複雑な問いや背景知識が必要な業務では、単純な情報検索だけでは限界があります…

第69回:検索結果をどう文章生成に統合するのか?

LLM

Hello there, ('ω')ノ ~LLMに「参考情報」をどう渡すかが回答の質を決める~ RAG(Retrieval-Augmented Generation)では、 ユーザーの質問に対して、まず情報を検索し、それを元にAIが文章を作ります。 ここで重要になるのが── 「検索した情報をどうLLMに…

第68回:クエリの作り方:より良い情報取得の鍵

LLM

Hello there, ('ω')ノ ~AIに“何をどう聞くか”が、答えの質を決める~ 「質問がうまく伝わらない」── それは、人間同士だけでなく、AIとのやり取りでもよく起こることです。 特にRAGでは、「どんなクエリ(検索指示)を投げるか」が、 どんな情報が取り出さ…

第67回:検索・取得に使われるベクトル検索の基礎

LLM

Hello there, ('ω')ノ ~「AIが意味で検索する」仕組みをやさしく理解する~ 「文章を意味で検索できる」──そう聞いても、ピンとこないかもしれません。 でも、たとえば以下のようなケースで、ベクトル検索は威力を発揮します。 従来のキーワード検索との違…

第66回:RAGとは?外部知識でLLMを強化する技術

LLM

Hello there, ('ω')ノ ~AIが「知らないこと」に答えられるようにする仕組み~ ChatGPTなどのLLMは非常に賢く見えますが、弱点もあります。 それは── 最新情報や社内独自の知識には対応できない ということ。 たとえば: 「新しい経費申請ルールはどうなった…

第65回:自動推論と自動ツール実行の未来

LLM

Hello there, ('ω')ノ ~AIが“自分で考えて動く”世界は、もう始まっている~ これまでのAI活用は、「人が指示して→AIが回答する」スタイルが中心でした。 しかし今、世界は次のフェーズに入りつつあります。 それが── AIが人の手を借りずに「考えて」「行動…

第64回:ツール選定と外部知識の連携方法

LLM

Hello there, ('ω')ノ ~LLMに“現場の知識”を与え、業務と接続するために~ ChatGPTのようなAIは非常に賢く見えますが、基本的には「ある期間までに学習した一般知識」をもとに回答しています。 つまり── ✅ 自社独自のマニュアルやルール ✅ リアルタイムのデ…

第63回:エラーや失敗を修正する反復プロンプト設計

LLM

Hello there, ('ω')ノ ~AIが“考え直してやり直す”仕組みをどう作る?~ 「AIが出力した内容が惜しいけどちょっと違う…」 「ミスに気づいて自分で修正してくれたらいいのに…」 そんな経験、ありませんか? 実は最近のLLMには、「間違いを認識し、再考して修…

第62回:表現言語(EL)を用いた高度プロンプト構成

LLM

Hello there, ('ω')ノ ~“自然文”と“プログラミング”の間にある、設計者のための共通言語~ 従来のプロンプト設計では、「できるだけわかりやすく自然な日本語で指示を出す」ことが中心でした。 しかしLLMがビジネスの中核で活躍する今、 より複雑で再利用可…

第61回:LangChainやLangGraphとの連携ポイント

LLM

Hello there, ('ω')ノ ~LLMを「動かす」ためのフレームワーク設計入門~ LLMは強力な知識や文章生成能力を持っていますが、ただ単体で動かすだけでは業務の自動化は難しいです。 そこで登場するのが、「LangChain(ラングチェーン)」や「LangGraph(ラング…

第60回:エージェントのように動くLLMの仕組み

LLM

Hello there, ('ω')ノ ~「話すAI」から「動くAI」への進化~ ChatGPTなどのAIは、これまでは「質問→回答」のやりとりに特化していました。 しかし今、多くの企業や開発者が目指しているのは、「会話するだけでなく、動けるAI」=AIエージェントの活用です。…

第59回:複雑なタスクをどう分割・実行させるか?

LLM

Hello there, ('ω')ノ ~AIに「一歩ずつ考えさせて、着実に仕事させる」ための技術~ AIに「このレポートを作って」と頼んだとき、 実際には「情報収集」「要点整理」「文章化」「フォーマット整形」…と、複数のステップが必要ですよね。 こうした“複雑な指…

第58回:マルチステップ推論とツール連携の設計法

LLM

Hello there, ('ω')ノ ~AIが“ひとつずつ考え、外部と連携する”ための設計の知恵~ ChatGPTなどのAIは、単純な質問にはすぐ答えられますが、以下のような複雑な業務指示には工夫が必要です: 「このファイルを確認して、必要な申請手続きを調べて、部門ごと…

第57回:自己反省するAI

LLM

Hello there, ('ω')ノ ~Reflection技術でAIに「見直す力」を持たせる~ AIが出力した内容を見て、 「ちょっと違うな」「あと一歩で正解なのに」…と思ったことはないでしょうか? 実は、こうした「間違いやズレ」に、AI自身が気づいて修正できるようにする技…