Kali Linux をコンテナ化した MCP サーバを作って Claude から操作する

LLM AI

Hello there, ('ω')ノ AI が外部ツールを直接操作できたら便利だと思いませんか？ポイントは以下の3つです。 MCP（Model Context Protocol）で AI とツールをつなぐ Kali Linux を Docker コンテナで安全に扱う Claude Desktop から侵入テストを実行させる …

2025-10-02

『はじめてのLLM設計第1巻：LLMのしくみと設計の考え方』を出版しました！

LLM

Hello there, ('ω')ノこのたび、新しい書籍『はじめてのLLM設計第1巻：LLMのしくみと設計の考え方』を出版いたしました。 https://www.amazon.co.jp/dp/B0FT6PS3NR/ref=sr_1_2?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&crid=23INKUC9WX5C1&dib=…

2025-07-22

第84回：社内で使えるLLMシステム構築のまとめ

LLM

Hello there, ('ω')ノ ✅ スタート地点に立つ前に考えるべき3つの視点 LLM導入は技術的な挑戦であると同時に、ビジネス的・組織的なプロジェクトでもあります。成功の鍵は、以下の視点を最初から組み込むことです。視点質問例ビジネス価値何の業務にどう…

2025-07-22

第83回：運用ログの活用と継続的改善

LLM

Hello there, ('ω')ノ～AIも“育てる”時代へ：ログから見える失敗と成長のヒント～ AIエージェントが本番環境で動き始めると、必ずこうした声が上がります：「なんでこんな応答をしたのか分からない」「昨日はうまくいったのに今日は失敗している」「ユー…

2025-07-22

第82回：AIエージェントのテストとデバッグ戦略

LLM

Hello there, ('ω')ノ～「ちゃんと動くか？」を確認できなければ、安心して任せられない～どんなに賢く設計されたAIでも、テストしなければ「そのうち壊れる危うい仕組み」にしかなりません。特にエージェント型LLMでは、自然言語・外部ツール・判断ロジ…

2025-07-22

第81回：LangGraphによる状態管理と分岐設計の実例

LLM

Hello there, ('ω')ノ～LLMを“迷わず動かす”ための次世代ワークフロー技術～多くの企業がLLMを実務で活用する中で、こんな課題に直面しています：処理フローの途中で“戻る”や“スキップ”がうまくできない途中で止まった時、どこで止まったか分からないチ…

2025-07-18

第80回：エージェントAIの倫理と安全性

LLM

Hello there, ('ω')ノ～AIが「自分で判断する」時代に、私たちが守るべきルールとは？～自律的に動くAIエージェントは、便利で強力です。しかし同時に、意図しない行動をとる有害な情報を拡散する偏った判断を下す情報漏洩のリスクがあるといった問…

2025-07-18

第79回：意思決定と行動の制御ロジック

LLM

Hello there, ('ω')ノ～AIが「何をすべきか」を自分で考え、正しく動くために～「AIに仕事を任せたら、見当違いなことをし始めた」「1ステップ前に戻るべきなのに、勝手に完了処理をしてしまった」 ──こうした問題は、AIの“意思決定ロジック”が不明確だっ…

2025-07-16

第78回：記憶や状態管理の導入方法

LLM

Hello there, ('ω')ノ～会話を忘れない、タスクを途中で投げ出さないAIのつくり方～ LLMに対してこんな不満を持ったことはありませんか？「さっき言ったこと、もう忘れてるの？」「前の話と矛盾してない？」「やりかけの作業、また最初から？」こうした…

2025-07-16

第77回：目標設定と計画：自律的に動く仕組み

LLM

Hello there, ('ω')ノ～「ゴールまでの道筋」をAIに考えさせるには？～従来のLLMは、入力されたプロンプトに対して一度だけ応答するというものでした。一方、エージェント的AIではこう考えます：「目的を達成するには、どんな手順を踏むべきか？」つま…

2025-07-16

第76回：エージェント的AIとは？LLMの新しい活用形態

LLM

Hello there, ('ω')ノ～AIが“考えて動く”時代へ：プロンプトだけではない次のステップ～従来のLLM活用は、ユーザーがプロンプトを送る AIが文章で返すそれを人間が読む・使うという「1回限りの質問回答型」でした。しかし最近は、 AIが“自分で目的を判…

2025-07-14

第75回：人手による評価とその工夫点

LLM

Hello there, ('ω')ノ～最終的に判断するのは「人」だからこそ、設計が重要～ AIの回答が完璧でも、「使えなければ意味がない」。 RAGでは、検索精度や生成品質に加えて、「現場の目線で有効だったか？」を人間がチェックすることが重要です。 ✅ なぜ人手評…

2025-07-14

第74回：RAGシステムの評価方法：何をどう測る？

LLM

Hello there, ('ω')ノ～「それっぽく答えてる」だけじゃない、定量的な検証のすすめ～ RAGは検索＋生成を組み合わせた仕組みです。したがって、評価も検索精度（Retrieval）と生成精度（Generation）の両方に目を向ける必要があります。 ✅ なぜ評価が難し…

2025-07-14

第73回：大規模ナレッジとの連携で注意すべきこと

LLM

Hello there, ('ω')ノ～情報が多すぎて混乱する前に考えておくべき設計と運用～「AIに社内のナレッジを読ませれば、業務が自動化される！」 ……そう思って、大量のドキュメントを詰め込んでみたものの── なぜか的外れな回答が増えるどこを見て答えているか…

2025-07-14

第72回：あいまいな質問に対応するには？

LLM

Hello there, ('ω')ノ～「質問がはっきりしない」からこそ、AI設計がものを言う～「それって、どういう意味で聞いてるの？」人間同士でもよくあるこんな場面。AIにとってもこれは大きな壁です。とくにRAGを活用するような業務AIでは、次のような質問がよ…

2025-07-14

第71回：高度なRAG戦略：反復・適応的な検索とは？

LLM

Hello there, ('ω')ノ～1回きりじゃ終わらない、AIの“調べ直し力”を育てる～従来のRAGは、「質問 → 検索 → 文章生成」という一発検索・一発生成が基本です。しかし、業務で使っているとこう思うことがあります：「もう少し違う観点の情報も欲しかった」 …

2025-07-14

第70回：グラフ構造を使った知識活用（Graph RAG）

LLM

Hello there, ('ω')ノ～LLMが“知識のつながり”を理解するための新しい土台～従来のRAGでは、「質問 → 関連情報の検索 → 回答生成」という直線的な流れが基本でした。しかし、複雑な問いや背景知識が必要な業務では、単純な情報検索だけでは限界があります…

2025-07-11

第69回：検索結果をどう文章生成に統合するのか？

LLM

Hello there, ('ω')ノ～LLMに「参考情報」をどう渡すかが回答の質を決める～ RAG（Retrieval-Augmented Generation）では、ユーザーの質問に対して、まず情報を検索し、それを元にAIが文章を作ります。ここで重要になるのが── 「検索した情報をどうLLMに…

2025-07-11