Shikata Ga Nai

Private? There is no such things.

GenAI Python

第79回|Hugging Faceでモデルを呼び出してみよう

Hello there, ('ω')ノ Hugging Faceとは? Hugging Face(HF)は、AIモデルやデータセットを誰でも公開・共有・実行できるプラットフォームです。 主な特徴: モデルの数:10万件以上(言語・画像・音声など) 多くがオープンソース&無料 Pythonコードで簡…

第78回|実践:Stable Diffusionで画像を生成しよう

Hello there, ('ω')ノ 必要なものは? Stable Diffusionを試すためには、以下のいずれかの方法があります: 方法 特徴 ✅ Google Colab(おすすめ) ブラウザだけで使えてインストール不要 ローカル実行(AUTOMATIC1111など) 高速&カスタマイズしやすい(…

第77回|ノイズ→画像へ:Diffusionの基本原理

Hello there, ('ω')ノ Diffusion(拡散)ってどういうこと? まず、「拡散」モデルの基本発想はとてもシンプルです: 2つのステップで成り立っています: 画像にノイズを足していく(壊す) ノイズを少しずつ取り除いて元の画像に戻す(復元する) つまり、…

第76回|Stable Diffusionとは?画像生成の本命

Hello there, ('ω')ノ Stable Diffusionとは? Stable Diffusionとは、テキスト(文章)を入力すると、そこから画像を生成するAIモデルです。 2022年に公開され、画像生成のブームに火をつけた立役者のひとつでもあります。 主な特徴: テキスト→画像を高精…

第75回|人物写真→アバター作成ツールの裏側

Hello there, ('ω')ノ ‍♂️「写真からアバター」ってなにが起きてる? たとえば、こんな流れです: 顔写真をアップロード AIが顔の特徴を検出(輪郭・目・鼻・口など) 似た3Dモデルを生成 好みに応じてアニメ調・リアル調に変換 完成したアバターがアプリ・…

第74回|イラストから3Dモデルへ:生成AIの進化系

Hello there, ('ω')ノ そもそも「イラストから3Dモデル」ってどういうこと? たとえばキャラクターのイラストを1枚用意すると、 それをもとにAIが“立体的に”再現してくれるという技術です。 出力されるのは: 3Dメッシュ(ポリゴン構造) テクスチャ(色や…

第73回|GANで文字から画像を作ることはできるか?

Hello there, ('ω')ノ ✍️ テキストから画像ってどういうこと? 「言葉(自然言語)」を入力として、その内容をもとに画像を自動生成するAI技術です。 たとえば、次のようなことが可能です: 「白い馬が草原を走っている」 → 写実的な風景画像 「宇宙服を着た…

第72回|Style Transferで画像の雰囲気をチェンジ

Hello there, ('ω')ノ Style Transferってなに? Style Transferは、「写真の中身(構造)はそのままに、別の画像の“画風・雰囲気”を重ねる技術」です。 たとえば: 自分の写真 × ゴッホの絵 → ゴッホ風の自撮り画像 街並み × 浮世絵 → 和風テイストの都市…

第71回|AIで古い写真をカラー化する方法

Hello there, ('ω')ノ 白黒写真のカラー化とは? 「色の情報がない写真」に対して、AIが推測と学習を使って“自然な色”をつけていく技術です。 どんな画像に使える? 昭和初期の家族写真 戦前・戦中の新聞・記録映像 歴史的なモノクロドキュメント 昔の企業…

第70回|データ拡張とは?学習用画像を増やす手法

Hello there, ('ω')ノ データ拡張ってなに? データ拡張とは、既存の学習データに“ちょっとした変化”を加えて、別のデータとして使う手法です。 たとえば、以下のような変換を加えます: 画像を左右反転する 明るさを変える 回転させる ノイズを加える 少し…

第69回|DeepFakeのリスクと倫理的な注意点

Hello there, ('ω')ノ DeepFakeに潜む3つの大きなリスク ①【フェイクニュースや情報操作】 有名人や政治家の“話している映像”を偽造し、 まるで本人が発言したように見せかけることができます。 SNSで一瞬で拡散し、世論の操作や選挙妨害にもつながりかねま…

第68回|AIで顔を変える!DeepFakeの仕組み

Hello there, ('ω')ノ DeepFakeとは? DeepFakeとは、「AIを使って人の顔や声を別のものに差し替える技術」です。 一見、実際に話しているように見える映像や音声が作られますが、 実際には存在しない“フェイク(偽物)”であるため、「ディープなフェイク」…

第67回|実践:ColabでGAN画像生成を試してみる

Hello there, ('ω')ノ 必要なもの まずはじめに、以下の準備だけでOKです: 準備するもの 説明 Googleアカウント Colabを使うために必要 ネット環境 ブラウザで実行するだけなのでPC1台あればOK プログラミング知識 最低限の操作だけでOK(コピペ中心) Col…

第66回|Pix2Pixで輪郭からリアルな絵を生成

Hello there, ('ω')ノ Pix2Pixとは? Pix2Pixは、画像ペアを使って学習し、片方の画像からもう片方を生成する条件付きGAN(cGAN)です。 例えば: 入力画像(輪郭)をGに与えて、 それに対応する「正解画像(リアルな写真)」を教師データとして学習します…

第65回|CycleGANで写真を「絵画風」に変換しよう

Hello there, ('ω')ノ CycleGANとは? CycleGANは、ある画像の「スタイル」を別のものに変換するためのAIモデルです。 たとえば: 写真 → ゴッホ風の絵画 馬の画像 → シマウマ 晴れの風景 → 雨の風景 実写画像 → アニメ風イラスト こうした画像の“見た目”を…

第64回|VAEとは?確率分布から画像をつくる技術

Hello there, ('ω')ノ VAEってどんな技術? VAEとは、画像などのデータを「圧縮」し、そこから「再構築」することに特化したAIモデルです。 でも、ただの再構成ではありません。 潜在空間(latent space)に「確率的な分布」を導入することで、新しい画像を…

第63回|DCGAN、cGAN、StyleGANなどのバリエーション

Hello there, ('ω')ノ まずは整理:なぜGANに「バリエーション」が必要? GANの基本形は強力ですが、こんな課題があります: 学習が不安定で収束しにくい 作る画像が単調で似通ってしまう(多様性の欠如) 入力にコントロールが効かない(何が出るかわから…

第62回|GANの構成:ジェネレータとディスクリミネータ

Hello there, ('ω')ノ GANの主役は「G」と「D」 名称 役割 イメージ例 Generator(G) データを「生成」する側 詐欺師:うその画像を本物っぽく作る Discriminator(D) 本物かどうか「判定」する側 鑑定士:本物と偽物を見分けようとする この2人が競い合…

第61回|GANとは?AIが画像をつくる仕組み

Hello there, ('ω')ノ GANとは? GAN(敵対的生成ネットワーク)とは、2つのAIが“競い合いながら”画像を生成していく仕組みです。 特徴的なのはこの構成: Generator(生成器):画像を作る側(「こういうの、どう?」と提案) Discriminator(識別器):本…

第60回|AIエージェントに仕事をさせてみよう!

Hello there, ('ω')ノ AIエージェントとは? AIエージェントとは「与えられた目的に応じて、自分で手順を決めて動くAI」のことです。 エージェントはこう動きます: 指示を受け取る(自然言語の命令) どんなツール(検索・計算・ファイル操作など)が必要…

第59回|LangChainで作る業務効率化ツール例

Hello there, ('ω')ノ LangChainでできること(復習) LangChainでは、以下のような機能を組み合わせてAIアプリを作れます: 機能 内容 LLM Chain プロンプト → AI応答の一連処理を構築 Memory機能 会話履歴を記憶・文脈の保持 ベクトルDBとの連携 意味ベー…

第58回|AIにユーザーの検索をやらせてみる

Hello there, ('ω')ノ AIに検索させるってどういうこと? ユーザーがあいまいな指示を出しても、AIが自ら検索し、正確な情報にたどり着けるようにする仕組みです。 たとえば── 「退職するときの社内フロー教えて」 という質問に対して、AIは次のように行動…

第57回|RAG(検索補助生成)の仕組みを理解しよう

Hello there, ('ω')ノ RAGとは何か?一言で言うと… RAGとは、「AIが生成する前に、外部から情報を検索してきて、それを使って答える仕組み」です。 通常のChatGPTのようなAIは、あらかじめ学習した知識だけで回答しますが、 RAGはリアルタイムでドキュメン…

第56回|メモリ付きAI:会話を覚えるチャットボット

Hello there, ('ω')ノ メモリ付きAIって何? 「前回の話を覚えているAI」のことです。 たとえば… ✅ ユーザーが「昨日の提案、気に入ってるよ」と言ったら、AIが「ありがとうございます、前回の提案ですね」と返せる ✅ ユーザーが名前や趣味を言えば、次回以…

第55回|ベクトルDBを使った検索型AIの仕組み

Hello there, ('ω')ノ なぜ「検索型AI」が必要なの? ChatGPTのようなAIは、学習済みの知識で会話します。 ですが… ✅ 社内マニュアルや業務ノウハウは学習されていない ✅ 法改正・新商品・独自データは反映されない ✅ 回答が“それっぽく”ても、間違っている…

第56回|メモリ付きAI:会話を覚えるチャットボット

Hello there, ('ω')ノ メモリ付きAIって何? 「前回の話を覚えているAI」のことです。 たとえば… ✅ ユーザーが「昨日の提案、気に入ってるよ」と言ったら、AIが「ありがとうございます、前回の提案ですね」と返せる ✅ ユーザーが名前や趣味を言えば、次回以…

第55回|ベクトルDBを使った検索型AIの仕組み

Hello there, ('ω')ノ なぜ「検索型AI」が必要なの? ChatGPTのようなAIは、学習済みの知識で会話します。 ですが… ✅ 社内マニュアルや業務ノウハウは学習されていない ✅ 法改正・新商品・独自データは反映されない ✅ 回答が“それっぽく”ても、間違っている…

第54回|LangSmithでAIのログを管理してみよう

Hello there, ('ω')ノ LangSmithとは? LangSmithとは、LangChainで作成したAIアプリのログ(記録)を収集・可視化・分析できるクラウドサービスです。 LangChain公式が提供しており、LangChainライブラリに数行の設定を加えるだけで、自動的にログが送信・…

第53回|LLM Chainで基本構造を作ってみよう

Hello there, ('ω')ノ LLM Chainとは? LLM Chainとは、プロンプト → AIの応答 → 結果の出力 という一連の処理を構造化した仕組みです。 LangChainにおける「最も基本的な構成要素」であり、 自作アプリでも、このChain(チェーン)を基本単位として構築し…

第52回|LangGraphってなに?より複雑な構成を作るツール

Hello there, ('ω')ノ LangGraphとは? LangGraphとは、「AIを使ったフロー処理」を、分岐・ループなども含めて柔軟に構築できるツールキットです。 LangChainと同じ開発チームが提供しており、内部的にもLangChainと連携しながら動かせます。 LangChainが…