Concepts#

AI 開発の根底にある概念・思想

このカテゴリでは、AI エージェント設計の背景にある考え方を扱います。具体的な手法や実装を理解する前段として読むと、全体像が掴みやすくなります。

14 件のエントリ

LLM の非決定性を前提に設計する

LLM の出力は本質的に非決定的。同じ入力でも呼び出しごとに違う結果が返る。これを「バグ」として扱うと無限に消耗する。前提として受け入れ、その上で設計するのが実用的な態度。非決定性の源 - サンプリ…
コンテキストは有限で劣化する資源である

LLM エージェントの回答品質は、渡されたコンテキスト量に比例しない。むしろ反比例する場面が多い。コンテキストは有限かつ劣化する資源として扱うのが、実運用での正しい前提。コンテキスト量と品質の関係…
Intent Engineering — 意図を凍結してから設計する

AI エージェントへの依頼で、実装が意図から乖離する問題を減らす考え方。意図（intent）を明文化された中間表現に凍結してから設計・実装に進むというアプローチ。全体フローなぜ必要か自然言語の指…
Drift Detection — 実装が意図から乖離する現象を検出する

AI エージェントによる実装が、当初の意図・仕様から徐々に乖離していく現象。これを検出して巻き戻す仕組みが drift-detection。発生と検出のメカニズムなぜ drift が起きるか -…
エージェントの自律度レベルと昇格基準

AI エージェントを運用する際、「どこまで自律的に動かしていいか」は設計の根本に関わる決定。エージェントの自律度レベルを段階として捉えると、判断がぶれない。 5 段階の自律度 L1: 提案のみエージ…
AI エージェントと人間の責任分界

AI エージェントに仕事を任せる際、「誰が何の責任を持つか」を曖昧にすると、事故時に収拾がつかなくなる。責任分界を明示的に設計する。責任の 3 層 - 判断層: 何をどうするか決める - 実行層:…
AI プロダクトと倫理 — 7 つの観点

AI を組み込んだプロダクトを作る際、技術・コスト・品質だけでなく、倫理的な考慮を避けられない論点として扱う必要がある。具体的な 7 つの観点を示す。 7 つの倫理的論点 1. 透明性（Transpa…
Eval-Driven Development — LLM 機能開発は評価から始める

LLM を使った機能を作る際、目視確認だけに頼ると品質が安定しない。評価を先に書き、評価が通ることを目指して実装するという進め方が、LLM 時代の TDD に相当する。Eval-Driven Deve…
プロンプトインジェクション — LLM アプリの最重要セキュリティ論点

LLM を組み込んだアプリで、ユーザー入力や外部データに仕込まれた悪意ある指示が LLM を操る攻撃。プロンプトインジェクションは LLM アプリのセキュリティで最も重要な論点。攻撃パターン典型的…
ファインチューニング vs プロンプト — どちらを選ぶか

「モデルをファインチューニングすべきか、プロンプトで頑張るか」は AI 機能開発でよく議論になる。結論から言うと、プロンプトエンジニアリングで行けるところまで行くのが基本。ファインチューニングは最後の…
LLM アプリの 5 つの典型アーキテクチャパターン

LLM を組み込んだアプリのアーキテクチャは、用途によって大きく 5 パターンに分類できる。自分のアプリがどのパターンかを意識すると、設計判断が迷わない。パターンマップパターン 1: シンプル応答…
AI 開発の速度と品質は両立できる

AI 開発では「速く作る」と「品質を担保する」がトレードオフに見えるが、実は両立可能。評価セット・自動化・仕組みが速度を下げず、品質を上げる。見かけのトレードオフ「速く作ると雑」「丁寧にやると遅い…
技術選定の5軸評価フレームワーク

新しいプロジェクトで技術スタックを選ぶ際、場当たり的に「流行ってるから」「使ったことあるから」で選ぶと後で痛い目を見る。判断軸を言語化しておくと、同じ失敗を繰り返さずに済む。 5 つの判断軸軸ごとの…
AI プロダクト設計の 3 つの基本原則

AI を組み込んだプロダクトを設計するとき、「AI にどこを任せるか」の判断が本質的に重要。ここが曖昧だと、どれだけ頑張っても良い製品にならない。設計の出発点 3 つの基本原則 1. AI は最後の…