Concepts#
AI 開発の根底にある概念・思想
このカテゴリでは、AI エージェント設計の背景にある考え方を扱います。具体的な手法や実装を理解する前段として読むと、全体像が掴みやすくなります。
14 件のエントリ
-
LLM の出力は本質的に非決定的。同じ入力でも呼び出しごとに違う結果が返る。これを「バグ」として扱うと無限に消耗する。前提として受け入れ、その上で設計するのが実用的な態度。 非決定性の源 - サンプリ…
-
LLM エージェントの回答品質は、渡されたコンテキスト量に比例しない。むしろ反比例する場面が多い。コンテキストは有限かつ劣化する資源として扱うのが、実運用での正しい前提。 コンテキスト量と品質の関係…
-
Intent Engineering — 意図を凍結してから設計する
AI エージェントへの依頼で、実装が意図から乖離する問題を減らす考え方。意図(intent)を明文化された中間表現に凍結してから設計・実装に進むというアプローチ。 全体フロー なぜ必要か 自然言語の指…
-
Drift Detection — 実装が意図から乖離する現象を検出する
AI エージェントによる実装が、当初の意図・仕様から徐々に乖離していく現象。これを検出して巻き戻す仕組みが drift-detection。 発生と検出のメカニズム なぜ drift が起きるか -…
-
AI エージェントを運用する際、「どこまで自律的に動かしていいか」は設計の根本に関わる決定。エージェントの自律度レベルを段階として捉えると、判断がぶれない。 5 段階の自律度 L1: 提案のみ エージ…
-
AI エージェントに仕事を任せる際、「誰が何の責任を持つか」を曖昧にすると、事故時に収拾がつかなくなる。責任分界を明示的に設計する。 責任の 3 層 - 判断層: 何をどうするか決める - 実行層:…
-
AI を組み込んだプロダクトを作る際、技術・コスト・品質だけでなく、倫理的な考慮を避けられない論点として扱う必要がある。具体的な 7 つの観点を示す。 7 つの倫理的論点 1. 透明性(Transpa…
-
Eval-Driven Development — LLM 機能開発は評価から始める
LLM を使った機能を作る際、目視確認だけに頼ると品質が安定しない。評価を先に書き、評価が通ることを目指して実装するという進め方が、LLM 時代の TDD に相当する。Eval-Driven Deve…
-
プロンプトインジェクション — LLM アプリの最重要セキュリティ論点
LLM を組み込んだアプリで、ユーザー入力や外部データに仕込まれた悪意ある指示が LLM を操る攻撃。プロンプトインジェクションは LLM アプリのセキュリティで最も重要な論点。 攻撃パターン 典型的…
-
「モデルをファインチューニングすべきか、プロンプトで頑張るか」は AI 機能開発でよく議論になる。結論から言うと、プロンプトエンジニアリングで行けるところまで行くのが基本。ファインチューニングは最後の…
-
LLM を組み込んだアプリのアーキテクチャは、用途によって大きく 5 パターンに分類できる。自分のアプリがどのパターンかを意識すると、設計判断が迷わない。 パターンマップ パターン 1: シンプル応答…
-
AI 開発では「速く作る」と「品質を担保する」がトレードオフに見えるが、実は両立可能。評価セット・自動化・仕組みが速度を下げず、品質を上げる。 見かけのトレードオフ 「速く作ると雑」「丁寧にやると遅い…
-
新しいプロジェクトで技術スタックを選ぶ際、場当たり的に「流行ってるから」「使ったことあるから」で選ぶと後で痛い目を見る。判断軸を言語化しておくと、同じ失敗を繰り返さずに済む。 5 つの判断軸 軸ごとの…
-
AI を組み込んだプロダクトを設計するとき、「AI にどこを任せるか」の判断が本質的に重要。ここが曖昧だと、どれだけ頑張っても良い製品にならない。 設計の出発点 3 つの基本原則 1. AI は最後の…