7.8K Views
March 12, 25
スライド概要
エージェント設計論争に 終⽌符を打つ Sonnet3.5の実⼒ Napps Technologies 榎本 友幸
⾃⼰紹介
AI社員とは
AI社員とは
AI社員とは
AI社員とは
AI社員とは
AI社員とは
AI社員とは
エージェントの型
ワークフロー型 プログラムで組んだ⼿順通りにLLM‧処理をチェーンする 1 2 3 4
⾃律型 Goalを元にLLMがステップを設計し実⾏する Start 1 2 Goal
メリット‧デメリット プランニングが難しい😢 ワークフロー型 自律型 柔軟性 🙆 安定性 🙆
1.⾃然⾔語で⼿順を定義する
Sonnet3.5以降で⾃然⾔語で⼿順を定義‧実⾏できる 次のタスクを1つずつ順番にこなします、タス ク1つごとにユーザに確認を求めます 1. gmail_search_messagesを使ってユーザの 指定するメールを取得します 2. gmail_get_messageを使って該当メールの 内容を表⽰します 3. 返信⽂を考えます
コマンドスタック 会話を積み上げることでタスクが順番にこなされる System System System System System ゴール ゴール ゴール ゴール ゴール 結果 結果1 結果1 結果1 結果2 結果2 承認 フィード バック 結果2 次のタスクを1つずつ順番にこなします、タ スク1つごとにユーザに確認を求めます 1. gmail_search_messagesを使ってユーザ の指定するメールを取得します 2. gmail_get_messageを使って該当メールの 内容を表⽰します フィード バック
2.⼿順をLLMで⽣成する
Sonnet3.5はFewshotが⾮常によく効くのでLLMで⽣成可能
箇条書きの⼿順をLLMで⾃動⽣成が可能
⼿順を⾃動⽣成実⾏することで ⽇常フェーズは安定して動作可能になる 導入フェーズ Goal 手順を生成 フィードバック 日常フェーズ 人間が評価 手順を生成 LLMが実行
3.データベースで安定化
AIエージェントは状態を持たない関数 x fx y1 fx2 y2
安定して動作させるのが難しい😢
エージェントの間にDBを挟むと安定 fx DB1 fx2 DB2
1.エージェントの実⾏結果をデータベースに格納 fx DB1 fx2 DB2
作業結果のチェックが容易に⾏える
メールアドレスが 実⾏結果にない場合バリデートされる
2.データベースを元にエージェントを起動 fx DB1 fx2 DB2
コンテキストが渡るので ハルシネーションを防げる
さらにSonnet3.5なら⾃動でデータベース設計可能
まとめ
Sonnet3.5なら ‧⾃律エージェントを⾃動作成できる ‧ワークフローの⾃動設計 ‧データベースを⾃動設計