エージェント設計論争に 終止符を打つ Sonnet3.5の実力

7.8K Views

March 12, 25

スライド概要

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

エージェント設計論争に 終⽌符を打つ Sonnet3.5の実⼒ Napps Technologies 榎本 友幸

2.

⾃⼰紹介

3.

AI社員とは

4.

AI社員とは

5.

AI社員とは

6.

AI社員とは

7.

AI社員とは

8.

AI社員とは

9.

AI社員とは

10.

エージェントの型

11.

ワークフロー型 プログラムで組んだ⼿順通りにLLM‧処理をチェーンする 1 2 3 4

12.

⾃律型 Goalを元にLLMがステップを設計し実⾏する Start 1 2 Goal

13.

メリット‧デメリット プランニングが難しい😢 ワークフロー型 自律型 柔軟性 󰢄 🙆 安定性 🙆 󰢄

14.

1.⾃然⾔語で⼿順を定義する

15.

Sonnet3.5以降で⾃然⾔語で⼿順を定義‧実⾏できる 次のタスクを1つずつ順番にこなします、タス ク1つごとにユーザに確認を求めます 1. gmail_search_messagesを使ってユーザの 指定するメールを取得します 2. gmail_get_messageを使って該当メールの 内容を表⽰します 3. 返信⽂を考えます

16.

コマンドスタック 会話を積み上げることでタスクが順番にこなされる System System System System System ゴール ゴール ゴール ゴール ゴール 結果 結果1 結果1 結果1 結果2 結果2 承認 フィード バック 結果2 次のタスクを1つずつ順番にこなします、タ スク1つごとにユーザに確認を求めます 1. gmail_search_messagesを使ってユーザ の指定するメールを取得します 2. gmail_get_messageを使って該当メールの 内容を表⽰します フィード バック

17.

2.⼿順をLLMで⽣成する

18.

Sonnet3.5はFewshotが⾮常によく効くのでLLMで⽣成可能

19.

箇条書きの⼿順をLLMで⾃動⽣成が可能

20.

⼿順を⾃動⽣成実⾏することで ⽇常フェーズは安定して動作可能になる 導入フェーズ Goal 手順を生成 フィードバック 日常フェーズ 人間が評価 手順を生成 LLMが実行

21.

3.データベースで安定化

22.

AIエージェントは状態を持たない関数 x fx y1 fx2 y2

23.

安定して動作させるのが難しい😢

24.

エージェントの間にDBを挟むと安定 fx DB1 fx2 DB2

25.

1.エージェントの実⾏結果をデータベースに格納 fx DB1 fx2 DB2

26.

作業結果のチェックが容易に⾏える

27.

メールアドレスが 実⾏結果にない場合バリデートされる

28.

2.データベースを元にエージェントを起動 fx DB1 fx2 DB2

29.

コンテキストが渡るので ハルシネーションを防げる

30.

さらにSonnet3.5なら⾃動でデータベース設計可能

31.

まとめ

32.

Sonnet3.5なら ‧⾃律エージェントを⾃動作成できる ‧ワークフローの⾃動設計 ‧データベースを⾃動設計