井の中の蛙〜AIエージェントの内省〜

139 Views

April 22, 26

#AIエージェント #自己内省 #外部情報 #暗黙的フィードバック #LLM

スライド概要

AIエージェントの内省について話しました

やぎ

@7707589

スライド一覧

SIerのデータサイエンティスト 2025 Japan AWS Jr.Champions

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

失われたCDK王国の旗を、今こそ掲げよう

やぎ 2.2K

ベクトルサーチをやめる

やぎ 1.9K

プロンプトエンジニアクビになる

やぎ 1.8K

記憶のバス停　〜AI エージェントのメモリー戦略〜

やぎ 430

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

ue4 ue5 ue-beginner

エピックゲームズジャパン 1.7M

Unreal Engine5 Lumenの仕組みと肝心なところ

ue5 ue-rendering ue-lumen

エピックゲームズジャパン 1.4M

各ページのテキスト

井の中の蛙〜AIエージェントの内省〜

自己紹介やぎかえるくんのともだちかえるくん

夢は大海に行くこと

Chapter1 内省の限界

いつも 1人で練習していた

友人と議論してもいいアイデアは出てこなかった

なぜでしょうか？

内省とは内省（Self-Reflection）とは、 LLMが自分の出力を自分自身で、評価・修正する仕組み Madaan et.al.（2023）Self-Refine: Iterative Refinement with Self-Feedback

内省の例 ①Self-Refine 出力を自分で批判し、反復改善する手法 feedback LLM Output LLM(批判) ②LLM-as-a-Judge 別の LLM に出力を評価させる手法 feedback LLM Output LLM(評価)

10.

の精度はよくなるのか？ ①Self-Refine 出力を自分で批判し、反復改善する手法 feeda LLM Output LLM(批判) ②LLM-as-a-Judge 別の LLM に出力を評価させる手法 feeda LLM Output LLM(評価)

11.

内省の限界単体の LLM による自己内省は効かない d'Aliberti et al. (2026) によると、 "Aha! モーメント" は精度改善に寄与しない。 Huang et.al.(2024) Large Language Models Cannot Self-Correct Reasoning Yet 同じモデル同士の議論は効かない debateでは精度は上がらず、多数決の効果となる。 Wu et al. (2025)によると、議論の成功の上限は、参加者の中で最も強いモデルによって決まる。 Choi et.al.(2025) Debate or Vote: Which Yields Better Decisions in Multi-Agent Large Language Models?

12.

内省内省では内部知識を超えれないないでなでい

13.

Chapter2 外部情報

14.

３匹の師匠から学んだ

15.

見違えるほど伸びた

16.

なぜでしょうか？

17.

外部情報が大事 LLMの自己修正が機能するのは、外部フィードバックがある場合だけである。＜よくあるリーク例＞ LLM：答えは25です（間違っていることを知っている時だけ）人間：間違ってます。考え直して。実運用では正解を知らないので、再現できない。 Kamoi et.al.（2024）When Can LLMs Actually Correct Their Own Mistakes? A Critical Survey of Self-Correction of LLMs

18.

外部情報を取り込む3つの手法 ①Self-RAG 文書検索 + 検索結果の内省的評価 Asai et.al.(2023) SELF-RAG: LEARNING TO RETRIEVE, GENERATE, AND CRITIQUE THROUGH SELF-REFLECTION ②Reflexion Tool実行 + 失敗の反省 Shinn et.al.(2023) Reflexion: Language Agents with Verbal Reinforcement Learning ③Human-in-the-Loop 人間入力 + 自己修正よくある実装パターン（厳密に論文があるわけではない）

19.

内省外部情報内省は省外部情報で向上するるるで

20.

Chapter3 暗黙のFB

21.

フクロウから学ぶのが一番伸びた

22.

フクロウは全然来ない。 1人で練習するしかなかった。

23.

どうしたらいい？

24.

暗黙のFB 精度向上には人間FBが不可欠だが、収集にコストがかかる。明示的FB 暗黙的FB ユーザーに評価を求める高品質・少量評価の意識なく自然発生ノイジー・大量