LLMを用いた補完関係推定における判定バイアスに関する基礎的調査

>100 Views

March 05, 26

#国内会議 #ポスター #LLM #補完推薦 #判定バイアス #ECサイト #推薦システム

スライド概要

富澤千香, 岡本一志, 軽部幸起, 原田慧, 柴田淳司: LLMを用いた補完関係推定における判定バイアスに関する基礎的調査, 第18回データ工学と情報マネジメントに関するフォーラム, 2026.3, 兵庫県神戸市.

Okamoto Lab. (The Univ. of Electro-Communications)

@okmt_lab

スライド一覧

Data Science Research Group, The University of Electro-Communications

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

Is it really complementary? Revisiting behavior-based labels for complementary recommendation

論文読み会

Okamoto Lab. (The Univ. of Electro-Communications) 2.3K

アスペクトに着目した読者に影響を与える映画レビューの分析

国内会議

Okamoto Lab. (The Univ. of Electro-Communications) 1.2K

大規模言語モデルを用いた推薦システムにおけるセレンディピティ判断の検討

国内会議

Okamoto Lab. (The Univ. of Electro-Communications) 856

深層学習を用いた物件外観画像による築年代推定法の検討

国内会議

Okamoto Lab. (The Univ. of Electro-Communications) 741

Evaluation of session segmentation methods using behavior and text embeddings

国際会議

Okamoto Lab. (The Univ. of Electro-Communications) 643

大規模言語モデルを用いた料理レシピの曖昧表現補完

国内会議

Okamoto Lab. (The Univ. of Electro-Communications) 456

各ページのテキスト

LLMを用いた補完関係推定における判定バイアスに関する基礎的調査富澤千香, 岡本一志, 軽部幸起, 原⽥慧, 柴田淳司（電気通信大学）はじめに実験結果補完推薦ある商品と一緒に使うと価値が高まる関係（補完関係）を提示例：パソコン × マウス ECサイトで重要視され，多数の研究が存在 [Li+, 24] 1. 属性操作による判定の揺れ現状の課題人手による判定は労力が大きく拡張性が乏しい ⇒高精度な補完関係の自動判定が必要 LLMの活用により補完関係判定の自動化が可能しかし事前学習データに起因するバイアスが存在 ⇒ 誤った推薦につながり得る ⇒ 全体的な傾向：LLMと人間の判定変化には差がある 2. 判定バイアスの内訳過剰反応率：，未検出率：本研究の目的補完推薦の自動化に向け，LLMの判定の安定性を分析関連研究を用いた推薦システムにおけるバイアス LLM 生成する推薦リストを統計的に分析し，バイアスを確認既存研究と本研究の違い既存研究 [Zhang+, 23] [Sakib+, 24] アプローチ分析対象推薦リスト観点出力の偏り関心結果の公平性 3. 本研究補完関係の判定過程判定変化の不一致推論の安定性判定バイアス：属性操作前後でLLMと人間の判定変化が一致しない現象リサーチクエスチョン：LLMは補完関係を判定する際にどのような判定バイアスを示すか RQ2：LLMが⼈間の判定と乖離しない補完関係の判定を⾏うためには，どの程度の情報が必要か RQ1 判定過程への介入補完関係が本質的に変わらないはずの状況で，商品属性のみを変えることで判定がどう揺れるか観測する（商品属性操作）データセット ⇒ いずれも一定程度で判定バイアス（変化の不一致）が存在から商品ペアを手動で収集商品属性の操作前後でLLMの判定が変化したぺア：30件変化しなかったペア：30件使用モデル：gpt-5-nano 判定バイアスを抑制するための情報の検証判定バイアスが確認されたため，入力情報の量による抑制効果を検証入力情報レベルレベル1：商品名＋1属性レベル2：商品名＋2属性レベル3：商品名＋2属性＋説明文結果過剰反応：大幅に減少カテゴリ：20件→3件（85%減）ブランド：18件→5件（72%減）未検出：改善は限定的 → 属性情報の追加は過剰反応抑制に有効おわりにまとめ補完推薦の⾃動化において LLMが⽰す補完関係の判定バイアスを分析 LLMは属性操作に対して人間より敏感に反応判定変化の不一致（判定バイアス）が確認されたカテゴリ+ブランドを入力情報に加えることで過剰反応を大幅に抑制 Amazon.co.jp 被験者実験今後の展望データセット（商品カテゴリやドメイン，商品数）の拡張複数のLLMモデル，プロンプト設計での⽐較 [Li+, 24] L. Li, Z. Du: Complementary Recommendation in E-commerce: Definition, Approaches, and Future Directions, arXiv preprint arXiv:2403.16135, 2024. [Zhang+, 23] J. Zhang, K. Bao, Y. Zhang, W. Wang, F. Feng, X. He:Is Chat GPT Fair for Recommendation? Evaluating Fairness in Large Language Model Recommendation, Proc. 17th ACM Conf. Recomm. Syst., 993-999, 2023. [Sugahara+, 24] K. Sugahara, C. Yamasaki, K. Okamoto:Is It Really Complementary? Revisiting Behavior-based Labels for Complementary Recommendation, Proc. 18th ACM Conf. Recomm. Syst., 1091-1095, 2024 [Sakib+ 24] S. K. Sakib, A. B. Dab: Challenging Fairness: A Comprehensive Exploration of Bias in LLM-Based Recommendations, 2024 IEEE Int. Conf. Big Data, 1585-1592, 2024.