Webアンケートにおける不真面目回答の ChatGPTを用いた自動分類

2.9K Views

January 22, 24

#webアンケート #chatgpt #不真面目 #分類 #Webアンケート #不真面目回答 #ChatGPT #自動分類 #機械学習

スライド概要

Nakamura Laboratory (Meiji University)

@nkmr-lab

スライド一覧

明治大学総合数理学部先端メディアサイエンス学科中村聡史研究室

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

周辺視野に対するぼかしエフェクトが作業時の集中力に及ぼす影響の調査

Nakamura Laboratory (Meiji University) 25.6K

商品選択においてフォントがユーザの選択行動に及ぼす影響の調査

Nakamura Laboratory (Meiji University) 17.1K

手書きとフォントの文字形状の違いによる記憶効果の比較

Nakamura Laboratory (Meiji University) 17.1K

Make-up FLOW 2.0: 美容系YouTuberの化粧フローチャートの共有・取り入れ手法

化粧メイク化粧工程フローチャート美容系youtuber 取り入れ

Nakamura Laboratory (Meiji University) 15.6K

周辺視野における妨害刺激の減衰が集中度に及ぼす影響

Nakamura Laboratory (Meiji University) 14.1K

色覚特性を考慮したゲームの有利不利制御のAmong Usを用いた検証

色覚多様性者模擬フィルタ色のハンディキャップオンラインゲーム

Nakamura Laboratory (Meiji University) 12.8K

各ページのテキスト

Webアンケートにおける不真⾯⽬回答の ChatGPTを⽤いた⾃動分類畑中健壱⼭﨑郁未中村聡史明治⼤学先端数理科学研究科 1

背景 • Web アンケートは紙のアンケートに⽐べ⼿軽に多くの回答を集めることが可能 [Vergnaud 2011] • データが多く必要となる社会調査や研究の基礎データの収集に利⽤されている Vergnaud, A. C., Touvier, M., Méjean, C., Kesse-Guyot, E., Pollet, C., Malon, A., Castetbon, K. and Hercberg, S. “Agreement between webbased and paper versions of a socio-demographic questionnaire in the NutriNet-Santé study.” International Journal of Public Health, Vol. 56, No. 4, p. 507-417 (2011). 2

⾃由記述の重要性⾃由記述設問は，回答者の多様な回答を得られる → アンケートに必要不可⽋ [Schuman 1979],[Reja 2003] 真⾯⽬に回答しない⼈が多い Schuman, H., Presser, S. “The Open and Closed Question.” American Sociological Review, Vol. 44, No. 5, p. 692-712 (1979). Reja, U., Manfreda, K., Hlebec, V., Vehovar, V. “Open-ended vs. Close-ended Questions in Web Questionnaires.” Adv Methodol Stats, Vol. 19, No. 1, p. 159-177 (2003). 3

不真⾯⽬回答 • 選択式の設問などと⽐べ回答に時間がかかる[Couper 2013] → 回答負担が⼤きい • 設問に答えない，考える必要のない回答「不真⾯⽬回答」をする⼈がいる [Revilla 2016] • 「わからない」「fdjkgfg」「ただ何となく」 [Holland 2009] • 道の特徴は？→普通の道 Couper, M. P., Kreuter, F. “Using paradata to explore item level response times in surveys.” Journal of the Royal Statistical Society, Vol.176, No. 1, p. 271-286 (2013). Revilla, M., Ochoa, C. “Open Narrative Questions in PC and Smartphones: Is the Device Playing a Role?” Quality & Quantity, Vol. 50, No. 6, p. 2495-2513 (2016). Holland, J. L., Christian, L. M. “The Influence of Topic Interest and Interactive Probing on Responses to Open-Ended Questions in Web Surveys.” Social Science Computer Review, Vol. 27, No. 2, p. 196-212 (2009). 4

不真⾯⽬回答への対策アンケートの⼯夫が様々⾏われている • 設問⽂に動機づけ⽂章を追加 →無回答が減少 [Zuell 2015] • ⾃由記述設問を最初に配置 →不真⾯⽬回答の割合が減少 [Yamazaki 2023] Zuell, C., Menold, N., Körber, S. “The Influence of the Answer Box Size on Item Nonresponse to Open-Ended Questions in a Web Survey.” Social Science Computer Review, Vol. 33, No. 1, p. 115-122 (2015). Yamazaki, I., Hatanaka, K., Nakamura, S. and Komatsu, T. “A Basic Study to Prevent Non-Earnest Responses in Web Surveys by Arranging the Order of Open-ended Questions.” International Conference on Human-Computer Interaction (HCII 2023), LNCS, Vol. 14011, p. 314-326. 5

評価基準 • 不真⾯⽬回答の割合で評価 • 不真⾯⽬回答分類の問題 • 分類者の負担 • 不真⾯⽬回答の基準が個⼈によって異なる • 機械学習などによる不真⾯⽬回答の⾃動分類 →アンケート毎に不真⾯⽬回答を定義 6

アプローチ • 不真⾯⽬回答は，質問に対して回答がずれている → ⽇常的な会話のズレ例) 好きな動物園‧⽔族館は？ →みんな1回ずつしか⾏っていない。 • ChatGPTは質問への⾃然な回答得意不真⾯⽬回答のような質問に対する不⾃然な回答を検知できるのでは？ 7

⽬的⾃由記述設問の不真⾯⽬回答を，ChatGPTを⽤いて⾃動分類することが可能であるかを調査 8

データセット • 2種類のアンケートデータ • 真⾯⽬か不真⾯⽬かのラベル付与 • 「質問に対する答えが伴っていない回答と意味をなさない回答」 [Yamazaki 2023] Yamazaki, I., Hatanaka, K., Nakamura, S. and Komatsu, T. “A Basic Study to Prevent Non-Earnest Responses in Web Surveys by Arranging the Order of Open-ended Questions.” International Conference on Human-Computer Interaction (HCII 2023), LNCS, Vol. 14011, p. 314-326. 9

10.

運転免許を所持している⼈向けのアンケート [Yamazaki 2023] データ件数…979件不真⾯⽬回答分類…評価者2名設問内容回答例（真⾯⽬） Q-1 運転をする理由買い物のためなんとなく 2.9 Q-2 運転する道の特徴⾞線の多い道路普通の道 6.1 Q-3 どんなことが苦⼿か駐⾞得意である 7.8 Q-4 気をつけていること歩⾏者に注意する注意 5.6 設問番号回答例（不真⾯⽬）不真⾯⽬回答率(%) 10

11.

動物園‧⽔族館に関するアンケート [HCI201] データ件数…989件不真⾯⽬回答分類…著者1名設問番号設問内容回答例（真⾯⽬）回答例（不真⾯⽬）不真⾯⽬回答率(%) Q-1 好きな動物園‧⽔族館王⼦動物園、美ら海⽔族館みんな1回ずつしか⾏っていない。 2.3 Q-2 好きな動物‧⽣き物パンダ，ペンギンアクアリウム 2.0 Q-3 動物園‧⽔族館で楽しかったこと動物と触れ合えたこと楽しいから 4.6 Q-4 リピート訪問した理由リニューアルしたから品川⽔族館 12.8 11

12.

不真⾯⽬回答分類⼿法 • OpenAIのAPIを⽤いて分類 • GPT-4 Turbo • 3つの⼿法 • 単純判定⼿法 • ⾃信度指標⼿法 • 点数付与⼿法 12

13.

判定⼿法単純判定⼿法「質問に対する答えが伴っていない回答と意味をなさない回答」で判定みんな1回ずつしか⾏っていない【判定】1 13

14.

判定⼿法⾃信度指標⼿法 • 単純判定⼿法＋判定の⾃信度を出⼒（5段階） • 半⾃動分類の可能性みんな1回ずつしか⾏っていない【判定】1 【⾃信度】5 14

15.

判定⼿法点数付与⼿法 • 全ての回答に点数を付与閾値以下を不真⾯⽬回答みんな1回ずつしか⾏っていない【点数】10点 • インタビュアとして，その回答が返ってきて嬉しいかどうかを100点満点で出⼒ 15

16.

結果（運転）⾃信度指標⼿法…⾃信度5のみ（92%）点数付与⼿法…10点以下不真⾯⽬ 16

17.

結果（運転）全体的に正答率⾼い点数付与⼿法が最も⾼い 17