【大規模言語モデル入門】５章5.1~5.3

3.3K Views

October 31, 24

#自然言語処理 #大規模言語モデル #感情分析 #日本語ベンチマーク #JGLUE

スライド概要

京都大学人工知能研究会KaiRA

@kyoto-kaira

スライド一覧

AI・機械学習を勉強したい学生たちが集まる、京都大学の自主ゼミサークルです。私たちのサークルに興味のある方はX(Twitter)をご覧ください！

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

【論文読み会】GraphCast: Learning skillful medium-range global weather forecasting

京都大学人工知能研究会KaiRA 30.1K

【論文読み会】NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

京都大学人工知能研究会KaiRA 22.9K

【IT Text 自然言語処理の基礎】第7章：事前学習済みモデルと転移学習

京都大学人工知能研究会KaiRA 21.2K

【物体検出】ResNet・EfficientNet (v2)

京都大学人工知能研究会KaiRA 18.4K

【Pythonで学ぶ音声認識】第5章：GMM-HMMによる音声認識（5.3節まで）

京都大学人工知能研究会KaiRA 13K

【Pythonで学ぶ音声認識】第5章：GMM-HMMによる音声認識（5.5節）

京都大学人工知能研究会KaiRA 12.1K

各ページのテキスト

2024年度後期輪読会#5 10/31 大規模言語モデル入門 5.1-5.3 京都大学理学部3回生宮本真弥 0

アジェンダ ◼ 日本語ベンチマーク:JGLUE ◼ 感情分析モデルの実装 ◼ 感情分析モデルのエラー分析 1

アジェンダ ◼ 日本語ベンチマーク:JGLUE ◼ 感情分析モデルの実装 ◼ 感情分析モデルのエラー分析 2

日本語ベンチマーク:JGLUE 基盤モデルが進歩するほど難しいベンチマークが必要になる基盤モデルの性能向上・BERT ・GPT ・Amazon Titan ・Claude ・BLOOM … 難しいベンチマークの提案・GLUE ・SuperGLUE ・BIG-Bench ・HELM ・GAIA … しかし英語のものが多くほかの言語におけるベンチマークの作成は重要な課題 3

日本語ベンチマーク:JGLUE 日本語のベンチマークJGLUEが構築されるタスクデータセット文章分類 MARC-ja MARC-ja JSTS・JNLI JCoLA 文ペア分類 JSTS JSQuAD JNLI 質疑応答 JCommonsenseQA JSQuAD JCommonsenseQA JCoLAのデータ https://github.com/osekilab/JCoLA/blob/main/data/jcola-v1.0/in_domain_train-v1.0.tsv 画像引用：https://techblog.yahoo.co.jp/entry/2022122030379907/ 4

日本語ベンチマーク:JGLUE MARC-ja:Amazonの商品レビューテキスト＋極性ラベル(1:肯定的, 0:否定的) レビューの星が3のものを除外。星1～2なら否定的、星4～5なら肯定的とラベリング Amazonレビューテキスト：パッケージがUK使用だったため、少し安っぽい印象でしたが、中身は日本語吹き替え、日本語字幕、特典映像もちゃんとついてます。この値段でこの内容なら十分満足です。ラベル：肯定的画像を作成したサイト：https://k-editor.com/editor/template/7/edit/ 5

https://k-editor.com/editor/template/7/edit/

アジェンダ ◼ 日本語ベンチマーク:JGLUE ◼ 感情分析モデルの実装 ◼ 感情分析モデルのエラー分析 6

感情分析モデルの実装大規模言語モデルをファインチューニングして感情分析モデルをつくる • データセットはWRIME(MARC-jaと同じような感情分析用データセット) • エンコーダ構成のtransformerに線形層のヘッドを追加したモデル • モデル・トークナイザはともに東北大学が公開しているBERTを用いる実装は以下の手順で行う 1. 2. 3. 4. 5. 6. 環境・データセットの準備トークナイゼーション前処理モデルの構築モデルの訓練モデルの評価 7

感情分析モデルの実装１．環境・データセットの準備：AIプラットフォーム Hugging Face を利用 Hugging Face：人工知能のモデルやデータを共有し利用するためのオープンソースプラットフォーム・transformers・datasetsは Hugging Faceが提供しているライブラリ。インストールするだけで簡単に使える。・pprint関数はprint関数より出力が見やすい形になっている。出力 8

10.

感情分析モデルの実装２.トークナイゼーション：transformersライブラリのトークナイザを用いる・transformersのAutoTokenizerをimportしてAutoTokenizer.from_pertrained(“モデル名”) とすればトークナイザを呼び出せる・tokenizerの出力はBatchEncodingというクラスのオブジェクトで、Pythonのdictのように扱えるが、いくつか特別なメソッドが用意されている (char_to_token,convert_to_tensorなど) ・オブジェクトの内容は3つ・input_ids:トークンのID ・token_type:セグメント埋め込み(0か1) ・attention_mask:トークンなら1、それ以外は0とする。ミニバッチを構築するときにダミーを作るのでそれを0とする 9

11.

感情分析モデルの実装トークン化の流れ 1.トークンに分割：MeCab+WordPiece (MeCab:https://taku910.github.io/mecab/ ) 2.トークンをID化。文の初めに[CLS]、文の最後に[SEP]に対応するIDがつく。これが BERTのインプットに用いられる。・convert_ids_to_tokensメソッドでIDをトークンに戻せる。実際に文をうまくトークン化できていることが分かる。・tokenizer(前述)はトークン化を一発でやってくれる。 10

https://taku910.github.io/mecab/

12.

感情分析モデルの実装データの可視化：左が訓練用、右が検証用のデータ外れ値! 外れ値! 11

13.

感情分析モデルの実装 3.前処理:テキストをトークンＩＤ系列に変換する関数を定義・tokenizerにexample[“sentence”]を与えてID化する。max_lengthは最大系列長のことで、この値を超えると先頭からトークンを切り詰める(truncation)。・ラベルも格納しておく・この関数を用いてデータセット全体をトークナイゼーションする。Mapメソッドでデータセットの事例それぞれに指定した関数を適用できる。 12

14.

感情分析モデルの実装 3.ミニバッチを構築する。このときPaddingという処理で入力の系列長を最大のものにそろえる。・DataCollatorWithPaddingを用いる。正確にはDataCollatorWithPadding内でtokenizer のtokenizer.padメソッドを用いる。・labelはバッチサイズ(ここでは4)のテンソル、ほかは（バッチサイズ×バッチ内の最大系列長）次元のテンソルとして変換されていることが分かる。 13

15.

感情分析モデルの実装 4.モデル構築：AutoModelForSequenceClassificationのfrom_pretrainedで訓練済みモデルを読み込む・読み込んだ時点で最後尾に線形層のヘッドを付けてくれている。出力次元はnum_labelsで指定する。・label2id,id2labelを使うとIDとラベルが対応付けされて後々pipelineを使う時に見やすくなる。・モデルの入力にはforwardメソッドを用いる。出力はSequenceClassifierOutputクラスのオブジェクトで、loss(損失)、logits(モデルの出力するテンソル)がある。Hidden_statesとattentions は普通は出力されない。 14

16.

感情分析モデルの実装 5.モデルの訓練：まずTrainingArgumentクラスを使って学習の設定を行う・学習率スケジューラによって訓練の中で学習率を変動させる。今回は linear schedulerを用いる。このとき、はじめは学習率をだんだん大きくしていき、その後徐々に小さくして０に近づけていくように変化させる。このとき学習率を大きくしていくことをウォームアップという。・warmup_ratioによってウォームアップの長さの比率を指定できる。 15

17.

感情分析モデルの実装 5.モデルの訓練：Trainerライブラリを用いてモデルを訓練する・評価指標として関数を定義している。ここではAccuracyを評価指標としている。・損失関数のデフォルトはクロスエントロピー関数。一応カスタム可能・Trainerにモデル、訓練データ、検証データ、collator、Augment、評価指標を設定しtrain()で実行するだけ 16

18.

感情分析モデルの実装 6.モデルの訓練：検証用データでモデルを評価 17

19.

アジェンダ ◼ 日本語ベンチマーク:JGLUE ◼ 感情分析モデルの実装 ◼ 感情分析モデルのエラー分析 18

20.

感情分析モデルのエラー分析 Pipeline関数を用いてモデルの予測結果を取得・pipeline関数を使うことでトークナイザやモデルを読み込むことなく入力の前処理・内部計算・出力の後処理までを呼び出すことができる・load_datasetによってで保存したデータを所得。・pipeline(“テキスト”)とすれば、そのテキストに対応する予測結果（予測ラベルとスコア）を所得できる。・int2strメソッドでラベルをIDから”positive”と”negative”に変換している。 19

21.

感情分析モデルのエラー分析混合行列を使って全体的な傾向を分析 20

22.

感情分析モデルのエラー分析【おまけ】予測が間違っているデータを見てみる(予想してみよう！） 1.何のこれしき会社員だった頃の辛さに比べれば。まあ種類が違うけど。 2.今年のプリキュアの決め台詞が、「お大事に」今年にマッチングし過ぎてて、プリキュアスタッフの先見の明がすご過ぎるし、何が言いたいかと言うと変身する棒を買わされました。 3.ツイッター早朝部、いくわよ！！あと諸事情により数人ブロックさせて頂きました…申し訳ない…… 4.酒はぬるめの燗がいい肴は炙ったイカでいい←もっといいもの食えよ 5.できれば今すぐお線香あげにいきたい 6.もうwwww訳がwwwwわからないよwwww 7.一月ぶりに湯らっくす行って、10時間も寛いでいまい、寝落ちする以外なにもできない 8.この時期はこれだから 9.というか私のオタク人生に大きな影響を与えすぎたのがクロウ 10. 3週間ガーッと仕事して1週間まるっと旅に出るというサイクルを繰り返したい。そんな働き方させてもらえませんかね。なんだこれ。答え：1.P, 2.N, 3.P, 4.N, 5.N, 6.N, 7.P, 8.N, 9.P, 10.P 21

23.

【大規模言語モデル入門 】５章5.1~5.3