20241216_cloudlt_lt_beajouneyman

352 Views

December 16, 24

スライド概要

クラウドLT #cloudlt # 12 の登壇資料です。
re:Invent2024 で発表された Amazon Bedrock のRAG評価を試したお話しです。

profile-image

システム維持PjM&SE #AWS/コミュニティ #営餃 #DevReljp #JBUG #BacklogWorld #JAWSUG #PRLT #開発PM勉強会/趣味 #バイク乗り #桃が好きなんです #富士山好き🗻51回登頂 #つれづれジャニ #ジャニタビ #ジャニソラ/著書📘http://amzn.to/3IUyM87

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

#cloudlt Bedrockの新評価機能(Preview) でRAGを評価してみた Journeyman | @beajourneyman Dec 2024

2.

本日、お伝えしたいコト(結論) • BedrockとRAGの特徴をつかむ • 新機能、RAG評価を学ぶ • どんな評価ができるか知る

3.

Journeyman ジャニ (Takeki Oizumi) 所属:セゾンテクノロジー(4月に社名変更) 2022年10月より遠隔地勤務可に 仕事:Amazon Connect を基盤とした IVRシステムの開発保守リーダー他 推しサービス:Amazon Connect / Polly 最近は Bedrock SNS:@beajourneyman 認定: CLF / SAA / AIF

4.

Amazon Bedrock とは?

5.

基盤モデルを使用して生成 AI アプリケーション を構築およびスケーリングする最も簡単な方法。 Amazon Bedrockは、Amazon Web Services (AWS) が提供する基盤とな るAIサービスです。このサービスは、高度な機械学習モデルを簡単に利用可能にするこ とで、開発者が効率的にアプリケーションを構築できるようにします。Bedrockは、多 様なデータ処理と機械学習のニーズに対応し、エンタープライズレベルのセキュリティと 可用性を提供します。これにより、ビジネスの成長に必要な強力なAI機能を活用しや すくなります。

6.

RAG(検索拡張生成)とは? RAG(検索拡張生成)は、外部の情報を活用して生成されたコンテンツの信頼性を 高めるための技術です。RAGは、生成モデル(Genrative AI)と外部データベース を組み合わせて、ユーザーの質問に関連する最新の情報や専門知識を即座に取り込 むことができます。これにより、AIが生成する回答の精度と関連性が向上し、より信頼 性の高い情報提供が可能になります。RAGは、特にインフォメーションシステムや検索 エンジンの応用に有効です。

7.

Amazon Bedrock の新しい RAG 評価 と LLM を審査員として利用する機能 New & Preview https://aws.amazon.com/jp/blogs/aws/new-rag-evaluationand-llm-as-a-judge-capabilities-in-amazon-bedrock/

8.

何が嬉しいのか? • • これまでRAGを評価する際には、ユーザーが評価を行うか、他ベンダー製品 (Ragasなど)を利用する必要があった。 本新機能により、AWSサービスでシームレスにRAG評価が可能になり、評価プロ セスの効率化と統合が期待できる。 何故試そうと思ったのか? • • • RAGはユーザー自身がデータセットを作成して運用するため、品質を維持していく 対策が重要になる。 RAGをプロダクションで活用してく上で、品質評価は必須要件である。 LLMOps(RAGOps)をAWSサービスで完結して構築する要の機能と感じた。

9.

さっそく、自分チャットボット を評価しました ドキドキ QR https://qiita.com/beajourneyman/items/65161b0b434d88dff21f

10.

ナレッジベース評価基盤構築と結果確認の流れ 1. 2. 3. 4. S3バケットを用意する 評価用JSONLデータセット(お手本)を用意してS3にアップロードする RAG評価基盤を構築する 評価結果サマリ、詳細を確認する QR https://qiita.com/beajourneyman/items/c1ac4948214891887e2e

11.

自分RAGの評価結果が出ました(サマリ) 数十本の自分のQiita記事を ベクトルストアに入れたRAG <品質指標> 1.0に近いほど良い <レスポンシブAIメトリクス> ※いわゆる責任あるAI指標 0に近いほど良い ホッ

12.

自分RAGの評価結果の詳細

13.

苦労したポイント

14.

本日、お伝えしたいコト(再掲) • BedrockとRAGの特徴をつかむ • 新機能、RAG評価を学ぶ • どんな評価ができるか知る 是非使ってみてください!!

15.

今回紹介したRAG評価含め 推しサービスを中心に アドベントカレンダーを書いているので、 良かったらご覧ください QR https://qiita.com/beajourneyman

16.

QR https://jawsug-niigata.connpass.com/event/337921/

17.

QR https://increments.connpass.com/event/338077/

18.

ご清聴、ありがとうございます! ジャニ (Journeyman) | @beajourneyman