WhisperとChatGPTで文字起こし

30.6K Views

June 24, 23

スライド概要

2023/06/24 ChatGPT のAPIを使ったハンズオン #機械学習名古屋 LTにて発表

profile-image

闇のエンジニア/変なデジカメ開発中/ディープラーニング芸人/Raspberry Piとからあげ大好き/はてなブログ書いてます

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

WhisperとChatGPTで文字起こし Chat GPT のAPIを使ったハンズオンでのLT 2023/06/24 からあげ @karaage0703

2.

自己紹介 名前:からあげ(本名は内緒) 職業:エンジニア 家族:妻・娘・ネコ x 2 https://karaage.hatenadiary.jp @karaage0703 karaage0703 ブログ、各種SNSで情報発信しています

3.

SIGNATEのChatGPTコンペ 活用成功例 活用失敗例 2部門を制覇!(自慢です)

4.

Podcastを文字起こししたい 歴史について語るPodcast 「COTEN RADIO」を愛聴してます エピソードを振り返りたいとき 音声だと時間かかるし振り返れないので不便

5.

AIで文字起こしだ!!

6.

Whisperで文字起こし 項目 Whisper API Google Colaboratory ローカル (Docker) お金 API料金(1円/分) △ 無料(課金可) ◯ 無料 ◯ 無し ◯ 不要 ◯ あり(課金次第) △ 毎回必要 ☓ 無し ◯ 初回のみ必要 ◯ 必要 ☓ 必要 ☓ 不要 ◯ ほぼ不要 ◯ 不要 ◯ 必要 ☓ 利用時間制約 モデルダウンロード ネット環境 セットアップ 方法は色々ありますがお好みで (今回はGoogle Colaboratory前提です)

7.

文字起こしの問題点 句読点無し 樋口 世界の歴史キュレーションプログラム コテンラジオ樋口 世界の歴史キュレーション プログラム コテンラジオパーソナリティーの株式会社ブック代表樋口清則 です深井 そし て株式会社コテンの深井 隆之介です樋口 そして株式会社コテンの楊 英史です樋口 この ラジオは歴史を愛し歴史 の面白さを知りすぎてしまった深井さんを代表とする株式会社 コテンのお二人と一緒に学校の授業ではなかなか学べない国内外 の歴史の面白さを学ん じゃおうという番組ですよろしくお願いします 誰が喋っているか 分かりづらい 出典: 2019年12月23日放送 COTEN RADIO「お金の歴史」 ―カネさえあれば人生HAPPY? WhisperではLargeモデルでもプロンプトに句読点含め ても現状はあまりうまくいかない

8.

それでもChatGPTなら… ChatGPTならきっと何とか してくれる…

9.

プロンプト(無茶振り) 次の文章の誤記訂正、句読点の追加をしてください。 極力元の文章は変更しないようにしてください。 頼む!

10.

ChatGPT回答 やるじゃん…

11.

問題点 チャットGPTへの入力: GPT-3.5で入出力合わせて4096トークン※ (※ 最近1万6千トークンに対応) 1話の文字起こし結果 1万トークン 入力としては余裕持って半分の更に半分(1/4) 1000トークンくらい プロンプトの文字数制限にひっかかる

12.

対策 1000トークン 1話の文字起こし結果 1万トークン 1000トークン … 1000トークン 困難は分割 (コードはChatGPTに書いてもらいました)

13.

成果物 https://github.com/karaage0703/colab-notebooks transcription.ipynb Google Colaboratoryで 簡単に文字起こしできます(要OpenAI API KEY) 試してみてください

14.

ご静聴ありがとうございました