TechDive_Development_Realities

>100 Views

February 22, 26

#AI #LLM #技術情報収集 #TechDive #開発事例

スライド概要

松井敏

@binnmti

スライド一覧

こんにちは

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

技術書を集中して読むために新たに始めた方法が自分にクリティカルヒットした話

松井敏 130.4K

C#の素晴らしさ

松井敏 108.1K

C#の高速化入門

松井敏 19.7K

ベクトルプログラミングとunsafe

松井敏 10.7K

ベクトルプログラミング入門を読んでunsafeの沼に足を踏み入れかけたが _unsafeはUnsafeでセーフ_

松井敏 5.1K

C#でC#コンパイラを作っている話

松井敏 5K

各ページのテキスト

TechDive 開発録：テックワード自動収集サービスを作って見えた「現実」 LLM as a Judgeの実装、コストの壁、そして「一次情報」の正体 TechDive Case Study | @binnmti NotebookLM

情報収集の「巡回疲れ」を解消したい現状の課題: Qiita、Zenn、Hatena Bookmark... 毎日複数のサイトを手動で巡回するのは非効率。開発の動機: 「特定のキーワード（例: 量子コンピュータ）を登録すれば、勝手に記事が集まる」状態を作りたい。目指す体験: 受動的(Passive)かつ効率的な技術キャッチアップ。 Qiita Zenn B H H B G BEFORE JetBrains Mono TechDive Quantum Computing - Recent Developments 1 hrs ago Serverless Architecture Best Practices 1 hrs ago AI in Healthcare Trends 1 hrs ago Google News AFTER JetBrains Mono NotebookLM

キーワードを入れるだけ。 AIが収集・採点・要約。自動収集: 特定技術(AI, Robot, etc.)を追跡 AI採点: 重要度を判定し優先表示要約表示: リンクを開かずに概要把握 TechDive 量子コンピュータ Recommended Quantum Supremacy Achieved in New Experiment A team of researchers claims to have demonstrated quantum supremacy using a new S4-qubit processor, marking a significant milestone in quantum computing... Recommended New Qubit Stability Findings Publish... New Qubit Stability Findings Published: a new 54-qubit processor, sharing a significant milestone in quantum computing... Intro to Quantum Mechanics for Engine... Intro to Quantum Mechanics for Enginee: exhibes quantum supremacy using a cunnuting milestone in quantum computing... NotebookLM

核心技術: 「LLM as a Judge」アプローチ: 人間が数百件の記事を読むのは不可能。AIに「AI/記事」を採点させる。技術スタック: C# / Azure OpenAI Service (Web API)。初期の試行: GPT-4oベースのモデルや技術特化のCodexを採用し、複数回のジャッジによる精度向上を検証。 Raw Articles (Web) GPT-4o / Codex Azure OpenAI Service Scoring & Evaluation Ranked Output NotebookLM

高精度なモデルは、あまりに「高すぎる」直面した壁: 良いモデル(GPT-4o等)はコストが高い。計算式: [数百の記事] x [複数回のジャッジ] x [高単価モデル] = 予算オーバー Cost (JPY) (コスト) Number of Articles (記事数) GPT-4o Full Usage Personal Dev Budget NotebookLM

20点と19点に、本当の差はあるのか？ Meaningful Difference 100 pts 50 pts Noise (The Trap) ? 20 pts 19 pts 採点のジレンマ: 100点と50点は違うが、20点と19点は誤差でしかない。点数で厳密に順位付けするのは不誠実である。 NotebookLM

解決策: 安価な一次評価 + 高精度な二次評価一次評価(Batch): 1回のAPIコールで多数の記事をまとめてGPT-4o-mini に渡す(安価・高速)。二次評価(Verify): 選別された記事に対し、o3-miniを1回だけ通す(高精度)。 Bulk Batch GPT-4o-mini o3-mini (Verify) High Quality NotebookLM

「ランキング」をやめて「おすすめ順」へ見せ方の変更: 厳密なスコアリング (点数順)という建前を捨てる。新UI: 「ランキング」ではなく、ゆるるやかな「おすすめ順」として提示。特におすすめの記事には自動でマークを付与。 1. 19.5pts 2. 19.4pts 3. 19.1pts Recommended Recommended Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut urna... Recommended Lorem ipsum dolor sit amet, consectetur hesune. Cander-nolutun: Lorem ipsum dolor sit amet, consectetur adipiscing elit. Doming Ipsum Lorem ipsum dolor sit amet, consectetur adipiscing. Honest UI NotebookLM

「量子コンピュータ」の上位記事が、すべて英語だった件観測された事実** 高品質フィルターを通すと、上位は Google Newsなどの英語記事が独占。 **データ: TOP30件中、日本語の記事はわずか1~2件のみ。 30 vs 1 Japanese Sources (Secondary) 5% 95% English Sources (Primary) NotebookLM

10.

AIが突きつけた現実: 「英語=一次情報」 English (Primary Source) JetBrains Mono Time & Translation JetBrains Mono Japanese (Secondary Source) 「英語の情報が一次情報であり、日本語の情報はそれを翻訳・解説した二次情報になりがちである」 - AIの回答 NotebookLM

11.

1日100円の赤字と、これからのこれからの構想マネタイズ: 現状、API利用料で1日約1 00円の赤字。キーワード増=コスト増。構想: ユーザー登録機能(既読管理) の実装と、一般公開への道のり。 Current Free Beta / Quantum Only Next User Accounts / Read Status Future Sustainable Model / Public Open NotebookLM

12.

ツールを作って得たものは、技術力と「視点」 Cost Quality Cost vs Quality (Optimization) UX > Score (Honesty) English is Primary (The Truth) Try TechDive: https://techdive.binnmti.net/articles NotebookLM