ナレッジグラフ活用大全 ― 構造化すれば、AIは賢くなる

>100 Views

May 31, 26

スライド概要

ベクトル検索だけでは、関係をたどる問いに答えられない。本スライドはナレッジグラフ活用の入門編です。知識を主語・述語・目的語の3つ組で表す仕組み、RDB/ベクトル/グラフDBの使い分け、GraphRAGの4段階パイプライン、従来RAGとの違い、実例の数字までを12枚で俯瞰します。

▼Zenn Bookで全文(無料)
https://zenn.dev/kenimo49/books/knowledge-graph-practical-guide
▼Kindle版
https://www.amazon.co.jp/dp/B0GX465PG7

著者: ken imoto / kenimoto.dev

profile-image

Propel-Lab代表。WebRTC・音声AIのエンジニアをやりながら、LLMを仕事の戦力にするための設計を研究しています。中心テーマは「ハーネス・エンジニアリング」——AIの成果はモデルそのものより、その外側の環境(制約・フィードバック・ツール)で決まる、という考え方です。これとContext Engineering、AIコードレビューの自動化などをZennとKindleで本にしてきました。ここには各本の要点をスライドにまとめて置いていきます。詳しくは kenimoto.dev へ。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

Knowledge Graph 実践 ナレッジグラフ活用大全 構造化すれば、AIは賢くなる ken imoto エンジニア / Propel-lab ナレッジグラフ活用大全 kenimoto.dev

2.

ベクター検索では答えられない問い LLMは流暢に語る。だが「点と点をつなぐ」推論は、苦手ままだ。 RAGが詰まる質問 「このデータセット全体のテーマは何か?」 「プロジェクトAとBに共通する課題は?」 答えるには、文書間の関係性を理解する必要がある。 ベクトル類似検索は「近い文書」を見つけるのは得意。だが離れた点と点をつなぐ推論はできない。 そこにナレッジグラフが効く。GraphRAGは、この壁を越えた。 ナレッジグラフ活用大全 02 kenimoto.dev

3.

知識を「3つ組」で表す ナレッジグラフの最小単位はトリプル。主語・述語・目的語で、ひとつの事実を表現する。 GraphRAG developed_by Microsoft 主語 Subject 目的語 Object ノード(頂点)は実体を、エッジ(辺)は関係を表す。 このトリプルが何万と集まったものが、ナレッジグラフだ。 ナレッジグラフ活用大全 03 kenimoto.dev

4.

3つのDBは、別々の「問い」に強い RDB・ベクトルDB・ナレッジグラフは競合しない。得意な問いが、根本的に違う。 リレーショナルDB 得意な問い 「ID=123を取得」 検索方法 WHERE句 + JOIN 弱点 深い関係探索が遅い ベクトルDB 得意な問い 「Xに似たものを探す」 検索方法 コサイン類似度 / ANN 弱点 つながりの推論ができない ナレッジグラフ 得意な問い 「XとYはどうつながるか」 検索方法 グラフ探索(ホップ) 弱点 曖昧な類似検索が苦手 ナレッジグラフ活用大全 04 kenimoto.dev

5.

最初の分岐: RDFかプロパティグラフか 同じ「グラフ」でも設計思想が違う。迷ったらプロパティグラフから始める。 RDF W3C標準 / SPARQL / トリプルストア - 組織を超えたデータ連携(Linked Data) - OWL/RDFSによる論理推論 - 既存オントロジー(FIBO等)を活用 - 学習曲線は急(URI・名前空間) プロパティグラフ Neo4j普及 / Cypher / ネイティブグラフDB - ホワイトボードの図がそのままデータに - エッジに重みや日付を直接持てる - 単一組織の知識管理・アプリ開発向き - 学習が緩やか・高速な探索 ナレッジグラフ活用大全 05 kenimoto.dev

6.

GraphRAGの4段階パイプライン LLMでテキストからグラフを自動構築し、その構造で検索を拡張する。 STAGE 1 エンティティ・関係抽出 LLMがテキストから人・組織・概念と関係を抽出 STAGE 2 Leidenクラスタリング 密につながるノード群をコミュニティに自動分割 STAGE 3 コミュニティ要約生成 各コミュニティをLLMが要約し検索インデックス化 STAGE 4 グラフ拡張検索 質問に関連する要約を取得して回答生成に活用 2024年2月、Microsoft Researchが発表。データセット全体に関する質問に答えられるようになった。 ナレッジグラフ活用大全 06 kenimoto.dev

7.

従来RAG vs GraphRAG 単一チャンクの引用から、グラフ構造による文書横断の推論へ。 従来RAG GraphRAG 検索単位 文書チャンク コミュニティ要約+エンティティ 質問タイプ 特定の事実検索 データセット全体に関する質問 推論 単一チャンク内 文書横断的 回答の根拠 取得チャンクの引用 グラフ構造による推論パス ナレッジグラフ活用大全 07 kenimoto.dev

8.

LLMとKGは補完関係 対立する技術ではない。互いの弱点を、互いが埋める。 KGが→LLMを補う ハルシネーション 知識の陳腐化 推論が不透明 構造化知識の欠如 エビデンスベースの回答 リアルタイムなKG更新 グラフパスで説明可能 オントロジーで体系化 LLMが→KGを補う 構築コストが高い 自然言語で問えない 非構造化データ処理 スキーマ設計が難しい エンティティ・関係を自動抽出 テキスト→Cypher自動変換 テキスト理解・要約 オントロジーの自動提案 ナレッジグラフ活用大全 08 kenimoto.dev

9.

コードベースは、巨大なグラフだ Tree-sitterでASTを抽出すれば、コードの構造がそのままナレッジグラフになる。 UserService HAS_METHOD 持つ update_user update_user CALLS 呼ぶ db.save update_user CALLS 呼ぶ notify_change get_user RETURNS 返す User 「この関数を変えたら、どこに影響するか?」にグラフ探索で即答。 19以上の言語に対応、LLM不要でローカル高速処理。変更の波及範囲を辿るBlast Radius分析は、コードKGの最も実用的な応用だ。 ナレッジグラフ活用大全 09 kenimoto.dev

10.

数字が示す、KGの実力 「賢くする」は理念ではない。企業事例の数字が、それを裏づける。 Meta 5→100% AIコンテキストカバレッジ 4,100以上のファイルに散らばる暗黙知を、50+エージェントで構造化。ツール呼び出しは40%削減。 LinkedIn 28.6% サポート品質を改善 サポートチケットをKG化し、KG+RAGで関連する解決策を提示。応答精度が向上。 NTTデータ 73% 企業関係の自動抽出精度 ニュース記事からLLMで企業間の関係を抽出。投資判断・競合分析・サプライチェーン可視化に活用。 ナレッジグラフ活用大全 10 kenimoto.dev

11.

構造化が、AIの天井を上げる ベクトル検索の限界は、知識を「関係」で持つことで越えられる。 「似ている」を探すAIから、「つながり」で考えるAIへ。 その鍵が、ナレッジグラフだ。 01 知識を主語-述語-目的語のトリプルで構造化する 02 GraphRAGで文書横断の推論にLLMが答えられる 03 コード・組織知・暗黙知まで「グラフで考える」が効く ナレッジグラフ活用大全 11 kenimoto.dev

12.

全体像は、この本に。 Zenn Book zenn.dev/kenimo49/books/knowledge-graph-practical-guide Kindle amazon.co.jp/dp/B0GX465PG7 ナレッジグラフの設計・構築・GraphRAG活用までを事例つきで体系化。 kenimoto.dev ナレッジグラフ活用大全 12 kenimoto.dev