MEGURU RAG戦略 — 知識ギャップ分析と対応方針

現状の3層知識基盤

① NotebookLM(稼働中・即RAG可能)

NotebookSources内容
巡命学 さくらの教え290十大主星×100ペア、中央/北の方位21、canon11、基本概念15、禄存60 etc.
陰陽五行75塾のPDF資料 2017-2021(天中殺、位相法、六十花甲子 etc.)
十干十二支11十干十二支入門、YouTube系ソース
Self-Study Guide1総合ガイド
合計377

NotebookLMの強み: GoogleのAIがsource全文を読み込み、高品質なRAG回答を生成。さくら口調での回答も可能。東・南など直接sourceがなくても基本概念から推論で回答できる。

② gbrain(8,106ページ、search全滅中)

タイプページ数内容
entity2,878キャラクター、企業 etc.
star-combination1,500十大主星の組み合わせ解説
concept1,338算命学概念
learning-content584十二大主星×5軸(306) + 十二大従星×4軸(278)
character371物語キャラクター
article661記事・考察
その他774draft, review, original etc.

gbrainの学習データ(brain/learning/)内訳:

  • 十二大主星: 306 pages(仕事36、親子144、恋愛78、子育48)
  • 十二大従星: 278 pages(仕事80、親子100、恋愛55、子育41)
  • 大運: 12 pages
  • 年運: 60 pages

問題: embedding次元不整合(vector(1536) vs config=1280)でsearch/query全滅。修復が必要。

③ MEGURU Obsidian raw(2,589ファイル、未加工)

カテゴリファイル数重複除去後
方位別星解説482~96
星の解説557~100
恋愛パターン200~100
日干×地支225~120
十二大従星(中年/晩年)2424
方位関係(冲/破/半会/方三位)3232
番外編99
DB系73~30
キャラクター88
無題30
重複(2.md)2850
重複(3.md)100

ギャップ分析

NotebookLMでカバーできているもの ✅

  • 十大主星の基本性質(10星×各10ペア = 100パターン)
  • 中央・北の方位別解説(21パターン)
  • 基本概念(天中殺、大運、陽占、陰占、五行、十大主星、十二大従星、六十花甲子)
  • 十二大主星×十二大従星の組み合わせ基本
  • 陰陽五行の深い理解(塾PDF 75冊分)

NotebookLMに足りないもの ❌

ギャップ重要度代替ソース
東・南・西の方位別星解説HIGHMEGURU raw(96ファイル)
十二大主星×5軸の詳細解説HIGHgbrain(306ページ)
十二大従星×4軸の詳細解説HIGHgbrain(278ページ)
中年期・晩年期の従星解説HIGHMEGURU raw(24ファイル)
大運の各相詳解MEDIUMgbrain(12ページ)
年運の詳細データMEDIUMgbrain(60ページ)
日干×地支の十大主星対応MEDIUMMEGURU raw(120ファイル)
恋愛パターンの独自解釈MEDIUMMEGURU raw(100ファイル)
冲・破・半会の詳解LOWMEGURU raw(32ファイル)
物語キャラクターの命式LOWgbrain(371ページ)
番外編の独自解釈記事LOWMEGURU raw(9ファイル)

推奨対応方針

Phase 1: NotebookLMへのsource追加(最優先)

gbrainの brain/learning/ にある高品質な構造化データをCSVに変換してNotebookLMに追加:

  1. 十二大主星×5軸 → CSV化して「さくらの教え」に追加(306 sources)
  2. 十二大従星×4軸 → CSV化して「さくらの教え」に追加(278 sources)
  3. 東・南・西の方位別星 → MEGURU rawから重複除外して追加(~72 sources)

Phase 2: gbrain修復(並行)

  1. embedding config を vector(1536) に統一
  2. APIキー設定(OpenAI text-embedding-3-small 等)
  3. gbrain embed --stale で209チャンクを埋める
  4. gbrain extract all でlink graph構築

Phase 3: MEGURU rawのクリーンアップ(後回し)

  1. 重複285+10件を隔離
  2. 無題3件を削除
  3. 正本だけをNotebookLM/gbrainに追加

結論

NotebookLMはすでにRAGとして実用レベル。基本概念から推論できる範囲が広い。 gbrainの brain/learning/ 584ページ(十二大主星×5軸、十二大従星×4軸)をNotebookLMに追加すれば、回答の深度と正確性が劇的に向上する。

まずは Phase 1 の gbrain → NotebookLM source追加をworkflowで実行する。