D-07|原典・素材DBの入力テンプレート

目的

原典・素材DBは、A/B/C/Dすべての親素材を安全に保管するためのDB。

ここでは、正典・準正典・書籍・外部記事・OCR・文字起こし・制作親素材を、本文化する前に 原文保持・出典管理・派生先管理 できる状態にする。

既存DBへの追加反映

原典・素材DBには、D-07運用に必要な以下のプロパティを追加済み。

追加プロパティ用途
素材種別正典 / 準正典 / 外部記事 / 書籍 / OCR素材 / 文字起こし / 制作親素材 / 保留
元ソースzip名、フォルダ名、ファイル名など
出典書籍名、記事URL、Notion元ページ、参照元など
原文・抜粋原文保持用の抜粋。全文が長い場合は代表部分
要約素材の内容を短く説明
渡し先レーンA / B / C / D
派生先DB学問概念DB、星・診断パターンDB、登場キャラDBなど
関連概念五行陰陽天中殺位相法など
関連星十大主星十二大従星六十花甲子など
保留理由出典不明、OCR崩れ、重複疑い、用途不明など
原文保持原文を保持すべき素材かどうか

原典・素材DBに入れるもの

素材主な目的
正典canon、SOURCE、巡命学の基準文A/B/Cの根拠として保持
準正典正典候補、出典確認前の基準文後で正典化・派生化する
書籍素材books、books-md、docx原本理論・診断素材の出典管理
外部記事html、取得記事出典付きで保管
OCR素材十大主星OCR、文字化け素材修正前の親素材として保持
文字起こしc_.txt、p_.txtなど講義・発想・診断文候補の親素材
制作親素材metaのうちA/B/Cにも派生する素材制作資料DBへ分岐する前の親素材
保留素材判断不能、重複疑い、出典不明無理にA/B/Cへ流さず保持

原典・素材DBに直接入れないもの

入れないもの理由渡し先
完成済みの概念ページ本文原典ではなく編集済み本文学問概念DB
完成済みの診断カード文親素材ではなく派生物星・診断パターンDB
完成済みのキャラ設定ページ親素材ではなくDB本文登場キャラDB
完成済みEP本文原典親素材ではなく物語DB本文物語・エピソードDB
プロンプト単体制作資料として管理すべき制作資料DB

ただし、完成済み本文でも「元原稿」「正本」「出典として残すべきもの」は原典・素材DBに入れる。

入力テンプレート

基本プロパティ

項目入力ルール
Name素材名。ファイル名ではなく、後で検索しやすい仮タイトルにする十大主星OCR|石門星
素材種別素材の性質を選ぶOCR素材
キーワード大きな系統を付けるarticles / 星 / OCR
ソース種別ファイル形式・取得元を選ぶOCR / txt / html / book-md
元ソースzip・フォルダ・ファイル名まで書くarticles/ocr/sekimon-sei.md
出典書籍名、記事URL、元資料名など不明 / 要確認
原文・抜粋原文保持が必要な箇所を抜粋石門星に関するOCR本文の冒頭
要約何の素材か一文で説明石門星の性質・診断文候補を含むOCR素材
渡し先レーンA/B/C/Dを選ぶB / D
派生先DB将来作るページのDBを選ぶ星・診断パターンDB / 原典・素材DB
関連概念関連する理論語陽占十大主星、中心星
関連星星名や干支石門星
取込状態未着手 / 棚卸し済 / 登録済 / 重複確認 / 要修正要修正
原文保持原文を残す必要がある場合ONON
保留理由なぜ未投入・未派生かOCR崩れ確認が必要

素材種別ごとの登録ルール

正典

対象:

  • canon

  • articles/canon

  • _master/SOURCE

  • 巡命学の基準文

入力ルール:

  • 原文保持:ON

  • 渡し先レーン:A / 必要に応じてB/C/D

  • 派生先DB:学問概念DB、学習コンテンツDB、必要に応じて星・診断パターンDB

  • 保留理由:原則不要。未確定なら準正典にする

本文テンプレート:

# 原文
ここに原文または代表抜粋。
 
# 要約
何を定義・宣言している素材か。
 
# 正典として使う理由
後続ページの根拠になる点。
 
# 派生候補
- A:概念ページ
- B:診断基準文
- C:世界観・キャラ行動原理
 
# 注意
表現を変える場合に守る意味。

準正典

対象:

  • 正典候補だが確定前の文

  • 出典確認前の思想・基準文

  • A/B/C共通で使えそうな親素材

入力ルール:

  • 原文保持:ON

  • 取込状態:重複確認または棚卸し済

  • 保留理由:必須

  • 渡し先レーン:D、必要に応じてA/B/C

本文テンプレート:

# 原文・抜粋
 
# 正典候補と見なす理由
 
# 未確定の理由
- 出典不明
- 文脈不足
- 重複疑い
 
# 確認後の派生先

書籍

対象:

  • books

  • books-md

  • docx原本

  • 書籍文字起こし、読書メモ

入力ルール:

  • 原文保持:ON

  • 出典:書籍名・章名・ページ等が分かれば記載

  • 渡し先レーン:A/B/D

  • 派生先DB:学問概念DB、星・診断パターンDB、学習コンテンツDB

本文テンプレート:

# 出典
書籍名、章、ページ、ファイル名。
 
# 原文・抜粋
 
# 要約
 
# 使えそうな用途
- 理論説明
- 星別説明
- 診断文
- 教材例
 
# 派生先

外部記事

対象:

  • html

  • 外部記事の取得データ

  • 参照リンク

入力ルール:

  • 原文保持:ON

  • 出典:URLまたは取得元を必ず記載。不明なら保留

  • 渡し先レーン:D中心、必要に応じてA/B/C

  • 取込状態:棚卸し済または重複確認

本文テンプレート:

# 出典
URL、記事名、取得日、元ファイル。
 
# 原文・抜粋
 
# 要約
 
# 使用可否
- 参照のみ
- 要約利用
- 教材化候補
- 保留
 
# 注意
著作権・引用・出典確認。

OCR素材

対象:

  • 十大主星OCR

  • OCR由来md/txt

  • 文字化け・行番号ノイズがある素材

入力ルール:

  • 原文保持:ON

  • 取込状態:要修正

  • 渡し先レーン:B/D、必要に応じてA

  • 保留理由:OCR崩れ、星名確認、改行崩れなど

本文テンプレート:

# OCR原文・抜粋
 
# 崩れ確認
- 星名誤認
- 行番号ノイズ
- 置換文字
- 改行崩れ
 
# 修正方針
 
# Bレーンへ渡せる部分
 
# 保留箇所

文字起こし

対象:

  • root c*.txt

  • root p*.txt

  • 講義・対話・発想メモ由来のテキスト

入力ルール:

  • 原文保持:ON

  • 渡し先レーン:A/B/D

  • 素材種別:文字起こし

  • 出典不明なら保留理由を記載

本文テンプレート:

# 文字起こし原文・抜粋
 
# 要約
 
# 用途分類
- 理論説明:A
- 診断文:B
- 制作資料:D
- 保留
 
# 整形メモ
話し言葉、重複、欠落など。

制作親素材

対象:

  • metaのうちA/B/Cにも派生しうるもの

  • 教材構成と本文素材が混在するもの

  • プロンプトと診断文例が混ざるもの

入力ルール:

  • 原文保持:ON

  • 渡し先レーン:D、必要に応じてA/B/C

  • 派生先DB:制作資料DB、学習コンテンツDBなど

  • 保留理由:制作資料DBと他DBへの切り分けが必要な場合に記載

本文テンプレート:

# 原文・抜粋
 
# 何の親素材か
 
# 分岐候補
- 制作資料DB
- 学習コンテンツDB
- 学問概念DB
- 星・診断パターンDB
 
# 切り分けメモ

Dレーン素材別の初回登録方針

html 85件

  • 素材種別:外部記事

  • ソース種別:html

  • キーワード:articles

  • 取込状態:棚卸し済または重複確認

  • 渡し先レーン:D

  • 原文保持:ON

  • 出典:URLまたは取得元が分かる場合は記載。不明なら保留理由へ

docx 26件

  • 素材種別:書籍または制作親素材

  • ソース種別:zipまたはNotion既存ではなく、現状DB選択肢に合わせるならzip扱い

  • キーワード:articles / books

  • 取込状態:棚卸し済

  • 渡し先レーン:D、必要に応じてA/B

  • 原文保持:ON

  • メモ:md/txt派生素材との対応確認が必要

books-md 24件

  • 素材種別:書籍

  • ソース種別:book-md

  • キーワード:books

  • 渡し先レーン:A/B/D

  • 派生先DB:学問概念DB / 星・診断パターンDB / 学習コンテンツDB

  • 原文保持:ON

canon 13件 + articles/canon 11件

  • 素材種別:正典または準正典

  • キーワード:正典 / 03-commonplace

  • 渡し先レーン:A/D、必要に応じてB/C

  • 派生先DB:学問概念DB / 学習コンテンツDB / 星・診断パターンDB

  • 原文保持:ON

OCR十大主星11件

  • 素材種別:OCR素材

  • ソース種別:OCR

  • キーワード:OCR / 星 / articles

  • 渡し先レーン:B/D

  • 派生先DB:星・診断パターンDB / 原典・素材DB

  • 取込状態:要修正

  • 保留理由:OCR崩れ・星名確認が必要

root c*.txt 26件

  • 素材種別:文字起こし

  • ソース種別:txt

  • キーワード:articles

  • 渡し先レーン:A/B/D

  • 派生先DB:学問概念DB / 星・診断パターンDB / 学習コンテンツDB

  • 取込状態:棚卸し済または要修正

root p*.txt 11件

  • 素材種別:文字起こしまたは制作親素材

  • ソース種別:txt

  • 渡し先レーン:D/A

  • 派生先DB:制作資料DB / 学問概念DB

  • 保留理由:プロンプト部分と理論部分の切り分けが必要

登録時の判断ルール

原文保持をONにする

  • 正典

  • 準正典

  • 書籍

  • 外部記事

  • OCR素材

  • 文字起こし

  • 出典確認が必要な素材

原文保持をOFFにしてもよい

  • すでに派生DBで本文化済み

  • 単なる運用メモ

  • ファイル数だけを管理する集約ページ

保留理由を書く

  • 出典不明

  • OCR崩れ

  • 重複疑い

  • 正典か制作資料か不明

  • A/B/Cのどこへ渡すか未確定

  • 著作権・引用扱いに注意が必要

登録後の派生ルール

Aレーンへ派生

条件:

  • 定義、理論、思想、体系説明として使える

  • 教材の概念説明になる

派生先:

  • 学問概念DB

  • 学習コンテンツDB

Bレーンへ派生

条件:

  • 星、干支、診断文、カード文へ使える

  • 恋愛・相性・人物診断へ展開できる

派生先:

  • 星・診断パターンDB

  • 学習コンテンツDB

Cレーンへ派生

条件:

  • キャラ、会話、EP、世界観素材として使える

  • 九条巡の診断室の物語・教材演出に使える

派生先:

  • 登場キャラDB

  • 物語・エピソードDB

  • 学習コンテンツDB

Dレーンに残す

条件:

  • 親素材として残すべき

  • 制作資料DBへ分ける前の混合素材

  • 出典確認、重複確認、OCR修正が必要

派生先:

  • 制作資料DB

  • タスクDB

次アクション

  1. html 85件を外部記事親素材として登録候補化する

  2. docx 26件を原本素材として登録候補化する

  3. books-md 24件をA/Bへ派生できる書籍素材として登録する

  4. canon 13件 + articles/canon 11件を正典 / 準正典に分けて登録する

  5. OCR十大主星11件を要修正状態で登録し、Bレーンへ派生する

完了条件チェック

  • 原典・素材DBの実DB構造を確認した

  • 不足していたプロパティを追加した

  • 素材種別ごとの入力テンプレートを作った

  • html/docx/books/canon/OCR/txtの登録方針を作った

  • A/B/C/Dへの派生ルールを作った

  • 実素材を5〜10件単位で登録する

  • 既存素材のプロパティを新テンプレートに合わせて更新する

  • 重複候補を確認する

メモ

D-07はテンプレート定義として完了。原典・素材DB側にも必要なプロパティを追加済み。次に進めるなら、D-12で投入前チェックリストを作ると、D-07/D-08の運用を毎回確認できるようになる。