D-07|原典・素材DBの入力テンプレート
目的
原典・素材DBは、A/B/C/Dすべての親素材を安全に保管するためのDB。
ここでは、正典・準正典・書籍・外部記事・OCR・文字起こし・制作親素材を、本文化する前に 原文保持・出典管理・派生先管理 できる状態にする。
既存DBへの追加反映
原典・素材DBには、D-07運用に必要な以下のプロパティを追加済み。
| 追加プロパティ | 用途 |
|---|---|
| 素材種別 | 正典 / 準正典 / 外部記事 / 書籍 / OCR素材 / 文字起こし / 制作親素材 / 保留 |
| 元ソース | zip名、フォルダ名、ファイル名など |
| 出典 | 書籍名、記事URL、Notion元ページ、参照元など |
| 原文・抜粋 | 原文保持用の抜粋。全文が長い場合は代表部分 |
| 要約 | 素材の内容を短く説明 |
| 渡し先レーン | A / B / C / D |
| 派生先DB | 学問概念DB、星・診断パターンDB、登場キャラDBなど |
| 関連概念 | 五行、陰陽、天中殺、位相法など |
| 関連星 | 十大主星、十二大従星、六十花甲子など |
| 保留理由 | 出典不明、OCR崩れ、重複疑い、用途不明など |
| 原文保持 | 原文を保持すべき素材かどうか |
原典・素材DBに入れるもの
| 素材 | 例 | 主な目的 |
|---|---|---|
| 正典 | canon、SOURCE、巡命学の基準文 | A/B/Cの根拠として保持 |
| 準正典 | 正典候補、出典確認前の基準文 | 後で正典化・派生化する |
| 書籍素材 | books、books-md、docx原本 | 理論・診断素材の出典管理 |
| 外部記事 | html、取得記事 | 出典付きで保管 |
| OCR素材 | 十大主星OCR、文字化け素材 | 修正前の親素材として保持 |
| 文字起こし | c_.txt、p_.txtなど | 講義・発想・診断文候補の親素材 |
| 制作親素材 | metaのうちA/B/Cにも派生する素材 | 制作資料DBへ分岐する前の親素材 |
| 保留素材 | 判断不能、重複疑い、出典不明 | 無理にA/B/Cへ流さず保持 |
原典・素材DBに直接入れないもの
| 入れないもの | 理由 | 渡し先 |
|---|---|---|
| 完成済みの概念ページ本文 | 原典ではなく編集済み本文 | 学問概念DB |
| 完成済みの診断カード文 | 親素材ではなく派生物 | 星・診断パターンDB |
| 完成済みのキャラ設定ページ | 親素材ではなくDB本文 | 登場キャラDB |
| 完成済みEP本文 | 原典親素材ではなく物語DB本文 | 物語・エピソードDB |
| プロンプト単体 | 制作資料として管理すべき | 制作資料DB |
ただし、完成済み本文でも「元原稿」「正本」「出典として残すべきもの」は原典・素材DBに入れる。
入力テンプレート
基本プロパティ
| 項目 | 入力ルール | 例 |
|---|---|---|
| Name | 素材名。ファイル名ではなく、後で検索しやすい仮タイトルにする | 十大主星OCR|石門星 |
| 素材種別 | 素材の性質を選ぶ | OCR素材 |
| キーワード | 大きな系統を付ける | articles / 星 / OCR |
| ソース種別 | ファイル形式・取得元を選ぶ | OCR / txt / html / book-md |
| 元ソース | zip・フォルダ・ファイル名まで書く | articles/ocr/sekimon-sei.md |
| 出典 | 書籍名、記事URL、元資料名など | 不明 / 要確認 |
| 原文・抜粋 | 原文保持が必要な箇所を抜粋 | 石門星に関するOCR本文の冒頭 |
| 要約 | 何の素材か一文で説明 | 石門星の性質・診断文候補を含むOCR素材 |
| 渡し先レーン | A/B/C/Dを選ぶ | B / D |
| 派生先DB | 将来作るページのDBを選ぶ | 星・診断パターンDB / 原典・素材DB |
| 関連概念 | 関連する理論語 | 陽占、十大主星、中心星 |
| 関連星 | 星名や干支 | 石門星 |
| 取込状態 | 未着手 / 棚卸し済 / 登録済 / 重複確認 / 要修正 | 要修正 |
| 原文保持 | 原文を残す必要がある場合ON | ON |
| 保留理由 | なぜ未投入・未派生か | OCR崩れ確認が必要 |
素材種別ごとの登録ルール
正典
対象:
-
canon
-
articles/canon
-
_master/SOURCE
-
巡命学の基準文
入力ルール:
-
原文保持:ON
-
渡し先レーン:A / 必要に応じてB/C/D
-
派生先DB:学問概念DB、学習コンテンツDB、必要に応じて星・診断パターンDB
-
保留理由:原則不要。未確定なら準正典にする
本文テンプレート:
# 原文
ここに原文または代表抜粋。
# 要約
何を定義・宣言している素材か。
# 正典として使う理由
後続ページの根拠になる点。
# 派生候補
- A:概念ページ
- B:診断基準文
- C:世界観・キャラ行動原理
# 注意
表現を変える場合に守る意味。準正典
対象:
-
正典候補だが確定前の文
-
出典確認前の思想・基準文
-
A/B/C共通で使えそうな親素材
入力ルール:
-
原文保持:ON
-
取込状態:重複確認または棚卸し済
-
保留理由:必須
-
渡し先レーン:D、必要に応じてA/B/C
本文テンプレート:
# 原文・抜粋
# 正典候補と見なす理由
# 未確定の理由
- 出典不明
- 文脈不足
- 重複疑い
# 確認後の派生先書籍
対象:
-
books
-
books-md
-
docx原本
-
書籍文字起こし、読書メモ
入力ルール:
-
原文保持:ON
-
出典:書籍名・章名・ページ等が分かれば記載
-
渡し先レーン:A/B/D
-
派生先DB:学問概念DB、星・診断パターンDB、学習コンテンツDB
本文テンプレート:
# 出典
書籍名、章、ページ、ファイル名。
# 原文・抜粋
# 要約
# 使えそうな用途
- 理論説明
- 星別説明
- 診断文
- 教材例
# 派生先外部記事
対象:
-
html
-
外部記事の取得データ
-
参照リンク
入力ルール:
-
原文保持:ON
-
出典:URLまたは取得元を必ず記載。不明なら保留
-
渡し先レーン:D中心、必要に応じてA/B/C
-
取込状態:棚卸し済または重複確認
本文テンプレート:
# 出典
URL、記事名、取得日、元ファイル。
# 原文・抜粋
# 要約
# 使用可否
- 参照のみ
- 要約利用
- 教材化候補
- 保留
# 注意
著作権・引用・出典確認。OCR素材
対象:
-
十大主星OCR
-
OCR由来md/txt
-
文字化け・行番号ノイズがある素材
入力ルール:
-
原文保持:ON
-
取込状態:要修正
-
渡し先レーン:B/D、必要に応じてA
-
保留理由:OCR崩れ、星名確認、改行崩れなど
本文テンプレート:
# OCR原文・抜粋
# 崩れ確認
- 星名誤認
- 行番号ノイズ
- 置換文字
- 改行崩れ
# 修正方針
# Bレーンへ渡せる部分
# 保留箇所文字起こし
対象:
-
root c*.txt
-
root p*.txt
-
講義・対話・発想メモ由来のテキスト
入力ルール:
-
原文保持:ON
-
渡し先レーン:A/B/D
-
素材種別:文字起こし
-
出典不明なら保留理由を記載
本文テンプレート:
# 文字起こし原文・抜粋
# 要約
# 用途分類
- 理論説明:A
- 診断文:B
- 制作資料:D
- 保留
# 整形メモ
話し言葉、重複、欠落など。制作親素材
対象:
-
metaのうちA/B/Cにも派生しうるもの
-
教材構成と本文素材が混在するもの
-
プロンプトと診断文例が混ざるもの
入力ルール:
-
原文保持:ON
-
渡し先レーン:D、必要に応じてA/B/C
-
派生先DB:制作資料DB、学習コンテンツDBなど
-
保留理由:制作資料DBと他DBへの切り分けが必要な場合に記載
本文テンプレート:
# 原文・抜粋
# 何の親素材か
# 分岐候補
- 制作資料DB
- 学習コンテンツDB
- 学問概念DB
- 星・診断パターンDB
# 切り分けメモDレーン素材別の初回登録方針
html 85件
-
素材種別:外部記事
-
ソース種別:html
-
キーワード:articles
-
取込状態:棚卸し済または重複確認
-
渡し先レーン:D
-
原文保持:ON
-
出典:URLまたは取得元が分かる場合は記載。不明なら保留理由へ
docx 26件
-
素材種別:書籍または制作親素材
-
ソース種別:zipまたはNotion既存ではなく、現状DB選択肢に合わせるならzip扱い
-
キーワード:articles / books
-
取込状態:棚卸し済
-
渡し先レーン:D、必要に応じてA/B
-
原文保持:ON
-
メモ:md/txt派生素材との対応確認が必要
books-md 24件
-
素材種別:書籍
-
ソース種別:book-md
-
キーワード:books
-
渡し先レーン:A/B/D
-
派生先DB:学問概念DB / 星・診断パターンDB / 学習コンテンツDB
-
原文保持:ON
canon 13件 + articles/canon 11件
-
素材種別:正典または準正典
-
キーワード:正典 / 03-commonplace
-
渡し先レーン:A/D、必要に応じてB/C
-
派生先DB:学問概念DB / 学習コンテンツDB / 星・診断パターンDB
-
原文保持:ON
OCR十大主星11件
-
素材種別:OCR素材
-
ソース種別:OCR
-
キーワード:OCR / 星 / articles
-
渡し先レーン:B/D
-
派生先DB:星・診断パターンDB / 原典・素材DB
-
取込状態:要修正
-
保留理由:OCR崩れ・星名確認が必要
root c*.txt 26件
-
素材種別:文字起こし
-
ソース種別:txt
-
キーワード:articles
-
渡し先レーン:A/B/D
-
派生先DB:学問概念DB / 星・診断パターンDB / 学習コンテンツDB
-
取込状態:棚卸し済または要修正
root p*.txt 11件
-
素材種別:文字起こしまたは制作親素材
-
ソース種別:txt
-
渡し先レーン:D/A
-
派生先DB:制作資料DB / 学問概念DB
-
保留理由:プロンプト部分と理論部分の切り分けが必要
登録時の判断ルール
原文保持をONにする
-
正典
-
準正典
-
書籍
-
外部記事
-
OCR素材
-
文字起こし
-
出典確認が必要な素材
原文保持をOFFにしてもよい
-
すでに派生DBで本文化済み
-
単なる運用メモ
-
ファイル数だけを管理する集約ページ
保留理由を書く
-
出典不明
-
OCR崩れ
-
重複疑い
-
正典か制作資料か不明
-
A/B/Cのどこへ渡すか未確定
-
著作権・引用扱いに注意が必要
登録後の派生ルール
Aレーンへ派生
条件:
-
定義、理論、思想、体系説明として使える
-
教材の概念説明になる
派生先:
-
学問概念DB
-
学習コンテンツDB
Bレーンへ派生
条件:
-
星、干支、診断文、カード文へ使える
-
恋愛・相性・人物診断へ展開できる
派生先:
-
星・診断パターンDB
-
学習コンテンツDB
Cレーンへ派生
条件:
-
キャラ、会話、EP、世界観素材として使える
-
九条巡の診断室の物語・教材演出に使える
派生先:
-
登場キャラDB
-
物語・エピソードDB
-
学習コンテンツDB
Dレーンに残す
条件:
-
親素材として残すべき
-
制作資料DBへ分ける前の混合素材
-
出典確認、重複確認、OCR修正が必要
派生先:
-
制作資料DB
-
タスクDB
次アクション
-
html 85件を外部記事親素材として登録候補化する
-
docx 26件を原本素材として登録候補化する
-
books-md 24件をA/Bへ派生できる書籍素材として登録する
-
canon 13件 + articles/canon 11件を正典 / 準正典に分けて登録する
-
OCR十大主星11件を要修正状態で登録し、Bレーンへ派生する
完了条件チェック
-
原典・素材DBの実DB構造を確認した
-
不足していたプロパティを追加した
-
素材種別ごとの入力テンプレートを作った
-
html/docx/books/canon/OCR/txtの登録方針を作った
-
A/B/C/Dへの派生ルールを作った
-
実素材を5〜10件単位で登録する
-
既存素材のプロパティを新テンプレートに合わせて更新する
-
重複候補を確認する
メモ
D-07はテンプレート定義として完了。原典・素材DB側にも必要なプロパティを追加済み。次に進めるなら、D-12で投入前チェックリストを作ると、D-07/D-08の運用を毎回確認できるようになる。