books.zip は書籍文字起こし・OCR系の原典。まずは重複確認を行い、公開教材ではなく内部参照素材として扱う。