Home - HinTak/caj2pdf GitHub Wiki

关于本项目

本项目的目标是转换中国知网 .caj 格式的文献为可选择文本、包含完整大纲信息的 PDF 文件,使用 Python3 编写。

就目前所知,知网下载到的后缀为 caj 的文件内部结构其实分为两类:CAJ 格式和 HN 格式。目前本项目初步支持 CAJ 格式文件的转换,HN 格式仅支持基本文件信息和大纲信息的读取,但在文件内容结构的分析上也取得了一些微小的进展。关于本项目的使用请查阅 README

目录