pdf 常用操作小工具
当拿到一个扫描版的pdf文件且没有目录的时候, 会比较尴尬
使用步骤:
- 通过京东,当当,豆瓣等网站拿到该pdf书籍的正确目录(当然如果实在获取不到, 只能手动添加少量目录了)
- 拿到目录之后, 将其保存到
./src/main/resources/outlines.txt
中 - 运行
com.km7
包下的PDF.java
, 会分析目录页码, 并生成一个新的pdf文件(out.pdf
) - 源码保存在
PDF.java
中
后续实现:
- 由于目录的格式不好把控, 目前只能识别页码放在最后的情况, 后面会考虑通过缩进或其他方式识别. 如:
第1章 如何分析macOS软件.. 1
1.1 分析环境搭建.... 1
1.1.1 安装Clang.. 1
1.1.2 HT Editor. 2
1.1.3 Homebrew.. 6
其中对于二级,三级等子级目录没有一个统一的标准, 比较难以识别.