分享一下 pdf 书籍识别,加目录,同步的方法

本贴最后更新于 1962 天前,其中的信息可能已经事过景迁

ABBYY FineReader 14.0

识别率据说比 12 高,找了好一会。


书签生成工具

目前市面上大看到的工具都是从 jd,当当,亚马逊找书籍目录,按照页码对应上去。
这种方法只能跳转到每页的开头。当章节起始位置不在开头就还得往下拉。

所以我写了个小工具,可以给识别过或者文字版的 pdf 书籍加上目录,偏移到章节起始位置而不是页头。

imagepng

https://github.com/zwxbest/autobookmark
下面是我识别之后的目录
imagepng

使用说明:https://nizouba.com/articles/2018/11/19/1542605983761.html

目前很简陋,没有时间改进了,应该能满足大部分情况。
代码是自动加水印了,把那个方法调用注释掉就可以,或者换上你的水印。

同步工具

只有坚果云,不是广告,国内唯一可以增量同步 pdf 的。
这样在办公室记了笔记也可以同步回房间。
国外的 dropbox 好像也可以,但是速度和价格都没有优势。

pdf 内容复制方法

ABBYY FineReader 有个问题,我没找到配置的方法。
就是扫描后的文字一复制就会在中间出现好多空格。
我是用 Strokeplus 手势复制,在手势里写 lua 脚本来除空格的。

acSendKeys("^c");
local s = acGetClipboardText();
s = string.gsub(s," ","");
acSetClipboardText(s);

别的也没什么好的办法。

打赏 20 积分后可见
20 积分 • 3 打赏
  • PDF
    26 引用 • 36 回帖 • 1 关注
  • 书籍

    宋真宗赵恒曾经说过:“书中自有黄金屋,书中自有颜如玉。”

    76 引用 • 390 回帖
  • 工具

    子曰:“工欲善其事,必先利其器。”

    273 引用 • 679 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...