Android百度OCR文字识别开发汇总

Android百度OCR文字识别开发汇总

最近一段时间经常到厦门市图书馆看书,果然还是更喜欢阅读纸质图书的感觉。虽然电子图书查找、标注、共享、……等等功能非常方便,但是确有几个缺点。

  1. 更新不及时,很多图书馆的书籍没有Kindle版本,没有微信读书版本,……
  2. 回看很麻烦,不像纸质书翻页就能完成,需要不断跳转
  3. 打扰太多,总是能收到各种通知,打扰阅读过程。
  4. ……

阅读图书馆藏书有一个很大的限制。

不能标注,公共图书不能随便画重点。

纸质书籍的一些共同缺点。

  1. 不方便查找,很难根据关键字查找内容
  2. 不方便共享

OCR技术的出现可以弥补纸质图书的缺点,通过OCR可以对纸质图书进行局部数字化。

局部数字化的内容,便有了电子书的优点,可以查找、标注、共享、……

神马笔记的OCR实现方案采用的是百度OCR文字识别SDK。

基本的OCR识别流程

  1. 图片化,通过拍照、扫描等手段,将纸质书转化成图片
  2. 文字识别,使用百度OCR将图片转化为文字
  3. 重新组合文字,OCR后的文字以行为单位,需要重新组合成段落。

第1步使用拍照或者扫描等手段可以轻松实现。

第2步使用百度OCR完成,只需要调用相应接口提交数据即可得到识别后的文字。

第3步则需要编写代码来完成。

神马笔记OCR实现的各个版本。

版本 描述
4.0.0 选择已有图片(拍照或者扫描)调用百度OCR接口实现图片转文字。
4.1.0 调用手机的拍照功能,实现拍照后直接进行文字识别。
4.2.0 中文语境下将半角符号转换为全角符号(英文符号转中文符号)。
4.3.0 将识别结果重新组合成段落。
4.4.0 换行后自动缩进,保证段落格式的一致性。
4.4.1 优化智能分段功能。
  1. 半角符号转全角符号,对齐符号
  2. 智能分段
  3. 换行后自动缩径

第3步经过以上过程优化后,基本上可以还原纸质图书的排版。

OCR功能至此结束。

新的问题:如何将OCR结果保存到笔记中?

  • 纸质书籍图片化

  • 优化后的OCR识别结果
1
2
3
4
5
6
7
8
9
10
11
12
13
个人看的,所以保持字迹清晰很有必要。

  基本原则

  1.笔记里的事留在笔记里。如果你们当中有任意一方将不愿意说出口的话写在笔记里,那么请务必遵守这条原则,也就是说,不论发生任何事情,这件事只能在笔记里讨论。

  2.在笔记里畅所欲言。不要发火。妈妈们请尽量让孩子感到自己在你面前可以畅所欲言。如果担心写下某些内容会惹你发火或是受到惩罚,孩子是一定不会写的。反之亦然。妈妈必须确定自己写的是心里话,而孩子读后不应因为不中听而生气发火。只有做到这一点,你们才能敞开心扉,坦诚地沟通,如果不敢放胆说话,效果就会大打折扣。

  3.坦诚。前面已经提到了是吗?好吧,重要的事说三遍:要坦诚,要坦诚,要坦诚。

  4.别忘了寻找乐趣。这份笔记并不是仅仅用来讨论敏感问题的,它还可以为我们的亲子关系开拓一个新的天地。偶尔写些傻

  69