请问是否支持‘ocr’啊?该用什么参数?

使用问题 · 211 次浏览
craming 创建于 2024-07-08 10:11

请问是否支持‘ocr’啊?该用什么参数?


M-cc 2024-07-09 17:11 :

没理解你的需求,这是一个处理pdf文件的动作,什么需求需要在这个动作中用到ocr?

回复内容
craming 2024-07-10 06:54
#1

我需要把我的电脑里的pdf文档做ocr识别。一方面,ocr之后,可以支持关键词搜索。另一方面,更重要的是,ocr之后,可以利用通义千问的qwen-long对文档进行分析、概括、提问。

由于pdf文档比较多,所以需要在无GUI的情况下自动执行ocr

M-cc 2024-07-10 08:44
#2
回复 craming :

我需要把我的电脑里的pdf文档做ocr识别。一方面,ocr之后,可以支持关键词搜索。另一方面,更重要的是,ocr之后,可以利用通义千问的qwen-long对文档进行分析、概括、提问。

由于pdf文档比较多,所以需要在无GUI的情况下自动执行ocr

这种属于个人需求,动作不支持。这比较简单,可以自己写一个动作转图片后自动进行ocr。

craming 2024-07-10 13:44
#3

转图片的方式,我试过。不过有两个问题:
1、pdf里有了页眉页脚(作为页码)后,就无法转图片

2、在没有页眉页脚的情况下,可以转图片。然后ocr。可是ocr的成果,无法保存在pdf文档内,只能另存。

回复主贴