【优质问答】对文件进行ocr的功能优化

随便聊聊 · 417 次浏览
summer22 创建于 3天14小时前

感谢作者提供了这么好的ocr动作。我根据个人习惯修改的时候发现能对图片文件直接ocr,

我加了这两行,顺便把ctrl按键的开关加到菜单了,修改为默认不按ctrl就读取剪贴板,勾上就是原来的。

大家需要的话可以试试。

 

------

另外,这个过程中发现很奇怪。做了ctrl菜单后,点击设置竟然默认进行了ocr。于是乎把下面这两个调换了一下顺序才正常了。

-----

我是基于38版本改的,没想到新版已经支持文件ocr了。。。。。刚才看到代码

『扪』 最后更新于 2025/4/11

回复内容
summer22 3天14小时前
#1

不对,作者大大的这个版本做到了选中就复制,比我那个还要自己复制一遍效率高多了。

summer22 3天14小时前
#2

下次能把微信ocr也加上就好了,我参考【交互ocr】,放在本动作ocr mode6,可行,就是莫名其妙修改了表单后提示文件超过400k。比pixpin好的地方在于不会有后台占用,就是精确度稍微低了一点点

『扪』 回复 summer22 3天13小时前 :

微信OCR精度不如现有的几个接口,就不考虑添加了,日常使用PixPin和Quicker的OCR接口绝对够用了

『扪』 3天13小时前
#3

我正在测试开发功能:对选中的多张图片文件进行批量OCR识别,并按顺序将识别结果自动追加到文本窗口中  

有什么需求尽管提哦😁,欢迎提出一些具有建设性的意见和功能需求~


summer22 回复 『扪』 3天13小时前 :

有一个强迫症的bug,就是查看历史记录,没有提供删除或者情空的功能,要是ocr多了可能会大海捞针。

还有一个刚刚想到的使用场景,比如说批量ocr了之后,查看历史记录,加个标签或者筛选?一眼能看到是文件ocr的,然后选中能集中查看结果。

summer22 最后更新于 3天13小时前
『扪』 回复 summer22 3天13小时前 :


先记下了,倒是可以搞成这样,不难实现

『扪』 最后更新于 3天13小时前
summer22 回复 『扪』 3天13小时前 :

大佬,这样可以。我觉得倒是不用全截取识别内容形成标题。比如加判断,然后是文本跟剪贴板的就截取前几个字符+时间(正好可以鼠标悬停),如果是文件就读文件名取前几字符。

还是说,您觉得文本跟剪贴板就不重要了,默认时间,然后文件ocr的话,才读文件名+时间(可能时间也不太重要?)

『扪』 回复 summer22 3天13小时前 :

额,可以整理组合一下这几个要素:
1.识别来源

2.时间

3.识别内容的前几个字符

4.如果来源为文件,该如何取舍?文件名应该咋加进去?
...等等

你有想法的话,可以把这些格式整理发出来,可以按你的意思修改😊

『扪』 最后更新于 3天13小时前
summer22 回复 『扪』 3天12小时前 :

我构思了一下,感觉想法一般,你可以看看。

根据实际场景,来源可分为文件img与非文件,既然如此,那么只要让文件img凸显即可,原来想用图标,后面觉得【命名方式】或许可以区分。

对用户来说,太精细的时间 区别成本过高。那么针对不同的识别来源,命名可以相反。参考心理学7±2记忆原则,,对于非文件名取9如:

我的时间管理...jpg|今天天气真好,我...2025-04-10-20:19:21 //取文件名前5字符+后缀

我的运动计划...png|今天完成了3组...2025-04-10-21:19:21

2025 - 04 -10- 20:19:25|今天天气真好,我打开了//对于非文件名取前9字符


再重新回归历史记录的需求。我认为可以增加对来源路径的记录,这样的话,鼠标悬停预览就成了:

我的时间管理大师计划.jpg|D:\Softwares|

今天天气真好,我决定xxxxx(省略无数字,


打开后提示消息,可选点击后运行:打开对应的文件

summer22 最后更新于 3天12小时前
summer22 回复 『扪』 3天12小时前 :

燃烬了hhhh可以看看其他小伙伴有没有好想法😊

『扪』 3天12小时前
#4

不得不承认,兄台你是真的有水平的!👍 每次提的建议都特别走心,一看就是认真玩过的大佬~感谢支持,新版本已经在路上了!🚀

summer22 回复 『扪』 3天12小时前 :

不敢当不敢当,还是作者辛苦!希望动作发展越来越好😊

『扪』 2天23小时前
#5


好消息!以下新功能上线啦🎉 快来试试看~ 有任何想法随时告诉我哦💡

【新增】支持直接「选中图片文件」进行「批量OCR识别」👍(选中文件后,长按`鼠标右键`有惊喜哦~)

『扪』 最后更新于 2天23小时前
summer22 回复 『扪』 2天20小时前 :

我在资源管理器中长按右键没有反应:先依次选中两个jpg,长按右键没有。或者依次选中,调出面板,长按右键,也没有。第三,等待批量ocr完成后,右键,也没有。

除了这个不得要领之外,批量ocr挺好用的,给了一个识别的进度条让人觉得很安心。

btw,今天下载了pixpin的最新版发现占用竟然只剩下8m,给我震撼了,你说得对啊all in one还得是pixpin。

summer22 回复 『扪』 2天19小时前 :

有个问题,它41版本不支持上下文菜单识别了(剪贴板识别),现在调出上下文菜单后并点击这个动作,会需要自己重新截图,而之前是可以的。

summer22 回复 『扪』 2天19小时前 :

额文件识别也失效了

summer22 回复 『扪』 2天19小时前 :
看了一下,是不是把某些代码停用了
『扪』 回复 summer22 2天19小时前 :


检查是否开启了上下文菜单功能?

『扪』 最后更新于 2天19小时前
summer22 回复 『扪』 2天19小时前 :

开启了,40版本都是正常的

summer22 回复 『扪』 2天19小时前 :

还是不行。不过倒是发现了普通ocr截图的时候弹出文本框的方式改变了

summer22 最后更新于 2天19小时前
summer22 回复 『扪』 2天19小时前 :

看一下录屏

summer22 2天19小时前
#6


summer22 回复 summer22 2天19小时前 :

这个是一张图片,然后我用2345图片浏览器打开了

summer22 回复 summer22 2天19小时前 :

在这个状态下,调用系统上下文菜单,会自动复制【文件】,也就是说这是本动作识别为文件的状态。而比如说,我贴图再调用系统上下文菜单,会自动复制【图片】,此时本动作会要求用户再截图一次

summer22 回复 summer22 2天19小时前 :
『扪』 回复 summer22 2天19小时前 :

【修复】修复仅选中一个图片文件时,会识别出错的bug

确实是把相关代码删除了🤣

『扪』 最后更新于 2天19小时前
summer22 回复 『扪』 2天19小时前 :

这直接再创建了系统上下文菜单吗?有点厉害啊,就是重复了,我看看自己把系统的上下文菜单关了有没有效果

『扪』 回复 summer22 2天19小时前 :


因为需要支持快速截图直接OCR的功能,所以没法关闭'图片内容'里面的二级菜单

『扪』 最后更新于 2天19小时前
summer22 回复 『扪』 2天19小时前 :

噢噢这样,我觉得支持快速截图挺方便的。没事,我看看代码,看能不能写个开关

summer22 回复 『扪』 2天19小时前 :

又有个bug,就是我截完图,ocr完了,它不会自己返回或者中止。会接着判断剪贴版内容,提示“未检测到剪贴板内容改变”

summer22 回复 『扪』 2天19小时前 :

这不应该是检测到ocr完了之后输出一个success判断,,然后根据这个判断来停止后面的剪贴版操作吗

『扪』 回复 summer22 2天19小时前 :

需要发送【在『动作右键菜单』调试运行后的网址】给我 😊,不然没法判断你的意图


「教程」调试运行动作,并上传调试结果,获得网址 - Quicker

https://getquicker.net/KC/Kb/Article/1044

『扪』 最后更新于 2天19小时前
summer22 回复 『扪』 2天19小时前 :

可以,然后刚刚那个其实不太算bug,你应该是根据ocr文本,用户是否复制,如果没有复制就弹出“检测到剪贴版内容没有改变”,大概是这样的逻辑。如果我ocr后复制了,就不会有弹出

summer22 回复 『扪』 2天19小时前 :

https://temp.getquicker.net/1245455/17c8565f253541d79467f9c15c557556.html

summer22 回复 『扪』 2天19小时前 :

我还上传了录像

summer22 2天19小时前
#7

需要log的话我上传一下

『扪』 2天19小时前
#8


summer22 回复 『扪』 2天19小时前 :
批量没问题了。贴图的识别也没问题了,就是好奇怪啊,我概率性重复出现两个关于图片的上下文菜单。我再排查一下
『扪』 回复 summer22 2天19小时前 :

这是我设置的功能,不是bug哦😂

summer22 2天19小时前
#9


summer22 回复 summer22 2天19小时前 :
最后那个是因为,消息提示在屏幕下方,超过了录屏范围,我手动调了一下
『扪』 回复 summer22 2天19小时前 :

.........(⊙o⊙)…你不要点击"关闭"啊,这样剪切板没有写入识别后的内容,Quicker这边当然检测不到输出了,建议把PixPin这个弹窗设置为不弹出,默认复制结果就好了

『扪』 最后更新于 2天19小时前
summer22 回复 『扪』 2天19小时前 :

不是的,还有一种情况,就是比如我ocr了一张很多文字的图片,然后我在这个小窗口里自己选取后复制了,但是这个时候已经超时了。

summer22 回复 『扪』 2天19小时前 :

就像我们自己使用原生pixpin,贴图后可以自己选取需要的文字,这个是需要一定时间的

summer22 回复 『扪』 2天19小时前 :

当然如说我就是单纯想全部复制,那默认不弹窗就好了。总之,我觉得这个弹窗是很有用的,约等于pixpin原生的自选文字功能

『扪』 回复 summer22 2天19小时前 :

我觉得没必要吧,你把原始的识别结果传入Quicker,在文本窗口里选取你需要的文字就好了

『扪』 回复 『扪』 2天19小时前 :

那好吧,我把这个等待剪切板改变的时间开放出来,用户可自行设置最大等待时长

summer22 回复 『扪』 2天19小时前 :

确实你的做法也挺流畅,那这样这个弹窗的主要功能是什么呢

summer22 回复 『扪』 2天18小时前 :

我刚才想了一下,如果说,用户有编辑选择部分文字的需要,那么不止是要进行选取,可能还有格式化(文本窗口)的功能。但实际情况分为四种,用户是否选择弹窗、用户是否选择开文本窗口。2x2,=4.很明显弹窗跟文本窗口是冲突的。那么就剩下,用户要么开弹窗,要么开文本窗口。开文本的情况下,用户更适合长时间编辑。开弹窗适合短时间选取。都不选就是默认消息提示,全部复制。

summer22 最后更新于 2天18小时前
summer22 回复 『扪』 2天18小时前 :

这样一看自由度好高hhh

『扪』 回复 summer22 2天18小时前 :

【新增】新增功能开关设置:调用PixPin-OCR时,如果超过等待时间剪贴板未改变,则退出动作。 单位:s

summer22 回复 『扪』 2天18小时前 :

👍👍👍

『扪』 回复 summer22 2天18小时前 :

现在自由度应该足够了吧🤔

summer22 回复 『扪』 2天18小时前 :

我很久没用新版的pixpin了。我一直以为这个弹窗是你加的hhhh直到我刚才重新测试了一下原版pixpinhhhhh

summer22 回复 『扪』 2天18小时前 :

不过无伤大雅,这个复制后默认弹出还是很舒服的。更重要的是可以自选小窗编辑还是文本框编辑,还得是大佬出手啊👍

『扪』 回复 summer22 2天18小时前 :


『扪』 回复 summer22 2天18小时前 :

但是如果你在PixPin的小窗里编辑的时间超过了设置的最大等待剪切板改变的时间,那么Quicker动作就会报错退出的,会有一个报错提示消息

『扪』 最后更新于 2天18小时前
summer22 回复 『扪』 2天18小时前 :
报错退出的话,会把截图软件的进程退掉吗?动作自身的弹窗其实无关大局,但是比如说我刚编辑到一半,Quicker动作退出,这个时候软件应该不会自动退出编辑框吧?
summer22 回复 『扪』 2天18小时前 :

我试了一下,没问题的,不影响实际的需求

『扪』 回复 summer22 2天18小时前 :

这到不会导致PixPin进程退出,只是OCR这个动作结束了而已😂,我的意思你你会看到黄色的报错提示消息,可能会有点烦

summer22 回复 『扪』 2天18小时前 :

没关系我会偷偷把每个版本的“提示消息”停用掉😂。不过有个逻辑我没理清楚,想跟你请教一下,我看截图ocr那个子程序,判断剪贴版变化后才会复制text,进而复制到剪贴板。这里如果去掉【if】这个判断,好像也不太影响啊?就直接把剪贴板内容复制过去呗?反正后面还有一个if判断是不是空的。

『扪』 回复 summer22 2天18小时前 :

不太理解你的意思,我感觉没法再优化了,或者你把你修改后的程序步骤截图发过来看一下呗

summer22 回复 『扪』 2天18小时前 :


『扪』 回复 summer22 2天18小时前 :

这样绝对是不可以的,你试着在截图的时候停顿那么几秒,百分百动作会运行失败!
你禁用的恰好是核心部分👀

summer22 回复 『扪』 2天18小时前 :

算了,这样做之后,如果选择了文本窗口打开,那么那就回返回奇奇怪怪的东西

还是按你的方案来吧

summer22 2天18小时前
#10

@『扪』  看到新版本了👍还有之前提到的用户历史记录(词典)删除或者清空功能可以实现吗?

『扪』 回复 summer22 2天17小时前 :

删除或者清空历史记录这个功能随手就能加上,

就是前面提到的对历史记录条目重新进行格式化命名,这个功能工程量比较大,需要关联修改的地方非常多,短期内无法完成了

『扪』 最后更新于 2天17小时前
summer22 回复 summer22 2天17小时前 :

好的好的,这可以放todo细水长流。大佬辛苦了!ocr链条跟动作完善度已经做得很棒了

summer22 2天11小时前
#11

我又来了。我发现这个动作不会主动识别剪贴版。下面我展示我修改的(基于38版),与最新版的区别。场景是,右键长按贴图或者网页图片,(此时系统上下文菜单被调出),使用本动作(最新版)需要重新截图。

例外是,在【剪贴板】动作中,本动作最新版 选定【图片】右键可以实现ocr而无需重新截图。
@『扪』大佬辛苦看下

summer22 最后更新于 2天11小时前
summer22 回复 summer22 2天11小时前 :

等下,好像是要按下ctrl才会自动识别剪贴板。我刚刚试了。是不用重新截图的

summer22 回复 summer22 2天11小时前 :

说起来也不算bug?只要用户在上下文菜单中,同时按下ctrl跟动作本身就行了。

『扪』 回复 summer22 2天11小时前 :


『扪』 回复 『扪』 2天11小时前 :

推荐使用

获取窗口信息 - by 咿呀杀杀 - 动作信息 - Quicker

https://getquicker.net/Sharedaction?code=2d0c27d4-9783-439d-f821-08da38cccadf

summer22 回复 『扪』 2天11小时前 :

好的好的,谢谢大佬

summer22 2天11小时前
#12

我这么改完最新版,执行没啥问题,大佬你判断下有没有必要单独加这个到新版去?不知道有这个需求的人多不多,没必要的话,我自己弄就行。

summer22 回复 summer22 2天11小时前 :

算了,新版这么改完无法识别文件类型。大家别用这个办法了!!还是采用按下ctrl才识别剪贴版的办法好

summer22 最后更新于 2天11小时前
『扪』 2天11小时前
#13

等等,好像真的没法获取「贴图」时的图片文件路径,在这种情况下,应该直接获取剪贴板的图片变量才对

『扪』 最后更新于 2天11小时前
summer22 回复 『扪』 2天11小时前 :

这个简单,设置上下文菜单触发方式(我是右键触发-启动Quicker常用操作-复制并展开上下文菜单),

summer22 回复 『扪』 2天11小时前 :

这样就默认把贴图读到剪贴板

『扪』 回复 summer22 2天11小时前 :

更新了一版动作  :
 【优化】尝试支持直接识别「贴图」文件

summer22 回复 『扪』 2天11小时前 :

可以用,我特地把设置调整为不复制并展开上下文菜单,结果是静默复制ocr结果到剪贴板

回复主贴