Doc2X识别(改)

Doc2X识别(改) 公开 已发布

如何安装动作?

适用于
分类(旧)
图片操作 文本处理

Musk 吴赤侠 卧默人 五角星 哔哔小子3000 9 人赞了这个动作


更多信息
分享时间 2024-04-26 18:29
最后更新 2024-08-12 11:09
修订版本 26
用户许可 -未设置-
Quicker版本 1.43.11
动作大小 154.9 KB

分享到

【本动作基于或参考如下动作开发:https://getquicker.net/sharedaction?code=2dcf0ed8-742b-400f-f2ae-08dc63a5522a
「公式识别,按住ctrl纯公式识别」

简介


Doc2x的qq群:812422873,使用此动作出现问题可以@喵喵喵,也可以在最下面的反馈栏留言。

Doc2x:支持两栏三栏等复杂排版,将内容识别为md,或者是doc,latex等文件导出,支持公式识别,表格识别。
每日免费额度:500次图片识别,也可以当成普通文字OCR来使用

目前doc2x未开放api接口,本动作应该暂时不可用。

基本使用

普通文本公式混合识别:鼠标单击动作,或右击-信息-设置快捷键,并使用快捷键激发。

纯公式识别:按住ctrl,同时点击quicker动作

剪切板识别:鼠标右击动作,点击剪切板识别,则剪切板识别开启。此时识别在剪切板的图片。

粘贴到word:普通的md复制到剪切板后,使用Latex公式转换动作可以转换word中的latex公式,但此动作不适用于wps。

pdf识别:选中文件夹,文件,文件夹+文件,可以识别文件内容以及文件夹中不含子目录的pdf文件。可以右键设置内容。

百度翻译:默认关闭。百度翻译API,如何申请参考https://zhuanlan.zhihu.com/p/375789804   默认关闭,翻译开关在设置百度翻译中,翻译效果如下(由mathjax支持,一个小html页面)

自动化:我是这么用的,把需要截图的地方和笔记分屏放,然后自动化模式在运行动作的时候在固定的位置截图,然后单击笔记,加上跳转到最后的快捷键,然后ctrl+v。


设置内容

附加到末尾内容:比如---,在markdown软件中可以在末尾加入一道分割线,对识别PPT有用。

替换文本表达式:替换识别容易出现的错别字等等,䢃尖|劈尖,格式参考替换文本

设置最大宽度像素:开发者说训练的像素没那么高,低一点精度反而会高一些。


文本改进内容

  • 导出md到剪切板时将html的图床标签<img>转化为![](http)格式。
  • 多个行间公式在一起时,合并为一个行间公式

 替换文本表达式:

粘贴下面的内容可以确保行内公式$与公式间不含空格,用于Obsidian

\s*(?=\$(?!\$))|||
(?<=(?<!\$)\$)\s* |||

最近更新

修订版本 更新时间 更新说明
26 2024-08-12 11:09 bug fix
25 2024-08-11 23:19 选中文件、文件夹可识别其中的pdf文件
24 2024-08-01 12:55 修一下bug

最近讨论