Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于PDF文档转换问题和建议 #963

Closed
Tian14267 opened this issue Nov 15, 2024 · 5 comments
Closed

关于PDF文档转换问题和建议 #963

Tian14267 opened this issue Nov 15, 2024 · 5 comments
Labels
enhancement New feature or request

Comments

@Tian14267
Copy link

**当前功能有以下问题:
1:表格数据以图片形式展现的。这个希望报个数据能结构化输入,不要在用图片;
2:标识识别不准。所有标题都识别成了一级标题。需要按照标题自己的等级进行识别。一级,二级,三级,等等。
3:涉及到公式的地方,md文件展示的很差。建议公式改成图片形式展示就行了。
**

@Tian14267 Tian14267 added the enhancement New feature or request label Nov 15, 2024
@myhloli
Copy link
Collaborator

myhloli commented Nov 15, 2024

  1. 表格可以通过修改配置文件手动开启解析功能
  2. 标题分级目前没有支持,实现方案还在调研,可能会在后续版本加入
  3. 公式不能做到100%渲染,后续会考虑通过后处理的方式提高公式的渲染成功率

@myhloli myhloli closed this as completed Nov 15, 2024
@Tian14267
Copy link
Author

  1. 表格可以通过修改配置文件手动开启解析功能
  2. 标题分级目前没有支持,实现方案还在调研,可能会在后续版本加入
  3. 公式不能做到100%渲染,后续会考虑通过后处理的方式提高公式的渲染成功率

好嘞,感谢回复。表格的配置在哪里开启。能给一下样例吗。公式的分级,我看这个marker可以做,但是只能做到二级标题。我感觉最起码要到三级标题才有用。公式我感觉不需要提取内容,识别到位置直接截图展示也可以了。

非常期待能尽快进行改进和展示。做到上面几点,这个工具就非常nice了

@Tian14267
Copy link
Author

@myhloli 哈喽,不好意思打扰了。我没找表格识别的开关呀。现在的表格都直接截图的~

@myhloli
Copy link
Collaborator

myhloli commented Nov 15, 2024

在配置文件的table-config项目中配置enable为true即可

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

2 participants