Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

PPOCRLabel没看到关键信息提取怎样标注 #127

Open
jiangming7301 opened this issue Dec 16, 2024 · 1 comment
Open

PPOCRLabel没看到关键信息提取怎样标注 #127

jiangming7301 opened this issue Dec 16, 2024 · 1 comment

Comments

@jiangming7301
Copy link

我是用PPOCRLabel工具时,没看到怎样标注关键信息,?

@GreatV
Copy link
Collaborator

GreatV commented Dec 16, 2024

在使用 PPOCRLabel 工具时,如果你需要进行关键信息的标注,但没有发现相关操作方法,可以按以下步骤进行排查和尝试:

1. 检查自动标注功能是否正常运行

根据你提供的信息,执行自动标注后图片上没有任何标注,但终端会显示 "Using model from paddle"。这可能表明模型加载或自动标注功能出现了问题。你可以尝试以下方法:

  • 确认环境配置是否正确,尤其是 PaddleOCR 的依赖库是否已正确安装。
  • 检查是否加载了适配的模型。PPOCRLabel 的自动标注功能依赖于 PaddleOCR 提供的模型支持,确保所选的模型与任务类型(如文本检测或表格识别)相符。
  • 使用最新版本的 PPOCRLabel 工具,因为旧版本可能存在自动标注功能的 bug。参考 Issue #112 中提到的问题,确保你的工具是最新版本。

2. 手动标注关键信息

如果自动标注无法满足需求,你可以选择手动标注:

  • 在工具界面中,手动框选需要标注的关键信息区域。
  • 使用标注工具中的功能为每个区域定义具体的标签(如字段名、内容等)。

3. 特定场景的标注方法

  • 表格识别数据集标注:
    如果你需要标注表格类数据,参考 Issue #106。表格标注时需要注意生成的 gt.txt 文件中的 HTML 格式是否正确,并确保标注顺序与表格结构一致。
  • 不规则合并标注:
    如果是处理不规则宽度的表格或区域,参考 Issue #92 提到的方案,手动调整标注顺序并补全数据。

4. re模型标注的限制

如果你需要标注关系抽取(re模型)数据,注意到在 Issue #94 中提到,PPOCRLabel 当前版本可能无法支持 id 和 link 字段的标注,你可能需要通过其他工具或手动方式补充这些字段。

5. 优化操作体验

  • 如果工具在使用中出现效率低的问题(如删除图片后跳转到第一张图片),可以参考 Issue #102 中的反馈,等待官方更新优化。
  • 确保每次操作后,标注数据已保存,并在左侧列表中确认标注状态。

总结

对于关键信息的标注:

  • 确保使用正确的模型并加载成功。
  • 优先尝试手动标注关键信息。
  • 检查工具版本并关注官方 Issue 提供的解决方案。

如果问题依然无法解决,建议在 PPOCRLabel Issue 页面 提交详细问题描述,获取开发者的支持。


Response generated by feifei-bot | chatgpt-4o-latest

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants