V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
3297269
V2EX  ›  机器学习

CAD 智能识图 预处理图片分割问题请教

  •  
  •   3297269 · 2023-10-31 09:57:54 +08:00 · 625 次点击
    这是一个创建于 399 天前的主题,其中的信息可能已经有所发展或是发生改变。

    坐标设计院,应科改要求,领导想做一些智慧创新的东西,被临时抓来干活。。。 想实现的是 CAD 智能识图功能,我想的第一步是,在图纸上标注出说明/尺寸标注/表格等图元,通过深度学习,达到识别图元区域并输出,后续再对输出的区域做 OCR 识别。 现在我手头有 1000 张左右的 CAD 扫描图纸,分辨率极高,尺寸大约是 12000×8000 像素。我尝试着标注了几十张,将其 resize 到 640×640 像素,图纸直接马赛克了,看不清任何信息...学习的效果也非常非常差。

    我有几个问题请教,希望能给我一个大概的思路 1.该怎样对图片做预处理以在不丢失过多特征的前提下缩减像素?如果直接简单粗暴将每张图裁剪为等大的几份,会有一些图元被分割,这样影响学习效果吗?是否有开源项目可以裁剪出有内容的几小块,将空白舍弃? 2.如果学习时将图片裁剪了,那么识别时是否也应该先裁剪再分别输入?这样会丢失掉被分成两段的图元信息吗? 3.是否有现成的轮子可参考? 问的问题非常小白,各位大佬不吝赐教,感谢!!

    标注完的 CAD 图纸大概长这样 https://imgur.com/a/HYDdEQz

    6 条回复    2023-11-01 09:13:37 +08:00
    tool2d
        1
    tool2d  
       2023-10-31 10:04:38 +08:00   ❤️ 1
    你先把大图用传统的图片处理方法,分割成一小部分一小部分。这样才好有针对性训练图片分类吧。

    话说你这个需求,和带表格的 OCR 感觉没啥区别了。
    alexsz
        2
    alexsz  
       2023-10-31 10:12:26 +08:00   ❤️ 1
    这么大的图,就算模型已经训练出来了,实际检测的时候 上传图片要不少时间吧
    3297269
        3
    3297269  
    OP
       2023-10-31 10:35:09 +08:00
    @alexsz 实际检测时应该在本地,不上传
    3297269
        4
    3297269  
    OP
       2023-10-31 10:36:28 +08:00
    @tool2d 请问如果训练时分割了图片,使用时用完整图片,效果会不好吗?
    paopjian
        5
    paopjian  
       2023-10-31 10:39:12 +08:00   ❤️ 1
    没搞懂你的需求,你现在是需要分割图片吗?我看图片上这些留白都很清楚,那直接用传统 cv 的侵蚀扩展再配合 reseiz 不就可以标记出图片的位置,再微调下边框就可以切出来了
    或者直接试试 paddleocr 那个 PP-Structure 直接分析图标结构?
    3297269
        6
    3297269  
    OP
       2023-11-01 09:13:37 +08:00
    @tool2d
    @paopjian
    谢谢,我先去学习了解一下
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3760 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 04:18 · PVG 12:18 · LAX 20:18 · JFK 23:18
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.