零件字符编码示意图
1、由于不同车型不同视野以及景深的限制,传统OCR算法存在识别不稳定的问题,因此最终确认深度学习OCR的方案。
2、由于终端用户的车间是已经投入生产的状态,如果采用PC-base的方案,电气方面以及工控机的安装问题都需要重新设计,无法在现有产线的基础上进行使用,同时考虑到集成商的成本问题(现场环境复杂,光源还需定制),最终采用智能相机的方案。
实际调试过程中发现,不同景深下(光学近大远小的原理)字符大小有所差别,同时也无法避免个别车型的字符比较模糊的问题。
首先在成像方面,通过调整镜头的光圈和对焦位置,确保不同景深下字符相对清晰,避免某一车型的字符过于模糊,然后对测试阶段的车型采图进行深度学习字符训练打标。
在训练完模型后进行测试验证,发现部分字符定位不准,会出现定位框偏移的情况。
(1)查看集成商人员的打标训练集后发现打标不规范,因此需要重新打标。在打标的过程中需要特别注意打标规范,严格按照打标手册进行。同时由于相机分辨率较高,大视野下字符所占像素较少,为了保证数据的稳定性,在打标规范性的基础上需要加大训练集的数量。
(2)原始训练集85张,实际训练集需要200张左右,如果车型增加,训练集也要增加且需要覆盖所有车型、所有景深以及所有打光环境。
由于车型的限制,部分车型无法使用传统条光进行打光。
集成商联系光源厂商进行尺寸定制。
字符识别效果图
● 深度学习算法相比于传统的OCR算法能更好的适应复杂场景的应用。面对不同景深的字符以及不同打光环境下的字符,都可以加入训练集进行训练,保证算法的稳定性,在识别能力方面也比传统OCR更强。
● 相比于传统OCR的设备成本而言,智能相机的方案能够避免加密狗、工控机等额外设备带来的问题,进一步控制了设计成本,对于成本要求比较高的终端用户是一个重要优势。
● 目前样机已经能够很好适配现阶段多种车型,识别成功率在98%左右,终端用户对于效果表示满意,通过OCR很好地解决了客户无法追溯零部件来源地的问题,完善了用户的质量追溯体系。
● 对于集成商来说,在测试的过程中进一步巩固了调试人员自身的视觉水平,积累了视觉项目的经验,同时该项目也是集成商在汽车制造行业的第一个成功案例,扩大了集成商的影响力。
可点击下方观看现场效果视频