产品经理入门:图像识别的标签训练
图像识别算法现在已经有很多开源的,但在特定业务下仍然需要企业自己通过开源模型进行训练,获得对应业务领域的标签合集。
比如做医学的五官患者面部的疾病识别,我们从数据采集到图像算法建立,可以分为3个步骤。每个步骤产品经理输出的产品设计方案是有非常大的区别。
那些打算加入图像识别领域的产品经理,搞清楚产品经理的智能与分工,定义清楚输出的产品设计方案。
1.数据采集
数据采集是产品经理提供一套可以获得图像源数据的产品设计方案,比如在医院场景里,想通过图像识别某个患者病症,就需要收集到对应患者的原始图像数据。
采集方式可以用手机或者iPad等进行拍摄,图像数据可以有平面图片和3D图片,但原理都一样的,如下图是平面与3D图像之间患者照片
左边汽车代表了3D图像,支持三维空间中的体积和位置等特征,右边是仅用x,y坐标标注的平面图像。后者在标注处理上更容易,都会被遮挡所影响,但是平面图像在处理时候一定要给予方向,否则会影响应用。
市面上有非常多的数据标注开源软件,而建议大家选择比较稳定的labelimg,它是一款开源的基于python编写的标注工具,可以将标注文件导出为 PASCAL VOC 格式的 XML 文件或YOLO格式的TXT格式。在其默认版本中,labelimg 仅提供一种标注类型——边界框或矩形。但是,也可以使用 GitHub 页面使用代码添加另一个形状。
在数据采集,产品经理要关注当前图像数据核心采集操作,是选择平面还是边框还是多边形。从而提升采集软件的采集效率。有时候还可以支持多人协同采集,增加了采集速度
2.标签软件集成与打标签操作
有了采集软件,我们就要完成标签操作。大概步骤如下
运行labelme后,打开文件夹
使用多边形工具勾勒目标
勾勒完成后创建标签
微调边框,点击编辑多边形,有很多操作。
最后存储
由此,产品策划上可以设计出至少2个端,分别是采集端和打标签端,前者负责采集数据,后者负责对数据进行标签特征提取。
在采集软件中其中的标签
并将得到的图像进行处理,处理后得到2类文件:图像文件、以及图像标签文件。图像文件是JPG或者PNG,图像标签文件是JSON等数据格式。
有了以上数据,我们才能开始进入深度模型训练训练,建设图像识别的可能。
图像数据处理后,通过这些图像导入在模型进行特征集合训练,就可以得到算法模型
3.半自动辅助与人工业务操作
训练获得的模型算法之后,就能够开始辅助医疗人工诊断,在诊断过程中以辅助形式帮助人工检查,人工对机器结果进行核对,从而不断调优算法模型。
医学类的数据,一般会根据某个特例疾病的复杂度,来看需要多少样本。在这个阶段,这一点产品经理只是给出展示界面以及人工交互操作入口,同时基于以上管理端、采集端进行功能优化,提升采集效率。
在系统中记录数据日志,展示角色权限,可以让人对识别结果进行判断甚至是调整,不断优化模型识别结果。
4.全自动化操作
以上第三个步骤不断重复,最后实现在特例疾病下完全自动化操作,不需要人工操作就可以完成特殊疾病识别。
也是就是图像采集、标签、训练,产品经理的角色扮演。
-------------------END-------------------