在搜索引擎输入“图像识别”四个字,上千万的搜索结果,已对基于深度学习的图像识别技术做了足够的通俗化科普,学科问题不再赘述。那么标签又是什么鬼?
标签
机器在做图像识别的学习过程中,要对图片进行分类训练,这个类即为标签。一个分类下可以只有一张图,一个图片也可拥有多个标签。但从实际出发,只训练与大众习惯相关的分类标签即可。这就是通用标签。通用标签将图片归类后,随用户调用相关分类而展示。于是我们可以想象,通过识别一张图,即可让用户得到该图的详细信息,如场景、人物、事件、时间等。
商机
在国内,百度、腾讯、商汤、图森、旷世、图谱等都拥有自己的核心技术团队,实现着图像识别领域的商业化。由于该领域学术门槛较高,须强大科研团队,圈外公司很难涉足。同时,现实中的图片几可无限制细分其标签,但并非每个标签都有商业价值。所以直接调用通用标签很难实现商业化。
于是,总给人一个错觉:图像识别虽不是新鲜技术,但仅限于大型的或高精尖的科技公司;面对图像识别领域的商机和创业机会,新进者束手无措。然而业内专家却说,其实通过定制整站图片分类解决方案,完全可以实现人人拥有自己的图片识别技术。
解决方案
图森表示:发现和定义问题比解决问题更重要。这也是定制化图片分类解决方案的精髓所在。通过定制分类标签,可以让对应领域的图像识别更精准,从而实现通用标签达不到的商业化效果,比如这张军事类图:
在各平台的结果是(应平台方要求,前两个不体现平台名)
图① 平台①
或者
图② 平台②
图③ 图森通用标签
显然图③的图森平台的结果更好。技术上讲,图①的识别结果并没有错,但却不是我们所关注的焦点,而图②却是判断错误。其实这个结果抛开算法上的差异,得益于更加精细化的标签分类,以及对应的超大量训练。
商业化
相关行业某位投资人曾说过:定制标签,将图片分类展示,再通过技术配合,可应用于流量广告、相册分类、车辆识别、场景分类等诸多领域。比如上图,准确判断图片类型后,即可在该图片页面投放对应广告(军事或战争游戏等),或者相册中将其归类于军事,甚至联网云端告知该战车具体型号和参数(如果已解密)。
“通过整站图片分类解决方案,1行代码部署,24小时对网站新增网页和图片进行监控和实时图片标签分类,提供100%完整的数据管理后台,帮助网站管理图片资源,实现更好的图片增值变现,”图森产品负责人李祥曦表示,“图森已经在做这样的事情,在包括新浪、新浪微博、央视网等实现了图片分类的原生图片广告变现。”
由此可见,深度订制的图片分类解决方案,即能保障图片识别的准确率,也兼顾了识别效率。图森表示,其通过深度学习定制的标签体系,完全可以助用户再次实现商业化应用。即便不是学术圈出身的公司,也能跻身前沿科技领域,实现创业梦想。
您也可以关注我们的官方微信公众号(ID:ctoutiao),给您更多好看的内容。