公众号
关注微信公众号
移动端
创头条企服版APP

依图声纹识别竞赛夺冠?商汤、微美全息深耕互联网AI视觉

5669
i黑马 2019-09-18 19:06 抢发第一评

近日,在奥地利召开的机器语音国际顶会 InterSpeech 2019 上,国际声纹识别权威竞赛 VoxCeleb Speaker Recognition Challenge(VoxSRC)公布最新结果,依图科技大幅领先海内外多支强队获得冠军,再次展示了世界级人工智能算法实力,充分表明中国声纹识别技术已达世界领先水平。

此次参赛队伍不仅包括约翰霍普金斯大学、法国国家信息与自动化研究所、清华大学、中山大学等海内外知名高校、研究机构,还包含平安科技、NEC、君林科技等各大企业。至此,依图人工智能技术不仅在视觉感知、自然语言理解等领域领跑全球,声纹识别技术也已达世界顶尖水平。

声纹识别是一种通过声音判别说话人身份的技术。如果说语音识别是让机器判断「说了什么」,那声纹识别就是判断「是谁说的」,用于解决生物身份的确认和识别。很显然,使用基于端到端深度学习的方法做声纹识别,拥有大量声纹数据样本,就有了无可置疑的优势。

声纹识别的应用前景非常广泛,比如智能手机锁屏、声控安全门、汽车声控锁等;利用声纹辨认技术,还可以支持智能音箱、智能语音助理等提供个性化服务,比如针对家里的老人和孩子,推荐不同的歌曲、新闻。

但由于声纹识别技术本身的难度很高,这些应用需求大部分还处在探索阶段。这也是到目前市面上能自动辨别说话人的智能语音应用比较少见的一个原因。

在声纹识别领域,VoxCeleb Speaker Recognition Challenge(VoxSRC)是兼具影响力和权威性的国际评测。与常规的声纹识别评测不同,VoxSRC所用的数据量大、来源多样,而且都采集自真实场景,比如会场访谈、室外多人对话,含有各种噪音和杂音,对于算法性能的要求非常高。此外,该竞赛的评估方法非常严谨,因此其结果在学术界和工业界都得到认可。

成立 7 年来,依图在视觉感知、自然语言处理、语音识别、智能决策等多算法领域发展,并且都独占鳌头。这次在全球声纹识别权威竞赛 VoxSRC 中夺冠,是对中国自有 AI 技术能够引领世界的又一个绝佳证明。

依图这次创下纪录的声纹识别精度水平,已经可以满足基本的智能声纹应用需求,比如在线交易支付的动态声纹密码、个人账户登录的声纹动态口令登录。试想,社保局安装声纹身份认证系统后,就能实现安全的远程身份认证,让“信息多跑路,群众少跑腿”,为百姓生活带来极大的便利。随着技术的不断成熟和融合,声纹识别技术将逐渐融入我们的日常生活,产生巨大的应用价值。中国自研的人工智能技术,也将持续推动和引领全球技术发展,力争成为行业标杆。

近年来,随着人工智能利好政策频出、AI技术逐渐发展成熟,在巨大的市场需求下中国AI产业迅猛发展。相关数据显示,2018年中国人工智能市场规模约为238.2亿元,增长率达到56.6%,2019年市场规模预计达到近280亿元。而在蓬勃发展的人工智能产业中,计算机视觉领域尤为火热,不单单依图的声纹识别优秀,商汤、旷视、WiMi微美全息的计算机视觉同样格外令人瞩目。

商汤科技成立于2014年,是国内一家致力于计算机视觉和深度学习原创技术的创新型科技公司,提供人脸识别、语音技术,文字识别,人脸识别,深度学习等一系列人工智能产品及解决方案,帮助各行各业的客户打造智能化业务系统。作为全球领先的人工智能平台公司,商汤科技为中国科技部指定的国家新一代人工智能“智能视觉”开放创新平台。同时,商汤科技也是“全球最具价值的AI创新企业”,公司总融资额超过16亿美元,估值超过45亿美元。

商汤科技的市场占有率居多个垂直领域首位,涵盖智慧城市、智能手机、互动娱乐及广告、汽车、金融、零售、教育、地产等多个行业。目前,商汤科技已与国内外700多家世界知名的公司和机构建立合作,包括美国麻省理工学院、高通、英伟达、本田、阿里巴巴、苏宁、中国移动、银联、万达、华为、小米、OPPO、vivo、微博等。

此次商汤集团智能视觉国家新一代人工智能开放创新平台将在四个方面发挥核心使命,包括通过超算系统、训练系统、智能视觉工具链等核心基础的研发、数据系统的构建,在基础研究和核心技术上与国际保持同步研发水平;实现智能视觉底层关键技术和共性支撑技术的突破,促进智能视觉技术与多行业的快速结合、产业赋能;建立人工智能国际化人才体系和培养国际化人才;通过人工智能赋能,创造以众创空间、孵化器为代表的大众创业、万众创新的生态环境,促进新旧动能转换。同时,商汤集团将成为助推粤港澳大湾区打造科技创新新高地,推动科技全球化布局的领导力量。

国内的另外一家以全息视觉为引导的企业微美全息,在AI视觉领域也是较为突出。微美全息专注于计算机视觉全息云服务,微美全息覆盖从全息计算机视觉AI合成、全息视觉呈现、全息互动软件开发、全息AR线上及线下广告投放、全息ARSDK支付、5G全息通讯软件开发、全息人脸识别开发、全息AI换脸开发等全息AR技术的多个环节,是一家全息云综合技术方案提供商。

微美全息十分注重底层技术的研发,凭借多年来在计算机视觉领域的耕耘与积累,微美全息已经完成了从0到1的技术沉淀、打磨,微美的AI视觉技术已经到了成熟落地,各项技术指标也达到了行业的领先水平。技术成熟后,微美着重规划了从1到N落地应用,其中机器人是规划中非常重要的一环。微美全息云产品布局商业应用场景主要聚集在家用娱乐、光场影院、演艺系统、商业发布系统及广告展示系统等五大专业领域。

微美的全息图像处理功能定期进行优化和改进,包括两项核心技术:全息AI面部识别技术和全息AI面部变化技术。由于视频处理和识别技术的发展,微美基于图像检测、识别、模板匹配、图像动态融合和替换的全息AR广告和全息成像服务目前在行业中处于领先地位。

微美云息技术研发以满足客户需求和自身业务发展为目的,以计算机图形图像处理技术为基础,AR全息技术为核心,各环节技术成熟。

此外,我国计算机视觉的发展与国外有着不同的应用市场。根据IDC市场跟踪,2018年我国计算机视觉技术输出规模最大的三个行业是政府、金融和互联网。而国外计算机视觉技术则主要输出于消费、机器人(及机器视觉)、智能驾驶行业。不过,有业内人士指出,随着我国计算机视觉的不断发展,其也将与更多行业进行全方位地深入融合,这意味着计算机视觉市场仍有巨大的潜力。

在此背景下,聚焦于计算机视觉领域的商汤、旷视、WiMi微美全息等企业将值得期待。与此同时,我国人工智能的发展也将围绕计算机视觉等核心领域展开,在人工智能相关政策的推动下,计算机视觉也将继续满足各行各业的需求,推动产业的转型升级。

声明:该文章版权归原作者所有,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系。
您阅读这篇文章花了0
转发这篇文章只需要1秒钟
喜欢这篇 0
评论一下 0
凯派尔知识产权全新业务全面上线
相关文章
评论
试试以这些内容开始评论吧
登录后发表评论
凯派尔知识产权全新业务全面上线
阿里云创新中心
×
#热门搜索#
精选双创服务
历史搜索 清空

Tel:18514777506

关注微信公众号

创头条企服版APP