2020年7月9日-10日,第三届“世界人工智能大会云端峰会”在上海举办,今年腾讯论坛给出的与会主题是“绽放视界想象力”。此次云端峰会汇聚全球人工智能领域的专家学者、业界精英、科技工作者等有识之士,腾讯论坛更是邀请国内外数十位重量级嘉宾,带来5场主题演讲和1场圆桌论坛,进行观点与经验的交流,思想与智慧的碰撞,探讨人工智能的应用与未来。
在腾讯专场论坛上,PCG平台与内容事业群社交基础技术部总经理、腾讯QQ技术负责人黄俊洪受邀出席,介绍了QQ光影研究室在CV领域的研究成果及影像技术体系,包括美颜领域GAN网络,体态、手势识别技术,AI人脸融合、富文本语义联想、语音合成等技术和创新玩法在社交领域的落地案例,同时分享创新领域未来所面临的挑战和技术展望。
QQ构建全面CV技术体系,支撑多场景多产品线玩法落地
“十年AI科技的发展,我们可以看到AI的应用无处不在,医疗,工业,安防,自动驾驶,量化交易,乃至我们常用的手机APP,都能看到AI的身影”,黄俊洪在演讲中指出AI科技的魅力无处不在。而随着AI算法模型能力的不断提升,也依靠算力的增长,越来越多新的AI能力已经达到落地的效果以及性能要求,并可逐步应用于我们的日常生活产品中,而社交AI能力的持续发展也将使社交产品的玩法变得更加丰富多彩。
黄俊洪表示:QQ团队在CV方面建设了全面的技术体系,构建发布器中台,实现对AI能力业务落地的支持。从检测追踪分割等传统任务,到基于GAN的人脸属性、风格迁移,到基于3DMM和自研引擎的Animoji和3D挂件及美妆,再到基于slam的AR技术,都有所储备和布局,在最上层和业务场景有着广泛的结合与落地。
比如基于3D人脸重建+GAN的技术,第一次让用户可以实时编辑自己的年龄。黄俊洪介绍:“在年龄变换的运营活动中,有用户留言说,和家里的老人用了这个功能,看到了家里老人年轻的样子,很感动,很多人以前没有拍照条件,通过AI技术解决了这个遗憾。”除此之外,基于GAN网络可以迅速完成各式各样不同风格的卡通画生成,满足不同用户的诉求;基于人体迁移网络,让用户只需上传一张照片就变身灵魂的舞者。
除了满足终端用户的需求,QQ团队的AI能力以拍摄发布器中台为载体,服务了腾讯公司内部多路产品线,为包括QQ,微视,QQ空间,腾讯视频,Now直播,王者荣耀,QQ音乐、全民K歌等业务提供实时美颜、AR挂件、视频编辑等能力,并通过腾讯云为合作伙伴提供业务支撑。
AI技术仍在高速演进,面对挑战必须践行科技向善
黄俊洪介绍:随着AI技术的推进,使我们对2D图像视频的理解和编辑具备了更大的灵活度和自由度,未来大家会看到更加真实的GAN技术生成的图像和视频 ,一个不存在的场景或者角色都可能栩栩如生的出现在一张图片或者一个视频中。除了2D图像视频领域,基于AI的3D重建和神经网络渲染,在未来也会迎来更大的应用,比如用户可以用非常简单的方式创建自己的虚拟形象。
甚至在语音定制技术方面,QQ团队也在尝试通过积累数万个中文发音人数据去训练一个用户音色向量提取网络模型,再应用多人的高质量语音数据迁移学习到文本到个人音色的映射关系,合成个性化的声音。而这个技术未来也可能应用在一些公益性的场景,比如留守儿童的伴读等等。
黄俊洪表示:更便捷,更真实,更实时的技术必然让我们在面对伪造数据时面临挑战,AI服务也大量需要GPU资源,这对我们后续服务架构也提出了新的要求,AI服务的边界和伦理道德问题同样是一个需要被关注的问题。只要善用技术,科技向善,我们就一定能够克服新AI技术带来的挑战,为用户创造更多价值。
2023-11-14 京客网发布了 《京客网:企业为何要打好新闻推广和软文营销的“持久战”?》的文章
2023-11-14 京客网发布了 《京客网:新闻软文营销推广的直接作用是什么?》的文章
2023-11-14 京客网发布了 《京客网:绿春生态云茶.网址中文域名助绿春双财茶业互联网+数字化》的文章
2023-11-14 京客网发布了 《雅居乐集团上半年预售金额达人民币282.3亿元,多元业务占比提升》的文章
2023-11-14 京客网发布了 《2023 Z世代双十一消费行为报告:近6成年轻人选择购买国货品牌》的文章