图片来源@视觉中国
钛媒体快讯 | 9月19日消息:百度地图事业部总经理李莹今日宣布,百度推出行业首个地图语音定制功能。据李莹介绍,语音定制功能推出后,用户只需要在手机录制20句话,经过20分钟左右的制作,就可以生成个人完整语音包。
如图,用户可从百度地图首页进入语音定制页面,可选择性别,还可以录制童声。录制的文本方面,用户也可以选择系统推荐文本,卡通文本和电影台词。特别是录制童声时,百度为低龄儿童设置了语句更短、可重复的儿童语句。录制完的语音包可以自己使用,也可通过微信或者百度地图分享给他人使用。
百度地图语音定制模块图示
据悉,用户定制的语音包使用场景比较广泛,在手机地图的任何场景中都可使用,比如景区智能语音导览、智能语音交互等全部场景使用。用户可免费使用自己或家人的语音包在景区游览。
李莹也特别强调,在整个流程中百度地图遵循了业界最标准、最成熟的安全规范,采取了非常安全的保护措施,会最大程度的保障每个用户的安全隐私。“百度地图对于语音定制服务的权限获取将仅用作语音包录制,不做他用。百度地图未经用户的授权同意,不会将用户的语音包共享给任何人。”
李莹在演讲中介绍道,如果做一个通用大库的语音包,大概需要录制的语音量是上万句,制作周期近半年。如果做个人定制的,如某一个明星的语音包,需要在大库基础之上录制1000到2000句语音,要在专业的录音棚里面录制大概两周时间,而真正把这个语音包用语音技术生成出来需要两个月的时间。
新的语音定制功能大大缩减了此前语音录制的成本。百度语音首席架构师贾磊介绍了语音定制功能背后的技术:
“百度地图语音定制功能基于百度独创的说话人韵律迁移技术Meitron,其特点主要体现在发音人音色转换,多情感朗读和韵律风格迁移三个方面,从而让个性化语音合成的定制门槛大大降低。”
云端深度学习语音合成技术可形成不同风格的声音
贾磊介绍道,以前语音合成大多数都是新闻播音腔,而现在百度的语音合成可以有多重风格和声线。在现场原声与合成声音的比对测试中,两种声音几乎分辨不出差别。
当前,在数据生产方面,百度地图80%数据采集环节已实现AI化,拥有3000万的POI空间图谱、700万的用户兴趣图谱,共同组成了百度地图POI高精知识图谱。
(本文首发钛媒体,作者/芦依)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App
2022-09-14 钛媒体 App发布了 《星巴克加码中国市场,未来三年要新增开3000家门店|钛快讯》的文章
2022-08-11 钛媒体 App发布了 《白云山麾下公司虚抬药价“把戏”,被拆穿了》的文章
2022-07-06 钛媒体 App发布了 《为了帮00后卷王找到工作,简历修改师们拼了》的文章
2022-07-06 钛媒体 App发布了 《威尼斯向游客收“进城费”,国内城市如何借鉴?》的文章
2022-03-25 钛媒体 App发布了 《蔚来2021年财报发布:年营收361亿元,整车毛利率达到20.1%》的文章