公众号
关注微信公众号
移动端
创头条企服版APP

什么是语音标注

3807

  语音标注是标注员不断对语音信息进行翻译让人工系统进行学习,微信里的语音翻译功能就是如此完成的。语音标注里主要包括采样、采样率、采样精度、声道、噪音比几个专业词,下面萌萌客外包客服的经理就来为大家详细介绍一下这几个概念。

  1.采样

  由于声音为模拟连续信号,而计算机只能处理数字离散信号,因此要用计算机来分析和处理声音,就需要经历模数转换过程[Anlog to Digital Converter,即ADC],即将模拟连续信号转换为数字离散信号。采样就是按照一定时间间隔从模拟连续信号提取一定数量的样本来,其样本值用二进制码0和1来表示,这些0和1构成了数字音频文件,其过程实际上是将模拟音频信号转换成数字离散信号。

  2.采样率

  采样率表示了每秒对原始信号采样的次数。显然,在一秒中内采样的点越多,获取的信息越丰富,为了复原波形,一次振动中至少得有两个采样点,要想使采集到的信号不失真,采样频率规定至少为语音频率的2倍,因此要 得到一个频率为10000赫兹的声音,则其采样率至少要大于20000赫兹的。采样率越高,数字信号的保真度越高,但同时占用的存储空间越大。如果采样率低于语音频率的两倍,则会产生低频失真、信号混淆现象。

  3.采样精度

  采样精度就是指存放一个采样值所使用的比特数目。当用8个比特(采样精度为8位)存放一个采样值时,对声音振幅的分辨等级理论上为256个,即0至255;当用16个比特(采样精度为16位)存放一个采样值时,对声音振幅的分辨等级理论上为65536个,即0到65536。如果您将采样精度设置为16位,计算机记录的采样值范围则为-32768到32767之间的整数。

  注意采样率和采样精度越大,记录的波形更接近原始信号,但同时占用的内存空间也越大。

  4.声道

  声道指输入或输出信号的通道。通常用多声道来输入或输出不同的信号。如果只需录制一个位置的一种信号时,只要使用单声道就可以了。

  5.信噪比

  信噪比指信号与噪声之间的能量比。录音时信噪比越高越好。16位采样率的信噪比大约是96dB,8位采样率的信噪比大约是48dB。在录音时,在录音时简单估计噪音大小的办法是:当没有语音信号输入的时候,如果麦克风输入的信号振幅值超过200(单位为采样值,相当于46dB),则噪声就比较大,需要进行一定控制,如在比较安静的环境下录音,关闭窗户、空调、电扇等噪声源,远离电脑等噪声源等等,选用比较好的带有屏蔽的麦克风,选用比较好的声卡等等。噪声的振幅值越低越好,录音室里的录音一般可以控制在10以下(单位为采样值,相当于20dB)

  注:采样率和采样精度的设置以越高越好,采样率和采样精度越高则声音的质量越高,不过考虑到存储空间和语音信号的特点,一般可以设置为16000赫兹的采样率和16位的采样精度。如果需要录制两个不同的信号源,则使用立体声,否则都使用单声道。

  关于语音标注的几个基础知识您理解了吗?希望以上这些内容能够给您带来帮助。

  本文参考自CSDN中《语音标注必须了解的知识》,网址是https://blog.csdn.net/xinyi818/article/details/104769523 。


声明:该文章版权归原作者所有,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系。
您阅读这篇文章花了0
转发这篇文章只需要1秒钟
喜欢这篇 0
评论一下 0
凯派尔知识产权全新业务全面上线
相关文章
评论
试试以这些内容开始评论吧
登录后发表评论
凯派尔知识产权全新业务全面上线
阿里云创新中心
×
#热门搜索#
精选双创服务
历史搜索 清空

Tel:18514777506

关注微信公众号

创头条企服版APP