声纹采集是声纹识别系统通过采集语音,提取声纹特征,训练模型并建立声纹模型库,把待识别的语音和声纹模型库进行比对,从而实现对说话人的识别。
声纹识别系统通过采集语音,提取声纹特征,训练模型并建立声纹模型库,把待识别的语音和声纹模型库进行比对,从而实现对说话人的识别。声纹识别系统一般包括两个步骤:声纹建模和声纹验证,声纹建模过程中涉及到的语音文件采集就是所谓的声纹采集(Voiceprint collection)。
声纹识别,也叫做说话人识别是一项根据语音波形中反映说话人生理和行为特征的语音参数,来识别语音说话者身份的技术。由于每个人的发声器官(舌、牙齿、喉头、肺、鼻腔)在尺寸和形态方面不尽相同,因此声纹也就成为一种鉴别说话人身份的识别手段。在声纹识别的过程中,建立庞大有效的声纹数据库并对数据进行精确标注就成了基础且重要的一环。但在实际的声纹采集过程中,由于不同的设备、不同的信道等等的差异,声纹数据库质量往往参差不齐,这些质量问题往往会影响算法模型的建立,从而导致识别准确率的降低。