2006 NIST Speaker Recognition Evaluation Training Set数据集介绍,官网编号LDC2011S09
LDC2011S09是 NIST 2006 年说话人识别评测(SRE 2006)的官方训练集,由宾夕法尼亚大学语言数据联盟(LDC)发布,是声纹识别领域 GMM-UBM 体系下的核心训练基准,与 2005 SRE 数据一脉相承并扩展了多语言与多信道覆盖。
一、核心基本信息
项目 详情
官方编号 LDC2011S09
发布机构 Linguistic Data Consortium (LDC)
发布时间 2011 年 7 月
核心用途 SRE 2006 说话人检测(Speaker Detection)任务模型训练与条件对比
数据来源 Mixer 项目(含 2005 年复用数据与 2005–2006 年新增采集),采用 Fishboard 平台录制
语言 以英语为主,含西班牙语、普通话、粤语、阿拉伯语等多语言片段
格式 SPHERE,8-bit μ-law,16 kHz,单 / 双声道(电话)+ 多通道麦克风
