


全文预览已结束
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2 0 1 1 年第 2期 No 2 2 01 1 中 国 刑 警 学 院 学 报 j o u rna l o f C h i n a C r i mi n a l P o l i c e Un i v e r s i t y 不 同频段共 2 0 1 1 牟 6月 J u n 2 0 1 1 振峰在声纹鉴定中 应用价值研究 庄琳章东 1 南京森林警察学院江苏南京2 1 0 0 0 0 2 南京大学声学研究所江苏南京2 1 0 0 0 0 摘要本 实验通过对元音的线性预测谱 长N L P C h n e a r p r e d i c t i v e c o e f fi e n t s 分析 在 0到 3 k Hz 3 k Hz到 7 k Hz 7 k Hz以上三个频率段 内共振峰频 率 频带宽度 振幅求方差之 比来分析 各频率段特征 的价值 关键词共振峰L P C图谱声纹鉴定话者识别 声纹鉴定中分析的是语音信号中说话人的个性特 征 一般不考虑包含征语音中的字词的含义 合适的 语音特征选择对 于声纹鉴定极为重要 该特征一 方 衙 应具备个体差异高f 自身差异 二者差异越 在 声纹鉴定中的利用价值越高 另 方面应易于从说话 人的语音信号中提取和溯量 汉语元音类 的浊音是由声带的准明期振动 绎 道共鸣调制 由口鼻辐射出来 不同元音的音色反l唼 的频谱结构不同 当元音激励进入声道时会引起共振 特性 产生一组共振频率 称为共振峰 共振峰的参 数主要包括共振峰中心频率的位置 频带宽度和幅 度 共振峰反映了声道的谐振特性代表了发音信息的 最直接 的来 源 人在语 音感知中利用 了共振峰信息 它的频率分布和走向具有良好的特定性和稳定性 是 声纹鉴定中最重要的参考依据 一般认为语音频潜包 络中的最大值就是共振峰 利用线性预测谱长时 I P c 可 以提取频谱包络 图及共振峰 参数 饧俊杰实 验表 明 语音的长时平均 L P C图谱具有较强的个体稳 性 通过检验语音 的长时平均 L P C潜不失 为进 声 纹鉴定的途径之一 但研究人员对元音各次共振峰在话者识别中的鉴 别能力存在争议 杨俊杰等认为不同频率共振峰在话 者识别中区别能力无显著差异 吴新源发现发音 人的 第四共振峰 频率在 3 K H z 以上的共振峰 数据存在较大 差异 反映了语音 的特殊性 对于语音 同一认定有一 定的价值 但未能对第四及以上共振峰的具体作用作 更深入的研究 有的话者识别理论认为低频 中高频 高频范围内共振峰的区别能力随着频率的升高而增强 本研究的目的是进一步阐明各次共振峰在话者识 别中的鉴定能力 通过对男女各 5人一组发音人的元 音进行一段时间的跟踪和多次采样 研究元音共振峰 的频率 带宽 振幅三个参数在不同频率段的变异情 况 对不同人的数据与同一人的数据方差之比进行统 计分析 讨论不 同频率共振峰在声纹鉴定 中的应用价 值 1 实验 1 1仪器 1 1 硬 件 华索 V M 一 4 2 3 数字录音笔 麦克风 计算机 1 1 2 软 件 v s一9 9语音工作站 北京 阳宸电子技术公司 S P S S统计分析软件 1 2样本 共 1 0人 男性 5人 女 l生5人 年龄均 2 1 2 4 岁左右 来 自 全国不同方言区 普通话发音较标准 基 无特殊发音习惯 以自然语声在普通房闯朗读包 含普通话 6 单元音 a J 0 1 f i u J y 的词 组每次 2遍 每隔一至二周采样一次 时间跨 度半 年 共 采样 2 0遍 录音采样率 2 2 k H z 每个采样点 量化精度为 1 6 b i t 1 3 实验内容 利用 v s 一 9 9 语音工作站分析线性预测谱 L P C时 的参数设置为 帧长 2 0毫秒 运算点数 5 1 2 个采样 点 阶数 2 8 哈明窗 其中滤波器阶数与共振峰的 个数相关 通常一对极点对应一个共振峰 因此当共 振峰数为 5时 滤波器阶数应为 1 0 此外当语音为 s t 簪 一 l 2 0 1 1 丘 中国刑警学院学报 6 月 鼻音和摩擦音时 声道传递函数并不符合全极点模型 的假定 而是一个既有极点 又有零点的模型 考虑 到这些情况 滤波器阶数设置为 2 D l 其中D为共 振峰的个数 实验分别提取语音 中相同单元 音 中间段 的长时 时间长度 5 0 2 0 0 m s 左右 视元音稳定程度确定 L P C图谱及共振峰频率 H z 共振峰带宽 H z 共 振峰幅值 d b 等数据 2 各频率段共振峰人间差异大小分析 2 1 样本示意图 图 1 二女生元音 时域波形图 图 1 为女生 1 和女生 2元音 i 的时域波形图 横 轴为时间轴 纵轴为振幅 图 2 为女生 1 元音 i 1 的光 标间长时 L P C图谱 横轴为共振峰频率 纵轴为各 共振 峰振 幅 由图可见 共振峰 的峰值 出现在 2 3 4 Hz 2 9 05 kHz 4 51 4 k Hz 6 91 2 k Hz 7 9 07 k Hz 9 2 9 1 k Hz 及 1 0 3 6 k Hz 处 并且在 2 3 4 H z 处出现最高 峰值 嚣 筹臀 詈嚣 三三 图 2 女生 1元音 日 光标 间长 时 L P C图谱 2 2 图谱分析 图谱分析各段共振峰个体差异大小 将不同个体 相同元音长时 L P C图谱进行正片叠底比对 得到长时 L P C 重叠图谱 图3 及图4 为两女生的fa 1元音及 i 元音 的图谱分析 从 图中可以看出长时 L P C图谱在 3 k H z 以下的共振峰频率 带宽和幅度等重叠较好 尤其低 频部分 7 k H z L P C谱线波 动较小图形差异不明显 图 3 二女生元音 a L P C图谱重叠比对图 图 4 二女生元音 i L P C 图谱重叠比对图 2 3 数据统计分析 为了研究元音各频率段个体差异性 并选择合适 的参数用于声纹鉴定 我们结合图谱比对共振峰差 异 将共振峰分为 低频段 7 k Hz 并对这三个频段进行方 差分析 方差之 比 F分析 以统计分 析各频段共振 峰区别能力 对于某一特征 若同一人说话的不同次 发音 的均值变化较少 但不同说话人发音 的变化较 大 则可用方差之 比 F来衡量这一特征参数 的有效 性 方差之 比 F定义为 F 一不同说话人的特征各 自的均值的方差 一同一说话人各次特征的方差的均值 一均值的方差 全部说话人之间一 i 一方差均值 同一说话人之内 一 式中 i 是指对说话人作平均 i 是指对某说话人各次 的某语音特征作平均 x 为第 i 个说 话 人 的第 a次语 音特 征 Ix i F 值越大的越适合作为说话人的个性特 征用与识别说话人 F 值的大小表明了话者之间差异 大于话者 自身变异的程度 将 同一人 2 O次相同元音分别提取 的 L P C数据 包括共振峰频率 振幅 带宽三项参数 对 2 0 次共 振峰频率 振幅 带宽三项参数分别进行平均处理 并求得各 自的方差均值 再求不同人频率 振幅 带 宽的均值与本人频率 振幅 带宽的方差 求各段频 率方差的 F值 表 1 列出了各频率段的不同人频率 均值的方差与本人频率方差的均值之比 表 2 列出了 各段频率 振幅 带宽三者平均的F 值 3 结果与讨论 统计结果分析表明 共振峰频率在中频段 3 k H z 2 0 1 1 年 庄 琳 章 东 不同 频段共 振峰 在声纹鉴 定中 应用价值研究 第 2 期 到 7 k H z 的方差之比F 平均值均明显大于低频段及高 频段的方差之比F 阴影部分数据大于二边数据 但 是也有例外 在表 l 的男生 2发元音 i 时频率方差之 比 F在 7 k Hz以上为 1 3 8 7 9 而频率在 3 k H z 到 7 k Hz 范围内的方差之比 F为 6 2 6 7 但在表 2该男生发元 音 时在 3 k H z 到 7 k H z 范围内共振峰峰值 带宽 频 率的综合方差之比 F为 1 4 4 8 8 频率小于 3 k H z 范 围 的方差之 比 F为 3 7 4 8和频率大于 7 k H z范围的方差 之 比F为 4 9 9 9 仍然符合结论 这说明共振峰频 率 振幅 带宽 F的平均值 比共振峰频率 F的平均 值更具有判断的价值 F 值越大表明此类特征在不同 人之间差异越大 则越合适用于区别不同人 数据分 析的结果验证了图谱比对的结果 表 1 共振峰频率 F值平均 表 2 共振峰频率 振幅 带宽 F值平均 实验表明 元音的线性预测谱长时 L P C具有个 体特性 特征稳定可靠 话者 自 身差异小 是较好的 个体特征参数 尤其在中频段 3 k H z 到 7 k H z 共振峰 的频率 峰值 带宽对于区别不 同话 者具 有 明显优 势 但由于该研究是在实验室条件下进行 的 语音质 量较高 而实践中检验的语音质量差别较大 因此实 际案件鉴定中还应考虑不同录音设备及录音环境等因 素对语音 L P C数据 的影响 4比对 中应注意的问题 在选取语音段时 应在相同元音相应稳定部位截 取 5 0 2 0 0 ms 左右语音段分析 相同语音不 同部位频 率振幅特征不同 各次共振峰数据应对齐方可进行方差统计分析 一 般共振峰的密度为 相邻共振峰差值约为 1 K H z 由于共振峰仍然是基音的倍音 倍音之间的差值为 N 个基频 对于数据 比较接近的共振峰 考虑到频率掩 盖现象 原则上越细化越好 一个数据划分在哪个区 域要兼顾这组数据的最大值和最小值 考虑到它们之 间的差 看更合适在哪个范围或单独为一个范围 对 于缺峰情况的处理 缺峰有的并不是真的没有峰 对 于是由于软件无法读 出的原因可以采取人工提取 对 于图谱 中真正没有的共振峰 则同一频段中的两个共 振峰对于易缺失的共振峰计算方差时进行权重处理 权重取其出现的百分率 参考文献 1 陈杰 张玲华 说话人识别 中语音特征参数 的研究 1 1 信息技术 2 0 0 6 1 1 2 f 美 T h o ma s F Qu a t i e r i 赵 胜辉 刘 家康 等译 离散 时间语音信 号处理 原理与应用l M 北京 电子工业出版社 2 0 0 4 3 韩纪庆 张磊 郑铁然 语音信号处理 M 清华大学出版社 2 0 0 4 4 张翠玲 法庭语音技术研 究 1 中国社会 出 版 社 2 0 0 9 5 杨俊杰 崔效义 李敬阳 王莉等 利用长 时平均 L P C谱检验 双胞胎语音之探讨 1 1 中 国人 民 公安大学学报 自然科 学版 2 0 0 3 4 6 杨俊杰 白建芳 杨运 生 梁向东 王
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 代码实现减价活动方案
- 代账公司活动策划方案
- 以学为本教研组活动方案
- 以赛促专活动方案
- 仲夏民俗活动方案
- 企业pk活动方案
- 企业三违活动方案
- 企业人过年活动方案
- 企业全民阅读活动方案
- 企业冬日活动方案
- 健康管理科管理制度
- 2024年中考道德与法治一轮复习:七八九年级6册提分必背知识点提纲
- DB31-T 1564-2025 企业实验室危险化学品安全管理规范
- 工程造价毕业设计答辩问题及答案
- 劳务合同完整版(2025年版)
- 2025-2030传媒行业市场运行分析及发展前景与投资机会研究报告
- 金属预成冠的护理配合
- 四川省绵阳市名校2025届中考生物五模试卷含解析
- 劳务公司派遣员工合同范本
- 2025年心理卫生协会心理咨询师资格认证考试指导题库(含答案)
- 科技公司研发部的安全操作规范
评论
0/150
提交评论