说话人识别笔记

BASE

image.png
  • 将语义信息尽可能平均化,突出语音中说话人的个人特征,将不同人的特征差异凸显出来.
  • 模型训练的过程就是建模的过程,识别的过程就是模式匹配的过程.
  • 模型训练
    模型训练的过程就是建模的过程,识别的过程就是模式匹配的过程.


    模型训练.png

    根据系统的建模算法,训练得到一个人的模型.

  • 识别系统
识别系统.png

特征提取

base

  • 特征能够对原始信号进行最大程度的表征.
  • 减少冗余信息,减少计算量
  • 外界有干扰的时候能够有良好的鲁棒性

  • 一阶差分 二阶差分
    语音信号两帧之前存在较大的相关性,需要在静态的倒谱中加入动态信息来强化特征表示
  • 倒谱均值减和倒谱方差归一化处理,消除传输信道的影响和信道的偏移误差
  • 耳蜗
    耳蜗相当于是一个滤波器组,对于声音频率的感应是非线性的,具有良好的抗噪能力和识别性能.MFCC参数就是模仿人类的听觉特性.

MFCC

  1. 语音信号模数转化,预加重,分帧,加窗经过FFT得到频域信号
  2. 频域信号通过D个Mel滤波器组,得到D维的Mel频谱,再求频谱平方计算能量普
  3. 能量普取对数
  4. 能量谱DCT变换得到MFCC 静态特征.
MFCC.png

SVM

这篇文章挺适合我这种小白入门的.
针对线性可分情况进行分析,对线性不可分的情况,通过非线性映射算法讲低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而使高维特征空间采用线性算法对样本的分线性特征进行线性分析成为可能.
svm可以挖掘出数据中的高层未知参数.

GMM UBM

通过EM算法训练,估计一个高阶的GMM模型参数来刻画说话人的特征分布,训练阶段未覆盖到的特征区域采用UBM的特征近似刻画。在识别阶段,将测试的语音特征和模型匹配得分累加(最大似然率),输出识别结果。

GMM

GMM是一种概率模型,建模的依据是特征的概率分布情况。根据似然得分来判断模型的相似性。声学特征代表广义上的因素。
GMM利用多个高斯分布的组合来近似矢量的连续概率分布情况。
说话人的声学特征参数可以认为是不同发音时的声特征在特征空间的集合而成的.从不同的语音参数特征分布中找到不同的说话人.

四个高斯概率密度函数线性组合的GMM.png
  • 用EM算法进行迭代,拟合训练高斯模型,但是拟合精度和训练数据为正比关系,但是实际场景没有大量的训练数据.因此引入UBM.

UBM

通用背景模型(Universal Background Model,UBM)

  • 用大量说话人语音训练出一个高阶高斯模型,包含了大量说话人的特征信息.GMM模型来表征说话人的个性特征.GMM和UBM之间的高斯概率密度函数建立了相互对应的关系,抵消声音因素的影响,凸显目标说话人的个性特点.
  • UBM模型是在GMM模型上最大的后验概率上(MAP)自适应得到的.MAP自适应只修改UBM和目标说话人特征中相近部分的高斯分布的买搜狐,突出目标说话人的个性特征所在,与目标说话人特征分布较远的部分不做变动,表明目标说话人和冒充者的共同特征.训练时间越长,UBM越接近说话人的分布并且远离UBM.

GMM-SVM

GMM-UBM只关注自身语音特征的分布情况,对于相似的说话人和说话人之间的特征差异未做考虑.冒充的风险较大.GMM-UBM做为模型的前端(刻画特征,将特征从低维空间扩展到高维空间),然后用SVM基于特征分类.


GMM-SVM.png
  • 将GMM-UBM得到说话人模型的各个混合分量的均值向量拼接成GSV高斯超矢量


    GSV.png

SVM

SVM可以从一组有监督的样本中找到正样本和负样本的最佳分界面.
svm训练需要正例样本和负例样本,将正例样本和负例样本的GSV一起做为SVM的输入,训练一个超平面以表征目标话者的模型.

i-vector

即包含说话者之间的差异,又包含信道的差异.将高维空间的特征投影到低维.
将语音特征提取为一个低维的矢量矩阵,用来表征说话人信息的差异性,在识别阶段只需要计算矢量之间的余弦距离就可以作为相似性的评价标准,降低计算复杂度.

i-vector 说话人识别系统
  • 全局差异空间的估计
  • i-vector的估计
  • PLDA 空间应用概率线性鉴别分析

参考文章:

基于i-vector的说话人识别系统及其应用

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,056评论 5 474
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,842评论 2 378
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 148,938评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,296评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,292评论 5 363
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,413评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,824评论 3 393
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,493评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,686评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,502评论 2 318
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,553评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,281评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,820评论 3 305
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,873评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,109评论 1 258
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,699评论 2 348
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,257评论 2 341

推荐阅读更多精彩内容