解码就是输入音频,利用声学模型、构建好的WFST解码网络,输出最优状态序列的过程。以Kaldi中LatticeFasterOnlineDecoder为例,解析解码代码。示例程...

解码就是输入音频,利用声学模型、构建好的WFST解码网络,输出最优状态序列的过程。以Kaldi中LatticeFasterOnlineDecoder为例,解析解码代码。示例程...
语音识别解码过程使用的是Viterbi算法,本质上是一种动态规划算法,能够得到全局最优解。为了进一步减少计算复杂度,引用了Beam Search 算法,可以在损失微小性能的条...
交叉熵(Corss Entropy)损失函数定义 二分类问题: = - (y+ (1-y)) 多分类问题: = -y 激活函数: SoftMAX 定义(多分类) =...
fstaddselfloops: Adds self-loops to states of an FST to propagate disambiguation symbol...
语音识别解码过程使用的是Viterbi算法,本质上是一种动态规划算法,能够得到全局最优解。为了进一步减少计算复杂度,引用了Beam Search 算法,可以在损失微小性能的条...