终端乱码和无法输入中文这个问题很烦人,对语言设置不是很明白简直就是无头苍蝇。度娘之,然后终于找到了解决方案。 方案一、修改中文支持 1、首先,安装中文支持包language-...
终端乱码和无法输入中文这个问题很烦人,对语言设置不是很明白简直就是无头苍蝇。度娘之,然后终于找到了解决方案。 方案一、修改中文支持 1、首先,安装中文支持包language-...
一直没有搞明白 hmm-gmm 之间是通过什么联系起来的,花了些时间查代码,看到最直观联系的就是 gmm-init-mono 工具。 通过上述看到,主要的配置都是 在 top...
阅读本文的前置条件: 掌握基本的 Markdown 语法 用过 Typora,或者至少知道 Typora 是干嘛用的 如何在 Typora 中插入图片 在 Typora 中插...
这是删除线 下面的语法就是删除线啦,又学到一招,漂亮
这节介绍一下如何修改生成适合自己场景的语言模型。 Ref Online decoding in Kaldi(Nnet2) http://kaldi-asr.org/doc/o...
前言 Keras中,直接利用API可以快速的实现一些功能简单的自定义损失函数: 然而任何的简单都是有代价的,通过这个内置方法定义的损失函数有且只能有y_true和y_pred...
总结: 近期的工作一直围绕《AutoAugment:Learning Augmentation Strategies from Data》和《SpecAugment: A S...
工作总结 这半个月主要围绕组会要讲的内容进行展开。组会的整体框架: DCASE2019的任务介绍 McDonnell的技术报告 mixup的方法 谷歌大脑AutoAugmen...
总结: 数据集:声学场景分类任务,使用DCASE2019_task_1b的数据集,共10000个训练集和5000个验证集,做好了数据的处理工作。 特征提取:特征提取采用pyt...
残差 残差在数理统计中是指实际观察值与估计值(拟合值)之间的差。在集成学习中可以通过基模型拟合残差,使得集成的模型变得更精确;在深度学习中也有人利用layer去拟合残差将深度...
Transformer模型是在Attention Is All You Need中提出的模型。讲解Transformer模型最好的博客当然是这篇The Illustrated...
一、MFCC 几乎照搬语音特征参数MFCC提取过程详解参考CSDN语音信号处理之(四)梅尔频率倒谱系数(MFCC) 1.定义MFCCs(Mel Frequency Cepst...
SVM! 参考资料支持向量机通俗导论(理解SVM的三层境界)参考资料支持向量机(SVM)从入门到放弃再到掌握 支持向量机(Support Vector Machine)是Co...
BatchNormalization介绍 参考知乎深度学习中 Batch Normalization为什么效果好?参考CSDN对Batch_Normalization的理解 ...
定义:两个字串之间,由一个转成另一个所需的最少编辑操作次数,如果它们的距离越大,说明它们越是不同。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。 ...
在牛客网上的好资源真的很多,根据牛客网算法面试宝典写份总结,希望在面试过程中能好好表现。 1. 微积分 SGD,Momentum,Adagard,Adam原理 SGD为随机梯...
讯飞一个麦克风阵列简介 语音信号的采集: 语音信号计算机中是采用PCM编码按时间序列保存的一连串数据。计算机中最原始语音文件是wav,可以通过各种录音软件录制,录制是包括三个...
最近在学习CTC,这位作者的文章写的非常好,对我入门CTC非常有帮助,抱着向前辈学习的态度来写一篇学习笔记,这里附上原文链接:CTC Algorithm Explained ...
1.find和cp结合 想要复制当前文件夹下符合条件的文件到另一个文件夹中,例如将本文件夹中所有.txt文件复制走,可以用如下命令: 2.批量重命名 来源:谁不小心的CSDN...
标签:ASR, Python, Keras, CTC 最近在自己动手搭建一个中文语音识别系统,因为也是入门阶段,所以比较吃力,直到在GitHub上找到了一个已经在做的开源工程...