2017-07-17 Huang Lu
最近使用了Aishell开源的中文语料库,做Kaldi的实验。但是需要自己准备wav.scp、text和corpus.txt等文件,这些都是一些关于文本处理的,自己当时也查阅了很多,现将几个比较常用的总结如下。 vim 继续阅读 »
2017-07-14 Huang Lu
最近一直做实验,选择的都是TEDLIUM、AMI等开源的英文语料库,以及Switchboard语料库,而在中文上目前开源的也只有我们清华王东老师THCHS-30,之前也在上面做过实验,但是数据集只有30小时,还是不怎么痛快。今天看微信,偶然发现【北京希尔贝壳科技有限公司】开源了一个178小时的中文语料库。 继续阅读 »
2017-07-13 Huang Lu
经常在朋友圈看到有朋友各种文件误删或者忘记保存,以前总是不屑,终于今天我把自己的一个30+G的工作成果给删了,主要是用Kaldi做识别的一些脚本、特征和模型。十分悔恨,尝试了各种方法,没有恢复。没办法,浪子回头。之后自己想了想,想把每次删除的文件先放到一个文件夹下,然后自己定期手动删除,毕竟误删文件在删除后五分钟内肯定是可以发现,至少我是这样的。 继续阅读 »
2017-06-01 Huang Lu
之前简单介绍过 LSTM,网址,本文将利用 LSTM 来实现一个文本情感分类模型,是基于 Keras 和 Python 的。 概要 继续阅读 »
2017-05-31 Huang Lu
之前简单介绍过 LSTM,网址,本文将利用 LSTM 构建一个故事生成的模型。 本文的代码可以参考 GitHub. 继续阅读 »
2017-05-31 Huang Lu
Got from zzw922cn/awesome-speech-recognition-papers. Automatic speech recognition paper roadmap, including HMM, DNN, RNN, CNN, Seq2Seq, Attention 继续阅读 »
2017-05-31 Huang Lu
I got a good things on GitHub, and share it here. There are some classical papers about deep learning. Survey Review Deep learning (2015), Y. LeCun, Y. Bengio and G. Hinton [pdf] :sparkles: Deep learning in neural networks: An overview (2015), J. Schmidhuber [pdf] :sparkles: Representation learning: A review and new 继续阅读 »
2017-05-31 Huang Lu
There is a book about Deep Learning, http://www.deeplearningbook.org/, which is wrote by Ian Goodfellow, Yoshua Bengio and Aaron Courville. 继续阅读 »
2017-05-30 Huang Lu
This blog is reprinted from colah's blog and some changes are added by myself. 继续阅读 »
2017-02-22 Huang Lu
本文主要参考的是 kaldi-asr.org,主要介绍我们在使用 kaldi 的时候可能用到的数据处理的脚本以及相关文件的信息。 简介 在运行完 kaldi 提供的例子之后,也许你想用自己的数据来建立一个系统,本节主要介绍如何准备自己的数据。请确保你使用的是例程脚本是最新的脚本。在本文中,你可以参考这些例子中有关数据准备的脚本。在每一个例子的根目录有一个 run.sh,该文件一般在开头会有若干行和数据准备有关的操作。比如在 RM 的例子中有: 继续阅读 »