2017-02-08 Lu Huang
ASR
在阅读《解析深度学习:语音识别实践》时,也会参考一些博客,看到好的也会整理一下分享出来。本文主要通过浅显的语言来展示语音识别的基本过程和原理。本文大部分内容转载至:语音识别的技术原理是什么?。 语音识别技术,也被称为自动语音识别AutomaTIc Speech RecogniTIon(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。下面我们来详细解读语音识别技术原理。 首先,我们知道声音实际上是一种波。常见的mp3等格式都是压缩格式,必须转成非压缩的纯波形文件来处理,比如Windows P 继续阅读 »
2017-02-08 Lu Huang
ASR
最近开始阅读《解析深度学习:语音识别实践》,将会把文中的一些总结放到这里和大家分享。今天的这篇文章主要介绍语音识别的基本结构。 下图中展示的是语音识别系统的典型结构,语音识别系统主要由图中的四部分组成:信号处理和特征提取、声学模型(AM)、语言模型(LM)和解码搜索部分。 信号处理和特征提取部分以音频信号为输入,通过消除噪声和信道失真对语音进行增强,将信号从时域转化到频域,并为后面的声学模型提取合适的有代表性的特征向量。声学模型将声学和发音学(phonetics)的知识进行整合,以特征提取部分生成的特征为输入,并为可变长特征序列生成声学模型分数。语言模型估计通过从训练语料(通常是文本形式)学习词之间的相互关系,来估计假设词序 继续阅读 »
2017-02-08 Lu Huang
在前面的caffe笔记:运行手写数字识别例程一节中,我们已经运行了caffe的mnist例程,并且训练出了自己的模型,并用自己的模型对测试集进行了预测,结果还是比较理想的。本节主要阐述如何把自己的手写数字图片(28×28)送入到上一节训练得到的LeNet模型中进行预测,评估数字识别效果。 继续阅读 »
2017-02-08 Lu Huang
在安装caffe的时候,我们需要解决一系列依赖问题,这些依赖一般都是开源的库,通过使用开源库可以大大节省开发的时间,并降低开发的难度。本文将主要介绍caffe中常用到的几个依赖库,并简单阐述他们的作用。 1. ProtoBuffer 继续阅读 »
2017-02-08 Lu Huang
昨天在用sudo apt-get install XXX安装软件包的时候出现了下面所示的错误。 shell E: Sub-process /usr/bin/dpkg returned an error code (1) 继续阅读 »
2017-02-08 Lu Huang
本文主要介绍如何在安装完caffe后运行一个简单的例程:手写数字识别,以了解和熟悉caffe的基本使用过程。至于如何安装caffe,请参考我之前的文章:ubuntu 16.04上配置cuda+caffe环境。 继续阅读 »
2017-02-06 Lu Huang
在很多科研单位和企业研发部门,服务器是极少被允许连外网的,一般情况下只可以通过内网里的机器访问服务器。由于自己的经历,我曾经接触过这样一台服务器,由于有8张Tesla K80的GPU,我很想在上面安装一个kladi。因此,这里的离线指的是服务器不能访问外网,或者服务器压根不能上网。我下面的操作是在和服务器在同一内网下的Windows机器上进行的,读者也可以直接在服务器上操作(不过一般很难得到许可)。 在阅读本文之前,建议先阅读一下我之前写的文章:ubuntu 16.04在线安装kaldi,以熟悉kaldi安装的大概过程。 1. 下载kaldi并上传 从kaldi在github的代码仓库(https://github.com/k 继续阅读 »
2017-01-15 Lu Huang
This page is going to tell how to install tensorflow on ubuntu 16.04 from the github sources. I sugget you to use conda or miniconda as your python, then you can skip section 6: Create the pip package and install. 继续阅读 »
2017-01-13 Lu Huang
本文转载至《你必须知道的 34 个简单实用的 Ubuntu 快捷键》。 Ctrl + W: 关闭当前 Nautilus 窗口 Ctrl+T: 在 Nautilus 打开新的 Tab Ctrl + H: 切换隐藏文件(夹)显示或者不显示 Ctrl+E: 发送当前文档给某个 Email Ctrl+Q: 退出应用 Ctrl + 1/2: 修改文件夹视图为图标或者列表模式 Ctrl + Shift + W: 关闭所有的 Nautilus 窗口 Ctrl + Shift + N: 创建新文件夹 Ctrl + Alt + L: 锁屏,如果你想走开一会而不想让别人看到你的屏幕 Ctrl + Alt + D: 显示桌面/恢复打开的窗口 Ctrl 继续阅读 »
2017-01-03 Lu Huang
由于在搭建的过程中涉及到很多权限问题(permission denied),建议使用root用户进行下面的操作。 1. 安装并启动mongodb 到mongodb官网下载相应系统的最新版安装包,或者从以下链接下载较旧的64位linux mongodb 3.0.1,。下载完以后请放/root目录下,然后解压。 继续阅读 »