Tensorflow 十分擅长于实现和训练深度神经网络,本文将:
构建一个 Softmax 回归模型
用 TensorFlow 训练这个模型
用测试数据测试模型的精度
建立、训练并测试一个多层的卷积神经网络
加载 MNIST 数据
继续阅读 »
1. CNN特点
假设一批图片样本,图片尺寸都是100 × 100(单通道)。使用神经网络来进行训练,假设第一个隐藏层有2500个神经单元,则参数个数一共为 10000 × 2500 = 2500W
存在的问题:
参数数据量太多,需要大量的计算资源
图片是一个二维结构,相邻像素之间的关联较强,距离远的像素之间关联较弱,因此不必要一次性把所有像素在一起计算
继续阅读 »
本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载.本文由机器之心编译,蒋思源、刘晓坤参与.
本文从最基本的依赖项开始,依次配置了 VS 2015、Anaconda 4.4.0、CUDA 8.0.61 和 cuDNN v5.1 等基本环境,然后再从 Keras 出发安装 Theano、TensorFlow 和 CNTK 以作为其后端.在完成配置深度学习框架后,本文分别利用这三个框架作为 Keras 后端在 CPU 和 GPU 上训练了一个标准的卷积神经网络,完成该简单的卷积网络也就意味着我们完成了深度学习环境的配置.
继续阅读 »
文/Robin
笔者长期使用 Google Translate 作为翻译辅助工具,直到遇到了本文的主角 DeepL Translator。
DeepL 翻译(英语: DeepL Translator)是于 2017 年 8 月由 DeepL GmbH(一家由 Linguee 支持的创业公司)推出的翻译服务,支持 简体中文、英语、德语、法语、日语、西班牙语、意大利语、荷兰语及波兰语之间的翻译。其利用神经网络训练翻译能力。与 Google 翻译、 Bing 翻译及 Facebook 等其他主流的翻译服务相比,DeepL Translator 的翻译显得更加自然,在同等时间内得到的翻译结果更精确、更细致。
我们来看看知名机构、媒
继续阅读 »