Template error, template file not found
64x64

集运物流

推荐 0

浏览 676

漫谈RNN之序列建模(机器翻译篇)

本期讲解运用LSTM进行序列建模,并且介绍了机器翻译的原理,阅读本文可以参考以下几篇历史文章:《漫谈RNN之基本概念》《漫谈RNN之训练方法》《漫谈RNN之梯度消失及梯度爆炸》《漫谈RNN之长短期记忆模型LSTM》《漫谈RNN之长短期记忆模型LSTM(续)》1.原理概述序列学习其实是深度学习中的一个应用非常广泛的概念

阅读更多

64x64

喷漆李

推荐 0

浏览 328

漫谈RNN之长短期记忆模型LSTM(续)

本期讲解LSTM为什么可以取代RNN从而解决了梯度消失的问题,阅读本文可以参考以下几篇历史文章:《漫谈RNN之基本概念》《漫谈RNN之训练方法》《漫谈RNN之梯度消失及梯度爆炸》《漫谈RNN之长短期记忆模型LSTM》在《漫谈RNN之梯度消失及梯度爆炸》一文中,已经阐述了为什么RNN会引起梯度消失的问题,我觉得总结起来

阅读更多

64x64

喷漆李

推荐 0

浏览 475

漫谈RNN之长短期记忆模型LSTM

正因为RNN的梯度消失问题导致RNN的时间记忆性不够长,因此HochreiterSepp,JürgenSchmidhuber等人于1995年发明了长短期记忆网络(LongShort-termMemory,LSTM)来克服RNN的记忆缺陷,本期将介绍什么是LSTM模型,下期将介绍LSTM为什么可以解决RNN的记忆缺陷问

阅读更多

64x64

喷漆李

推荐 0

浏览 832

漫谈RNN之梯度消失及梯度爆炸

昨天提到RNN的训练方法,提到了最流行的算法BPTT,其实训练RNN除了BPTT以外,还有两种算法:Real-timeRecurrentLearning(RTRL)以及ExtendedKalmanFiltering(EKF),不过工业上基本上都被BPTT占领了,所以后面两个算法就不再介绍。那么本期将讲解为什么训练RN

阅读更多

64x64

喷漆李

推荐 0

浏览 280

漫谈RNN之训练方法

RNN的训练因其递归性而变得复杂,现在深度学习大多系统中通常采用的是Back-propagationThroughTime算法,本文不打算运用公式来讲解,而是将公式转化成易懂的文字来描述这些算法。阅读本期可以参考我的历史文章:《漫谈RNN之基本概念》《我所理解的深度学习(一)——BP图模型算法》RNN是一个循环递归网

阅读更多

64x64

喷漆李

推荐 0

浏览 297

漫谈RNN之基本概念

RNN是一个图灵完全的模型,便意味着只要设计好RNN的外部存储机制,RNN模型的应用之广泛将远超我们的想象。为了更好地了解时序模型,从这期开始谈谈以RNN为核心的可扩展时序模型的研究状况及应用。在神经网络模型中,一般分为非时序模型和时序模型,对于非时序模型而言,其应用场景有单一手写字识别、图像物体分类等等,最基本的模

阅读更多

64x64

机械设计

推荐 0

浏览 252

Tensorflow|如何保存或导入训练好的模型

 在深度学习实践中,我们通常要先搭建好模型如何经过长时间的训练才能使用。那么,对于训练好的模型,我们自然想把它保存起来以便调用。  曾经,我写过一个比较大的深度学习模型,由于每次迭代需要长达1-2个小时,并且用的是nohup在服务器后台上运行,但是鉴于nohup有时会不稳定,因此我的后台程序随时可能会被kill掉,于

阅读更多

64x64

机械设计

推荐 0

浏览 1353

TensorFlow(五)——构建深度残差学习网络

TensorFlow系列推荐阅读:TensorFlow(一)——基础图模型TensorFlow(二)——逻辑回归TensorFlow(三)——卷积神经网络用于手写字识别TensorFlow(四)——构建自动编码器用于数据压缩及复原卷积神经网络系列推荐阅读:我所理解的深度学习(一)——BP图模型算法我所理解的深度学习(

阅读更多

64x64

机械设计

推荐 0

浏览 289

什么是对抗式生成网络

1GenerativeModelvsDiscriminativeModel首先,我们要明白机器学习中主要有两种模型,生成模型和判别模型。顾名思义,判别模型就是判别输入数据属于哪一类,例如卷积神经网络可以判别一幅图是不是包含猫;而生成模型并不知道数据是属于哪一类,它的作用是通过熟悉输入数据的特定分布,来产生一组新数据与

阅读更多

64x64

机械设计

推荐 0

浏览 386

TensorFlow(三)——卷积神经网络用于手写字识别

往期TensorFlow教程系列延伸阅读:TensorFlow(一)——基础图模型TensorFlow(二)——逻辑回归1.导入基本库这期讲解如何运用TensorFlow来建立一个卷积神经网络用于手写字识别。首先导入一些必备的库。importtensorflowastfimporttensorflow.example

阅读更多

热门专栏

Template error, template file not found