Template error, template file not found
64x64

机械设计

推荐 0

浏览 228

TensorFlow(二)——逻辑回归

 逻辑回归是深度学习中的最基础的例子,今天来看一下如何使用TensorFlow写一个简单的逻辑回归算法。逻辑回归可以看成只具有一层网络的前馈式神经网络,它的公式为Y_predict=logistic(X*W+b),其中X为输入,W为输入与隐含层之间的连接权重,b为隐含层神经元的偏置,而logistic为激活函数,一般

阅读更多

64x64

机械设计

推荐 0

浏览 277

TensorFlow(一)——基础图模型

 穿插整理一系列以前的笔记,将围绕TensorFlow来讲解深度学习的知识,形式以原理解说+代码演示为主,首先来讲讲TensorFlow的基础知识。TensorFlow是基于计算图模型的深度学习框架,每个TensorFlow程序都有一个默认图,一般情况下我们在程序中所添加的操作(operation,简称op)都是添加

阅读更多

64x64

机械设计

推荐 0

浏览 259

n-Armed Bandit Problem(二)

 在Bandit问题的第一期提到(n-ArmedBanditProblem(一)),我们可以使用贪婪算法来得到最大回报。这种贪婪算法有两种,即e等于0或e不等于0。接下来,我们可以分别写出它们的代码并得到实验结果。 根据之前假设,每个决策都会得到一个由高斯分布产生的随机回报值。而这个假设是固定不变的,因此我们可以先写

阅读更多

64x64

机械设计

推荐 0

浏览 193

n-Armed Bandit Problem(一)

 强化学习的核心就是一个最优函数使得总回报达到最大,这个最优方程又称为Bellman方程,而解决这种最优问题常用的思路就是动态规划(详见:RL(一)——马尔科夫决策过程,我对动态规划算法的理解(一)),如果不使用动态规划算法的话,那么后果就是计算量变得异常庞大,例如一个大小为5*5的棋盘,如果按照上一期中提到的状态空

阅读更多

64x64

密泰传动系统

推荐 0

浏览 278

什么是对抗式生成网络

1.GenerativeModelvsDiscriminativeModel首先,我们要明白机器学习中主要有两种模型,生成模型和判别模型。顾名思义,判别模型就是判别输入数据属于哪一类,例如卷积神经网络可以判别一幅图是不是包含猫;而生成模型并不知道数据是属于哪一类,它的作用是通过熟悉输入数据的特定分布,来产生一组新数据

阅读更多

64x64

密泰传动系统

推荐 0

浏览 349

基于强化学习开发人机对弈五子棋游戏

 上一期提到过,强化学习主要包括状态空间、价值函数、状态转移三个部分,通过状态之间的转移来得到每个状态的价值,强化学习的目标是使得总价值达到最大。注意,与监督学习不同的是,监督学习通常需要大量的样本来获得有价值的信息,而强化学习却不需要,强化学习可以不需要预先给定任何知识,只需要指定一定的策略和回报,它可以通过不断地

阅读更多

64x64

功夫熊猫

推荐 0

浏览 352

又一世界巨头计划在中国生产电池和电动汽车

随着中国监管机构展开行动防治污染和能源浪费,梅赛德斯-奔驰计划在这个全球最大的汽车市场修建一家电池厂并生产EQ电动汽车。“实现中国生产本土化是我们的策略,电动汽车也是如此,”奔驰母公司戴姆勒的中国业务主管HubertusTroska周一晚间在记者会上表示。“中国政府的战略目标是鼓励发展电动汽车,以改善空气质量,同时减

阅读更多

64x64

密泰传动系统

推荐 0

浏览 209

RL(一)——马尔科夫决策过程

 强化学习的应用领域之多相信大家都有所听闻,无论是机器人控制领域、优化管理、金融领域、通信等都有涉及,印象最深应该就是今年的围棋比赛了吧,其中使用了深度强化学习。今天来讲讲强化学习中的最基本原理——马尔科夫决策过程,以下简称MDP。前面在DP算法中有提到,DP算法可以理解为由状态、策略、转移函数三部分组成(详见:我对

阅读更多

64x64

凯麦亿精密机械

推荐 0

浏览 323

我对动态规划的理解(三)

 前面提到了动态规划的原理以及一个计算最短延迟时间的例子,联想到之前说过的隐马尔科夫模型(HMM)中的forward-backward算法、时序分类模型CTC中的动态规划算法,这些无非是在降低问题的计算时间复杂度。如果不使用DP算法来解决的话,原问题当然也是可以解决的,只不过计算量会非常大。  那么到底什么是DP算法

阅读更多

64x64

凯麦亿精密机械

推荐 0

浏览 288

我对动态规划算法的理解(二)

如下图所示为一个街景图,左边是一些居民的居住地,右边是一些停车场,图中连线是代表街道,而圆圈代表不同街道之间的交界处。网络之所以设计成这种钻石形状,是为了使得每次都必须穿越五条街才能达到停车场。圆圈中的数字表示等待时间,要解决的问题是希望规划出一条从家到停车场行走路线以至于所需的等待时间最短。 这个问题最朴素的做法就

阅读更多

热门专栏

Template error, template file not found