加载中...
扫一扫
下载苏宁易购APP
关注苏宁推客公众号
自购省钱·分享赚钱
下载苏宁金融APP
关注苏宁易购服务号
用户评价:----
物流时效:----
售后服务:----
实名认证领苏宁支付券立即领取 >
¥
提前抢
SUPER会员专享
由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
欢迎光临本店铺
点我可查看更多商品哦~
100%刮中券,最高50元无敌券,券有效期7天
亲,今日还有0次刮奖机会
我的云钻:0
您的云钻暂时不足,攒足云钻再来刮
恭喜获得1张券!
今天的机会已经全部用完了,请明天再来
恭喜刮出两张券,请选择一张领取
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
全新正版深度学习笔记9787301161227北京大学
¥ ×1
商品
服务
物流
讲神经网络与深度学习11.1机器学习与深度学习的关系21.2感知机与神经网络3第2讲神经网络的过拟合与正则化72.1机器学习的核心要义82.2范数与正则化9.神经网络的正则化和Droput1第3讲深度学习的优化算法143.1机器学习的数学规约153.2损失函数和深度学习优化算法153.3梯度下降法163.4从Momentum到Adam18第4讲卷积神经网络214.1CNN发展简史与相关人物224.2卷积的含义4.3池化和全连接26深度学习笔记目录第5讲CNN图像学习过程与可视化285.1CNN的直观理解295.2CNN图像学习的可视化31第6讲CNN图像分类:从LeNet5到EfficientNet376.1计算机视觉的三大任务386.2CNN图像分类发展史39第7讲CNN目标检测:从RCNN到YOLO477.1目标检测概述487.2CNN目标检测算法49第8讲CNN图像分割:从FCN到U-Net568.1语义分割和实例分割概述578.2语义分割58第9讲迁移学习理论与实践659.1迁移学习:深度学习未来五年的驱动力?669.2迁移学习的使用场景669.3深度卷积网络的可迁移679.4迁移学习的使用方法689.5基于ResNet的迁移学习实验680讲循环神经网络7610.1从语音识别到自然语言处理7710.2RNN:网络架构与技术7910.3四种RNN结构811讲长短期记忆网络8411.1深度神经网络的困扰:梯度与梯度消失8511.2LSTM:让RNN具备更好的记忆机制872讲自然语言处理与词向量9112.1自然语言处理简介9212.2词汇表征931.词向量与语言模型943讲word2vec词向量9813.1word2vec9913.2word2vec的训练过程:以CBOW为例1004讲seq2seq与注意力模型10414.1seq2seq的简单介绍10514.2注意力模型10514.3基于seq2seq和Attention机制的机器翻译实践1085讲语音识别11815.1概述11915.2信号处理与特征提取12015.3传统声学模型12215.4基于深度学习的声学模型115.5端到端的语音识别系统简介1256讲从Embedding到XLNet:NLP预训练模型简介12716.1从Embedding到ELM2816.2特征提取器:Transformer12916.3低调:GPT13116.4封神之作:BERT13116.5持续创新:XLNet1327讲深度生成模型之自编码器13417.1自编码器13517.2自编码器的降噪作用13617.3变分自编码器13817.4VAE的Keras实现1438讲深度生成模型之生成式对抗网络14818.1GAN14918.2训练一个DCGAN1519讲神经风格迁移、深度强化学习与网络15919.1神经风格迁移16019.2深度强化学习16219.3网络166第20讲深度学习框架17120.1概述17220.2TensorFlw7320.3Keras17520.4PyTorch1762讲深度学习数据集17921.1CV经典数据集18021.2NLP经典数据集187参考文献189
讲神经网络与深度学习深度学习作为当前机器学习一个门的发展方向,仍然保持着传统机器学习方法的理念与特征。从有监督学习的角度来看,深度学习与机器学习并无本质上的差异。隐藏层使得感知机能够发展为拟合万物的神经网络模型,而反向传播算法则是整个神经网络训练的核心要义。1.1机器学习与深度学习的关系深度学习笔记讲神经网络与深度学习想要学习深度学习,就要先温习一下机器学习,弄清楚二者之间的关系。简单来说,机器学习就是从历史数据中探索和训练出数据的普遍规律,将其归纳为相应的数学模型,并对未知的数据进行预测的过程。至于在这个过程中所碰到的各种各样的问题,如数据质量、模型评价标准、训练优化方法、过拟合等一系列关乎机器学习模型生死的问题,在这里不做具体展开,读者可自行补习相关的机器学习知识。在机器学习中,有很多相当成熟的模型和算法。其中有一种很厉害的模型,那就是人工神经网络。这种模型从早期的感知机发展而来,对任何函数都有较好的拟合,但自20世纪90年代一直到2012年深度学习集中爆发前夕,神经网络受制于计算资源的限制和较差的可解释,一直处于发展的低谷阶段。之后大数据兴起,计算资源也迅速跟上,加之2012年ImageNet竞赛采用的AlexNet卷积神经网络一举将图像分类的Top5错误率降至16.4%,震惊了当时的学界和业界。从此之后,原本处于研究边缘状态的神经网络又迅速火热了起来,深度学习也逐渐占据了计算机视觉的地位。注意:这里有必要解释一下模型和算法的概念,通常所说的像支持向量机(SupportVectorMachine,SVM)之类的所谓机器学十算法其实不应该称之为算法,更应该称之为模型。机器学习算法应该是在给定模型和训练策略的情况下采取的优化算法,如梯度下降法、牛顿法等。当然,一般情况下将机器学习中的模型和算法概念混在一起并没有什么不妥之处,竟模型中本身就包含着计算规则的意思。介绍了这么多,无非就是想让大家知道,以神经网络为核心的深度学习是机器学习的一个领域分支,所以深度学习在其本质上也必须遵循机器学习的基本要义和法则。在传统的机器学习中,需要训练的是结构化的数值数据,如预测销售量、预测某人按时还款等。但在深度学习中,其训练输入就不再是常规的数值数据了,它可能是一张图像、一段语言、一段对话语音或一段视频。例如,深度学习要做的就是输入一张狗的图像到神经网络中,它输出的是狗或dog这样的标签;输入一段语音到神经网络中,它输出的是如“你好”这样的文本。综上所述,可以看出机器学习(深度学习)的核心任务就是找(训练)一个模型,它能够将输入转化为正确的输出。1.2感知机与神经网络深度学习看起来就像是一个黑箱机制,输入各种非结构化的数据之后出来预测结果。例如,输入一段语音,输出为“Hello,World!”这样的文本;输入一张狗的图像,输出为“狗”这样的标签;输入一副棋盘和当前的局势,输出为下一步的走棋方式;输入“你好!”这样一句中文,输出为“Hi!”这样一句英文;等等。我们很难对输入与输出之间的模型转化过程给出一个合理的解释。在实际工作中,调用像TensorFlow这样的深度学习框架能够快速搭建起一个深度学习项目,但在学习深度学习时,不建议大家一开始就上手各种深度学框架希望家能和笔者一起,在把基本原理弄清楚之后利用Python自己手动去编写模型和实现算法细节。为了学习深度学习和各种结构的神经网络,我们需要从头开始。感知机作为神经网络和支持向量机的理论基础,一定要清楚其中的模型细节。简单来说,感知机就是一个旨在建立一个线超平面对线可分的数据集进行分类的线模型,其基本结构如图1.1所示。图1.1感知机的基本结构图1.1从左到右为感知机模型的计算执行方向,模型接受了x1、x、x三个输入,将输入与权值参数w进行加权求和并经过sigmoid函数进行激活,将激活结果y作为输出,这便是感知机执行前向计算的基本过程。这样就行了吗?当然不行。刚刚只是解释了模型,对策略和算法并未做出解释。当执行完前向计算得到输出之后,模型需要根据当前的输出和实际的输出按照损失函数计算当前损失,计算损失函数关于权值和偏置的梯度,然后根据梯度下降法更新权值和偏置,经过不断地迭代调整权值和偏置使损失,这便是完整的单层感知机的训练过程。图1.2所示是输入为图像的感知机计算过程。图1.2输入为图像的感知机计算过程前面介绍的是单层感知机,单层感知机包含两层神经元,即输入与输出神经元,可以容易地实现逻辑与、逻辑或和逻辑非等线可分情形,但是单层感知机的学习能力是有限的,对于像异或问题这样的线不可分情形,单层感知机就搞不定了(所谓线不可分,即对于输入训练数据,不存在一个线超平面能够将其进行线分类)。其学习过程会出现一定程度的振荡,权值参数w难以稳定下来,不能求得合适的解,异或问题如图1.3(c)所示。(a)x1ANDx2(b)x1ORx2(c)x1XORx2图1.3异或问对于不可分的情况,在感知机基础上一般有两个解决方向,一个是著名的支持向量机,旨在通过核函数映来处理非线的情况,而另一种就是神经网络模型。这里的神经网络模型也叫作多层感知机(MultiLayerPerceptron,MLP),图1.4单隐藏层的神经网络的结构与单层感知机在结构上的区别主要在于MLP多了若干隐藏层,这使得神经网络能够处理非线问题。一个单隐藏层的神经网络的结构,如图1.4所示。从图1.4中可以看出,相较于两层神经元的单层感知机,该多层感知机中间多了一个隐藏层。何为隐藏层?即在神经网络的训练过程中只能观察到输入层和输出层的数据,对于中间隐藏层的数据变化是看不见的,因而在深度神经网络(DeepNeuralNetworks,DNN)中,将中间看不见又难以对其效果进行合理解释的隐藏层称为“黑箱子”。含隐藏层的神经网络是如何训练的呢?与感知机一样,神经网络的训练依然包含前向计算和反向传播(BackPropaggtion,BP)两个主要过程。当然,单层感知机没有反向传播这个概念,而是直接建立损失函数对权值和偏置参数进行梯度优化。简单来说,前向计算就是权值偏置与输入的线加权和激活操作,在隐藏层上有个嵌套的过程。这里重点讲解反向传播算法(也称为误差逆传播算法),作为神经网络的训练算法,反向传播算法可谓是目前成功的神经网络学习算法。通常所说的BP神经网络就是指应用反向传播算法进行训练的神经网络模型。那么,反向传播算法的工作机制究竟是怎样的呢?这里需要大家复习一下在大学阶段学习的微积分知识。下面以一个两层(单隐藏层)网络为例,即图1.4中的网络结构,给大家详细推导一下反向传播的基本过程。设输入层为x,输入层与隐藏层之间的权值和偏置分别为w1和b1,线加权计算结果为Z1=w1x+b1,采用sigmoid激活函数,激活输出为a1=σ(Z1)。而隐藏层到输出层的权值和偏置分别为w2和b2,线加权计算结果为Z2=w2x+b2,激活输出为a2=σ(Z2)。所以,这个两层网络的前向计算过程为x→Z1→a1→Z2→a2。可以看出,反向传播的直观理解就是将前向计算过程反过来,但必须是梯度计算的方向反过来,设这里采用如式(1.1)所示的交叉熵损失函数。L(y,a)=-(yloga+(1-y)lg(-a))(1.1)反向传播是基于梯度下降策略的,主要是以目标参数的负梯度方向对参数进行更新,所以基于损失函数对前向计算过程中各个变量进行梯度计算就必要了。将前向计算过程反过来,那么基于损失函数的梯度计算顺序就是da2→dZ2→dw2→db2→da1→dZ1→dw1→db1。下面从输出a2开始进行反向推导,输出层激活输出为a2,那么首先计算损失函数L(y,a)关于a2的微分da2,影响输出a2的是谁呢?由前向传播可知,a2是由Z2经激活函数激活计算而来的,所以计算损失函数关于Z2的导数dZ2必须经由a2进行复合函数求导,即微积分上常说的链式求导法则。然后继续往前推,影响Z2的又是哪些变量呢?由前向计算Z2=w2x+b2可知,影响Z2的有w2、a1和b2,继续按照链式求导法则进行求导即可。以交叉熵损失函数为代表的两层神经网络的反向传播向量化求导计算公式如下。
抢购价:¥ 38.00
易购价:¥ 38.00
注:参加抢购将不再享受其他优惠活动
亲,很抱歉,您购买的宝贝销售异常火爆,让小苏措手不及,请稍后再试~
验证码错误
看不清楚?换一张
确定关闭
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
查看我的收藏夹
非常抱歉,您前期未参加预订活动,无法支付尾款哦!
关闭
抱歉,您暂无任性付资格
继续等待
0小时0分
立即开通
SUPER会员