《大语言模型：基础与前沿》熊涛著【摘要书评在线阅读】-苏宁易购图书

云钻刮券活动规则

活动时间

活动自2017年6月2日上线，敬请关注云钻刮券活动规则更新。

活动形式

会员打开苏宁易购wap端、PC端、苏宁易购APP端方可参与活动。
活动方式为云钻刮券，每次刮券需要扣除200云钻。奖励分为无敌券和店铺云券两种，100%刮出无敌券，最低2元。店铺券由店铺提供，用户可以根据购物需求，在无敌券和店铺云券之间二选一。如因为网络、用户关闭等原因，造成页面关闭，导致用户没有或无法选择，系统将在5分钟内自动按照获得的无敌券面额发放到用户账户。
每人每天参与刮券次数上限为1次。活动每日限量，如用户参与时已达到活动最高上限，则不能再继续参与，次日可以继续参与。
如会员在刮券时选择了店铺云券，券发至账户后则无法再更改为平台的无敌券；如会员在刮券时选择了平台的无敌券，券发至账户后则无法再更改为店铺云券。
云钻刮券获得的不固定面值的券，会随机获得无敌券：2~2.2元、5元、10元、20元、50元的无敌券或不同面额的店铺云券。
券是否成功发放，可在“我的优惠券”中查询。

其他

如活动受政府机关指令需要停止举办的，或活动遭受严重网络攻击需暂停举办的，或者系统故障导致的其它意外问题，苏宁无需为此承担赔偿或者进行补偿。

券使用规则

不同面额的无敌券有不同的使用门槛，2~2.2元、5元、10元、20元、50元无敌券为无门槛使用，具体以实际发放券说明为准。配送方式仅限选择配送使用，不能抵扣运费部分。
用户刮券获得的店铺云券可与店铺内领取的店铺易券叠加使用。
店铺云券使用门槛等具体信息以商家在其店铺内的设置使用说明为准。
无敌券可用于单件商品的付款，也可用于购物车合并下单付款，同时支持在跨店铺订单中使用。店铺云券仅可使用在指定店铺中，注：部分店铺活动商品不支持用券，以订单实际提交为准。
云钻刮券获得的无敌券可以购买大聚惠、抢购、团购、手机专享价，但不可购买闪拍、预售、S码、名品特卖、海外购、秒杀、虚拟产品、法律规定限制产品如一段奶粉（包括但不仅限列出的商品）等、云钻加钱兑及云钻全额兑。
在购物时，点击购买后，页面会提示可使用易购券，只要点击选择易购券即可抵用扣除对应金额。云钻刮券获得无敌券或店铺云券使用时可用于抵扣商品金额，不能抵扣运费、运费险、增值服务等非商品金额。
云钻刮券获得的无敌券或店铺云券可与店铺页面领取的店铺易券叠加使用，付款时默认优先使用力度较大的店铺优惠券，如使用店铺易券后的订单金额仍然满足云钻刮券所获得店铺云券使用条件，可继续叠加使用店铺云券。（举例：店铺在页面设置满199减50元的店铺易券，同时用户在店铺刮券获得一张满20元减20元的店铺云券，如商品订单金额为200元，会员在用已使用领取的50元店铺易券情况下，仍然可以使用云钻刮券获得20元店铺云券）
云钻刮券获得的无敌券或店铺云券不得提现，不得转赠他人，不得为他人付，不得拆分使用。
一个订单最多使用6张易购券。
云钻刮券获得的有效期为：自获得之日起7天内有效（部分活动券可能存在不同有效期，具体详见“我的优惠券”内易购券有效期说明）。
在获取和使用券过程中，如果出现违规行为（如作弊领取、恶意套现、刷取信誉、虚假交易等），苏宁将取消用户的中奖资格，并有权撤销违规交易、收回易购券（含已使用的易购券及未使用的易购券）,必要时追究法律责任。
使用易购券的订单若交易未成功或发生退款及售后，在交易所使用的易购券有效期内订单取消完成的，易购券将退回用户账户，退回后的易购券有效期不变。如在使用的易购券有效期之外发生退款，所使用的券退回当天有效，过期不予退还。如发生售后退款，易购券退回当天有效，过期不予退还。

文轩网图书旗舰店

https://product.suning.com/0070067633/11555288247.html

商品参数

作者：熊涛著
出版社：人民邮电出版社
出版时间：2024-04-01 00:00:00
版次：1
印次：1
印刷时间：2024-04-01
页数：260
开本：16开
装帧：平装
ISBN：9787115634887
国别/地区：中国
版权提供：人民邮电出版社

大语言模型：基础与前沿

作者:熊涛著

定价:118

出版社:人民邮电出版社

出版日期:2024年04月01日

页数:260

装帧:平装

ISBN:9787115634887

内容丰富。本书全面且深入介绍了大语言模型及其前沿进展，适合所有需要了解这个领域或掌握这种方法与工具的科学家、工程师和学生参考。内容紧贴前沿领域。大语言模型作为当前爆火的chatGPT背后的技术，受到广泛关注，预计未来将推动人工智能技术进一步发展。深入浅出，理论与实践相结合。本书摒弃了纯理论的说教模式，从案例入手，采用庖丁解牛的方式帮助读者理解与认识大语言模型。作者权威，大厂海外技术骨干。本书作者熊涛曾担任多家中美高科技公司的首席科学家，长期深耕人工智能领域，发表相关论文百余篇。行业专家背书，包括清华大学教授陈文光、复旦大学浩清特聘教授漆远、阿里巴巴集团阿里云副总裁叶杰平、蚂蚁集团副总裁赵闻飙。

本书深入阐述了大语言模型的基本概念和算法、研究前沿以及应用，涵盖大语言模型的广泛主题，从基础到前沿，从方法到应用，涉及从方法论到应用场景方方面面的内容。首先，本书介绍了人工智能领域的进展和趋势；其次，探讨了语言模型的基本概念和架构、Transformer、预训练目标和解码策略、上下文学习和轻量级微调、稀疏专家模型、检索增强型语言模型、对齐语言模型与人类偏好、减少偏见和有害性以及视觉语言模型等内容；最后，讨论了语言模型对环境的影响。本书内容全面、系统性强，适合高年级本科生和研究生、博士后研究人员、讲师以及行业从业者阅读与参考。

熊涛，美国明尼苏达大学双城分校电子与计算机工程博士。曾在多家中美知名高科技公司担任高级管理职位和首席科学家，在人工智能的多个领域，包括大语言模型、图神经网络等从事研发和管理工作多年。

无

第 1章大语言模型：辩论、争议与未来发展方向 1 1.1 新时代的曙光 1 1.2 LLM有意识吗 3 1.2.1 理解LLM的层次结构 3 1.2.2 意识是否需要碳基生物学 4 1.2.3 具身化与落地 4 1.2.4 世界模型 7 1.2.5 沟通意图 8 1.2.6 系统性和全面泛化 9 1.3 未来发展方向 10 1.4 小结 13 第 2章语言模型和分词 15 2.1 语言建模的挑战 16 2.2 统计语言建模 16 2.3 神经语言模型 18 2.4 评估语言模型 19 2.5 分词 19 2.5.1 按空格分割 20 2.5.2 字符分词 21 2.5.3 子词分词 21 2.5.4 无分词器 24 2.5.5 可学习的分词 25 2.6 小结 27 第3章 Transformer 29 3.1 Transformer编码器模块 29 3.2 编码器-解码器架构 31 3.3 位置嵌入 32 3.3.1 绝对位置编码 32 3.3.2 相对位置编码 34 3.4 更长的上下文 38 3.5 外部记忆 42 3.6 更快、更小的Transformer 45 3.6.1 高效注意力 45 3.6.2 条件计算 47 3.6.3 搜索高效Transformer 48 3.6.4 在单个GPU上一天内训练一个语言模型 49 3.7 推理优化 49 3.7.1 推测解码 49 3.7.2 简化Transformer 51 3.7.3 修剪 52 3.7.4 蒸馏 53 3.7.5 混合精度 54 3.7.6 高效扩展Transformer推理 54 3.8 小结 56 第4章预训练目标和解码策略 57 4.1 模型架构 57 4.2 预训练目标 60 4.3 具有代表性的语言模型 62 4.4 解码策略 67 4.5 小结 72 第5章上下文学习和轻量级微调 73 5.1 上下文学习 74 5.1.1 示范样本选择 75 5.1.2 样本排序 82 5.1.3 指令生成 82 5.1.4 思维链 84 5.1.5 递归提示 87 5.1.6 为什么ICL有效 90 5.1.7 评估 93 5.2 提示语言模型的校准 94 5.3 轻量级微调 97 5.3.1 基于添加的方法 98 5.3.2 基于规范的方法 100 5.3.3 基于重新参数化的方法 101 5.3.4 混合方法 103 5.4 小结 104 第6章训练更大的模型 107 6.1 扩大尺度法则 107 6.1.1 预训练Transformer扩大尺度的启示 107 6.1.2 预训练和微调Transformer带来的新启示 110 6.1.3 k比特推理扩大尺度法则 111 6.1.4 挑战与机遇 112 6.2 涌现能力 113 6.3 人工智能加速器 115 6.4 并行 117 6.4.1 数据并行 119 6.4.2 流水线并行 126 6.4.3 张量/模型并行 131 6.4.4 专家混合 133 6.5 混合训练和低精度训练 133 6.5.1 单位缩放 133 6.5.2 FP8与INT8 135 6.6 其他节省内存的设计 136 6.7 小结 137 第7章稀疏专家模型 139 7.1 为什么采用稀疏专家模型 139 7.2 路由算法 142 7.2.1 每个词元选择top-k个专家 142 7.2.2 每个专家选择top-k个词元 144 7.2.3 全局很优分配 145 7.2.4 随机路由 148 7.2.5 双层路由 149 7.2.6 针对不同预训练领域的不同专家 149 7.3 其他改进措施 152 7.3.1 加快训练速度 152 7.3.2 高效的MoE架构 153 7.3.3 生产规模部署 154 7.3.4 通过稀疏MoE扩展视觉语言模型 154 7.3.5 MoE与集成 155 7.4 小结 156 第8章检索增强型语言模型 157 8.1 预训练检索增强型语言模型 158 8.2 词元级检索 161 8.3 通过高效和精简检索进行问答和多跳推理 163 8.4 检索增强型Transformer 166 8.5 检索增强型黑盒语言模型 168 8.6 视觉增强语言建模 169 8.7 小结 170 第9章对齐语言模型与人类偏好 171 9.1 基于人类反馈进行微调 172 9.1.1 基于人类反馈的强化学习 172 9.1.2 KL散度：前向与反向 174 9.1.3 REINFORCE、TRPO和PPO 174 9.1.4 带有KL惩罚的强化学习：贝叶斯推理观点 178 9.1.5 通过分布控制生成进行语言模型对齐 180 9.1.6 通过f散度最小化统一RLHF和GDC方法 182 9.2 基于语言反馈进行微调 183 9.3 基于监督学习进行微调 184 9.4 基于人工智能反馈的强化学习 185 9.5 基于自我反馈进行迭代优化 188 9.6 基于人类偏好进行预训练 190 9.7 小结 193 第 10章减少偏见和有害性 195 10.1 偏见 196 10.2 有害性 199 10.3 偏见和有害性的检测与减少 200 10.3.1 基于解码的策略 201 10.3.2 基于提示的脱毒 202 10.3.3 基于数据的策略 204 10.3.4 基于投影和正则化的方法 205 10.3.5 基于风格转换的方法 205 10.3.6 基于强化学习的微调和基于人类偏好的预训练 206 10.4 小结 206 第 11章视觉语言模型 207 11.1 语言处理的多模态落地 207 11.2 不需要额外训练即可利用预训练模型 208 11.2.1 视觉引导解码策略 208 11.2.2 作为大语言模型提示的视觉输入 209 11.2.3 基于相似性搜索的多模态对齐 212 11.3 轻量级适配 213 11.3.1 锁定图像调优 213 11.3.2 作为（冻结）语言模型前缀的学习视觉嵌入 214 11.3.3 视觉-文本交叉注意力融合 216 11.4 图文联合训练 219 11.5 检索增强视觉语言模型 222 11.6 视觉指令调整 225 11.7 小结 227 第 12章环境影响 229 12.1 能源消耗和温室气体排放 229 12.2 估算训练模型的排放量 230 12.3 小结 231 参考文献 232

查看全部评论>

服务体验

大语言模型:基础与前沿熊涛著专业科技文轩网

新华书店正版

看了又看

商品预定流程：

预约抢购流程说明：

云钻刮券

刮券规则

云钻刮券活动规则

活动时间

活动形式

其他

券使用规则

苏宁商家

搜索店内商品

商品分类

商品分类

文轩网图书旗舰店

售后保障

最近浏览

猜你喜欢

服务体验

大语言模型:基础与前沿 熊涛 著 专业科技 文轩网

新华书店正版

看了又看

商品预定流程：

预约抢购流程说明：

云钻刮券

刮券规则

云钻刮券活动规则

活动时间

活动形式

其他

券使用规则

苏宁商家

搜索店内商品

商品分类

商品分类

计算机/网络排行榜

文轩网图书旗舰店

售后保障

最近浏览

猜你喜欢

大语言模型:基础与前沿熊涛著专业科技文轩网