返回首页
苏宁会员
购物车 0
易付宝
手机苏宁

服务体验

店铺评分与同行业相比

用户评价:----

物流时效:----

售后服务:----

  • 服务承诺: 正品保障
  • 公司名称:
  • 所 在 地:
本店所有商品

  • [正版新书]大语言模型开发 用开源模型开发本地系统 范煜 清华大学出版社 数据开发 模型开发
  • 新商品上架
    • 作者: 范煜著
    • 出版社: 清华大学出版社
    • 出版时间:2024-09
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    苏宁商家

    商家:
    句字图书专营店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    商品分类

    商品参数
    • 作者: 范煜著
    • 出版社:清华大学出版社
    • 出版时间:2024-09
    • 开本:16开
    • ISBN:9780224065371
    • 版权提供:清华大学出版社

     书名:  大语言模型开发:用开源模型开发本地系统
     出版社:  清华大学出版社
     出版日期  
     ISBN号:  9787302670513
    本书旨在帮助读者理解开源大语言模型的架构、训练和推理过程,以及相关的源代码。主要研究对象是Meta开源的Llama模型。本书从PyTorch实现单层感知机和神经网络开始,逐步讲解了如何实现Transformer模型和Llama模型。此外,本书还介绍了增量预训练模型、监督微调和人类反馈强化学习等模型训练过程。对于私有知识的加入,书中重点介绍了监督微调,也介绍了 RAG 中词向量的计算。本书采用循序渐进的方式,通过功能框图、代码分解执行、执行结果显示、背景知识补充等手段帮助读者理解模型和算法。
    本书的核心读者群体定位为大语言模型应用的开发人员,特别适合那些想从计算机视觉转向自然语言处理的人。此外,本书还适合作为大学本科及研究生相关课程的教学参考教材使用。
    本书封面贴有清华大学出版社防伪标签,无标签者不得销售。
    版权所有,侵权必究。举报:010-62782989,beiqinquan@tup.tsinghua.edu.cn。

     

    范煜,江苏南通人,毕业于南京航空航天大学,研究员级高级工程师,中国商业联合会数据分析专业委员会专家组成员,南通理工学院教师,上海范思软件有限公司创始人,中国移动集团、51CTO外聘讲师经常在全国各地讲授大数据、数据分析人工智能、大语言模型等方面课程。研发了Fancy Q&A大语言模型应用开发平台。著有《人工智能与ChatGPT》《数据革命:大数据价值实现方法、技术与案例》。兼具人工智能、大数据、软件、工业控制(嵌入式系统和软PLC)技术背景。目前主要从事基于大语言模型的知识库建设与知识问答应用的研究和开发。

     

    •本书基本覆盖大语言模型开发的多个方面。整体上可以参照OpenAI的安德烈•卡帕西(Andrej Karpathy)在微软的2023年Build大会报告中介绍的GPT助手训练流程。
    •本书的内容来源不仅包含网络上的各类教程和文章,也包括原始论文和源代码。
    •本书不但适用于大型语言模型应用开发人员,而且对于渴望深度探究ChatGPT背后的运行机制,更高效地运用和优化其功能的实践者,同样具有极高的参考价值。

     

    目录
    CONTENTS





    ========================================
    @@@0@@@
    @@@1@@@第 1 章
    @@@2@@@
    @@@3@@@自然语言处理
    @@@4@@@
    @@@5@@@
    @@@6@@@
    @@@7@@@
    ========================================
    @@@0@@@1.1
    @@@1@@@人工智能的技术构成
    @@@2@@@………….
    @@@3@@@002
    @@@4@@@
    ========================================
    @@@0@@@
    @@@1@@@
    @@@2@@@
    @@@3@@@
    @@@4@@@
    @@@5@@@
    @@@6@@@
    @@@7@@@
    @@@8@@@
    @@@9@@@
    @@@10@@@
    ========================================
    @@@0@@@1.1.1
    @@@1@@@机器学习和深度学习的区别
    @@@2@@@….
    @@@3@@@002
    @@@4@@@
    ========================================
    @@@0@@@
    @@@1@@@
    @@@2@@@
    @@@3@@@
    @@@4@@@
    @@@5@@@
    ========================================
    @@@0@@@1.1.2
    @@@1@@@表示学习与深度学习的关系
    @@@2@@@….
    @@@3@@@003
    @@@4@@@
    ========================================
    @@@0@@@
    @@@1@@@
    @@@2@@@
    @@@3@@@
    @@@4@@@
    @@@5@@@
    ========================================
    @@@0@@@1.2
    @@@1@@@自然语言处理的发展阶段
    @@@2@@@………
    @@@3@@@004
    @@@4@@@
    ========================================
    @@@0@@@
    @@@1@@@
    @@@2@@@
    @@@3@@@
    @@@4@@@
    @@@5@@@
    @@@6@@@
    ========================================
    @@@0@@@1.3
    @@@1@@@规则驱动的方法
    @@@2@@@……………..
    @@@3@@@005
    @@@4@@@
    ========================================
    @@@0@@@
    @@@1@@@
    @@@2@@@
    @@@3@@@
    @@@4@@@
    @@@5@@@
    @@@6@@@
    @@@7@@@
    @@@8@@@
    @@@9@@@
    @@@10@@@
    @@@11@@@
    @@@12@@@
    @@@13@@@
    ========================================
    @@@0@@@1.4
    @@@1@@@统计方法
    @@@2@@@………………….
    @@@3@@@005
    @@@4@@@
    ========================================
    @@@0@@@
    @@@1@@@
    @@@2@@@
    @@@3@@@
    @@@4@@@
    @@@5@
    ………

     

    前言
    PREFACE




    ChatGPT 的成功推动下,人工智能(artificial intelligence,AI)技术的主要研究焦点已从计算机视觉逐渐转向自然语言处理(natural language processing,NLP)。这使得原本相对边缘的自然语言处理技术逐渐走向了舞台中心。尽管自然语言处理的研究者相较于计算机视觉(computer vision,CV)领域来说少,但经过几十年的发展,其积累的技术成果也十分丰富。以 ChatGPT 及其背后的 GPT(Generative Pretrained Transformer)模型为代表的大语言模型(LLM)技术的成功,不是一夜之间的突变,而是基于多年技术积累取得的一次重大突破。
    但是,并非所有的自然语言处理技术都被大语言模型的开发所采用。一些技术路线已被放弃,一些虽然得到了发展,但已被更优秀的技术所取代。在大语言模型技术的后续发展中,这些被抛弃或替代的技术仍有可能被重新研究和改进。本书旨在是让读者了解主流大语言模型所采用的技术,而不是去开发新的大语言模型。因此,我们主要介绍了 GPT 系列及开源 Llama 2 模型所采用的技术,对其他技术并未进行探讨,例如知名的词嵌入(word embeddings)技术 Word2Vec。
    现在的大语言模型基本上都是基于 Transformer 架构。相较于标准的编码器 - 解码器

    (Encoder-Decoder)结构,如今的 GPT 系列产品及 Llama 1、Llama 2 都采用了单解码器结构。本书以 Transformer 模型架构为基础,重点关注了纯解码器技术方向,并对相关技术进行了详细的阐述。
    由于 GPT-3.5、GPT-4 的技术并未开源,且基于其 API(应用程序接口)的开发并不适合本地部署,因此本书的开发技术主要基于开源的大
    范煜,江苏南通人,毕业于南京航空航天大学,研究员级高级工程师,中国商业联合会数据分析专业委员会专家组成员,南通理工学院教师,上海范思软件有限公司创始人,中国移动集团、51CTO外聘讲师经常在全国各地讲授大数据、数据分析人工智能、大语言模型等方面课程。研发了Fancy Q&A大语言模型应用开发平台。著有《人工智能与ChatGPT》《数据革命:大数据价值实现方法、技术与案例》。兼具人工智能、大数据、软件、工业控制(嵌入式系统和软PLC)技术背景。目前主要从事基于大语言模型的知识库建设与知识问答应用的研究和开发。

     

    1
    • 商品详情
    • 内容简介

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购