返回首页
苏宁会员
购物车 0
易付宝
手机苏宁

服务体验

店铺评分与同行业相比

用户评价:----

物流时效:----

售后服务:----

  • 服务承诺: 正品保障
  • 公司名称:
  • 所 在 地:

  • 语音识别 原理与应用 洪青阳,李琳 著 专业科技 文轩网
  • 新华书店正版
    • 作者: 洪青阳,李琳著
    • 出版社: 电子工业出版社
    • 出版时间:2020-06-01 00:00:00
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    苏宁商家

    商家:
    文轩网图书旗舰店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    商品分类

         https://product.suning.com/0070067633/11555288247.html

     

    商品参数
    • 作者: 洪青阳,李琳著
    • 出版社:电子工业出版社
    • 出版时间:2020-06-01 00:00:00
    • 版次:1
    • 印次:1
    • 印刷时间:2020-06-01
    • 字数:362000
    • 页数:319
    • 开本:16开
    • 装帧:平装
    • ISBN:9787121385025
    • 国别/地区:中国
    • 版权提供:电子工业出版社

    语音识别 原理与应用

    作  者:洪青阳,李琳 著
    定  价:128
    出 版 社:电子工业出版社
    出版日期:2020年06月01日
    页  数:319
    装  帧:平装
    ISBN:9787121385025
    主编推荐

    内容简介

    本书系统地介绍了语音识别的原理和应用,全书共分15章,原理部分涵盖声学特征、隐马尔可夫模型(HMM)、高斯混合模型(GMM)、深度神经网络(DNN)、语言模型和加权有限状态转换器(WFST),重点描述了GMM-HMM、DNN-HMM和端到端(E2E)三种语音识别框架。本书应用部分包含Kaldi、Espnet、工业应用实践介绍,内容主要来自工程经验,极具实用性。本书可以作为普通高等学校人工智能、计算机科学与技术、电子信息工程、自动化等专业的本科生及研究生教材,也适合作为从事智能语音系统的科研和工程技术人员的参考用书。

    作者简介

    洪青阳,厦门大学副教授,语音识别方向,在国际重要期刊和会议发表学术论文近50篇,已获得发明专利授权7项,并研发多款语音声纹产品,成功应用到智能手机、智能玩具、公安司法、市场调查等行业客户。2018年3月起,研发的声纹识别技术先后在华为P20、Mate20手机落地应用。

    精彩内容

    目录
    第1章语音识别概论1
    1.1语音的产生和感知1
    1.2语音识别过程4
    1.3语音识别发展历史8
    1.4国内语音识别现状15
    1.5语音识别建模方法19
    1.5.1DTW19
    1.5.2GMM-HMM20
    1.5.3DNN-HMM20
    1.5.4端到端22
    1.6语音识别开源工具22
    1.7语音识别常用数据库22
    1.8语音识别评价指标24
    1.9参考资料24
    第2章语音信号基础28
    2.1声波的特性28
    2.2声音的接收装置29
    2.2.1麦克风阵列31
    2.3声音的采样32
    2.4声音的量化33
    2.5语音的编码35
    2.6WAV文件格式38
    2.7WAV文件分析39
    2.8本章小结42
    思考练习题43
    第3章语音特征提取44
    3.1预处理44
    3.2短时傅立叶变换48
    3.3听觉特性51
    3.4线性预测54
    3.5倒谱分析55
    3.6常用的声学特征56
    3.6.1语谱图57
    3.6.2FBank58
    3.6.3MFCC59
    3.6.4PLP61
    3.6.5CQCC62
    3.7本章小结65
    思考练习题66
    第4章HMM67
    4.1HMM的基本概念69
    4.1.1马尔可夫链70
    4.1.2双重随机过程71
    4.1.3HMM的定义72
    4.2HMM的三个基本问题73
    4.2.1模型评估问题74
    4.2.2很好路径问题77
    4.2.3模型训练问题79
    4.3本章小结81
    4.4参考资料82
    思考练习题82
    第5章GMM-HMM83
    5.1概率统计84
    5.2高斯分布85
    5.3GMM88
    5.3.1初始化89
    5.3.2重估计90
    5.4GMM-HMM91
    5.5GMM-HMM的训练97
    5.6模型自适应99
    5.6.1MAP99
    5.6.2MLLR100
    5.6.3fMLLR100
    5.6.4SAT101
    5.7本章小结101
    5.8参考资料101
    思考练习题102
    课程实践:基于HTK搭建GMM-HMM系统103
    第6章基于HMM的语音识别104
    6.1建模单元104
    6.2发音过程与HMM状态107
    6.3串接HMM108
    6.4固定语法的识别112
    6.5随机语法的识别117
    6.6本章小结123
    思考练习题124
    第7章音素的上下文建模125
    7.1协同发音125
    7.2上下文建模126
    7.3决策树128
    7.4问题集129
    7.4.1手工设计129
    7.4.2自动生成131
    7.5三音子模型的训练134
    7.6本章小结135
    思考练习题135
    第8章语言模型136
    8.1n-gram模型138
    8.2评价指标――困惑度142
    8.3平滑技术143
    8.3.1Good-Turing折扣法143
    8.3.2Jelinek-Mercer插值法144
    8.3.3Kneser-Ney插值法144
    8.3.4Katz回退法146
    8.4语言模型的训练148
    8.5递归神经网络语言模型151
    8.6本章小结156
    8.7参考资料156
    思考练习题157
    第9章WFST解码器158
    9.1基于动态网络的Viterbi解码159
    9.2WFST理论163
    9.3HCLG构建168
    9.3.1H的构建169
    9.3.2C的构建171
    9.3.3L的构建172
    9.3.4G的构建173
    9.3.5HCLG合并175
    9.4WFST的Viterbi解码177
    9.4.1Token的定义177
    9.4.2Viterbi算法178
    9.5Lattice解码185
    9.5.1主要数据结构185
    9.5.2令牌传播过程186
    9.5.3剪枝策略189
    9.5.4Lattice190
    9.6本章小结192
    9.7参考资料192
    思考练习题193
    第10章DNN-HMM194
    10.1深度学习194
    10.2DNN195
    10.2.1激活函数196
    10.2.2损失函数198
    10.2.3梯度下降算法199
    10.3DNN与HMM的结合201
    10.4不同的DNN结构205
    10.4.1CNN205
    10.4.2LSTM210
    10.4.3GRU210
    10.4.4TDNN211
    10.4.5TDNN-F214
    10.5本章小结218
    10.6参考资料219
    思考练习题219
    第11章序列区分性训练220
    11.1区分性准则221
    11.1.1MMI221
    11.1.2BMMI222
    11.1.3MPE/sMBR222
    11.2MMI求导过程223
    11.3Lattice-basedMMI225
    11.4Lattice-freeMMI227
    11.5KaldiChain模型230
    11.6本章小结231
    11.7参考资料231
    思考练习题232
    第12章端到端语音识别233
    12.1CTC234
    12.1.1损失函数235
    12.1.2前向算法239
    12.1.3后向算法242
    12.1.4求导过程243
    12.1.5CTC解码245
    12.2RNN-T248
    12.3Attention模型251
    12.4HybridCTC/Attention254
    12.5Transformer256
    12.6本章小结259
    12.7参考资料260
    思考练习题261
    第13章Kaldi实践262
    13.1下载与安装Kaldi263
    13.1.1获取源代码263
    13.1.2编译264
    13.2创建与配置基本的工程目录265
    13.3aishell语音识别工程266
    13.3.1数据映射目录准备267
    13.3.2词典准备和lang目录生成269
    13.3.3语言模型训练271
    13.3.4声学特征提取与倒谱均值归一化273
    13.3.5声学模型训练与强制对齐274
    13.3.6解码测试与指标计算277
    13.4本章小结279
    第14章Espnet实践280
    14.1数据准备280
    14.1.1映射文件准备280
    14.1.2特征提取281
    14.1.3数据增强282
    14.1.4词典生成282
    14.1.5数据打包283
    14.2Espnet配置文件284
    14.3语言模型训练285
    14.4声学模型训练287
    14.4.1声学模型训练脚本287
    14.4.2CTC声学模型训练288
    14.4.3Attention声学模型训练289
    14.4.4RNN-T模型训练290
    14.4.5Transformer模型训练292
    14.5语音识别解码293
    14.6Espnet训练解码可视化294
    14.6.1Espnet训练参数可视化294
    14.6.2Espnet中的Attention可视化295
    14.6.3Espnet解码结果可视化296
    14.7本章小结297
    14.8参考资料297
    第15章工业应用实践298
    15.1动态库封装298
    15.1.1函数接口298
    15.1.2动态库编译306
    15.1.3动态库调用309
    15.2语音云平台310
    15.3识别引擎优化315
    15.3.1加快响应速度315
    15.3.2定制语言模型316
    15.3.3定制声学模型316
    15.4嵌入式移植318
    15.5本章小结319

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购