- 商品参数
-
- 作者:
穆罕默德·J.扎基著
- 出版社:机械工业出版社
- 出版时间:2023-05
- ISBN:9787111726890
- 版权提供:机械工业出版社
店铺公告
为保障消费者合理购买需求及公平交易机会,避免因非生活消费目的的购买货囤积商品,抬价转售等违法行为发生,店铺有权对异常订单不发货且不进行赔付。异常订单:包括但不限于相同用户ID批量下单,同一用户(指不同用户ID,存在相同/临近/虚构收货地址,或相同联系号码,收件人,同账户付款人等情形的)批量下单(一次性大于5本),以及其他非消费目的的交易订单。
温馨提示:请务必当着快递员面开箱验货,如发现破损,请立即拍照拒收,如验货有问题请及时联系在线客服处理,(如开箱验货时发现破损,所产生运费由我司承担,一经签收即为货物完好,如果您未开箱验货,一切损失就需要由买家承担,所以请买家一定要仔细验货),
关于退货运费:对于下单后且物流已发货货品在途的状态下,原则上均不接受退货申请,如顾客原因退货需要承担来回运费,如因产品质量问题(非破损问题)可在签收后,联系在线客服。
本店存在书、古旧书、收藏书、二手书等特殊商品,因受采购成本限制,可能高于定价销售,明码标价,介意者勿拍!
1.书籍因稀缺可能导致售价高于定价,图书实际定价参见下方详情内基本信息,请买家看清楚且明确后再拍,避免价格争议!
2.店铺无纸质均开具电子,请联系客服开具电子版
![]()
![]()
![]() |
商品名称: | 数据挖掘与机器学习:基础概念和算法(原书第2版) |
作 者: | [美]穆罕默德·J.扎基(Mohammed J. Zaki),[巴]小瓦格纳·梅拉(Wagner Meira, Jr.) 著 |
市 场 价: | 199.00 |
ISBN 号: | 9787111726890 |
出版日期: | |
页 数: | 604 |
开 本: | |
出 版 社: | 机械工业出版社 |
![]()
![]()
目 录 Data Mining and Machine Learning 译者序 前言 作者简介 第一部分 数据分析基础 1 第1章 数据矩阵 3 1.1 数据矩阵的组成 3 1.2 属性 4 1.3 数据:代数和几何观点 5 1.3.1 距离和角度 7 1.3.2 均值和总方差 9 1.3.3 正交投影 10 1.3.4 线性无关和维数 12 1.4 数据:概率观点 13 1.4.1 二元随机变量 17 1.4.2 多元随机变量 20 1.4.3 随机抽样与统计 21 1.5 拓展阅读 22 1.6 练习 23 第2章 数值型属性 24 2.1 一元分析 24 2.1.1 集中趋势度量 25 2.1.2 离散度度量 28 2.2 二元分析 32 2.2.1 位置和离散度的度量 33 2.2.2 相关性度量 33 2.3 多元分析 37 2.4 数据归一化 41 2.5 正态分布 42 2.5.1 一元正态分布 43 2.5.2 多元正态分布 44 2.6 拓展阅读 47 2.7 练习 47 第3章 类别型属性 49 3.1 一元分析 49 3.1.1 伯努利变量 49 3.1.2 多元伯努利变量 51 3.2 二元分析 56 3.3 多元分析 65 3.4 距离和角度 69 3.5 离散化 70 3.6 拓展阅读 72 3.7 练习 72 第4章 图数据 74 4.1 图的概念 74 4.2 拓扑属性 77 4.3 中心度分析 81 4.3.1 基本中心度 81 4.3.2 Web中心度 82 4.4 图模型 89 4.4.1 Erd?s-Rényi随机图模型 91 4.4.2 Watts-Strogatz小世界图 模型 94 4.4.3 Barabási-Albert无标度模型 98 4.5 拓展阅读 104 4.6 练习 105 第5章 核方法 107 5.1 核矩阵 110 5.1.1 再生核映射 111 5.1.2 Mercer核映射 113 5.2 向量核 115 5.3 特征空间中的基本核运算 119 5.4 复杂对象的核 124 5.4.1 字符串的谱核 124 5.4.2 图节点的扩散核 125 5.5 拓展阅读 129 5.6 练习 129 第6章 高维数据 130 6.1 高维对象 130 6.2 高维体积 133 6.3 超立方体的内接超球面 135 6.4 薄超球面壳的体积 136 6.5 超空间的对角线 137 6.6 多元正态分布的密度 138 6.7 附录:超球面体积的推导 140 6.8 拓展阅读 143 6.9 练习 144 第7章 降维 146 7.1 背景介绍 146 7.2 主成分分析 149 7.2.1 最优一维近似 149 7.2.2 最优二维近似 152 7.2.3 最优r维近似 155 7.2.4 主成分分析的几何意义 158 7.3 核主成分分析 160 7.4 奇异值分解 166 7.4.1 奇异值分解中的几何 意义 167 7.4.2 SVD和PCA之间的 联系 168 7.5 拓展阅读 169 7.6 练习 169 第二部分 频繁模式挖掘 171 第8章 项集挖掘 173 8.1 频繁项集和关联规则 173 8.2 项集挖掘算法 176 8.2.1 逐层方法:Apriori算法 177 8.2.2 事务标识符集的交集方法: Eclat算法 181 8.2.3 频繁模式树方法:FPGrowth 算法 184 8.3 生成关联规则 188 8.4 拓展阅读 189 8.5 练习 190 第9章 项集概览 194 9.1 最大频繁项集和闭频繁项集 194 9.2 挖掘最大频繁项集:GenMax 算法 196 9.3 挖掘闭频繁项集:Charm算法 198 9.4 非可导项集 200 9.5 拓展阅读 205 9.6 练习 205 第10章 序列挖掘 208 10.1 频繁序列 208 10.2 挖掘频繁序列 209 10.2.1 逐层挖掘:GSP 209 10.2.2 垂直序列挖掘:Spade 211 10.2.3 基于投影的序列挖掘: PrefixSpan 212 10.3 基于后缀树的子串挖掘 214 10.3.1 后缀树 214 10.3.2 Ukkonen线性时间复杂度 算法 217 10.4 拓展阅读 222 10.5 练习 223 第11章 图模式挖掘 226 11.1 同构与支持度 226 11.2 候选图生成 229 11.3 gSpan算法 232 11.3.1 扩展和支持度计算 233 11.3.2 权威性检测 238 11.4 拓展阅读 239 11.5 练习 239 第12章 模式评估与规则评估 242 12.1 模式评估和规则评估的度量 242 12.1.1 规则评估度量 242 12.1.2 模式评估度量 249 12.1.3 比较多条规则和模式 251 12.2 显著性检验和置信区间 253 12.2.1 产生式规则的费希尔 精确检验 254 12.2.2 显著性的置换检验 257 12.2.3 置信区间内的自助抽样 261 12.3 拓展阅读 262 12.4 练习 263 第三部分 聚类 265 第13章 基于代表点的聚类 267 13.1 K-means算法 267 13.2 核K-means 271 13.3 期望最大化聚类 274 13.3.1 一维数据的EM 276 13.3.2 d维数据的EM 278 13.3.3 最大似然估计 283 13.3.4 EM算法 286 13.4 拓展阅读 289 13.5 练习 290 第 14 章 层次式聚类 292 14.1 基础知识 292 14.2 聚合型层次式聚类 294 14.2.1 簇间距离 294 14.2.2 更新距离矩阵 297 14.2.3 计算复杂度 298 14.3 拓展阅读 298 14.4 练习 298 第15章 基于密度的聚类 301 15.1 DBSCAN算法 301 15.2 核密度估计 304 15.2.1 一元密度估计 304 15.2.2 多元密度估计 307 15.2.3 最近邻密度估计 308 15.3 基于密度的聚类:DENCLUE 309 15.4 拓展阅读 313 15.5 练习 314 第16章 谱聚类和图聚类 316 16.1 图和矩阵 316 16.2 基于图割的聚类 322 16.2.1 聚类目标函数:比例割 和归一割 323 16.2.2 谱聚类算法 325 16.2.3 最大化目标函数:平均割 和模块度 328 16.3 马尔可夫聚类 334 16.4 拓展阅读 339 16.5 练习 340 第17章 聚类验证 342 17.1 外部验证度量 342 17.1.1 基于匹配的度量 343 17.1.2 基于熵的度量 346 17.1.3 成对度量 349 17.1.4 关联度量 352 17.2 内部验证度量 354 17.3 相对验证度量 361 17.3.1 簇稳定性 366 17.3.2 聚类趋向性 368 17.4 拓展阅读 372 17.5 练习 373 第四部分 分类 375 第18章 基于概率的分类 377 18.1 贝叶斯分类器 377 18.1.1 估计先验概率 377 18.1.2 估计似然值 378 18.2 朴素贝叶斯分类器 382 18.3 K最近邻分类器 385 18.4 拓展阅读 387 18.5 练习 387 第19章 决策树分类器 389 19.1 决策树 390 19.2 决策树算法 392 19.2.1 分割点评估度量 393 19.2.2 评估分割点 394 19.2.3 计算复杂度 401 19.3 拓展阅读 401 19.4 练习 401 第20章 线性判别分析 403 20.1 最佳线性判别 403 20.2 核判别分析 408 20.3 拓展阅读 413 20.4 练习 414 第21章 支持向量机 415 21.1 支持向量和间隔 415 21.2 SVM:线性可分的情况 419 21.3 软间隔SVM:线性不可分 的情况 423 21.3.1 铰链误损 424 21.3.2 二次误损 427 21.4 核SVM:非线性情况 428 21.5 SVM训练算法:随机梯度上升 431 21.6 拓展阅读 436 21.7 练习 436 第22章 分类评估 438 22.1 分类性能度量 438 22.1.1 基于列联表的度量 439 22.1.2 二元分类:正类和负类 441 22.1.3 ROC分析 444 22.2 分类器评估 448 22.2.1 K折交叉验证 449 22.2.2 自助抽样 450 22.2.3 置信区间 451 22.2.4 分类器比较:配对t检验 455 22.3 偏差–方差分解 457 22.4 合成分类器 460 22.4.1 装袋法 460 22.4.2 随机森林:装袋决策树 461 22.4.3 boosting 463 22.4.4 堆栈法 467 22.5 拓展阅读 468 22.6 练习 469 第五部分 回归 471 第23章 线性回归 473 23.1 线性回归模型 473 23.2 二元回归 474 23.3 多元回归 479 23.3.1 多元回归的几何结构 481 23.3.2 多元回归算法 483 23.3.3 多元回归分析:随机梯度 下降 486 23.4 岭回归 487 23.5 核回归 490 23.6 L1回归:套索回归 494 23.6.1 次梯度和次微分 495 23.6.2 二元L1回归 495 23.6.3 多元L1回归 496 23.7 拓展阅读 498 23.8 练习 499 第24章 逻辑回归 500 24.1 二元逻辑回归 500 24.2 多元逻辑回归 506 24.3 拓展阅读 510 24.4 练习 510 第25章 神经网络 511 25.1 人工神经元:激活函数 511 25.2 神经网络:回归函数和分类 函数 515 25.2.1 回归函数 515 25.2.2 分类函数 516 25.2.3 误差函数 518 25.3 多层感知器:一个隐藏层 519 25.3.1 前馈阶段 520 25.3.2 反向传播阶段 521 25.3.3 MLP训练 525 25.4 深度多层感知器 529 25.4.1 前馈阶段 530 25.4.2 反向传播阶段 531 25.4.3 输出层的净梯度 531 25.4.4 隐藏层的净梯度 534 25.4.5 深度MLP训练 534 25.5 拓展阅读 537 25.6 练习 537 第26章 深度学习 539 26.1 循环神经网络 539 26.1.1 时间上的前馈 541 26.1.2 时间上的反向传播 541 26.1.3 训练RNN 544 26.1.4 双向RNN 546 26.2 门控RNN:长–短期记忆 网络 547 26.2.1 遗忘门 549 26.2.2 长–短期记忆网络 552 26.2.3 训练LSTM网络 553 26.3 卷积神经网络 556 26.3.1 卷积 556 26.3.2 偏差和激活函数 562 26.3.3 填充和步幅 563 26.3.4 广义聚合函数:池化 565 26.3.5 深度CNN 566 26.3.6 训练CNN 566 26.4 正则化 571 26.4.1 深度学习的L2正则化 572 26.4.2 丢弃正则化 574 26.5 拓展阅读 576 26.6 练习 576 第27章 回归评估 578 27.1 一元回归 578 27.1.1 估计方差 579 27.1.2 拟合优度 580 27.1.3 回归系数和偏差项 的推断 583 27.1.4 回归效果的假设检验 587 27.1.5 标准化残差 588 27.2 多元回归 591 27.2.1 拟合优度 593 27.2.2 回归系数推断 596 27.2.3 假设检验 598 27.2.4 统计检验的几何学方法 601 27.3 拓展阅读 604 27.4 练习 604 |
![]()
![]()
本书详实介绍了数据挖掘与机器学习相关的各种内容,包括数据矩阵、图数据、核方法、项集挖掘、聚类、贝叶斯分类器、决策树、支持向量机、线性回归、逻辑回归、神经网络、深度学习等,介绍其相关概念和基础算法,并在每章的末尾配有相关练习。第二版新增了几个关于回归的章节,包括神经网络和深度学习的内容。 |
1