返回首页
苏宁会员
购物车 0
易付宝
手机苏宁

服务体验

店铺评分与同行业相比

用户评价:----

物流时效:----

售后服务:----

  • 服务承诺: 正品保障
  • 公司名称:
  • 所 在 地:

  • 正版 阿里云天池大赛赛题解析(机器学习篇) 天池平台 电子工业出
  • 新华书店旗下自营,正版全新
    • 作者: 天池平台著 | 天池平台编 | 天池平台译 | 天池平台绘
    • 出版社: 电子工业出版社
    • 出版时间:2019-03
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    苏宁商家

    商家:
    美阅书店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    商品参数
    • 作者: 天池平台著| 天池平台编| 天池平台译| 天池平台绘
    • 出版社:电子工业出版社
    • 出版时间:2019-03
    • 版次:1
    • 印次:1
    • 字数:556000
    • 页数:366
    • 开本:16开
    • ISBN:9787121393501
    • 版权提供:电子工业出版社
    • 作者:天池平台
    • 著:天池平台
    • 装帧:平装-胶订
    • 印次:1
    • 定价:109.00
    • ISBN:9787121393501
    • 出版社:电子工业出版社
    • 开本:16开
    • 印刷时间:暂无
    • 语种:暂无
    • 出版时间:2019-03
    • 页数:366
    • 外部编号:9868009
    • 版次:1
    • 成品尺寸:暂无

    赛题一 工业蒸汽量预测
    1 赛题理解
    1.1 赛题背景
    1.2 赛题目标
    1.3 数据概览
    1.4 评估指标
    1.5 赛题模型
    2 数据探索
    2.1 理论知识
    2.1.1 变量识别
    2.1.2 变量分析
    2.1.3 缺失值处理
    2.1.4 异常值处理
    2.1.5 变量转换
    2.1.6 新变量生成
    2.2 赛题数据探索
    2.2.1 导入工具包
    2.2.2 读取数据
    2.2.3 查看数据
    2.2.4 可视化数据分布
    2.2.5 查看特征变量的相关性
    3 特征工程
    3.1 特征工程的重要性和处理
    3.2 数据预处理和特征处理
    3.2.1 数据预处理
    3.2.2 特征处理
    3.3 特征降维
    3.3.1 特征选择
    3.3.2 线性降维
    3.4 赛题特征工程
    3.4.1 异常值分析
    3.4.2 最大值和最小值的归一化
    3.4.3 查看数据分布
    3.4.4 特征相关性
    3.4.5 特征降维
    3.4.6 多重共线性分析
    3.4.7 PCA处理
    4 模型训练
    4.1 回归及相关模型
    4.1.1 回归的概念
    4.1.2 回归模型训练和预测
    4.1.3 线性回归模型
    4.1.4 K近邻回归模型
    4.1.5 决策树回归模型
    4.1.6 集成学习回归模型
    4.2 赛题模型训练
    4.2.1 导入相关库
    4.2.2 切分数据
    4.2.3 多元线性回归
    4.2.4 K近邻回归
    4.2.5 随机森林回归
    4.2.6 LGB模型回归
    5 模型验证
    5.1 模型评估的概念和方法
    5.1.1 欠拟合与过拟合
    5.1.2 模型的泛化与正则化
    5.1.3 回归模型的评估指标和调用方法
    5.1.4 交叉验证
    5.2 模型调参
    5.2.1 调参
    5.2.2 网格搜索
    5.2.3 学习曲线
    5.2.4 验证曲线
    5.3 赛题模型验证和调参
    5.3.1 模型过拟合与欠拟合
    5.3.2 模型正则化
    5.3.3 模型交叉验证
    5.3.4 模型超参空间及调参
    5.3.5 学习曲线和验证曲线
    6 特征优化
    6.1 特征优化的方法
    6.1.1 合成特征
    6.1.2 特征的简单变换
    6.1.3 用决策树创造新特征
    6.1.4 特征组合
    6.2 赛题特征优化
    6.2.1 导入数据
    6.2.2 特征构造方法
    6.2.3 特征构造函数
    6.2.4 特征降维处理
    6.2.5 模型训练和评估
    7 模型融合
    7.1 模型优化
    7.1.1 模型学习曲线
    7.1.2 模型融合提升技术
    7.1.3 预测结果融合策略
    7.1.4 其他提升方法
    7.2 赛题模型融合
    7.2.1 导入工具包
    7.2.2 获取训练数据和测试数据
    7.2.3 模型评价函数
    7.2.4 采用网格搜索训练模型
    7.2.5 单一模型预测效果
    7.2.6 模型融合Boosting方法
    7.2.7 多模型预测Bagging方法
    7.2.8 多模型融合Stacking方法
    7.2.9 模型验证
    7.2.10 使用lr_reg和lgb_reg进行融合预测
    赛题二 天猫用户重复购买预测
    1 赛题理解
    1.1 赛题背景
    1.2 数据介绍
    1.3 评估指标
    1.4 赛题分析
    2 数据探索
    2.1 理论知识
    2.1.1 缺失数据处理
    2.1.2 不均衡样本
    2.1.3 常见的数据分布
    2.2 赛题数据探索
    2.2.1 导入工具包
    2.2.2 读取数据
    2.2.3 数据集样例查看
    2.2.4 查看数据类型和数据大小
    2.2.5 查看缺失值
    2.2.6 观察数据分布
    2.2.7 探查影响复购的各种因素
    3 特征工程
    3.1 特征工程介绍
    3.1.1 特征工程的概念
    3.1.2 特征归一化
    3.1.3 类别型特征的转换
    3.1.4 高维组合特征的处理
    3.1.5 组合特征
    3.1.6 文本表示模型
    3.2 赛题特征工程思路
    3.3 赛题特征工程构造
    3.3.1 工具导入
    3.3.2 数据读取
    3.3.3 对数据进行内存压缩
    3.3.4 数据处理
    3.3.5 定义特征统计函数
    3.3.6 提取统计特征
    3.3.7 利用Countvector和TF-IDF提取特征
    3.3.8 嵌入特征
    3.3.9 Stacking分类特征
    4 模型训练
    4.1 分类的概念
    4.2 分类相关模型
    4.2.1 逻辑回归分类模型
    4.2.2 K近邻分类模型
    4.2.3 高斯贝叶斯分类模型
    4.2.4 决策树分类模型
    4.2.5 集成学习分类模型
    5 模型验证
    5.1 模型验证指标
    5.1.1 准确度
    5.1.2 查准率和查全率
    5.1.3 F1值
    5.1.4 分类报告
    5.1.5 混淆矩阵
    5.1.6 ROC
    5.1.7 AUC曲线
    5.2 赛题模型验证和评估
    5.2.1 基础代码
    5.2.2 简单验证
    5.2.3 设置交叉验证方式
    5.2.4 模型调参
    5.2.5 混淆矩阵
    5.2.6 不同的分类模型
    5.2.7 自己封装模型
    6 特征优化
    6.1 特征选择技巧
    6.2 赛题特征优化
    6.2.1 基础代码
    6.2.2 缺失值补全
    6.2.3 特征选择
    赛题三 O2O优惠券预测
    1 赛题理解
    1.1 赛题介绍
    1.2 赛题分析
    2 数据探索
    2.1 理论知识
    2.1.1 数据探索的定义
    2.1.2 数据探索的目的
    2.1.3 相关Python包
    2.2 初步的数据探索
    2.2.1 数据读取
    2.2.2 数据查看
    2.2.3 数据边界探索
    2.2.4 训练集与测试集的相关性
    2.2.5 数据统计
    2.3 数据分布
    2.3.1 对文本数据的数值化处理
    2.3.2 数据分布可视化
    3 特征工程
    3.1 赛题特征工程思路
    3.2 赛题特征构建
    3.2.1 工具函数
    3.2.2 特征群生成函数
    3.2.3 特征集成函数
    3.2.4 特征输出
    3.3 对特征进行探索
    3.3.1 特征读取函数
    3.3.2 特征总览
    3.3.3 查看特征的分布
    3.3.4 特征相关性分析
    4 模型训练
    4.1 模型训练与评估
    4.2 不同算法模型的性能对比
    4.2.1 朴素贝叶斯
    4.2.2 逻辑回归
    4.2.3 决策树
    4.2.4 随机森林
    4.2.5 XGBoost
    4.2.6 LightGBM
    4.2.7 不同特征效果对比
    4.3 结果输出
    5 模型验证
    5.1 评估指标
    5.2 交叉验证
    5.3 模型比较
    5.4 验证结果可视化
    5.5 结果分析
    5.6 模型调参
    5.7 实际方案
    6 提交结果
    6.1 整合及输出结果
    6.2 结果提交及线上验证
    赛题四 阿里云安全恶意程序检测
    1 赛题理解
    1.1 赛题介绍
    1.2 赛题分析
    2 数据探索
    2.1 训练集数据探索
    2.1.1 数据特征类型
    2.1.2 数据分布
    2.1.3 缺失值
    2.1.4 异常值
    2.1.5 标签分布
    2.2 测试集数据探索
    2.2.1 数据信息
    2.2.2 缺失值
    2.2.3 数据分布
    2.2.4 异常值
    2.3 数据集联合分析
    2.3.1 file_id分析
    2.3.2 API分析
    3 特征工程与基线模型
    3.1 特征工程概述
    3.1.1 特征工程介绍
    3.1.2 构造特征
    3.1.3 特征选择
    3.2 构造线下验证集
    3.2.1 评估穿越
    3.2.2 训练集和测试集的特征差异性
    3.2.3 训练集和测试集的分布差异性
    3.3 基线模型
    3.3.1 数据读取
    3.3.2 特征工程
    3.3.3 基线构建
    3.3.4 特征重要性分析
    3.3.5 模型测试
    4 高阶数据探索
    4.1 变量分析
    4.2 高阶数据探索实战
    4.2.1 数据读取
    4.2.2 多变量交叉探索
    5 特征工程进阶与方案优化
    5.1 pivot特征构建
    5.1.1 pivot特征
    5.1.2 pivot特征构建时间
    5.1.3 pivot特征构建细节和特点
    5.2 业务理解和结果分析
    5.2.1 结合模型理解业务
    5.2.2 多分类问题预测结果分析
    5.3 特征工程进阶实践
    5.3.1 特征工程基础部分
    5.3.2 特征工程进阶部分
    5.3.3 基于LightGBM的模型验证
    5.3.4 模型结果分析
    5.3.5 模型测试
    6 优化技巧与解决方案升级
    6.1 优化技巧:Python处理大数据的技巧
    6.1.1 内存管理控制
    6.1.2 加速数据处理的技巧
    6.1.3 其他开源工具包
    6.2 深度学习解决方案:TextCNN建模
    6.2.1 问题转化
    6.2.2 TextCNN建模
    6.2.3 数据预处理
    6.2.4 TextCNN网络结构
    6.2.5 TextCNN训练和测试
    6.2.6 结果提交
    7 开源方案学习

    本书由阿里云天池平台编写。

    天池平台已经举办了超过 200 场来自真实业务场景的竞赛,每场赛事沉淀的课题和数据集,将在天池保留和开放。天池平台已成为在校学生踏入职场前的虚拟实践基地,也成为聚集40万数据人才,孵化2000余家数据创新工作室的数据智能大社区。


    人工智能是新一轮科技革命和产业变革的战略性技术,是推动我国科技跨越式发展、产业优化升级、生产力整体跃升的重要战略资源。人工智能的发展需要与产业紧密融合,除了基础数据和平台技术的突破创新,还需要搭好人工智能与应用场景有效衔接的桥梁。高校在人工智能人才培养的过程中,要重视人工智能技术与产业的结合,基于真实的业务数据和时间场景,通过知识深度和高度的构筑帮助学生成长,夯实基础,深化专业,复合知识,加强实践。本书以简单易懂的方式介绍了人工智能算法的实践操作,让学生在有限的时间内,能生动领会人工智能关键技术的应用,为进一步深入研究人工智能问题打下良好的基础。

    ——中国工程院院士,清华大学教授、清华大学信息科学技术学院院长、清华大学脑与认知科学研究院院长,中国人工智能学会理事长 戴琼海


    本书是面向AI开发者的实战类技术图书,聚焦机器学习算法建模及相关技术,以四个天池经典赛题作为实战案例,内容由浅入深、层层递进,值得一读。

    ——浙江大学研究生院副院长、软件学院常务副院长 卜佳俊


    本书以天池大赛的四个应用场景为背景,全面展示了数据特征分析、模型方法、解题思路、具体的数据处理技巧和代码等,不仅能为读者参加比赛提供参考,而且能提升读者利用机器学习解决实际问题的能力。

    ——北京大学信息科学技术学院计算机系教授 高军


    天池大赛提供了一个“云”上的练兵场,让所有对人工智能应用感兴趣的开发者都能很容易地触达业界的实际需求和场景。基于天池的实际案例,本书向读者提供了一手的体感和经验,值得一读。

    ——阿里巴巴副总裁 贾扬清


    天池大数据竞赛的参赛经历,对我个人的能力和职业发展起到了积极影响,而赛题的解决方案可以用于解决工业界的众多实际问题,相信无论在校学生还是互联网从业者,都可以从本书中获益良多。

    ——天池比赛,快手科技技术专家 李森栋


    训练数据的收集和处理能力已经成为人工智能系统设计中的必要因素,而天池大赛为广大缺乏上述能力的研究人员提供了一个很好的学习与训练平台,本书值得给大家。

    ——清华大学计算机系教授 刘奕群


    多年来,阿里云的天池大赛深受海内外热爱人工智能的学生的欢迎,大赛提供了海量的实际应用场景数据,其都是学生在校园场景中难以触及的。本书由具有丰富实战经验的大赛选手和组织者精心完成,内容翔实,我乐意把它给人工智能爱好者和学习者。

    ——新加坡南洋理工大学计算机科学与工程学院院长 苗春燕


    本书从赛题理解到解决方案,将整个实操过程展现得淋漓尽致,带你深入了解机器学习算法的真实应用。天池为年轻人提供了一个展示与交流的平台,期待越来越多的青年学子与天池一起成长。

    ——清华大学计算机系教授 唐杰


    大数据驱动这一计算范式可从人机物交互所涌现的海量数据中预测人类社会的生活模式、经济形态和生产方式等,本书从算法的角度介绍了在线经济领域中从大数据到知识、从知识到决策的过程,凸显了“知其意,悟其理,守其则,践其行”的初衷。

    ——浙江大学人工智能研究所所长 吴飞




    本书通过几个经典赛题,详细剖析了数据挖掘实战中常用的步骤和方法,为大数据参赛者铺垫了一条捷径。本书教你内练算法理论,外练代码招式,见招拆招,快速成为天池论剑中的佼佼者。

    ——天池比赛,菜鸟网络科技有限公司算法工程师 姚易辰


    阿里云历时七年,精心打造天池大赛平台,其有效服务于阿里经济体、阿里云客户、高校学生及社会各个行业。此书对天池大赛机器学习部分的赛题进行了的系统性梳理,是一本真正意义上的实操手册。

    ——苏州大学计算机学院院长 张民


    本书系统地介绍了天池多个机器学习比赛的全流程,不管是入门小白,还是竞赛爱好者,都能从中收获甚多。从机器学习竞赛小白,到天池比赛,再到天池比赛出题人,感谢阿里云天池平台伴我一路成长。

    ——天池比赛,蚂蚁金服AI图机器学习方向负责人 张志强



    本书聚焦机器学习算法建模及相关技术,以工业蒸汽量预测、天猫用户重复购买预测、O2O优惠券预测和阿里云安全恶意程序检测等四个天池经典赛题作为实战案例,针对实际赛题按照赛题理解、数据探索、特征工程、模型训练、模型验证、特征优化、模型融合等步骤,将赛题的解决方案从0到1层层拆解、详细说明,在展现专业选手解题过程的同时,配以丰富的相关技术知识作为补充。本书从经典商业案例出发,内容由浅入深、层层递进,既可以作为专业开发者的参考用书,也可以作为参赛选手研读专业算法的实战手册。

    适读人群 :IT技术从业者、专业开发者,相关专业的高校学生,尤其是天池大赛(或其他赛事)的新进选手和新晋关注者。

    本书的赛题均来自阿里云天池的真实业务场景,由具有丰富实战经验的大赛选手精心完成。本书通过解析选手的解题思路,总结了大赛可复制的套路。其可以向专业开发者提供技术参考,可以使高校学生和相关技术人员入门天池大赛及其他比赛,还可以帮助参赛选手进阶。


    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购