加载中...
扫一扫
下载苏宁易购APP
关注苏宁推客公众号
自购省钱·分享赚钱
下载苏宁金融APP
关注苏宁易购服务号
用户评价:----
物流时效:----
售后服务:----
实名认证领苏宁支付券立即领取 >
¥
提前抢
SUPER会员专享
由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
欢迎光临本店铺
点我可查看更多商品哦~
100%刮中券,最高50元无敌券,券有效期7天
亲,今日还有0次刮奖机会
我的云钻:0
您的云钻暂时不足,攒足云钻再来刮
恭喜获得1张券!
今天的机会已经全部用完了,请明天再来
恭喜刮出两张券,请选择一张领取
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
全新大数据分析与计算汤羽 等 编著9787302485865
¥ ×1
商品
服务
物流
章绪论1.1数据与数据科学1.2大数据概念1.3大数据技术特征参考文献习题第2章大数据计算体系2.1大数据计算架构2.2数据存储系统2.2.1数据清洗与建模2.2.2分布式文件系统2..NoSL数据库2.2.4统一数据访问接口.数据处理平台..1数据分析算法..2计算处理模型..计算平台与引擎2.4数据应用系统2.4.1大数据应用领域2.4.2大数据解决方案参考文献习题第3章大数据标准与模式3.1大数据标准体系3.2大数据计算模式参考文献习题第4章数据采集方法4.1系统日志采集4.1.1日志采集的目的4.1.2日志采集过程4.2网络数据采集4.2.1网络爬虫工作原理4.2.2网页搜索策略4..网页分析算法4.2.4网络爬虫框架4.3数据采集接口参考文献习题第5章数据清洗与规约方法5.1数据预处理研究现状5.1.1数据清洗的研究现状5.1.2数据规约的研究现状5.2数据质量问题分类5.2.1单数据源的问题5.2.2多数据源的问题5.3数据清洗技术5.3.1重复记录清洗5.3.2消除噪声数据5.3.3缺失值清洗5.4数据归约5.4.1维归约5.4.2属选择5.4.3离散化方法5.5数据清洗工具参考文献习题第6章数据分析算法6.1C4.5算法6.1.1算法描述6.1.2属选择度量6.1.3特征6.2k均值算法6.3支持向量机6.4Apriori算法6.5EM算法6.5.1案例: 估计k个高斯分布的均值6.5.2EM算法步骤6.6PageRank算法6.6.1PageRank的核心思想6.6.2PageRank的计算过程6.7AdaBoost算法6.7.1Boosting算法的发展历史6.7.2AdaBoost算法及其分析6.8k邻近算法6.9朴素贝叶斯6.9.1朴素贝叶斯分类器6.9.2贝叶斯网络6.10分类回归树算法6.10.1建立回归树6.10.2剪枝过程参考文献习题第7章文本读写技术7.1读取文本文件7.1.1读取txt文件7.1.2读取csv文件7.2写入文本文件7.3处理二进制数据7.4数据库的使用7.4.1数据库的连接7.4.2执行SL语句7.4.3选择和打印7.4.4动态插入7.4.5update作参考文献习题第8章数据处理技术8.1合并数据集8.1.1索引上的合并8.1.2轴向连接8.1.3合并重叠数据8.2数据转换8.2.1移除重复数据8.2.2利用函数进行数据转换8..替换值8.2.4重命名轴索引8.2.5离散化数据8.2.6检测异常值8.2.7排列和随机采样8.2.8哑变量8.3字符串作8.3.1内置字符串方法8.3.2正则表达式8.3.3Pandas中矢量化的字符串函数参考文献习题第9章数据分析技术9.1NumPy工具包9.1.1创建数组9.1.2打印数组9.1.3基本运算9.1.4索引、切片和迭代9.1.5形状作9.1.6复制和视图9.1.7NumPy实用技巧9.2Pandas工具包9.2.1Series9.2.2DataFrame9.3ScikitLearn工具包9.3.1逻辑回归9.3.2朴素贝叶斯9.3.3k近邻9.3.4决策树9.3.5支持向量机9.3.6优化算法参数参考文献习题0章数据可视化技术10.1Matplotlib绘图10.1.1Matplotlib API入门10.1.2Figure和Subplot的画图方法10.1.3调整Subplot周围的间距10.1.4颜色、标记和线型的设置10.1.5刻度、标签和图例10.2Mayavi2绘图10.2.1使用mlab快速绘图10.2.2Mayavi嵌入到界面中10.3图形化工具参考文献习题1章Hadoop生态系统11.1Hadoop系统架构11.2HDFS分布式文件系统11.2.1HDFS体系结构11.2.2HDFS存储结构11..数据容错与恢复11.2.4Hadoop/HDFS安装11.3分布式存储架构11.3.1HBase系统架构11.3.2数据模型与存储模式11.3.3HBase数据读写11.3.4数据仓库工具Hive11.3.5HBase安装与配置11.4HBase索引与检索11.4.1二次索引表机制11.4.2二次索引技术方案11.5资源管理与作业调度11.5.1分布式协同管理组件ZooKeeper11.5.2作业调度与工作流引擎Oozie11.5.3集群资源管理框架YARN参考文献习题2章MapReduce计算模型12.1分布式并行计算系统12.2MapReduce计算架构1.键值对与输入格式12.4映与化简12.5应用编程接口参考文献习题3章图并行计算框架13.1图基本概念13.2BSP模型13.3Pregel图计算引擎13.4Hama开源框架13.5应用编程接口参考文献习题4章交互式计算模式14.1数据模型14.2存储结构14.3并行查询14.4开源实现参考文献习题5章流计算系统15.1流计算模型15.2Storm计算架构15.3工作机制实现15.4Storm编程接口参考文献习题6章内存计算模式16.1分布式缓存体系16.2内存数据库16.3内存云MemCloud16.4Spark内存计算参考文献习题7章基于医疗数据的临床决策分析应用17.1国内外研究现状及发展动态分析17.2技术路线和方案参考文献习题8章基于医保数据的预测分析应用18.1数据准备阶段18.2模型变量选择和转换18.2.1模型变量的选择18.2.2模型变量的转换18..筛选模型变量18.3建模过程18.4模型效果参考文献习题9章互联网电商数据的分析应用19.1电商流程管理分析19.1.1行业背景与业务问题19.1.2分析方法与过程19.2用户消费行为分析19.2.1业务问题19.2.2分析方法与过程19.3送货速度相关分析19.3.1业务问题19.3.2分析方法与过程19.4总结参考文献习题第20章金融和经济数据的分析应用20.1企业对创新经济活动推动的影响分析20.1.1案例背景20.1.2分析方法与过程20.2信贷风险模型评估20.3中小能源型企业的信用评价分析20.3.1案例背景20.3.2分析方法与过程20.3.3分析结果参考文献习题
汤羽,博士/教授,上海交通大学工学学士,重庆大学工学硕士,美国Bowie State University计算机科学硕士,美国The George Washington University计算机科学博士。
抢购价:¥ 38.00
易购价:¥ 38.00
注:参加抢购将不再享受其他优惠活动
亲,很抱歉,您购买的宝贝销售异常火爆,让小苏措手不及,请稍后再试~
验证码错误
看不清楚?换一张
确定关闭
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
查看我的收藏夹
非常抱歉,您前期未参加预订活动,无法支付尾款哦!
关闭
抱歉,您暂无任性付资格
继续等待
0小时0分
立即开通
SUPER会员