由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
100%刮中券,最高50元无敌券,券有效期7天
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
醉染图书社交媒体数据挖掘与分析9787111643685
¥ ×1
新春将至,本公司假期时间为:2025年1月23日至2025年2月7日。2月8日订单陆续发货,期间带来不便,敬请谅解!
译者序
前言
致谢
作者简介
技术编辑简介
章用户:谁参与社交媒体1
1.1测量Wikipedia中用户行为的变化1
1.1.1用户活动的多样2
1.1.2人类活动中的长尾效应18
1.2随处可见的长尾效应:80/20定律20
1.3Twitter上的在线行为
1.3.1检索用户的Tweet24
1.3.2对数分区26
1.3.3Twitter上的用户活动27
1.4总结28
第2章网络:社交媒体如何运行29
2.1社交网络的类型和属30
2.1.1用户何时创建连接:显式网络30
2.1.2有向图与无向图31
2.1.3节点和边的属31
2.1.4加权图32
2.1.5由活动构建图:隐式网络33
2.2网络可视化35
.度:赢家通吃38
..1连接40
..2用户连接的长尾分布41
..理想网络模型43
2.4捕获相关:三角结构、簇和同配45
2.4.1局部三角结构和簇45
2.4.2同配49
2.5总结53
第3章时序过程:用户何时使用社交媒体54
3.1传统模型如何描述事件发生的时间54
3.2事件间隔时间57
3.2.1与无记忆过程的对比60
3.2.2自相关63
3..与无记忆过程的偏离64
3.2.4用户活动中的时间周期66
3.3个体行为的爆发70
3.4预测长期指标78
3.4.1发现趋势80
3.4.2发现季节2
3.4.3利用ARIMA预测时间序列84
3.5总结86
第4章内容:社交媒体中有什么88
4.1定义内容:聚焦于文本和非结构数据88
4.1.1从文本生成特征:自然语言处理基础89
4.1.2文本中词条的基本统计91
4.2使用内容特征识别主题92
4.2.1话题的流行度98
4.2.2用户个体兴趣有多么多样化100
4.3从高维文本中抽取低维信息102
4.4总结120
第5章处理大型数据集122
5.1MapReduce:组织并行和串行操作122
5.1.1单词124
5.1.2偏斜:个Reducer的诅咒127
5.2多阶段MapReduce流127
5.2.1扇出129
5.2.2归并数据流129
5..连接两个数据源131
5.2.4连接小数据集134
5.2.5大规模MapReduce模型134
5.3MapReduc程序设计模式135
5.3.1静态MapReduce作业135
5.3.2迭代MapReduce作业140
5.3.3增量MapReduce作业146
5.3.4时间相关的MapReduce作业146
5.3.5处理长尾分布社交媒体数据的挑战153
5.4抽样和近似:以较少计算得到结果154
5.4.1HyperLogLg56
5.4.2Bloom过滤器161
5.4.3Count-MinSketch166
5.5在Hadoop集群上运行171
5.5.1在AmazonEC2上安装CHD集群171
5.5.2为合作者提供IAM存取174
5.5.3根据需要增加集群处理能力175
5.6总结175
第6章学习、映和177
6.1在线社交媒体服务177
6.1.1搜索引擎177
6.1.2内容参与178
6.1.3与现实世界的互动179
6.1.4与人的互动180
6.2问题阐述180
6.3学习和映182
6.3.1矩阵分解183
6.3.2学习和训练184
6.3.3电影评分示范187
6.4预测与197
6.4.1评估199
6.4.2方法概述200
6.5总结209
第7章结论210
7.1人类互动模式出乎意料的稳定210
7.2均值、标准差和抽样211
7.3移除异常值216
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
非常抱歉,您前期未参加预订活动,
无法支付尾款哦!
抱歉,您暂无任性付资格