返回首页
苏宁会员
购物车 0
易付宝
手机苏宁

服务体验

店铺评分与同行业相比

用户评价:----

物流时效:----

售后服务:----

  • 服务承诺: 正品保障
  • 公司名称:
  • 所 在 地:
本店所有商品

  • 正版 社交媒体数据挖掘与分析 加博尔 萨博 用户行为变化测量 长尾效应 有向图 网络模型 时序过程 大型数据集处理
  • 新商品上架
    • 作者: 加博尔·萨博等著
    • 出版社: 机械工业出版社
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    苏宁商家

    商家:
    句字图书专营店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    商品分类

    商品参数
    • 作者: 加博尔·萨博等著
    • 出版社:机械工业出版社
    • ISBN:9787328911636
    • 版权提供:机械工业出版社

    内容介绍

    本书围绕着如何探索和理解社交媒体系统的基本组成部分进行组织,简单地说来就是谁(who)、如何(how)、何时(when)和什么(what)构成了社交媒体过程。本书的目标是“授人以渔”。在涵盖了社交媒体分析的主要方面之后,本书还以大量篇幅介绍了大数据环境下处理社交媒体数据所需的工具、算法的原理和实际案例,读者可以以此为基础,快速介入生产环境下的社交媒体数据处理任务。
    目录

    译者序 前言 致谢 作者简介 技术编辑简介 *1章 用户:谁参与社交媒体 1 1.1 测量Wikipedia中用户行为的变化 1 1.1.1 用户活动的多样性 2 1.1.2 人类活动中的长尾效应 18 1.2 随处可见的长尾效应:80/20定律 20 1.3 Twitter上的在线行为 23 1.3.1 检索用户的Tweet 24 1.3.2 对数分区 26 1.3.3 Twitter上的用户活动 27译者序
    前言
    致谢
    作者简介
    技术编辑简介
    *1章 用户:谁参与社交媒体 1
    1.1 测量Wikipedia中用户行为的变化 1
    1.1.1 用户活动的多样性 2
    1.1.2 人类活动中的长尾效应 18
    1.2 随处可见的长尾效应:80/20定律 20
    1.3 Twitter上的在线行为 23
    1.3.1 检索用户的Tweet 24
    1.3.2 对数分区 26
    1.3.3 Twitter上的用户活动 27
    1.4 总结 28
    *2章 网络:社交媒体如何运行 29
    2.1 社交网络的类型和属性 30
    2.1.1 用户何时创建连接:显式网络 30
    2.1.2 有向图与无向图 31
    2.1.3 节点和边的属性 31
    2.1.4 加权图 32
    2.1.5 由活动构建图:隐式网络 33
    2.2 网络可视化 35
    2.3 度:赢家通吃 38
    2.3.1 连接计数 40
    2.3.2 用户连接的长尾分布 41
    2.3.3 超越理想网络模型 43
    2.4 捕获相关:三角结构、簇和同配性 45
    2.4.1 局部三角结构和簇 45
    2.4.2 同配性 49
    2.5 总结 53
    第3章 时序过程:用户何时使用社交媒体 54
    3.1 传统模型如何描述事件发生的时间 54
    3.2 事件间隔时间 57
    3.2.1 与无记忆过程的对比 60
    3.2.2 自相关 63
    3.2.3 与无记忆过程的偏离 64
    3.2.4 用户活动中的时间周期 66
    3.3 个体行为的爆发 70
    3.4 预测长期指标 78
    3.4.1 发现趋势 80
    3.4.2 发现季节性 82
    3.4.3 利用ARIMA预测时间序列 84
    3.5 总结 86
    第4章 内容:社交媒体中有什么 88
    4.1 定义内容:聚焦于文本和非结构数据 88
    4.1.1 从文本生成特征:自然语言处理基础 89
    4.1.2 文本中词条的基本统计 91
    4.2 使用内容特征识别主题 92
    4.2.1 话题的流行度 98
    4.2.2 用户个体兴趣有多么多样化 100
    4.3 从高维文本中抽取低维信息 102
    4.4 总结 120
    第5章 处理大型数据集 122
    5.1 MapReduce:组织并行和串行操作 122
    5.1.1 单词计数 124
    5.1.2 偏斜:*后一个Reducer的诅咒 127
    5.2 多阶段MapReduce流 127
    5.2.1 扇出 129
    5.2.2 归并数据流 129
    5.2.3 连接两个数据源 131
    5.2.4 连接小数据集 134
    5.2.5 大规模MapReduce模型 134
    5.3 MapReduc程序设计模式 135
    5.3.1 静态MapReduce作业 135
    5.3.2 迭代MapReduce作业 140
    5.3.3 增量MapReduce作业 146
    5.3.4 时间相关的MapReduce作业 146
    5.3.5 处理长尾分布社交媒体数据的挑战 153
    5.4 抽样和近似:以较少计算得到结果 154
    5.4.1 HyperLogLog 156
    5.4.2 Bloom过滤器 161
    5.4.3 Count-Min Sketch 166
    5.5 在Hadoop集群上运行 171
    5.5.1 在Amazon EC2上安装CHD集群 171
    5.5.2 为合作者提供IAM存取 174
    5.5.3 根据需要增加集群处理能力 175
    5.6 总结 175
    第6章 学习、映射和推荐 177
    6.1 在线社交媒体服务 177
    6.1.1 搜索引擎 177
    6.1.2 内容参与 178
    6.1.3 与现实世界的互动 179
    6.1.4 与人的互动 180
    6.2 问题阐述 180
    6.3 学习和映射 182
    6.3.1 矩阵分解 183
    6.3.2 学习和训练 184
    6.3.3 电影评分示范 187
    6.4 预测与推荐 197
    6.4.1 评估 199
    6.4.2 方法概述 200
    6.5 总结 209
    第7章 结论 210
    7.1 人类互动模式出乎意料的稳定性 210
    7.2 均值、标准差和抽样 211
    7.3 移除异常值 216 显示全部信息
    关联推荐

    社交媒体是大数据的丰富来源,财富500强公司中的90%都在投资大数据方面的计划来帮助预测用户的行为。了解社交媒体数据*有效的挖掘方法能够帮助你获得产生惊人业绩的信息。
    社交媒体是非结构化、动态、面向未来的。高效而有洞察力的数据挖掘需要新的分析工具和技术。由任职社交网络公司的业界专家所撰写的本书提供了一个实践教程,教授你如何使用*新的工具和专门针对社交媒体的复杂数据挖掘技术。本书深入剖析了收集和应用社交媒体数据的机制,以理解用户、定义趋势并做出预测,从而改善对增长和销售的分析。
    你将了解如何充分利用从社交媒体及其他相关的丰富数据源所收集的数据,也将学习如何识别在线用户的共性行为模式,以便独立构建和应用基于这些模式的预测算法。

    通过阅读本书,你将学到:
    ?在线服务的4个关键特征:用户、社交网络、行为和内容
    ?数据发现的生命周期:数据抽取、分析和可视化
    ?使用社交媒体进行客户预测和推荐的技术
    ?如何使用分布式计算高效处理大规模社交媒体数据
    ?使用Python、R和Scala编写的代码级的示例解决方案
     
    1
    • 商品详情
    • 内容简介

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购