原书前言本书是为解决问题而编写的。在我面试的数据科职中的那些具有纯正数学背景的人中,大多数都无法编写一个计算斐波那契数的简单脚本(如果读者不熟悉斐波那契数,这只需要大约5行代码)。另一方面,雇主倾向于将数据科学家视为神秘的巫师或二手车销售人员,而当数据科学家被认为无法编写基本的脚本时,后一种印象就尤为深刻!这些问题反映了所有各方对数据科学是什么(或不是什么)以及从业者需要什么样的技能存在根本误解。当我初涉数据科学时,也存在同样的问题。多年的物理学科训练使我擅长以抽象理论来解决问题,而在其中缺乏常识或灵活。幸运的是,我知道如何编码(得益于在Google公司的实习),这让我一瘸一拐地抓住了重要的实用技能和思维模式。离开学术界后,我为多种类型的公司做过数据科学咨询,包括针对小型初创企业进行的网络流量分析、财富100巨头的制造优化以及介于两者之间的方方面面。要解决的问题总是的,但解决这些问题所需的技能却出奇一致。它们是计算机编程、数学和商业思维的折衷组合。这些技能很少在一个人身上找到,但实际上可以被任何人学习而获得。一些面试经历在我脑海中浮现而出。有位候选人聪明且知识渊博,但这次面试痛苦而又清楚地表明他们对数据科学家的日常工作毫不知晓。当候选人开始为浪费您的时间而道歉时,作为面试官又能够做什么呢?我们开设了1h的速成课程,讲述了他们缺失的知识内容,以及他们如何填补他们的知识空白。他们在面试之后,学习了他们所需要的东西,现在已是成功的数据科学家。我写本书的目的是通过将数据科学的各种技能凝练成一本手册来帮这样的求职者,其关注点还是实用:对于需要速成或在紧迫的截止日期前解决问题的人来说本书是理想的选择。在教育系统还没有赶上这个令人兴奋的新领域的需求之前,希望本书能填补空白。 Field Cady 2016年9月华盛顿州雷德蒙德