前言

前言

本书由分别毕业于英国剑桥大学和美国斯坦福大学的数据科学爱好者黄莉婷和苏川集为你呈现。

我们发现,虽然数据科学被越来越多地用来改善决策,但是很多人对它知之甚少。鉴于此,我们把一些教程汇编成书,以便更多人学习。不管你是心怀抱负的学生,还是商业精英或其他什么人,只要你对数据科学充满好奇,都可以通过本书学习。

每篇教程介绍一种数据科学技术,并讲解其重要功能和基本思想,但内容不会涉及数学。此外,我们还将结合现实世界中的数据和实例对这些技术做具体阐释。

本书得到了不少朋友的帮助,没有他们,本书就无法面世。

首先,我们要感谢 Sonya Chan,她是本书英文版的文字编辑,也是我们的好朋友。她巧妙地把我们两人的写作风格融合在一起,确保将我们各自讲解的内容衔接得天衣无缝。

其次,感谢 Dora Tan,她是一位才华横溢的平面设计师,本书英文版的排版设计和封面设计都出自她之手。

感谢我们的朋友 Michelle Poh、Dennis Chew 和 Mark Ho,他们提出了许多宝贵的建议,使本书读起来更容易理解。

还要感谢密歇根大学安娜堡分校的 Long Nguyen 教授,以及斯坦福大学的 Percy Liang 教授和 Michal Kosinski 博士。他们耐心地培养我们,并且无私地分享自己的专业建议。

最后,我们还要感谢彼此。尽管有时会争吵,但我们仍然是好朋友。我们一起并肩作战,直至实现最初目标。

电子书

扫描如下二维码,即可购买本书电子版。

{%}

目录

  • 版权声明
  • 前言
  • 为何需要数据科学
  • 第 1 章 基础知识
  • 第 2 章 k 均值聚类
  • 第 3 章 主成分分析
  • 第 4 章 关联规则
  • 第 5 章 社会网络分析
  • 第 6 章 回归分析
  • 第 7 章 k 最近邻算法和异常检测
  • 第 8 章 支持向量机
  • 第 9 章 决策树
  • 第 10 章 随机森林
  • 第 11 章 神经网络
  • 第 12 章 A/B 测试和多臂老虎机
  • 附录 A 无监督学习算法概览
  • 附录 B 监督学习算法概览
  • 附录 C 调节参数列表
  • 附录 D 更多评价指标
  • 术语表
  • 关于作者