manbetx户口程序设计丛书

特征工程入门与实践

Sinan Ozdemir , Divya Susarla (作者) 庄嘉盛 (译者)
- 从零入手,全面了解特征工程
- 提升机器学习算法的效率、准确率

英文源代码及数据下载:https://pan.baidu.com/s/1lPFx0vVcrR1tm3_bfDeGQg
提取码:hsp9
本书将带你了解特征工程的完整过程,使机器学习更加系统、高效。你会从理解数据开始学习,机器学习模型的成功正是取决于如何利用不同类型的特征,例如连续特征、分类特征等。你将了解何时纳入一项特征、何时忽略一项特征,以及其中的原因。你还会学习如何将问题陈述转换为有用的新特征,如何提供由商业需求和数学见解驱动的特征,以及如何在自己的机器上进行机器学习,从而自动学习数据中的特征。
电子书
¥29.99
格式
mobi   pdf

纸质书
¥46.61 ¥59.00

出版信息

  • 书  名特征工程入门与实践
  • 系列书名manbetx户口程序设计丛书
  • 执行编辑关于本书的内容有任何问题,请联系 杨琳
  • 出版日期2019-05-27
  • 书  号978-7-115-51164-5
  • 定  价59.00 元
  • 页  数210
  • 印刷方式单色
  • 开  本16开
  • 出版状态上市销售
  • 原书名Feature Engineering Made Easy
  • 原书号9781787287600

同系列书

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Java技术手册(第6版)

    Benjamin J Evans   David Flanagan   安道   译

    通过学习本书,你将能够: 掌握最新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对...

  • 机器学习实战

    Peter Harrington   李锐   李鹏   曲亚东   王斌   译

    机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或...

本书特色

特征工程是数据科学和机器学习流水线上的重要一环,包括识别、清洗、构建和发掘数据的特征,为进一步解释数据并进行预测性分析做准备。

本书囊括了特征工程的全流程,从数据检查到可视化,再到转换和进一步处理等,并给出了大量数学工具,帮助读者掌握如何将数据处理、转换成适当的形式,以便送入计算机和机器学习流水线中进行处理。后半部分的特征工程实践用Python作为示例语言,循序渐进,通俗易懂。

- 识别和利用不同类型的特征
- 清洗数据中的特征,提升预测能力
- 为何、如何进行特征选择和模型误差分析
- 利用领域知识构建新特征
- 基于数学知识交付特征
- 使用机器学习算法构建特征
- 掌握特征工程与特征优化
- 在现实应用中利用特征工程

目录

版权声明 阅读
前言 阅读
第 1 章 特征工程简介 阅读
第 2 章 特征理解:我的数据集里有什么
第 3 章 特征增强:清洗数据
第 4 章 特征构建:我能生成新特征吗
第 5 章 特征选择:对坏属性说不
第 6 章 特征转换:数学显神通
第 7 章 特征学习:以AI促AI
第 8 章 案例分析

作者介绍

锡南·厄兹代米尔(Sinan Ozdemir)

数据科学家、数学家、约翰·霍普金斯大学讲师,Kylie.ai公司联合创始人、CTO,在应用数据挖掘、功能分析和算法开发做出基于数据和知识的决策方面拥有丰富的经验。

迪夫娅·苏萨拉(Divya Susarla)

在利用数据方面经验丰富,在包括投资管理、社会企业咨询和红酒营销的各个产业和领域里实现并应用过相应的策略。Kylie.ai公司产品经理,目前专注于自然语言处理和生成技术。

大家也喜欢

  • 机器学习基础:建模与问题求解

    本书作者曾就职美国谷歌公司和日本乐天集团,有着多年的机器学习开发经验。本书理论与实践相结合,通过直观具体、易于...

  • Python高级机器学习

    John Hearty   王大鹏   管晨   郭鹏程   译

    Python是杰出的脚本语言,在速度、安全性和可扩展性等方面表现出众。在机器学习领域,越来越多的从业者也选择使...

  • 生成对抗网络项目实战

    凯拉什·阿伊瓦   倪琛   译

    生成对抗网络(GAN)可以模拟任何数据分布方式,因而潜力巨大,为很多难以自动化的问题提供了解决途径。本书立足理...

  • Python数据分析实战(第2版)

    法比奥·内利   杜春晓   译

    Python简单易学,拥有丰富的库,并且具有极强的包容性。本书展示了如何利用Python语言的强大功能,以最小...

  • 深度学习基础与实践

    Josh Patterson   Adam Gibson   郑明智   译

    本书是由两位技术出身的企业管理者编写的深度学习普及书。本书的前四章提供了足够的关于深度学习的理论知识,包括机器...

相关文章

  • childishjin 推荐

    【电子书奖励计划】特征工程入门与实践1

    很高兴参加manbetx户口社区的电子书奖励计划,简直是免费读新书啊。既能激励自己,又可以持续不断的学习新知识,关键还不花钱,太棒了吧。我的第一本:特征工程入门与实践。因为一直在学习机器学习,但是在特征工程这方面还存在一些不理解,因此果断入手这本。![特征工程入门与实践][1] ...

  • 这本书有人申请翻译么?我能申请下么?
    龙家晓言  发表于 2018-03-07 08:03:35
  • 这本书大概什么时候出版?
    有电子版吗?有的话电子版大概什么时候出?
    潜心修行  发表于 2019-04-28 16:38:19
    • 您好,本书预计5月底出版,电子版应该会和纸质版同步上市,感谢您的关注!

      杨琳  发表于 2019-04-29 09:08:43
    • @杨琳 好,给你们点赞

      竞天问  发表于 2019-05-08 09:44:58
  • 源码的ipynb文件打开的确会报错:Feature_Understanding\Ch2.ipynb NotJSONError('Notebook does not appear to be JSON: \'\\ufeff{"nbformat":4,"nbformat_minor":0,...')
    简杨君  发表于 2019-09-03 11:40:09
    • 我也是,你解决了吗?

      白小  发表于 2019-09-25 19:32:31
    • @白小 下面给出源码地址了,下载用这个就行

      简杨君  发表于 2019-09-27 14:33:15
  • 源码下载地址:https://github.com/PacktPublishing/Feature-Engineering-Made-Easy
    简杨君  发表于 2019-09-03 14:41:04
    • 彩色图片下载地址:https://www.packtpub.com/sites/default/files/downloads/FeatureEngineeringMadeEasy_
      ColorImages.pdf

      简杨君  发表于 2019-09-03 19:56:27
  • 看了一些章节,个人感觉有些排版问题
    1. 3.3.4 整合起来 P69,表头 “使用的列数” --> "使用的行数", 同时最后一行感觉是 "768行"
    2. 4.3.3 将连续特征分箱 P82, 表最后一列"quantitative_column" 列值错误, 应该是分箱变换后的结果

    另外, 关于自定义变换实现过程, 为何将fit过程的逻辑合入到transform中实现, 而不应该将fit逻辑独立出来, 比如P75, 4.2.3 自定义分类填充器, 在拆分训练集和测试集的情况下, 测试集理论应该填充的数据应该是训练集中出现最多的元素, 直接写在transform中是否有问题, 请译者确认.
    xinshu  发表于 2019-09-16 20:13:55
  • 这本书什么时候开始翻译的?什么时候可以翻译完啊
    tuling_wu  发表于 2018-03-27 17:26:53
  • 电子版大概还要多长时间?
    征尘丶倚阑珊  发表于 2019-05-28 13:49:45
  • 扫了一眼目录,内容详尽与完全,与自己当下所要解决的问题很贴合,但由于留学国外,非常期待本书的电子版。
    chengfu_deng  发表于 2019-05-28 22:46:32
  • 请尽快推出电子版吧!
    CKHO  发表于 2019-05-31 17:26:42
  • 源代码无法打开
    转角  发表于 2019-07-22 13:44:14
  • 源码无法打开,我需要源码
    jiandanxuexi  发表于 2019-08-06 21:20:04
  • 你好,源代码ipynb文件无法打开,直接报错,需要解决。
    白小  发表于 2019-09-25 19:33:22
  • 购的pdf电子书加密看不了
    wngbx  发表于 2019-11-18 10:04:24
  • 买了电子书怎么不能下载呐
    ginkgo44  发表于 2019-11-24 16:53:35
  • 这本书很nice。书上第82页顶部那张表是有错吗,quantitative_column字段经过了连续特征分箱表后字段值却没有变化。
    iamjwe  发表于 2020-01-07 10:27:42