manbetx户口程序设计丛书

Python数据分析:活用Pandas库

丹尼尔·陈 (作者) 武传海 (译者)
请至页面右侧“随书下载”获取配套文件。

● 轻松掌握流行的Python数据分析工具
● 深入浅出,示例丰富,容易理解和上手
本书是Python数据分析入门书,每个概念都通过简单实例来阐述,便于读者理解与上手。具体内容包括:Python及Pandas基础知识,加载和查看数据集,Pandas的DataFrame对象和Series对象,使用matplotlib、seaborn和Pandas提供的绘图方法为探索性数据分析作图,连接与合并数据集,处理缺失数据,清理数据,转换数据类型,处理字符串,应用函数,分组操作,拟合及评估模型,正则化方法与聚类技术等。
纸质书
¥72.98 ¥89.00

其他购买方式?

出版信息

  • 书  名Python数据分析:活用Pandas库
  • 系列书名manbetx户口程序设计丛书
  • 执行编辑关于本书的内容有任何问题,请联系 张卫国
  • 出版日期2020-03-14
  • 书  号978-7-115-52911-4
  • 定  价89.00 元
  • 页  数312
  • 印刷方式单色
  • 开  本16开
  • 出版状态上市销售
  • 原书名
  • 原书号

同系列书

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Java技术手册(第6版)

    Benjamin J Evans   David Flanagan   安道   译

    通过学习本书,你将能够: 掌握最新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对...

  • 机器学习实战

    Peter Harrington   李锐   李鹏   曲亚东   王斌   译

    机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或...

本书特色

Python强大易用,是数据处理和数据分析利器,而众多库的加持令其如虎添翼。Pandas就是其中一个非常流行的开源库,它可以确保数据的准确性,将数据可视化,还可以高效地操作大型数据集。借助它,Python可以快速地自动化和执行几乎任何数据分析任务。

本书细致讲解了Pandas的基础知识和常见用法,通过简单的实例展示了如何使用Pandas解决复杂的现实问题,以及如何利用matplotlib、seaborn、statsmodels和sklearn等库辅助进行Python数据分析,涵盖了数据处理、数据可视化、数据建模等内容。此外,本书还简单介绍了Python数据分析生态系统。

亚马逊读者评论

“这本书比我读过的其他介绍Pandas的书好很多,别的书也不错,但这本书更简明扼要。作者先介绍方法,接着给出示例,然后继续推进,非常适合学习。”

“这本书令人耳目一新,讲解没有陷入无关紧要的细节和冗长的理论,而是直截了当地介绍如何精通Pandas(以及seaborn和其他库),还涵盖了数据科学的基础(整理数据、可视化等)。”

“我读过许多介绍Pandas的书、博客和论文,这本书格外出众,它讲解清晰,示例丰富,讨论也很有层次:先整体概述,再逐渐深入······一些困扰了我很久的问题在这本书中得到了解答。”

目录

前言 阅读
致谢 阅读
关于作者 阅读
第一部分 简介
第1章 Pandas DataFrame基础知识 阅读
第2章 Pandas数据结构
第3章 绘图入门
第二部分 数据处理
第4章 数据组合
第5章 缺失数据
第6章 整理数据
第三部分 数据整理
第7章 数据类型
第8章 字符串和文本数据
第9章 应用
第10章 分组操作:分割-应用-组合
第11章 datetime数据类型
第四部分 数据建模
第12章 线性模型
第13章 广义线性模型
第14章 模型诊断
第15章 正则化
第16章 聚类
第五部分 终章 
第17章 Pandas之外
第18章 写给自学者

作者介绍

丹尼尔·陈(Daniel Y. Chen)
Lander Analytics公司数据科学家,Software Carpentry和Data Carpentry的讲师和课程维护人员,DataCamp的课程讲师。目前他在弗尼吉亚理工大学社会与决策分析实验室从事政策决策数据分析。

大家也喜欢

  • Python数据分析实战(第2版)

    法比奥·内利   杜春晓   译

    Python简单易学,拥有丰富的库,并且具有极强的包容性。本书展示了如何利用Python语言的强大功能,以最小...

  • Python科学计算最佳实践:SciPy指南

    [澳]胡安•努内兹-伊格莱西亚斯   [美]斯特凡•范德瓦尔特   [澳]哈丽雅特•达士诺   陈光欣   译

    本书旨在介绍开源的Python算法库和数学工具包SciPy。近年来,基于NumPy和SciPy的完整生态系统迅...

  • R图形化数据分析

    John Jay Hilfiger   王洋洋   译

    本书介绍如何使用图形化的方法来分析和理解复杂的数据,该方法突出数据中重要的关联和分布趋势,并使用尽可能简单的视...

  • 干净的数据:数据清洗入门与实践

    Megan Squire   任政委   译

    本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的...

  • 洞悉数据:用可视化方法发掘数据真义

    Hunter Whitney   刘云涛   译

    本书为了解数据可视化的重要内容和功能提供了多学科的视角,通过各种各样的案例分析,来演示可视化如何让数据变得更清...

相关文章

  • 毛遂自荐一下, 因为感觉这本书特别的棒, 因此准备将学习过程进行一个录制. 会基于此书进行一个演示讲解及适量的扩充和修正, 以便让更多人接触到这类好书. 由于个人能力有限, 目前暂定周更. 如果没有完美诠释本书的精彩, 还请大家见谅. 希望能让更多的人, 以此作为Pandas和manbetx户口的兴趣起点. 视频第一集B站链接: https://www.bilibili.com/video/BV15t4y1U7NL, 由于每一集都是单个录制发布, 因此没有统一地址, 欢迎大家关注B站账户(个人B站主页https://space.bilibili.com/10872266)
    Guibs  发表于 2020-04-01 14:45:47
  • 大家好,本书P123.
    import os
    import urllib
    with open(r'C:\Users\freessh\Desktop\test\data\raw_data_urls.txt')as data_urls:
    for line,url in enumerate(data_urls):
    if line == 5:
    break
    fn = url.split('/')[-1].strip()
    fp = os.path.join('..','data',fn)
    print(url)
    print(fp)
    #urllib.request.urlretrieve(url,fp)
    由于一些网络问题代码数据不能正常下载,这可能会导致后面案例无法操作,现在,把这部分需要的数据包已下载分享给各位,共500M
    链接:https://pan.baidu.com/s/1FSuuGO26fW78pxk8-GaX4Q
    提取码:zch0
    本人B站主页: https://space.bilibili.com/406566843 欢迎访问啊,帮忙点点赞 ,谢谢。
    freessh  发表于 2020-05-24 15:50:03
  • 看完了这本书觉得实用性非常强,里面的代码基本都用手敲过了一遍
    无知的真理追求者  发表于 2020-04-26 21:05:54
  • 申请翻译,
    reyne  发表于 2018-02-28 22:20:04
    • 试译请先发邮件给[email protected](朱巍,manbetx户口资深策划)介绍自身技术背景,并注明想翻译的图书。

      英子  发表于 2018-04-02 21:09:11
  • 申请翻译,
    reyne  发表于 2018-02-28 22:25:45
    • 试译请先发邮件给[email protected](朱巍,manbetx户口资深策划)介绍自身技术背景,并注明想翻译的图书。

      英子  发表于 2018-04-02 21:09:05
  • 申请翻译
    龙家晓言  发表于 2018-03-02 19:19:24
    • 试译请先发邮件给[email protected](朱巍,manbetx户口资深策划)介绍自身技术背景,并注明想翻译的图书。

      英子  发表于 2018-04-02 21:08:54
  • 申请试译
    gobelieve  发表于 2018-03-13 13:47:23
    • 试译请先发邮件给[email protected](朱巍,manbetx户口资深策划)介绍自身技术背景,并注明想翻译的图书。

      英子  发表于 2018-04-02 21:09:00
  • 申请翻译,
    geeeeeeeek  发表于 2018-08-06 11:02:29
  • 期待
    白宦成  发表于 2018-09-20 09:35:15
  • manbetx户口在售的还有哪本书讲pandas比较详细啊?
    大羊羊  发表于 2019-11-12 19:07:12
    • 《Python数据分析实战(第2版)》目前正在印制,很快会出版。

      张卫国  发表于 2019-11-13 09:42:48
    • @张卫国 了解啦,目前正在看Python数据科学手册的第三章,实战这本先去下个单~

      大羊羊  发表于 2019-11-15 13:07:55
    • 个人觉得是《Python 数据科学手册》

      Leszek  发表于 2020-05-11 16:09:07
    • @Leszek
      没错,我看了这本,从numpy到pandas,里面的例子十分易懂,非常棒。

      大羊羊  发表于 2020-05-22 09:44:11
  • 老师,这本书大约什么时候能上市呢?
    Jeonhae  发表于 2019-12-05 18:07:37
    • 您好,预计一月初出版。

      张卫国  发表于 2019-12-06 14:19:12
  • 电子书今年出吗?
    yueyeKIDL  发表于 2020-02-28 13:45:47
    • 本书仅发售纸质版。

      张卫国  发表于 2020-02-28 16:50:01
  • 发售了吗?
    飞飞小雨  发表于 2020-03-09 20:11:35
    • 已印刷完成,很快会发售,谢谢关注。

      张卫国  发表于 2020-03-10 16:30:48
    • @张卫国 几月可以买到

      nickcarter  发表于 2020-03-13 22:18:49
    • @nickcarter 您好,现已发售。

      张卫国  发表于 2020-03-16 11:59:08
  • 192页的11.2标题为Python 的datatime对象应该是datetime对象
    MafiaAlien  发表于 2020-03-17 23:47:07
    • 感谢指正。

      张卫国  发表于 2020-03-18 13:09:58
  • P6 country_df = df['country'] 这个获取的其实就不是 DataFrame,而是 Series。
    要让获取的是 DataFrame,还要加个 [] 才行 country_df = df[['country']]
    Leszek  发表于 2020-05-16 00:14:17
    • 感谢指出。

      张卫国  发表于 2020-05-17 16:49:06