序言
数据科学是一门新兴的学科,但它与我们的距离并非遥不可及,我们每时每刻都在使用数据科学产品。例如,微博通过网络分析向我们推荐可能感兴趣的人;淘宝通过推荐系统实现商品的精准展示;Facebook通过情感分析来预测美国大选的结果等。这些应用都是基于数

据科学来实现的。

人类社会正在步入智能时代,大数据是智能革命中不可或缺的驱动力。随着各行各业生成的数据越来越多,需要对海量数据进行有效的管理和利用,数据科学是在这种社会大背景下诞生的一门应用性学科。作者为了让更多人学会管理和利用数据而编写了《Python数据科学导论》。

在第1章,作者对数据科学的现状及本书的使用方法进行了简要阐述。学习数据科学需要一定的理论基础。如果读者此前没接触过统计学和机器学习方面的内容,也不必担心。本书在第3、4章及第5~7章分别对统计学和机器学习进行了概要介绍,涉及描述统计学、统计

推断、监督学习、回归分析、无监督学习等主题,并结合实际案例来加深读者对这些知识的理解。

除了理论,学习数据科学离不开编程实践。《Python数据科学导论》的所有代码均使用Python语言编写。Python语言简洁优美、功能强大、可读性强,对初学者非常友好。在第2章,作者对常用的Python语言数据科学工具箱进行了介绍,包括NumPy、SciPy和Pandas等。但是本书并没有讲解Python语言的基本语法,所以建议没有这方面编程经验的读者在学习本书之前,先阅读一本入门书籍。

数据科学有广泛的应用场景。本书在第8~10章分别介绍了网络分析、推荐系统和情感分析这些常见的数据科学应用。为满足数据科学对计算机性能的需求,第11章介绍了并行计算及性能优化方法。

《Python数据科学导论》既可作为数据科学初学者的入门书籍,也可作为高等院校相关专业学生的参考书。

《Python数据科学导论》的翻译工作主要由章宗长、王艺深完成,参与本书翻译工作的还有陈子璇、姜冲、陈浩然、沈永亮、王泽宇。此外,感谢机械工业出版社的刘星宁编辑在整个翻译工作中给予的支持和理解。

由于译者水平有限,书中难免会出现错漏之处,恳请读者朋友批评指正。意见和建议请发至zzzhang@suda.edu.cn,我们不胜感激。



译 者 

于苏州大学



按 Ctrl+p 打印本页】【关闭